Partial string matching using bit-sliced signature files

dc.contributor.advisorDamras Wongsawang
dc.contributor.advisorSupachai Tangwongsan
dc.contributor.authorAthiwat Arpapongsak
dc.date.accessioned2024-01-18T01:51:26Z
dc.date.available2024-01-18T01:51:26Z
dc.date.copyright1999
dc.date.created2024
dc.date.issued1999
dc.descriptionComputer Science (Mahidol University 1999)
dc.description.abstractThe partial string searching using text pattern matching in unformatted data normally requires much processing time because it compares an indicated query with all data which are usually in large size. A signature file represents an actual file in searching. Since signature file size is much smaller than an actual files size, the processing time is faster. However, signature file algorithm cannot be directly use in partial searching. This thesis proposes a new approach to the use of signature files algorithm in partial string searching. We develop a searching algorithm called Wildcard Searching with Signature File (WSSF). WSSF creates two signature file that will be used in partial string searching. From theoretical analysis an experimentation of WSSF with actual data, we found that WSSF is more efficient than any existing text pattern matching algorithms when applied to partial string searching. This thesis presents how WSSF works and its procedures in detail. The researches on WSSF, its experimentation with real data, and its results are discussed. Moreover, suggestions and comments for improving WSSF in using this algorithm in the real world are also presented.
dc.description.abstractปกติการค้นหาบางส่วนของคำ (Partial String Searching) ในข้อมูลที่ไม่มี รูปแบบต้องใช้เวลาในการประมวลผลมาก เมื่อใช้เทคนิคของการค้นหาแบบเปรียบเทียบ กับข้อมูลโดยตรง (Text Pattern Matching) เพราะจะต้องค้นหาเปรียบเทียบกับ ข้อมูลทั้งหมดซึ่งมักจะมีขนาดใหญ่ แฟ้มข้อมูลลายเซ็นจะทำหน้าที่เป็นตัวแทนของข้อมูลจริง ซึ่งสามารถจะใช้ในการค้นหาได้เช่นเดียวกับข้อมูลจริง แต่จะมีขนาดเล็กกว่าข้อมูลจริง มาก จึงทำให้การค้นหาทำได้เร็วกว่า อย่างไรก็ตาม แฟ้มข้อมูลลายเซ็นไม่สามารถจะใช้ กับการค้นหาแบบบางส่วนได้โดยตรง งานวิทยานิพนธ์นี้จะได้นำเสนอวิธีการที่จะใช้แฟ้ม ข้อมูลลายเซ็นในการค้นหาแบบบางส่วน วิธีการค้นหาที่เรียกว่า WSSF (Wildcard Searching with Signature Files) ได้ถูกพัฒนาขึ้น WSSF จะสร้างแฟ้มข้อมูล ลายเซ็น 2 แฟ้ม ซึ่งจะสนับสนุนการค้นหาแบบบางส่วนได้ จากการวิเคราะห์และทดลอง กับข้อมูลจริงพบว่า WSSF ให้ประสิทธิภาพในการค้นหาแบบบางส่วนได้ดีกว่าวิธีการปกติ วิทยานิพนธ์ฉบับนี้จะได้นำเสนอวิธีการของ WSSF โดยละเอียด พร้อมกับการ วิเคราะห์การนำไปทดลองกับข้อมูลจริง พร้อมทั้งผลการทดลองที่ได้ นอกจากนี้ยังจะได้ นำเสนอข้อแนะนำต่างๆ ในการที่จะปรับปรุง WSSF ให้ดีขึ้นสำหรับการใช้งานจริง
dc.format.extentx, 82 leaves : ill.
dc.format.mimetypeapplication/pdf
dc.identifier.citationThesis (M.Sc. (Computer Science))--Mahidol University, 1999
dc.identifier.isbn9746623079
dc.identifier.urihttps://repository.li.mahidol.ac.th/handle/123456789/93216
dc.language.isoeng
dc.publisherMahidol University. Mahidol University Library and Knowledge Center
dc.rightsผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
dc.rights.holderMahidol University
dc.subjectData base management
dc.subjectFile management (Computer science)
dc.subjectText processing (Computer science)
dc.titlePartial string matching using bit-sliced signature files
dc.title.alternativeการค้นหาคำแบบบางส่วนโดยการใช้แฟ้มข้อมูลลายเซ็นแบบลำดับ
dc.typeMaster Thesis
dcterms.accessRightsopen access
mods.location.urlhttp://mulinet11.li.mahidol.ac.th/e-thesis/scan/4037547.pdf
thesis.degree.departmentFaculty of Science
thesis.degree.disciplineComputer Science
thesis.degree.grantorMahidol University
thesis.degree.levelMaster's degree
thesis.degree.nameMaster of Science

Files