Partial string matching using bit-sliced signature files
2
Issued Date
1999
Copyright Date
1999
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
x, 82 leaves : ill.
ISBN
9746623079
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Computer Science))--Mahidol University, 1999
Suggested Citation
Athiwat Arpapongsak Partial string matching using bit-sliced signature files. Thesis (M.Sc. (Computer Science))--Mahidol University, 1999. Retrieved from: https://repository.li.mahidol.ac.th/handle/123456789/93216
Title
Partial string matching using bit-sliced signature files
Alternative Title(s)
การค้นหาคำแบบบางส่วนโดยการใช้แฟ้มข้อมูลลายเซ็นแบบลำดับ
Author(s)
Advisor(s)
Abstract
The partial string searching using text pattern matching in unformatted data normally requires much processing time because it compares an indicated query with all data which are usually in large size. A signature file represents an actual file in searching. Since signature file size is much smaller than an actual files size, the processing time is faster. However, signature file algorithm cannot be directly use in partial searching. This thesis proposes a new approach to the use of signature files algorithm in partial string searching. We develop a searching algorithm called Wildcard Searching with Signature File (WSSF). WSSF creates two signature file that will be used in partial string searching. From theoretical analysis an experimentation of WSSF with actual data, we found that WSSF is more efficient than any existing text pattern matching algorithms when applied to partial string searching. This thesis presents how WSSF works and its procedures in detail. The researches on WSSF, its experimentation with real data, and its results are discussed. Moreover, suggestions and comments for improving WSSF in using this algorithm in the real world are also presented.
ปกติการค้นหาบางส่วนของคำ (Partial String Searching) ในข้อมูลที่ไม่มี รูปแบบต้องใช้เวลาในการประมวลผลมาก เมื่อใช้เทคนิคของการค้นหาแบบเปรียบเทียบ กับข้อมูลโดยตรง (Text Pattern Matching) เพราะจะต้องค้นหาเปรียบเทียบกับ ข้อมูลทั้งหมดซึ่งมักจะมีขนาดใหญ่ แฟ้มข้อมูลลายเซ็นจะทำหน้าที่เป็นตัวแทนของข้อมูลจริง ซึ่งสามารถจะใช้ในการค้นหาได้เช่นเดียวกับข้อมูลจริง แต่จะมีขนาดเล็กกว่าข้อมูลจริง มาก จึงทำให้การค้นหาทำได้เร็วกว่า อย่างไรก็ตาม แฟ้มข้อมูลลายเซ็นไม่สามารถจะใช้ กับการค้นหาแบบบางส่วนได้โดยตรง งานวิทยานิพนธ์นี้จะได้นำเสนอวิธีการที่จะใช้แฟ้ม ข้อมูลลายเซ็นในการค้นหาแบบบางส่วน วิธีการค้นหาที่เรียกว่า WSSF (Wildcard Searching with Signature Files) ได้ถูกพัฒนาขึ้น WSSF จะสร้างแฟ้มข้อมูล ลายเซ็น 2 แฟ้ม ซึ่งจะสนับสนุนการค้นหาแบบบางส่วนได้ จากการวิเคราะห์และทดลอง กับข้อมูลจริงพบว่า WSSF ให้ประสิทธิภาพในการค้นหาแบบบางส่วนได้ดีกว่าวิธีการปกติ วิทยานิพนธ์ฉบับนี้จะได้นำเสนอวิธีการของ WSSF โดยละเอียด พร้อมกับการ วิเคราะห์การนำไปทดลองกับข้อมูลจริง พร้อมทั้งผลการทดลองที่ได้ นอกจากนี้ยังจะได้ นำเสนอข้อแนะนำต่างๆ ในการที่จะปรับปรุง WSSF ให้ดีขึ้นสำหรับการใช้งานจริง
ปกติการค้นหาบางส่วนของคำ (Partial String Searching) ในข้อมูลที่ไม่มี รูปแบบต้องใช้เวลาในการประมวลผลมาก เมื่อใช้เทคนิคของการค้นหาแบบเปรียบเทียบ กับข้อมูลโดยตรง (Text Pattern Matching) เพราะจะต้องค้นหาเปรียบเทียบกับ ข้อมูลทั้งหมดซึ่งมักจะมีขนาดใหญ่ แฟ้มข้อมูลลายเซ็นจะทำหน้าที่เป็นตัวแทนของข้อมูลจริง ซึ่งสามารถจะใช้ในการค้นหาได้เช่นเดียวกับข้อมูลจริง แต่จะมีขนาดเล็กกว่าข้อมูลจริง มาก จึงทำให้การค้นหาทำได้เร็วกว่า อย่างไรก็ตาม แฟ้มข้อมูลลายเซ็นไม่สามารถจะใช้ กับการค้นหาแบบบางส่วนได้โดยตรง งานวิทยานิพนธ์นี้จะได้นำเสนอวิธีการที่จะใช้แฟ้ม ข้อมูลลายเซ็นในการค้นหาแบบบางส่วน วิธีการค้นหาที่เรียกว่า WSSF (Wildcard Searching with Signature Files) ได้ถูกพัฒนาขึ้น WSSF จะสร้างแฟ้มข้อมูล ลายเซ็น 2 แฟ้ม ซึ่งจะสนับสนุนการค้นหาแบบบางส่วนได้ จากการวิเคราะห์และทดลอง กับข้อมูลจริงพบว่า WSSF ให้ประสิทธิภาพในการค้นหาแบบบางส่วนได้ดีกว่าวิธีการปกติ วิทยานิพนธ์ฉบับนี้จะได้นำเสนอวิธีการของ WSSF โดยละเอียด พร้อมกับการ วิเคราะห์การนำไปทดลองกับข้อมูลจริง พร้อมทั้งผลการทดลองที่ได้ นอกจากนี้ยังจะได้ นำเสนอข้อแนะนำต่างๆ ในการที่จะปรับปรุง WSSF ให้ดีขึ้นสำหรับการใช้งานจริง
Description
Computer Science (Mahidol University 1999)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Science
Degree Discipline
Computer Science
Degree Grantor(s)
Mahidol University
