Using signature file technique for searching a multi-valued attribute in relational database
Issued Date
1998
Copyright Date
1998
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
xiii, 78 leaves : ill.
ISBN
9746610554
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Computer Science))--Mahidol University, 1998
Suggested Citation
Pairut Leelahakarnjana Using signature file technique for searching a multi-valued attribute in relational database. Thesis (M.Sc. (Computer Science))--Mahidol University, 1998. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/103523
Title
Using signature file technique for searching a multi-valued attribute in relational database
Alternative Title(s)
การใช้เทคนิคของแฟ้มข้อมูลลายมือในการค้นหาแบบพหุเทอมในฐานข้อมูลสัมพันธ์
Author(s)
Advisor(s)
Abstract
Signature file is an indexing technique for searching unformatted data in an information retrieval system. The earliest structure of signature file is sequential signature file. In query evaluation, sequential signature file requires accessing all bits in the signature file. Many researches proposed various organizations for the signature file that try to access without all bits. One interesting organization is vertically partitioned signature file. Recently, the multi-fragmented signature file is proposed for fast searching in the multi-term query. It is also grouped in the vertically partitioned signature. The multi-valued attribute in relational database can be viewed as unformatted data, and querying the multi-valued attribute by using SQL (Structural Query Language) requires high processing time. For these reasons, we propose a model that uses signature file for searching the multi-valued attribute in a relational database. Generally, if a relation has the multi-valued attribute, it should be split into many relations for getting normal forms. In our proposed model, the multi-valued attribute can be kept in a single relation. The signature file is created to be the index of the multi-valued attribute. We simulate the test environments and compare the results between our approach with the SQL statement approach that use SQL statement for getting the same result. We found that our approach gives faster response time than the SQL statement approach. The reason behind this result is because signature file processing deals with bit operation which always takes less processing time than record operation used in SQL. For SQL statement approach, the factors that affect the query response time are database size and number of terms in the query. While in our approach, the query response time depends on database size, number of projects in query, and number of records in the output. Increasing database size usually increases the query response time in both approaches. Increasing the number of terms in query increases
แฟ้มข้อมูลลายมือเป็นวิธีการหนึ่งที่ใช้ในการทำดัชนีของข้อมูลที่ไม่มีรูปแบบ โครงสร้างแรกที่ถูกเสนอจะประกอบด้วยข้อมูลลายมือเรียงกันไปอย่างต่อเนื่อง ในการ ค้นหาแบบพหุเทอม ทุกบิตของแฟ้มข้อมูลลายมือจะถูกตรวจสอบ งานวิจัยจำนวนมากได้ทำ การศึกษาและพัฒนาโครงสร้างของแฟ้มข้อมูลลายมือโดยพยายามลดจำนวนบิตที่ต้องการ ตรวจสอบ โครงสร้างหนึ่งที่น่าสนใจ คือ การแบ่งส่วนของแฟ้มข้อมูลลายมือตามขวาง เนื่องจากแบบพหุเทอมในฐานข้อมูลสัมพันธ์สามารถถูกจัดเป็นข้อมูลที่ไม่มีรูปแบบ และการใช้ SQL ในการค้นหาแบบพหุเทอมต้องการเวลาในการประมวลผลมาก ดังนั้น งานวิทยานิพนธ์นี้จึงนำเสนอการใช้แฟ้มข้อมูลลายมือในการทำดัชนีเพื่อใช้ในการค้นหา แบบพหุเทอมในฐานข้อมูลสัมพันธ์ ในการออกแบบฐานข้อมูลสัมพันธ์ ถ้าฐานข้อมูลมีแบบ พหุเทอม แบบพหุเทอมจะถูกจัดเก็บแยกต่างหาก แต่ในวิธีการที่นำเสนอนี้ แบบพหุเทอม สามารถถูกจัดเก็บรวมในฐานข้อมูลเดิมได้ และแฟ้มข้อมูลลายมือจะถูกสร้างขึ้นเพื่อใช้ เป็นดัชนีของแบบพหุเทอม จากการทดลองพบว่า วิธีการใช้แฟ้มข้อมูลลายมือใช้เวลา ในการประมวลผลน้อยกว่าวิธีการใช้ SQL สาเหตุที่ทำให้เกิดผลดังกล่าว คือ วิธีการ ใช้แฟ้มข้อมูลลายมือจะเกี่ยวข้องกับการจัดการกับบิตในแฟ้มข้อมูลลายมือ ในขณะที่วิธี การใช้ SQL จะเกี่ยวข้องกับการจัดการกับเรคคอร์ดของฐานข้อมูล และเวลาที่ใช้ในการ จัดการกับบิตจะน้อยกว่าเวลาที่ใช้ในการจัดการกับเรคคอร์ดของฐานข้อมูล ปัจจัยที่มีผลต่อเวลาที่ใช้ในการค้นหาแบบพหุเทอมของวิธีการใช้ SQL คือขนาดของ ฐานข้อมูล จำนวนเทอมที่ค้นหา ส่วนของวิธีการใช้แฟ้มข้อมูลลายมือขึ้นกับขนาดของฐานข้อมูล จำนวนเทอมที่ค้นหา และจำนวนเรคคอร์ดในผลลัพธ์ การเพิ่มขนาดของฐานข้อมูลจะทำให้ เวลาในการค้นหาเพิ่มขึ้นในทั้งสองวิธี การเพิ่มจำนวนเทอมที่ค้นหาจะเพิ่มเวลาในการ ค้นหาของวิธีการใช้ SQL แต่ละลดเวลาในการค้นหาของวิธีการใช้แฟ้มข้อมูลลายมือ เนื่องจากการเพิ่มจำนวนเทอมที่ค้นหาทำให้จำนวนเรคคอร์ดในผลลัพธ์ลดลงเสมอ และ เวลาที่เพิ่มขึ้นเนื่องจากการเพิ่มจำนวนเทอมที่ค้นหามักน้อยกว่าเวลาที่ลดลงเนื่องจาก การลดลงของจำนวนเรคคอร์ดในผลลัพธ์
แฟ้มข้อมูลลายมือเป็นวิธีการหนึ่งที่ใช้ในการทำดัชนีของข้อมูลที่ไม่มีรูปแบบ โครงสร้างแรกที่ถูกเสนอจะประกอบด้วยข้อมูลลายมือเรียงกันไปอย่างต่อเนื่อง ในการ ค้นหาแบบพหุเทอม ทุกบิตของแฟ้มข้อมูลลายมือจะถูกตรวจสอบ งานวิจัยจำนวนมากได้ทำ การศึกษาและพัฒนาโครงสร้างของแฟ้มข้อมูลลายมือโดยพยายามลดจำนวนบิตที่ต้องการ ตรวจสอบ โครงสร้างหนึ่งที่น่าสนใจ คือ การแบ่งส่วนของแฟ้มข้อมูลลายมือตามขวาง เนื่องจากแบบพหุเทอมในฐานข้อมูลสัมพันธ์สามารถถูกจัดเป็นข้อมูลที่ไม่มีรูปแบบ และการใช้ SQL ในการค้นหาแบบพหุเทอมต้องการเวลาในการประมวลผลมาก ดังนั้น งานวิทยานิพนธ์นี้จึงนำเสนอการใช้แฟ้มข้อมูลลายมือในการทำดัชนีเพื่อใช้ในการค้นหา แบบพหุเทอมในฐานข้อมูลสัมพันธ์ ในการออกแบบฐานข้อมูลสัมพันธ์ ถ้าฐานข้อมูลมีแบบ พหุเทอม แบบพหุเทอมจะถูกจัดเก็บแยกต่างหาก แต่ในวิธีการที่นำเสนอนี้ แบบพหุเทอม สามารถถูกจัดเก็บรวมในฐานข้อมูลเดิมได้ และแฟ้มข้อมูลลายมือจะถูกสร้างขึ้นเพื่อใช้ เป็นดัชนีของแบบพหุเทอม จากการทดลองพบว่า วิธีการใช้แฟ้มข้อมูลลายมือใช้เวลา ในการประมวลผลน้อยกว่าวิธีการใช้ SQL สาเหตุที่ทำให้เกิดผลดังกล่าว คือ วิธีการ ใช้แฟ้มข้อมูลลายมือจะเกี่ยวข้องกับการจัดการกับบิตในแฟ้มข้อมูลลายมือ ในขณะที่วิธี การใช้ SQL จะเกี่ยวข้องกับการจัดการกับเรคคอร์ดของฐานข้อมูล และเวลาที่ใช้ในการ จัดการกับบิตจะน้อยกว่าเวลาที่ใช้ในการจัดการกับเรคคอร์ดของฐานข้อมูล ปัจจัยที่มีผลต่อเวลาที่ใช้ในการค้นหาแบบพหุเทอมของวิธีการใช้ SQL คือขนาดของ ฐานข้อมูล จำนวนเทอมที่ค้นหา ส่วนของวิธีการใช้แฟ้มข้อมูลลายมือขึ้นกับขนาดของฐานข้อมูล จำนวนเทอมที่ค้นหา และจำนวนเรคคอร์ดในผลลัพธ์ การเพิ่มขนาดของฐานข้อมูลจะทำให้ เวลาในการค้นหาเพิ่มขึ้นในทั้งสองวิธี การเพิ่มจำนวนเทอมที่ค้นหาจะเพิ่มเวลาในการ ค้นหาของวิธีการใช้ SQL แต่ละลดเวลาในการค้นหาของวิธีการใช้แฟ้มข้อมูลลายมือ เนื่องจากการเพิ่มจำนวนเทอมที่ค้นหาทำให้จำนวนเรคคอร์ดในผลลัพธ์ลดลงเสมอ และ เวลาที่เพิ่มขึ้นเนื่องจากการเพิ่มจำนวนเทอมที่ค้นหามักน้อยกว่าเวลาที่ลดลงเนื่องจาก การลดลงของจำนวนเรคคอร์ดในผลลัพธ์
Description
Computer Science (Mahidol University 1998)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Science
Degree Discipline
Computer Science
Degree Grantor(s)
Mahidol University