A comparative study on variable selection in microarray classification
Issued Date
2014
Copyright Date
2014
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
x, 74 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Technology of Information System Management))--Mahidol University, 2014
Suggested Citation
Sirikul Laosrivichit A comparative study on variable selection in microarray classification. Thesis (M.Sc. (Technology of Information System Management))--Mahidol University, 2014. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/95228
Title
A comparative study on variable selection in microarray classification
Alternative Title(s)
การศึกษาเปรียบเทียบการคัดเลือกตัวแปรในการคัดแยกข้อมูลชนิดไมโครอะเรย์
Author(s)
Abstract
This thesis proposes usingthe shrinkage method for logistic regression. The normal exponential gamma (NEG) distribution is a Bayesian-inspire method. This method uses the normal-exponential-gamma prior for coefficients of model. The typical problems of microarray data have been solved by the LASSO and the elastic net. The comparative study of the two famous methods, NEG distribution and double exponential (DE) distribution were measured by the number of selected variables, predictive accuracy, deviance and computational time. The paired sample t-test was used to analyze the mean difference between two values. The results showed that the NEG distribution was more efficient the LASSO, the elastic net and the DE distribution.
งานวิจัยนี้นำเสนอวิธีการลดขนาดสัมประสิทธิ์ของแบบจำลองการถดถอยโลจิสติก โดยอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบแกมมาเลขชี้กำลังแบบปรกติเป็นความ น่าจะเป็ นก่อนหน้าของสัมประสิทธิ์ของแบบจำลอง ในปัญหาการศึกษาดีเอ็นเอไมโครอะเรย์ การศึกษาเปรียบเทียบประสิทธิภาพวิธีที่นำเสนอกับวิธีที่นิยมใช้กันมากในปัจจุบัน คือวิธีแลซโซ วิธี ข่ายยืดหยุ่น และวิธีที่มีการอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบเลขชี้กำลังคู่ ใน การศึกษาประสิทธิภาพจะใช้จำนวนยีนที่ถูกเลือก ค่าความถูกต้องของการทำนาย ค่าความผิดพลาด ของการทำนาย และเวลาที่ใช้ในการสร้างแบบจำลองการจำแนก และใช้หลักการทางสถิตินำมา วิเคราะห์หาความแตกต่างของค่าเฉลี่ยสองค่า (paired t-test) จากผลการศึกษาพบว่าการใช้การแจก แจงแบบแกมมาเลขชี้กำลังแบบปรกติมีประสิทธิภาพในการทำนายและความสามารถในการ คัดเลือกยีนสูงกว่าทั้งวิธีแลซโซ วิธีข่ายยืดหยุ่น และการใช้การแจกแจงแบบเลขชี้กำลังคู่
งานวิจัยนี้นำเสนอวิธีการลดขนาดสัมประสิทธิ์ของแบบจำลองการถดถอยโลจิสติก โดยอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบแกมมาเลขชี้กำลังแบบปรกติเป็นความ น่าจะเป็ นก่อนหน้าของสัมประสิทธิ์ของแบบจำลอง ในปัญหาการศึกษาดีเอ็นเอไมโครอะเรย์ การศึกษาเปรียบเทียบประสิทธิภาพวิธีที่นำเสนอกับวิธีที่นิยมใช้กันมากในปัจจุบัน คือวิธีแลซโซ วิธี ข่ายยืดหยุ่น และวิธีที่มีการอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบเลขชี้กำลังคู่ ใน การศึกษาประสิทธิภาพจะใช้จำนวนยีนที่ถูกเลือก ค่าความถูกต้องของการทำนาย ค่าความผิดพลาด ของการทำนาย และเวลาที่ใช้ในการสร้างแบบจำลองการจำแนก และใช้หลักการทางสถิตินำมา วิเคราะห์หาความแตกต่างของค่าเฉลี่ยสองค่า (paired t-test) จากผลการศึกษาพบว่าการใช้การแจก แจงแบบแกมมาเลขชี้กำลังแบบปรกติมีประสิทธิภาพในการทำนายและความสามารถในการ คัดเลือกยีนสูงกว่าทั้งวิธีแลซโซ วิธีข่ายยืดหยุ่น และการใช้การแจกแจงแบบเลขชี้กำลังคู่
Description
Technology of Information System Management (Mahidol University 2014)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Technology of Information System Management
Degree Grantor(s)
Mahidol University