A comparative study on variable selection in microarray classification

dc.contributor.advisorSotarat Thammaboosadee
dc.contributor.advisorSupaporn Kiattisin
dc.contributor.advisorWaranyu wongseree
dc.contributor.authorSirikul Laosrivichit
dc.date.accessioned2024-02-07T02:14:29Z
dc.date.available2024-02-07T02:14:29Z
dc.date.copyright2014
dc.date.created2014
dc.date.issued2014
dc.descriptionTechnology of Information System Management (Mahidol University 2014)
dc.description.abstractThis thesis proposes usingthe shrinkage method for logistic regression. The normal exponential gamma (NEG) distribution is a Bayesian-inspire method. This method uses the normal-exponential-gamma prior for coefficients of model. The typical problems of microarray data have been solved by the LASSO and the elastic net. The comparative study of the two famous methods, NEG distribution and double exponential (DE) distribution were measured by the number of selected variables, predictive accuracy, deviance and computational time. The paired sample t-test was used to analyze the mean difference between two values. The results showed that the NEG distribution was more efficient the LASSO, the elastic net and the DE distribution.
dc.description.abstractงานวิจัยนี้นำเสนอวิธีการลดขนาดสัมประสิทธิ์ของแบบจำลองการถดถอยโลจิสติก โดยอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบแกมมาเลขชี้กำลังแบบปรกติเป็นความ น่าจะเป็ นก่อนหน้าของสัมประสิทธิ์ของแบบจำลอง ในปัญหาการศึกษาดีเอ็นเอไมโครอะเรย์ การศึกษาเปรียบเทียบประสิทธิภาพวิธีที่นำเสนอกับวิธีที่นิยมใช้กันมากในปัจจุบัน คือวิธีแลซโซ วิธี ข่ายยืดหยุ่น และวิธีที่มีการอิงแนวคิดจากทฤษฎีของเบย์และใช้การแจกแจงแบบเลขชี้กำลังคู่ ใน การศึกษาประสิทธิภาพจะใช้จำนวนยีนที่ถูกเลือก ค่าความถูกต้องของการทำนาย ค่าความผิดพลาด ของการทำนาย และเวลาที่ใช้ในการสร้างแบบจำลองการจำแนก และใช้หลักการทางสถิตินำมา วิเคราะห์หาความแตกต่างของค่าเฉลี่ยสองค่า (paired t-test) จากผลการศึกษาพบว่าการใช้การแจก แจงแบบแกมมาเลขชี้กำลังแบบปรกติมีประสิทธิภาพในการทำนายและความสามารถในการ คัดเลือกยีนสูงกว่าทั้งวิธีแลซโซ วิธีข่ายยืดหยุ่น และการใช้การแจกแจงแบบเลขชี้กำลังคู่
dc.format.extentx, 74 leaves : ill.
dc.format.mimetypeapplication/pdf
dc.identifier.citationThesis (M.Sc. (Technology of Information System Management))--Mahidol University, 2014
dc.identifier.urihttps://repository.li.mahidol.ac.th/handle/20.500.14594/95228
dc.language.isoeng
dc.publisherMahidol University. Mahidol University Library and Knowledge Center
dc.rightsผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
dc.rights.holderMahidol University
dc.subjectDistribution (Probability theory)
dc.subjectDNA microarrays
dc.subjectLasso
dc.titleA comparative study on variable selection in microarray classification
dc.title.alternativeการศึกษาเปรียบเทียบการคัดเลือกตัวแปรในการคัดแยกข้อมูลชนิดไมโครอะเรย์
dc.typeMaster Thesis
dcterms.accessRightsopen access
mods.location.urlhttp://mulinet11.li.mahidol.ac.th/e-thesis/2556/cd484/5537223.pdf
thesis.degree.departmentFaculty of Engineering
thesis.degree.disciplineTechnology of Information System Management
thesis.degree.grantorMahidol University
thesis.degree.levelMaster's degree
thesis.degree.nameMaster of Science

Files