A breast cancer risk prediction model based on non-cancer drugs use data
Issued Date
2018
Copyright Date
2018
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
xi, 100 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2018
Suggested Citation
Sudasiri Sriwiang A breast cancer risk prediction model based on non-cancer drugs use data. Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2018. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/92296
Title
A breast cancer risk prediction model based on non-cancer drugs use data
Alternative Title(s)
แบบจำลองทำนายความเสี่ยงโรคมะเร็งเต้านมบนพื้นฐานของข้อมูลการใช้ยาที่ไม่เกี่ยวข้องกับโรคมะเร็ง
Author(s)
Abstract
Breast cancer is a common cancer that is the leading cause of death in women. Prediction model of breast cancer risk factors also cannot build a model with high accuracy and high precision. Drug use is considered to be another factor that should be aware as being associated with breast cancer. The aim of this study was to identify patterns of association between barest cancer and drug used data and create a breast cancer prediction model from non-cancer drug used data. Modeling process consisted of 3 methods: Association rule, Correlation and Classification methods. The result showed that the machine learning could create models to predict breast cancer with data that include multiple variables and complex data. Findings also showed that there was an association between medication and breast cancer by using the association rule mining. Measurement of medication weight by correlation showed that atorvastatin calcium had the maximum weight. The model created by classification method, gradient boosted tree (GBT), was the best with high accuracy (0.91) and precision (0.88).
มะเร็งเต้านมเป็นมะเร็งที่พบว่าเป็นสาเหตุการเสียชีวิตที่สูงที่สุด และการสร้างแบบจำลองทำนายการเกิดมะเร็งจากปัจจัยเสี่ยงยังไม่สามารถสร้างแบบจำลองที่มีความถูกต้องและเที่ยงตรงสูงได้ ปัจจัยจากการใช้ยากําลังถูกนำมาพิจารณาว่าน่าจะเป็นอีกปัจจัยที่ควรได้รับการตระหนักว่ามีความสัมพันธ์กับการเกิดโรคมะเร็ง การศึกษาครั้งนี้จึงมีวัตถุประสงค์ที่จะหารูปแบบความสัมพันธ์และสร้างแบบจำลองเพื่อทำนายการเกิดมะเร็งเต้านมจากข้อมูลการใช้ยาที่ไม่เกี่ยวข้องกับโรคมะเร็ง โดยวิธีการสร้างแบบจำลองประกอบด้วยสามวิธีคือ การหากฎความสัมพันธ์ (Association rule), การหาค่าสหสัมพันธ์ (Correlation) และวิธีการจำแนก (Classification Methods) ผลจากการสร้างแบบจำลองพบว่าการเรียนรู้ด้วยเครื่องจักร(Machine leaning) สามารถสร้างแบบจำลองทำนายการเกิดมะเร็งเต้านมด้วยข้อมูลที่มีหลายตัวแปร และข้อมูลที่ซับซ้อนได้ ซึ่งการหาความสัมพันธ์โดยการใช้วิธีสร้างกฎความสัมพันธ์ นอกจากจะสามารถช่วยลดตัวแปรในการนำมาวิเคราะห์แล้วยังสามารถสร้างกฎความสัมพันธ์ระหว่างมะเร็งเต้านมกับยาที่ผู้ป่วยได้รับได้ Atrovastatin calcium ให้ค่านํ้าหนักความสัมพันธ์กับมะเร็งเต้านมสูงที่สุด และการสร้างแบบจำลองโดยวิธีการจำแนก มีเพียง Gradient Boosted tree ที่สามารถสร้างแบบจำลองออกมาได้ด้วยค่าความแม่นยำเท่ากับ 0.91 และเที่ยงตรงเท่ากับ 0.88 ประโยชน์ที่คาดว่าจะได้จากการสร้างแบบจำลองครั้งนี้สามารถนำไปสร้างเครื่องมือหรือแอพพลิเคชั่นเพื่อช่วยในการตัดสินใจของบุคคลากรทางการแพทย์ อย่างไรก็ตามผลจากการสร้างแบบจำลองในครั้งนี้ยังไม่สามารถสร้างด้วยอัลกอรึทึมที่มนุษย์สามารถเข้าใจได้โดยง่ายจึงจำเป็นต้องอาศัยการสร้างเครื่องมือทางคอมพิวเตอร์เพื่อช่วยในการแปรผลของแบบจำลอง
มะเร็งเต้านมเป็นมะเร็งที่พบว่าเป็นสาเหตุการเสียชีวิตที่สูงที่สุด และการสร้างแบบจำลองทำนายการเกิดมะเร็งจากปัจจัยเสี่ยงยังไม่สามารถสร้างแบบจำลองที่มีความถูกต้องและเที่ยงตรงสูงได้ ปัจจัยจากการใช้ยากําลังถูกนำมาพิจารณาว่าน่าจะเป็นอีกปัจจัยที่ควรได้รับการตระหนักว่ามีความสัมพันธ์กับการเกิดโรคมะเร็ง การศึกษาครั้งนี้จึงมีวัตถุประสงค์ที่จะหารูปแบบความสัมพันธ์และสร้างแบบจำลองเพื่อทำนายการเกิดมะเร็งเต้านมจากข้อมูลการใช้ยาที่ไม่เกี่ยวข้องกับโรคมะเร็ง โดยวิธีการสร้างแบบจำลองประกอบด้วยสามวิธีคือ การหากฎความสัมพันธ์ (Association rule), การหาค่าสหสัมพันธ์ (Correlation) และวิธีการจำแนก (Classification Methods) ผลจากการสร้างแบบจำลองพบว่าการเรียนรู้ด้วยเครื่องจักร(Machine leaning) สามารถสร้างแบบจำลองทำนายการเกิดมะเร็งเต้านมด้วยข้อมูลที่มีหลายตัวแปร และข้อมูลที่ซับซ้อนได้ ซึ่งการหาความสัมพันธ์โดยการใช้วิธีสร้างกฎความสัมพันธ์ นอกจากจะสามารถช่วยลดตัวแปรในการนำมาวิเคราะห์แล้วยังสามารถสร้างกฎความสัมพันธ์ระหว่างมะเร็งเต้านมกับยาที่ผู้ป่วยได้รับได้ Atrovastatin calcium ให้ค่านํ้าหนักความสัมพันธ์กับมะเร็งเต้านมสูงที่สุด และการสร้างแบบจำลองโดยวิธีการจำแนก มีเพียง Gradient Boosted tree ที่สามารถสร้างแบบจำลองออกมาได้ด้วยค่าความแม่นยำเท่ากับ 0.91 และเที่ยงตรงเท่ากับ 0.88 ประโยชน์ที่คาดว่าจะได้จากการสร้างแบบจำลองครั้งนี้สามารถนำไปสร้างเครื่องมือหรือแอพพลิเคชั่นเพื่อช่วยในการตัดสินใจของบุคคลากรทางการแพทย์ อย่างไรก็ตามผลจากการสร้างแบบจำลองในครั้งนี้ยังไม่สามารถสร้างด้วยอัลกอรึทึมที่มนุษย์สามารถเข้าใจได้โดยง่ายจึงจำเป็นต้องอาศัยการสร้างเครื่องมือทางคอมพิวเตอร์เพื่อช่วยในการแปรผลของแบบจำลอง
Description
Information Technology Management (Mahidol University 2018)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Information Technology Management
Degree Grantor(s)
Mahidol University