Publication: NoduleNet: A Lung Nodule Classification Using Deep Learning
Issued Date
2020
Resource Type
Language
eng
ISSN
0125-3611 (Print)
2651-0561 (Online)
2651-0561 (Online)
Rights
Mahidol University
Rights Holder(s)
Department of Clinical Epidemiology and Biostatistics Faculty of Medicine Ramathibodi Hospital Mahidol University
Department of Diagnostic and Therapeutic Radiology Faculty of Faculty of Medicine Ramathibodi Hospital Mahidol University
Department of Diagnostic and Therapeutic Radiology Faculty of Faculty of Medicine Ramathibodi Hospital Mahidol University
Bibliographic Citation
Ramathibodi Medical Journal. Vol. 43, No. 4 (October-December 2020), 11-19
Suggested Citation
Ganesh Shah, Ratchainant Thammasudjarit, Ammarin Thakkinstian, Thitiporn Suwatanapongched, กาเนซ ชาห์, รัตน์ชัยนันท์ ธรรมสุจริต, อัมรินทร์ ทักขิญเสถียร, ฐิติพร สุวัฒนะพงศ์เชฏ NoduleNet: A Lung Nodule Classification Using Deep Learning. Ramathibodi Medical Journal. Vol. 43, No. 4 (October-December 2020), 11-19. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/72244
Research Projects
Organizational Units
Authors
Journal Issue
Thesis
Title
NoduleNet: A Lung Nodule Classification Using Deep Learning
Alternative Title(s)
NoduleNet: การจำแนกก้อนเนื้อในปอดด้วยวิธีการเรียนรู้เชิงลึก
Abstract
Background: Accurate detection and classification of lung nodules at an early stage can help physicians to improve the treatment outcomes of lung cancer. Several lung nodule classifications using deep learning have been proposed but they are lag of external validation to Thai patient data.
Objective: To propose a deep learning model called NoduleNet for lung nodule classification and perform internal and external validation of the proposed model.
Methods: Two datasets were performed; internal validation using LUNA16 (the public lung CT database), and external validation using ChestRama (37 chest CT scans retrospectively identified from the CT database of Ramathibodi Hospital between 2017 and 2019). The NoduleNet was built on top of pretrained architecture, VGG16, and VGG19 with customization.
Results: The NoduleNet showed impressive results in nodule classification. The best model achieved accuracy of 0.95 (0.94 - 0.96), sensitivity of 0.84 (0.82 - 0.86), and specificity of 0.97 (0.97 - 0.98) for internal validation, where the external validation results was accuracy of 0.95 (0.87 - 1.00), sensitivity of 0.91 (0.82 - 1.00), and specificity of 1.00 (1.00 - 1.00). There were 3 misclassified samples in external validation which are all false-negative.
Conclusions: The NoduleNet is able to generalize from non-Thai patient data to Thai patient data. It could be further improved by taking sequence of images into account, integrating with an automatic nodule detection algorithm, and adding more nodule types.
บทนำ: การจำแนกก้อนเนื้อ (Nodule) ในปอดได้อย่างแม่นยำตั้งแต่ระยะเริ่มต้นของโรคมะเร็งปอด สามารถช่วยให้แพทย์ตัดสินใจด้านการวางแผนการรักษาได้ดีขึ้น ที่ผ่านมามีการใช้การเรียนรู้เชิงลึกมาช่วยในการตรวจจับและจำแนกก้อนเนื้อในปอด แต่ยังขาดการนำมาประเมินความถูกต้องกับข้อมูลของคนไข้ไทย วัตถุประสงค์: เพื่อสร้างตัวแบบชื่อ NoduleNet ด้วยวิธีการเรียนรู้เชิงลึกสำหรับการจำแนกก้อนเนื้อในปอดและนำมาประเมินความถูกต้องกับข้อมูลคนไข้ไทย วิธีการศึกษา: ข้อมูลชุดแรก (LUNA16) ซึ่งเป็นข้อมูลสาธารณะถูกนำมาใช้สอนตัวแบบด้วยการเรียนรู้เชิงลึก ส่วนข้อมูลชุดที่สอง (ChestRama) ถูกนำมาใช้เพื่อการประเมินความถูกต้องของตัวแบบที่สร้างจากตัวแบบที่เคยผ่านการเรียนรู้มาก่อน (VGG16 และ VGG19) ผ่านวิธีการเรียนรู้แบบถ่ายทอด (Transfer Learning) ซึ่งเป็นรูปแบบหนึ่งของการเรียนรู้เชิงลึก ผลการศึกษา: NoduleNet สามารถทำงานได้ดีโดยสมรรถนะจากความตรงภายใน (Internal validation) มีค่าความแม่นยำเท่ากับ 0.95 (0.94 - 0.96) ความไวเท่ากับ 0.84 (0.82 - 0.86) ความจำเพาะเท่ากับ 0.97 (0.97 - 0.98) และความตรงภายนอก (External validation) มีค่าความแม่นยำเท่ากับ 0.95 (0.87 - 1.00) ความไวเท่ากับ 0.91 (0.82 - 1.00) และความจำเพาะเท่ากับ 1.00 (1.00 - 1.00) โดยมี 3 ข้อมูลตัวอย่างจาก ChestRama เท่านั้นที่ทำนายคลาดเคลื่อนเป็นผลลบปลอม (False-negative) สรุป: NoduleNet ที่สร้างขึ้นโดยการเรียนรู้จากข้อมูลผู้ป่วยที่ไม่ใช่คนไทยสามารถขยายผลไปสู่ข้อมูลผู้ป่วยที่เป็นคนไทยได้ดี นอกจากนี้ยังสามารถพัฒนาต่อยอดในอนาคตด้วยการควบรวมเข้ากับอัลกอริธึมการตรวจจับแบบอัตโนมัติเพื่อค้นหาตำแหน่งก้อนเนื้อในปอดสำหรับการจำแนกชนิดของก้อนเนื้อในปอด
บทนำ: การจำแนกก้อนเนื้อ (Nodule) ในปอดได้อย่างแม่นยำตั้งแต่ระยะเริ่มต้นของโรคมะเร็งปอด สามารถช่วยให้แพทย์ตัดสินใจด้านการวางแผนการรักษาได้ดีขึ้น ที่ผ่านมามีการใช้การเรียนรู้เชิงลึกมาช่วยในการตรวจจับและจำแนกก้อนเนื้อในปอด แต่ยังขาดการนำมาประเมินความถูกต้องกับข้อมูลของคนไข้ไทย วัตถุประสงค์: เพื่อสร้างตัวแบบชื่อ NoduleNet ด้วยวิธีการเรียนรู้เชิงลึกสำหรับการจำแนกก้อนเนื้อในปอดและนำมาประเมินความถูกต้องกับข้อมูลคนไข้ไทย วิธีการศึกษา: ข้อมูลชุดแรก (LUNA16) ซึ่งเป็นข้อมูลสาธารณะถูกนำมาใช้สอนตัวแบบด้วยการเรียนรู้เชิงลึก ส่วนข้อมูลชุดที่สอง (ChestRama) ถูกนำมาใช้เพื่อการประเมินความถูกต้องของตัวแบบที่สร้างจากตัวแบบที่เคยผ่านการเรียนรู้มาก่อน (VGG16 และ VGG19) ผ่านวิธีการเรียนรู้แบบถ่ายทอด (Transfer Learning) ซึ่งเป็นรูปแบบหนึ่งของการเรียนรู้เชิงลึก ผลการศึกษา: NoduleNet สามารถทำงานได้ดีโดยสมรรถนะจากความตรงภายใน (Internal validation) มีค่าความแม่นยำเท่ากับ 0.95 (0.94 - 0.96) ความไวเท่ากับ 0.84 (0.82 - 0.86) ความจำเพาะเท่ากับ 0.97 (0.97 - 0.98) และความตรงภายนอก (External validation) มีค่าความแม่นยำเท่ากับ 0.95 (0.87 - 1.00) ความไวเท่ากับ 0.91 (0.82 - 1.00) และความจำเพาะเท่ากับ 1.00 (1.00 - 1.00) โดยมี 3 ข้อมูลตัวอย่างจาก ChestRama เท่านั้นที่ทำนายคลาดเคลื่อนเป็นผลลบปลอม (False-negative) สรุป: NoduleNet ที่สร้างขึ้นโดยการเรียนรู้จากข้อมูลผู้ป่วยที่ไม่ใช่คนไทยสามารถขยายผลไปสู่ข้อมูลผู้ป่วยที่เป็นคนไทยได้ดี นอกจากนี้ยังสามารถพัฒนาต่อยอดในอนาคตด้วยการควบรวมเข้ากับอัลกอริธึมการตรวจจับแบบอัตโนมัติเพื่อค้นหาตำแหน่งก้อนเนื้อในปอดสำหรับการจำแนกชนิดของก้อนเนื้อในปอด