Performance analysis of darknet content clustering
| dc.contributor.advisor | Noppadol Wanichworanant | |
| dc.contributor.advisor | Tanasanee Phienthrakul | |
| dc.contributor.advisor | Mingmanas Sivaraksa | |
| dc.contributor.author | Patipon Tapaneeyakul | |
| dc.date.accessioned | 2026-01-08T09:41:14Z | |
| dc.date.available | 2026-01-08T09:41:14Z | |
| dc.date.copyright | 2022 | |
| dc.date.created | 2026 | |
| dc.date.issued | 2022 | |
| dc.description.abstract | This research demonstrates a performance analysis of the darknet content clustering. For darknet clustering, Latent Dirichlet Allocation (LDA), Latent Semantic Analysis (LSA), and K-means clustering were used as a set of natural language processing methods. Five services, which are a darknet spider service, a crawler service, a data preprocessing service, a data processor service, and a clustering service, were developed for our darknet clustering system. To verify clustering accuracy, darknet data were labeled then collected and clustered using Latent Dirichlet-allocation (LDA), Latent-semantic analysis (LSA), and K-mean clustering, respectively. Finally, the findings indicate that K-means clustering has been the most effective method for clustering darknet content. According to our experiments, the accuracy of the K-means clustering approach was 85.81 percent, the highest of the three methods. | |
| dc.description.abstract | งานวิจัยชิ้นนี้นำเสนอการวิเคราะห์ประสิทธิภาพการจัดหมวดหมู่เนื้อหาของเว็บไซต์ในดาร์กเน็ต โดยใช้ขั้นตอนวิธีการประมวลผลภาษาธรรมชาติ Latent Dirichlet Allocation (LDA), Latent Semantic Analysis (LSA) และ K-means Clustering ในการจำแนกหมวดหมู่ในดาร์กเน็ต ระบบจัดหมวดหมู่ในดาร์กเน็ตที่เราได้พัฒนาขึ้น มีส่วนทำงานให้บริการ 5 ส่วน ประกอบด้วย ส่วนการค้นหาเว็บไซต์ในดาร์กเน็ต, ส่วนการสกัดข้อมูลบนเว็บไซต์, ส่วนการเตรียมข้อมูล, ส่วนการประมวลผลข้อมูล, และส่วนการจัดหมวดหมู่ เพื่อตรวจสอบความถูกต้องของการจัดหมวดหมู่ ข้อมูลในดาร์กเน็ตได้ถูกทำป้ายกำกับก่อน แล้วนำไปจำแนกหมวดหมู่ โดยใช้ขั้นตอนวิธี Latent Dirichlet-allocation (LDA), Latent Semantic Analysis (LSA), และ K-means Clustering ผลการวิจัยพบว่าวิธีการจัดหมวดหมู่ด้วย K-means นั้นมีประสิทธิภาพดีที่สุดสำหรับการจัดหมวดหมู่เนื้อหาในดาร์กเน็ต จากการทดลองของเรา วิธีการจัดหมวดหมู่ด้วย K-means ได้ค่าความแม่นยำเฉลี่ยสูงที่สุดของทั้ง 3 ขั้นตอนวิธี อยู่ที่ 85.81 | |
| dc.format.extent | x, 79 leaves : ill. | |
| dc.format.mimetype | application/pdf | |
| dc.identifier.citation | Thesis (M.Eng. (Computer Engineering))--Mahidol University, 2022) | |
| dc.identifier.uri | https://repository.li.mahidol.ac.th/handle/123456789/113948 | |
| dc.language.iso | eng | |
| dc.publisher | Mahidol University. Mahidol University Library and Knowledge Center | |
| dc.rights | ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า | |
| dc.rights.holder | Mahidol University | |
| dc.subject | Dark Web -- Research | |
| dc.subject | Data mining -- Mathematical models | |
| dc.subject | Cluster analysis -- Automation | |
| dc.subject | Natural language processing (Computer science) | |
| dc.title | Performance analysis of darknet content clustering | |
| dc.title.alternative | การวิเคราะห์ประสิทธิภาพการจัดหมวดหมู่ของดาร์กเน็ต | |
| dc.type | Master Thesis | |
| dcterms.accessRights | open access | |
| thesis.degree.department | Faculty of Engineering | |
| thesis.degree.discipline | Computer Engineering | |
| thesis.degree.grantor | Mahidol University | |
| thesis.degree.level | Master's degree | |
| thesis.degree.name | Master of Engineering |
