A data-masking guideline for optimizing insights and privacy under GDPR compliance

dc.contributor.advisorSotarat Thammaboosadee
dc.contributor.advisorTaweesak Samanchuen
dc.contributor.advisorChanattha Chansutthirangkool
dc.contributor.authorChitanut Tachepun
dc.date.accessioned2024-01-10T01:27:09Z
dc.date.available2024-01-10T01:27:09Z
dc.date.copyright2020
dc.date.created2020
dc.date.issued2024
dc.descriptionInformation Technology Management (Mahidol University 2020)
dc.description.abstractAfter the General Data Protection Regulation (GDPR) has been enforced it became a disruptive issue to every organization due to its severe penalties. So the protecting data is important to every organization. The data Pseudonymization and Anonymization are some of the employed techniques to protect and reduce the privacy risks from the data breach as described in Article 32. However, those techniques destroy the pattern of the data, which represents the fact that it could be analyzed or monetized to gain useful insights by using data analytics or data science approaches. This thesis focuses on optimizing the criteria of methods choosing to gain the balancing the privacy and insights that the data could be useful for analyzing and also compliance with the GDPR. This thesis proposes the guideline consists of three techniques: Tokenization, Suppression, and Generalization to protect personal data by calculating risk scores from two methods: Data classification and Data uniqueness. The resulting criteria in the guideline are experimented to achieve the optimized classification performance in five protected open data compared with their original by using three data mining algorithms empowered by hyperparameter tuning. The results show that the protected data by the proposed guideline can protect adequate information and achieve insignificant classification performance when compared to the unprotected data.
dc.description.abstractกฎหมายคุ้มครองข้อมูลส่วนบุคคลของสหาพยุโรป (GDPR) มีผลบังคับใช้ตั้งแต่เดือนพฤษภาคม 2562 และกลายเป็นสิ่งที่ทำให้ทุกองค์กรต้องปรับตัวเนื่องจากมีบทลงโทษที่รุนแรงในการละเมิดข้อมูลหรือการใช้ข้อมูลส่วนบุคคลผิดจากวัตถุประสงค์ เช่น ขาดความยินยอมของหัวเรื่องข้อมูล ดังนั้นการทำ Data Masking จึงเป็นหนึ่งในเทคนิคที่ใช้ในการปกป้องและลดความเสี่ยงด้านความเป็นส่วนตัวจากการละเมิดข้อมูล แต่วิธีการดังกล่าวอาจจะทำลายรูปแบบของข้อมูลซึ่งเป็นเป็นข้อเท็จจริงที่สามารถวิเคราะห์เพื่อให้ได้ข้อมูลเชิงลึกที่เป็นประโยชน์โดยการวิเคราะห์ข้อมูล บทความนี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพความเป็นส่วนตัวและวิธีการวิเคราะห์ข้อมูลที่อาจเป็นประโยชน์สำหรับการวิเคราะห์และสอดคล้องกับ GDPR โดยเสนอแนวทางประกอบด้วยสามเทคนิคได้แก่ Tokenization, Suppression และ Generalization เพื่อปกป้องข้อมูลส่วนบุคคลโดยการคำนวณคะแนนความเสี่ยงจากสองวิธีได้แก่ การจำแนกข้อมูลและการหาความเป็นเอกลักษณ์ของข้อมูล เกณฑ์ของแนวทางถูกทดลองเพื่อให้ได้ประสิทธิภาพการจำแนกประเภทที่เหมาะสมที่สุดในข้อมูลที่ได้รับการป้องกันเปรียบเทียบกับข้อมูลสาธารณะที่ไม่มีการปกปิดห้ารายการโดยการวิเคราะห์ด้วยอัลกอริทึมการทำเหมืองข้อมูลสามวิธี ผลการศึกษาพบว่าข้อมูลที่ได้รับการป้องกันตามแนวทางที่เสนอ โดยผลการทดลองของข้อมูลที่ปิดบังไม่มีนัยสำคัญทางสถิติเมื่อเทียบกับข้อมูลที่ไม่มีการป้องกัน
dc.format.extentix, 56 leaves : ill.
dc.format.mimetypeapplication/pdf
dc.identifier.citationThesis (M.Sc. (Information Technology Management))--Mahidol University, 2020
dc.identifier.urihttps://repository.li.mahidol.ac.th/handle/20.500.14594/92106
dc.language.isoeng
dc.publisherMahidol University. Mahidol University Library and Knowledge Center
dc.rightsผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
dc.rights.holderMahidol University
dc.subjectData protection -- Law and legislation -- European Union countries
dc.subjectData protection
dc.subjectPrivacy, Right of -- European Union countries
dc.titleA data-masking guideline for optimizing insights and privacy under GDPR compliance
dc.title.alternativeวิธีการปิดบังข้อมูลเพื่อการดุลระหว่างข้อมูลเชิงลึกและความเป็นส่วนตัวภายใต้การปฏิบัติตามกฎหมาย GDPR
dc.typeMaster Thesis
dcterms.accessRightsopen access
mods.location.urlhttp://mulinet11.li.mahidol.ac.th/e-thesis/2562/558/6037554.pdf
thesis.degree.departmentFaculty of Engineering
thesis.degree.disciplineInformation Technology Management
thesis.degree.grantorMahidol University
thesis.degree.levelMaster's degree
thesis.degree.nameMaster of Science

Files