A data-masking guideline for optimizing insights and privacy under GDPR compliance
Issued Date
2024
Copyright Date
2020
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
ix, 56 leaves : ill.
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2020
Suggested Citation
Chitanut Tachepun A data-masking guideline for optimizing insights and privacy under GDPR compliance. Thesis (M.Sc. (Information Technology Management))--Mahidol University, 2020. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/92106
Title
A data-masking guideline for optimizing insights and privacy under GDPR compliance
Alternative Title(s)
วิธีการปิดบังข้อมูลเพื่อการดุลระหว่างข้อมูลเชิงลึกและความเป็นส่วนตัวภายใต้การปฏิบัติตามกฎหมาย GDPR
Author(s)
Abstract
After the General Data Protection Regulation (GDPR) has been enforced it became a disruptive issue to every organization due to its severe penalties. So the protecting data is important to every organization. The data Pseudonymization and Anonymization are some of the employed techniques to protect and reduce the privacy risks from the data breach as described in Article 32. However, those techniques destroy the pattern of the data, which represents the fact that it could be analyzed or monetized to gain useful insights by using data analytics or data science approaches. This thesis focuses on optimizing the criteria of methods choosing to gain the balancing the privacy and insights that the data could be useful for analyzing and also compliance with the GDPR. This thesis proposes the guideline consists of three techniques: Tokenization, Suppression, and Generalization to protect personal data by calculating risk scores from two methods: Data classification and Data uniqueness. The resulting criteria in the guideline are experimented to achieve the optimized classification performance in five protected open data compared with their original by using three data mining algorithms empowered by hyperparameter tuning. The results show that the protected data by the proposed guideline can protect adequate information and achieve insignificant classification performance when compared to the unprotected data.
กฎหมายคุ้มครองข้อมูลส่วนบุคคลของสหาพยุโรป (GDPR) มีผลบังคับใช้ตั้งแต่เดือนพฤษภาคม 2562 และกลายเป็นสิ่งที่ทำให้ทุกองค์กรต้องปรับตัวเนื่องจากมีบทลงโทษที่รุนแรงในการละเมิดข้อมูลหรือการใช้ข้อมูลส่วนบุคคลผิดจากวัตถุประสงค์ เช่น ขาดความยินยอมของหัวเรื่องข้อมูล ดังนั้นการทำ Data Masking จึงเป็นหนึ่งในเทคนิคที่ใช้ในการปกป้องและลดความเสี่ยงด้านความเป็นส่วนตัวจากการละเมิดข้อมูล แต่วิธีการดังกล่าวอาจจะทำลายรูปแบบของข้อมูลซึ่งเป็นเป็นข้อเท็จจริงที่สามารถวิเคราะห์เพื่อให้ได้ข้อมูลเชิงลึกที่เป็นประโยชน์โดยการวิเคราะห์ข้อมูล บทความนี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพความเป็นส่วนตัวและวิธีการวิเคราะห์ข้อมูลที่อาจเป็นประโยชน์สำหรับการวิเคราะห์และสอดคล้องกับ GDPR โดยเสนอแนวทางประกอบด้วยสามเทคนิคได้แก่ Tokenization, Suppression และ Generalization เพื่อปกป้องข้อมูลส่วนบุคคลโดยการคำนวณคะแนนความเสี่ยงจากสองวิธีได้แก่ การจำแนกข้อมูลและการหาความเป็นเอกลักษณ์ของข้อมูล เกณฑ์ของแนวทางถูกทดลองเพื่อให้ได้ประสิทธิภาพการจำแนกประเภทที่เหมาะสมที่สุดในข้อมูลที่ได้รับการป้องกันเปรียบเทียบกับข้อมูลสาธารณะที่ไม่มีการปกปิดห้ารายการโดยการวิเคราะห์ด้วยอัลกอริทึมการทำเหมืองข้อมูลสามวิธี ผลการศึกษาพบว่าข้อมูลที่ได้รับการป้องกันตามแนวทางที่เสนอ โดยผลการทดลองของข้อมูลที่ปิดบังไม่มีนัยสำคัญทางสถิติเมื่อเทียบกับข้อมูลที่ไม่มีการป้องกัน
กฎหมายคุ้มครองข้อมูลส่วนบุคคลของสหาพยุโรป (GDPR) มีผลบังคับใช้ตั้งแต่เดือนพฤษภาคม 2562 และกลายเป็นสิ่งที่ทำให้ทุกองค์กรต้องปรับตัวเนื่องจากมีบทลงโทษที่รุนแรงในการละเมิดข้อมูลหรือการใช้ข้อมูลส่วนบุคคลผิดจากวัตถุประสงค์ เช่น ขาดความยินยอมของหัวเรื่องข้อมูล ดังนั้นการทำ Data Masking จึงเป็นหนึ่งในเทคนิคที่ใช้ในการปกป้องและลดความเสี่ยงด้านความเป็นส่วนตัวจากการละเมิดข้อมูล แต่วิธีการดังกล่าวอาจจะทำลายรูปแบบของข้อมูลซึ่งเป็นเป็นข้อเท็จจริงที่สามารถวิเคราะห์เพื่อให้ได้ข้อมูลเชิงลึกที่เป็นประโยชน์โดยการวิเคราะห์ข้อมูล บทความนี้มุ่งเน้นไปที่การเพิ่มประสิทธิภาพความเป็นส่วนตัวและวิธีการวิเคราะห์ข้อมูลที่อาจเป็นประโยชน์สำหรับการวิเคราะห์และสอดคล้องกับ GDPR โดยเสนอแนวทางประกอบด้วยสามเทคนิคได้แก่ Tokenization, Suppression และ Generalization เพื่อปกป้องข้อมูลส่วนบุคคลโดยการคำนวณคะแนนความเสี่ยงจากสองวิธีได้แก่ การจำแนกข้อมูลและการหาความเป็นเอกลักษณ์ของข้อมูล เกณฑ์ของแนวทางถูกทดลองเพื่อให้ได้ประสิทธิภาพการจำแนกประเภทที่เหมาะสมที่สุดในข้อมูลที่ได้รับการป้องกันเปรียบเทียบกับข้อมูลสาธารณะที่ไม่มีการปกปิดห้ารายการโดยการวิเคราะห์ด้วยอัลกอริทึมการทำเหมืองข้อมูลสามวิธี ผลการศึกษาพบว่าข้อมูลที่ได้รับการป้องกันตามแนวทางที่เสนอ โดยผลการทดลองของข้อมูลที่ปิดบังไม่มีนัยสำคัญทางสถิติเมื่อเทียบกับข้อมูลที่ไม่มีการป้องกัน
Description
Information Technology Management (Mahidol University 2020)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Information Technology Management
Degree Grantor(s)
Mahidol University