Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR
dc.contributor.advisor | Kanlaya Naruedomkul | |
dc.contributor.advisor | Cercone, Nick | |
dc.contributor.advisor | Lalita Narupiyakul | |
dc.contributor.author | Ekawat Chaowicharat | |
dc.date.accessioned | 2023-09-11T03:57:42Z | |
dc.date.available | 2023-09-11T03:57:42Z | |
dc.date.copyright | 2016 | |
dc.date.created | 2016 | |
dc.date.issued | 2023 | |
dc.description.abstract | The image feature used for classification is a crucial part of an optical character recognition system. To achieve a high accuracy for offline handwritten character recognition, the feature should capture and emphasize the differences between different characters classes and ignore the differences among the various drawings of the same character class. In this research, we present a novel image feature called direction histogram (DH) and a feature extraction algorithm called bag of histogram (BoH). Unlike the traditional image feature, DH is a global feature that describes pixel density in every direction around each center, which tolerates stroke thickness and variation, and omits the stroke connectivity (if any). BoH is the algorithm to count the proportion of distinct DHs in an unseen image and generate a one-dimensional feature vector. This vector is compressed by PCA and is classified by a neural network. Fifty-two datasets, each containing 30 drawings of 80 Thai characters, are used for training our OCR system, and the original, thick, and distorted handwritten datasets are used for testing. The recognition system with our proposed DH and BoH feature extraction yielded higher recognition accuracy when compared to the popular convolutional neural network. | |
dc.description.abstract | การหาคุณลักษณะของภาพเป็นส่วนสำคัญของการสร้างระบบรู้จำตัวอักขระให้มี ความแม่นยำ คุณลักษณะของภาพที่ได้จะต้องแยกแยะความแตกต่างระหว่างตัวอักขระที่ต่างกันได้ แต่ต้องประนีประนอมต่อความผิดเพี้ยนที่ทำให้รูปร่างของตัวอักขระเดียวกันมีความแตกต่างกัน งานวิจัยนี้ได้นำเสนอคุณลักษณะของภาพที่ชื่อว่า Direction histogram (DH) และ ระเบียวิธีหาคุณลักณะของภาพที่เรียกว่า Bag of histogram (BoH) หลักการออกแบบ DH ใช้ความหนาแน่นของจุดภาพในแต่ละทิศทางรอบจุดศูนย์กลางและตำแหน่งมาสร้างเป็นเวกเตอร์ ค่าของ DH มีคุณสมบัติไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อเปลี่ยนความหนาของเส้นที่ใช้เขียน เมื่อเกิดความบิดเบี้ยวของภาพตัวอักขระ และเมื่อเกิดการเชื่อมกันของจุดภาพ ส่วน BoH เป็นการสร้างเวกเตอร์ที่เป็นตัวแทนของภาพโดยใช้การนับ DH ที่ปรากฎซ้ำๆ กันในภาพหนี่งๆ เวกเตอร์ที่ได้จะนำบีบอัดด้วย PCA และนำเข้าสู่ขั้นตอนการแยกแยะด้วย Neural Network ในการทดสอบได้ใช้ลายมือของกลุ่มตัวอย่างจำนวน 52 คน โดยเขียนชุดตัวอักขระภาษาไทยทั้ง 80 ตัว จำนวน 50 ครั้ง โดย 30 ครั้งแรกเพื่อเป็นข้อมูลที่ใช้ฝึกฝน Neural Network ละอีก 20 ครั้งที่เหลือเป็นลายมือสำหรับทดสอบระบบ ลายมือนี้ยังถูกทำให้หนาขึ้นและบิดเบี้ยวเพื่อใช้สำหรับทดสอบความสามารถในการรับมือความผันแปรของลายมือ ผลการทดสอบพบว่าระบบรู้จำตัวอักขระที่ใช้เวกเตอร์จาก BoH ให้ความแม่นยำสูงว่าระบบที่สร้างจาก Convolutional neural netorks | |
dc.format.extent | xii, 107 leaves : ill. | |
dc.format.mimetype | application/pdf | |
dc.identifier.citation | Thesis (Ph.D. (Mathematics))--Mahidol University, 2016 | |
dc.identifier.uri | https://repository.li.mahidol.ac.th/handle/20.500.14594/89762 | |
dc.language.iso | eng | |
dc.publisher | Mahidol University. Mahidol University Library and Knowledge Center | |
dc.rights.holder | Mahidol University | |
dc.subject | Image processing -- Digital techniques | |
dc.subject | Optical character recognition | |
dc.subject | Text processing (Computer science) | |
dc.title | Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR | |
dc.title.alternative | ฮิสโทแกรมทิศทาง : การหาคุณลักษณะแบบแยกแยะทั่วทั้งภาพชนิดใหม่ สำหรับระบบรู้จำตัวอักขระลายมือเขียนภาษาไทย | |
dcterms.accessRights | restricted access | |
mu.link.internalLink | http://mulinet11.li.mahidol.ac.th/e-thesis/2558/508/5237083.pdf | |
thesis.degree.department | Faculty of Science | |
thesis.degree.discipline | Mathematics | |
thesis.degree.grantor | Mahidol University | |
thesis.degree.level | Doctoral Degree | |
thesis.degree.name | Doctor of Philosophy |