Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR

dc.contributor.advisorKanlaya Naruedomkul
dc.contributor.advisorCercone, Nick
dc.contributor.advisorLalita Narupiyakul
dc.contributor.authorEkawat Chaowicharat
dc.date.accessioned2023-09-11T03:57:42Z
dc.date.available2023-09-11T03:57:42Z
dc.date.copyright2016
dc.date.created2016
dc.date.issued2023
dc.description.abstractThe image feature used for classification is a crucial part of an optical character recognition system. To achieve a high accuracy for offline handwritten character recognition, the feature should capture and emphasize the differences between different characters classes and ignore the differences among the various drawings of the same character class. In this research, we present a novel image feature called direction histogram (DH) and a feature extraction algorithm called bag of histogram (BoH). Unlike the traditional image feature, DH is a global feature that describes pixel density in every direction around each center, which tolerates stroke thickness and variation, and omits the stroke connectivity (if any). BoH is the algorithm to count the proportion of distinct DHs in an unseen image and generate a one-dimensional feature vector. This vector is compressed by PCA and is classified by a neural network. Fifty-two datasets, each containing 30 drawings of 80 Thai characters, are used for training our OCR system, and the original, thick, and distorted handwritten datasets are used for testing. The recognition system with our proposed DH and BoH feature extraction yielded higher recognition accuracy when compared to the popular convolutional neural network.
dc.description.abstractการหาคุณลักษณะของภาพเป็นส่วนสำคัญของการสร้างระบบรู้จำตัวอักขระให้มี ความแม่นยำ คุณลักษณะของภาพที่ได้จะต้องแยกแยะความแตกต่างระหว่างตัวอักขระที่ต่างกันได้ แต่ต้องประนีประนอมต่อความผิดเพี้ยนที่ทำให้รูปร่างของตัวอักขระเดียวกันมีความแตกต่างกัน งานวิจัยนี้ได้นำเสนอคุณลักษณะของภาพที่ชื่อว่า Direction histogram (DH) และ ระเบียวิธีหาคุณลักณะของภาพที่เรียกว่า Bag of histogram (BoH) หลักการออกแบบ DH ใช้ความหนาแน่นของจุดภาพในแต่ละทิศทางรอบจุดศูนย์กลางและตำแหน่งมาสร้างเป็นเวกเตอร์ ค่าของ DH มีคุณสมบัติไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อเปลี่ยนความหนาของเส้นที่ใช้เขียน เมื่อเกิดความบิดเบี้ยวของภาพตัวอักขระ และเมื่อเกิดการเชื่อมกันของจุดภาพ ส่วน BoH เป็นการสร้างเวกเตอร์ที่เป็นตัวแทนของภาพโดยใช้การนับ DH ที่ปรากฎซ้ำๆ กันในภาพหนี่งๆ เวกเตอร์ที่ได้จะนำบีบอัดด้วย PCA และนำเข้าสู่ขั้นตอนการแยกแยะด้วย Neural Network ในการทดสอบได้ใช้ลายมือของกลุ่มตัวอย่างจำนวน 52 คน โดยเขียนชุดตัวอักขระภาษาไทยทั้ง 80 ตัว จำนวน 50 ครั้ง โดย 30 ครั้งแรกเพื่อเป็นข้อมูลที่ใช้ฝึกฝน Neural Network ละอีก 20 ครั้งที่เหลือเป็นลายมือสำหรับทดสอบระบบ ลายมือนี้ยังถูกทำให้หนาขึ้นและบิดเบี้ยวเพื่อใช้สำหรับทดสอบความสามารถในการรับมือความผันแปรของลายมือ ผลการทดสอบพบว่าระบบรู้จำตัวอักขระที่ใช้เวกเตอร์จาก BoH ให้ความแม่นยำสูงว่าระบบที่สร้างจาก Convolutional neural netorks
dc.format.extentxii, 107 leaves : ill.
dc.format.mimetypeapplication/pdf
dc.identifier.citationThesis (Ph.D. (Mathematics))--Mahidol University, 2016
dc.identifier.urihttps://repository.li.mahidol.ac.th/handle/20.500.14594/89762
dc.language.isoeng
dc.publisherMahidol University. Mahidol University Library and Knowledge Center
dc.rights.holderMahidol University
dc.subjectImage processing -- Digital techniques
dc.subjectOptical character recognition
dc.subjectText processing (Computer science)
dc.titleDirection Histogram : novel discriminative global feature for Thai offline handwritten OCR
dc.title.alternativeฮิสโทแกรมทิศทาง : การหาคุณลักษณะแบบแยกแยะทั่วทั้งภาพชนิดใหม่ สำหรับระบบรู้จำตัวอักขระลายมือเขียนภาษาไทย
dcterms.accessRightsrestricted access
mu.link.internalLinkhttp://mulinet11.li.mahidol.ac.th/e-thesis/2558/508/5237083.pdf
thesis.degree.departmentFaculty of Science
thesis.degree.disciplineMathematics
thesis.degree.grantorMahidol University
thesis.degree.levelDoctoral Degree
thesis.degree.nameDoctor of Philosophy

Files

Collections