Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR
Issued Date
2023
Copyright Date
2016
Language
eng
File Type
application/pdf
No. of Pages/File Size
xii, 107 leaves : ill.
Access Rights
restricted access
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (Ph.D. (Mathematics))--Mahidol University, 2016
Suggested Citation
Ekawat Chaowicharat Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR. Thesis (Ph.D. (Mathematics))--Mahidol University, 2016. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/89762
Title
Direction Histogram : novel discriminative global feature for Thai offline handwritten OCR
Alternative Title(s)
ฮิสโทแกรมทิศทาง : การหาคุณลักษณะแบบแยกแยะทั่วทั้งภาพชนิดใหม่ สำหรับระบบรู้จำตัวอักขระลายมือเขียนภาษาไทย
Author(s)
Advisor(s)
Abstract
The image feature used for classification is a crucial part of an optical character recognition system. To achieve a high accuracy for offline handwritten character recognition, the feature should capture and emphasize the differences between different characters classes and ignore the differences among the various drawings of the same character class. In this research, we present a novel image feature called direction histogram (DH) and a feature extraction algorithm called bag of histogram (BoH). Unlike the traditional image feature, DH is a global feature that describes pixel density in every direction around each center, which tolerates stroke thickness and variation, and omits the stroke connectivity (if any). BoH is the algorithm to count the proportion of distinct DHs in an unseen image and generate a one-dimensional feature vector. This vector is compressed by PCA and is classified by a neural network. Fifty-two datasets, each containing 30 drawings of 80 Thai characters, are used for training our OCR system, and the original, thick, and distorted handwritten datasets are used for testing. The recognition system with our proposed DH and BoH feature extraction yielded higher recognition accuracy when compared to the popular convolutional neural network.
การหาคุณลักษณะของภาพเป็นส่วนสำคัญของการสร้างระบบรู้จำตัวอักขระให้มี ความแม่นยำ คุณลักษณะของภาพที่ได้จะต้องแยกแยะความแตกต่างระหว่างตัวอักขระที่ต่างกันได้ แต่ต้องประนีประนอมต่อความผิดเพี้ยนที่ทำให้รูปร่างของตัวอักขระเดียวกันมีความแตกต่างกัน งานวิจัยนี้ได้นำเสนอคุณลักษณะของภาพที่ชื่อว่า Direction histogram (DH) และ ระเบียวิธีหาคุณลักณะของภาพที่เรียกว่า Bag of histogram (BoH) หลักการออกแบบ DH ใช้ความหนาแน่นของจุดภาพในแต่ละทิศทางรอบจุดศูนย์กลางและตำแหน่งมาสร้างเป็นเวกเตอร์ ค่าของ DH มีคุณสมบัติไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อเปลี่ยนความหนาของเส้นที่ใช้เขียน เมื่อเกิดความบิดเบี้ยวของภาพตัวอักขระ และเมื่อเกิดการเชื่อมกันของจุดภาพ ส่วน BoH เป็นการสร้างเวกเตอร์ที่เป็นตัวแทนของภาพโดยใช้การนับ DH ที่ปรากฎซ้ำๆ กันในภาพหนี่งๆ เวกเตอร์ที่ได้จะนำบีบอัดด้วย PCA และนำเข้าสู่ขั้นตอนการแยกแยะด้วย Neural Network ในการทดสอบได้ใช้ลายมือของกลุ่มตัวอย่างจำนวน 52 คน โดยเขียนชุดตัวอักขระภาษาไทยทั้ง 80 ตัว จำนวน 50 ครั้ง โดย 30 ครั้งแรกเพื่อเป็นข้อมูลที่ใช้ฝึกฝน Neural Network ละอีก 20 ครั้งที่เหลือเป็นลายมือสำหรับทดสอบระบบ ลายมือนี้ยังถูกทำให้หนาขึ้นและบิดเบี้ยวเพื่อใช้สำหรับทดสอบความสามารถในการรับมือความผันแปรของลายมือ ผลการทดสอบพบว่าระบบรู้จำตัวอักขระที่ใช้เวกเตอร์จาก BoH ให้ความแม่นยำสูงว่าระบบที่สร้างจาก Convolutional neural netorks
การหาคุณลักษณะของภาพเป็นส่วนสำคัญของการสร้างระบบรู้จำตัวอักขระให้มี ความแม่นยำ คุณลักษณะของภาพที่ได้จะต้องแยกแยะความแตกต่างระหว่างตัวอักขระที่ต่างกันได้ แต่ต้องประนีประนอมต่อความผิดเพี้ยนที่ทำให้รูปร่างของตัวอักขระเดียวกันมีความแตกต่างกัน งานวิจัยนี้ได้นำเสนอคุณลักษณะของภาพที่ชื่อว่า Direction histogram (DH) และ ระเบียวิธีหาคุณลักณะของภาพที่เรียกว่า Bag of histogram (BoH) หลักการออกแบบ DH ใช้ความหนาแน่นของจุดภาพในแต่ละทิศทางรอบจุดศูนย์กลางและตำแหน่งมาสร้างเป็นเวกเตอร์ ค่าของ DH มีคุณสมบัติไม่เปลี่ยนแปลงอย่างมีนัยสำคัญเมื่อเปลี่ยนความหนาของเส้นที่ใช้เขียน เมื่อเกิดความบิดเบี้ยวของภาพตัวอักขระ และเมื่อเกิดการเชื่อมกันของจุดภาพ ส่วน BoH เป็นการสร้างเวกเตอร์ที่เป็นตัวแทนของภาพโดยใช้การนับ DH ที่ปรากฎซ้ำๆ กันในภาพหนี่งๆ เวกเตอร์ที่ได้จะนำบีบอัดด้วย PCA และนำเข้าสู่ขั้นตอนการแยกแยะด้วย Neural Network ในการทดสอบได้ใช้ลายมือของกลุ่มตัวอย่างจำนวน 52 คน โดยเขียนชุดตัวอักขระภาษาไทยทั้ง 80 ตัว จำนวน 50 ครั้ง โดย 30 ครั้งแรกเพื่อเป็นข้อมูลที่ใช้ฝึกฝน Neural Network ละอีก 20 ครั้งที่เหลือเป็นลายมือสำหรับทดสอบระบบ ลายมือนี้ยังถูกทำให้หนาขึ้นและบิดเบี้ยวเพื่อใช้สำหรับทดสอบความสามารถในการรับมือความผันแปรของลายมือ ผลการทดสอบพบว่าระบบรู้จำตัวอักขระที่ใช้เวกเตอร์จาก BoH ให้ความแม่นยำสูงว่าระบบที่สร้างจาก Convolutional neural netorks
Degree Name
Doctor of Philosophy
Degree Level
Doctoral Degree
Degree Department
Faculty of Science
Degree Discipline
Mathematics
Degree Grantor(s)
Mahidol University