Handwritten recognition system for pali cards of Buddhadasa Indapanno
Issued Date
2013
Copyright Date
2013
Resource Type
Language
eng
File Type
application/pdf
No. of Pages/File Size
xiv, 119 leaves : ill. (some col.)
Access Rights
open access
Rights
ผลงานนี้เป็นลิขสิทธิ์ของมหาวิทยาลัยมหิดล ขอสงวนไว้สำหรับเพื่อการศึกษาเท่านั้น ต้องอ้างอิงแหล่งที่มา ห้ามดัดแปลงเนื้อหา และห้ามนำไปใช้เพื่อการค้า
Rights Holder(s)
Mahidol University
Bibliographic Citation
Thesis (M.Sc. (Technology of Information System Management))--Mahidol University, 2013
Suggested Citation
Wanwisa Chevakulmongkol Handwritten recognition system for pali cards of Buddhadasa Indapanno. Thesis (M.Sc. (Technology of Information System Management))--Mahidol University, 2013. Retrieved from: https://repository.li.mahidol.ac.th/handle/20.500.14594/95179
Title
Handwritten recognition system for pali cards of Buddhadasa Indapanno
Alternative Title(s)
ระบบรู้จำลายมือเขียนสำหรับบัตรบาลีของท่านพุทธทาส อินทปัญโญ
Author(s)
Abstract
The Dhamma principles of Buddhadasa Indapanno are highly valuable. In order to preserve and propagate these principles, the Buddhadasa Indapanno's handwritten images are kept in digital image file format. However, searching from image files is difficult. Hence, optical character recognition is one method to search these files easily. This research proposes a handwriting recognition system for the files of Buddhadasa Indapanno. One hundred and forty-eight handwritten Pali cards were used in this study. This system consists of four main processes which are preprocessing, character segmentation, feature extraction, and character recognition. In pre-processing, the contrast of the images was automatically adjusted. Then these images were converted to gray scale images. Median filtering was used to remove noise in binary images. Connected Component Labeling and Projection Profile were applied for character segmentation. The zoning method was used to extract the features of single characters. Finally, a feed-forward backpropagation neural network was used to recognize the characters. There were 34,020 characters used for testing. The accuracy of character recognition was satisfactory. Moreover, this system can be applied to other similar handwritten images.
หลักธรรมคำสอน ของท่านพุทธทาส อินทปัญโญ ล้วนแต่เป็น ผลงานอันทรงคุณค่า เพื่อเก็บรักษาคำสอนเหล่านี้ให้คงอยู่ เอกสารลายมือของท่านพุทธทาส อินทปัญโญ จึงถูกเก็บอยู่ใน รูปแบบของ เอกสารเชิงภาพดิจิตอล แต่ถึงอย่างไรก็ตาม การค้นหาข้อความจากเอกสารเชิงภาพนั้น ทำได้ยาก ดังนั้น ระบบรู้จำตัวอักษรลายมือเขียนจึงเป็นวิธีการที่ดีในการเก็บรักษาเอกสารเหล่านี้ ใน งานวิจัยนี้จึงได้นำเสนอระบบรู้จำลายมือเขียน ของท่านพุทธทาส อินทปัญโญขึ้น ภาพลายมือที่ นำมาใช้ในการศึกษาเบื้องต้นนี้เป็นภาพตัวอักษรลายมือที่อยู่ในหมวดของบัตรบาลี มีจำนวนทั้งสิ้น 148 ภาพ โดยระบบรู้จำตัวอักษรลายมือนี้ ประกอบด้วย 4กระบวนการหลัก คือ กระบวนการ ประมวลผลภาพเบื้องต้น กระบวนการตัดตัวอักษร กระบวนการสกัดคุณลักษณะของตัวอักษร และ กระบวนการรู้จำตัวอักษร ในกระบวนการประมวลผลภาพเบื้องต้น จะทำการปรับคอนทราสของภาพแบบ อัตโนมัติ หลังจากนั้นภาพเหล่านี้จะถูกแปลงไปเป็นภาพระดับเทา และใช้ตัวกรองมัธยฐาน(Median filter) ในการกำจัดสัญญาณรบกวนที่เกิดขึ้นบนภาพขาว-ดำ ส่วนเทคนิคการเชื่อมต่อของ องค์ประกอบ (Connected Component Labeling) และ การทำโปรเจคชั่น (Projection Profile) ได้ถูก นำมาประยุกต์ใช้ในกระบวนการตัดแยกตัวอักษร และทำการสกัดคุณลักษณะพิเศษของตัวอักษร โดยใช้วิธีการแบ่งโซน โดยโครงข่ายประสาทแบบไปข้างหน้าและย้อนกลับได้ถูกนำมาใช้ใน กระบวนการรู้จำตัวอักษร ซึ่งชุดข้อมูลตัวอักษรที่นำมาใช้ในการทดสอบ มีจำนวนทั้งสิ้น 34,020 ตัวอักษร โดยผลความถูกต้องของระบบในการรู้จำตัวอักษรนี้เป็นที่น่าพอใจ และนอกจากนี้ ระบบนี้ ยังสามารถนำไปประยุกต์ใช้กับภาพที่มีลักษณะใกล้เคียงกันได้
หลักธรรมคำสอน ของท่านพุทธทาส อินทปัญโญ ล้วนแต่เป็น ผลงานอันทรงคุณค่า เพื่อเก็บรักษาคำสอนเหล่านี้ให้คงอยู่ เอกสารลายมือของท่านพุทธทาส อินทปัญโญ จึงถูกเก็บอยู่ใน รูปแบบของ เอกสารเชิงภาพดิจิตอล แต่ถึงอย่างไรก็ตาม การค้นหาข้อความจากเอกสารเชิงภาพนั้น ทำได้ยาก ดังนั้น ระบบรู้จำตัวอักษรลายมือเขียนจึงเป็นวิธีการที่ดีในการเก็บรักษาเอกสารเหล่านี้ ใน งานวิจัยนี้จึงได้นำเสนอระบบรู้จำลายมือเขียน ของท่านพุทธทาส อินทปัญโญขึ้น ภาพลายมือที่ นำมาใช้ในการศึกษาเบื้องต้นนี้เป็นภาพตัวอักษรลายมือที่อยู่ในหมวดของบัตรบาลี มีจำนวนทั้งสิ้น 148 ภาพ โดยระบบรู้จำตัวอักษรลายมือนี้ ประกอบด้วย 4กระบวนการหลัก คือ กระบวนการ ประมวลผลภาพเบื้องต้น กระบวนการตัดตัวอักษร กระบวนการสกัดคุณลักษณะของตัวอักษร และ กระบวนการรู้จำตัวอักษร ในกระบวนการประมวลผลภาพเบื้องต้น จะทำการปรับคอนทราสของภาพแบบ อัตโนมัติ หลังจากนั้นภาพเหล่านี้จะถูกแปลงไปเป็นภาพระดับเทา และใช้ตัวกรองมัธยฐาน(Median filter) ในการกำจัดสัญญาณรบกวนที่เกิดขึ้นบนภาพขาว-ดำ ส่วนเทคนิคการเชื่อมต่อของ องค์ประกอบ (Connected Component Labeling) และ การทำโปรเจคชั่น (Projection Profile) ได้ถูก นำมาประยุกต์ใช้ในกระบวนการตัดแยกตัวอักษร และทำการสกัดคุณลักษณะพิเศษของตัวอักษร โดยใช้วิธีการแบ่งโซน โดยโครงข่ายประสาทแบบไปข้างหน้าและย้อนกลับได้ถูกนำมาใช้ใน กระบวนการรู้จำตัวอักษร ซึ่งชุดข้อมูลตัวอักษรที่นำมาใช้ในการทดสอบ มีจำนวนทั้งสิ้น 34,020 ตัวอักษร โดยผลความถูกต้องของระบบในการรู้จำตัวอักษรนี้เป็นที่น่าพอใจ และนอกจากนี้ ระบบนี้ ยังสามารถนำไปประยุกต์ใช้กับภาพที่มีลักษณะใกล้เคียงกันได้
Description
Technology of Information System Management (Mahidol University 2013)
Degree Name
Master of Science
Degree Level
Master's degree
Degree Department
Faculty of Engineering
Degree Discipline
Technology of Information System Management
Degree Grantor(s)
Mahidol University