การรู้จำตัวอักษรพิมพ์ไทยโดยการใช้วิธีคอนดิชั่นนัลแรนดอมฟิลด์สและระยะเซนทรอยด์แบบลำดับชั้น
Files
Publisher
Issued Date
2013
Available Date
Copyright Date
Resource Type
Series
Edition
Language
tha
File Type
application/pdf
No. of Pages/File Size
94 แผ่น
ISBN
ISSN
eISSN
DOI
Other identifier(s)
b184401
Identifier(s)
Access Rights
Access Status
Rights
ผลงานนี้เผยแพร่ภายใต้ สัญญาอนุญาตครีเอทีฟคอมมอนส์แบบ แสดงที่มา-ไม่ใช้เพื่อการค้า-ไม่ดัดแปลง 4.0 (CC BY-NC-ND 4.0)
Rights Holder(s)
Physical Location
สถาบันบัณฑิตพัฒนบริหารศาสตร์. สำนักบรรณสารการพัฒนา
Bibliographic Citation
Citation
อุษนีย์ สังฆธรรม (2013). การรู้จำตัวอักษรพิมพ์ไทยโดยการใช้วิธีคอนดิชั่นนัลแรนดอมฟิลด์สและระยะเซนทรอยด์แบบลำดับชั้น. Retrieved from: http://repository.nida.ac.th/handle/662723737/3056.
Title
การรู้จำตัวอักษรพิมพ์ไทยโดยการใช้วิธีคอนดิชั่นนัลแรนดอมฟิลด์สและระยะเซนทรอยด์แบบลำดับชั้น
Alternative Title(s)
Printed Thai character recognition using conditional random fields and hierarchical centroid distance
Author(s)
Editor(s)
Advisor(s)
Advisor's email
Contributor(s)
Contributor(s)
Abstract
การรู้จำตัวอักษรพิมพ์ไทย เพื่อระบุรูปภาพตัวอักษรว่าเป็นตัวอักษรใด โดยการใช้วิธีคอนดิชั่นนัลแรนดอมฟิลด์สและระยะเซนทรอยด์แบบลำดับชั้น โดยขั้นตอนการดำเนินการนั้นจะประกอบไปด้วยการสกัดคุณลักษณะเด่นและการจำแนกตัวอักษร สาหรับการสกัดคุณลักษณะเด่นนั้น โดยการกระจายทิศทางสาหรับรูปภาพของตัวอักษร เพื่อทำการวิเคราะห์สาหรับคุณลักษณะของตัวอักษรสาหรับฟอนต์ที่แตกต่างกัน ถัดจากนั้น จะเป็นขั้นตอนการจำแนกว่าเป็ นตัวอักษรชนิดใด ซึ่งจะใช้ 2 วิธีด้วยกัน สำหรับวิธีการแรก คือ การใช้วิธีคอนดิชั่นนัลแรนดอมฟิ ลด์ส เพื่อทำการเลือกคุณสมบัติ ที่ใช้ในการจำแนกตัวอักษรภายในแต่ละกลุ่มของชุดข้อมูล เมื่อกลุ่มข้อมูลที่ได้จากการทำนายจากชุดฝึกฝนแล้ว ต่อไปจะทำการจำแนกว่าข้อมูลจากการทดสอบนั้น มีความคล้ายคลึงกันมากที่สุดกับข้อมูลที่ได้จากการทำนายจากชุดฝึกฝน โดยจะใช้วิธีการ ซึ่งเรียกว่า ระยะเซนทรอยด์แบบลำดับชั้น เพื่อทำการเปรียบเทียบข้อมูลทดสอบกับข้อมูลที่ได้จากการทำนายของแต่ละชุดข้อมูลฝึกฝนจากวิธีแรก โดยวัดจากค่าระยะเซนทรอยด์แบบลา ดับชั้นที่มีค่าใกล้เคียงกันมากที่สุด โดยงานวิจัยนี้มีจำนวนตัวอักษรที่นำมาเป็นข้อมูลชุดฝึ กฝน จา นวน 80,960 ตัวอักษร และจำนวนตัวอักษรที่นำมาทดสอบจำนวน 1,227 ตัวอักษร ซึ่งสามารถรู้จำตัวอักษรได้ 1,190 ซึ่งความถูกต้องคิดเป็น 96.96 %
Table of contents
Description
วิทยานิพนธ์ (วท.ม.((สถิติประยุกต์และเทคโนโลยีสารสนเทศ))--สถาบันบัณฑิตพัฒนบริหารศาสตร์, 2556.