OCR ทำงานอย่างไร อธิบายในวิธีที่ง่ายและเข้าใจได้
ในบทความนี้เราจะอธิบายวิธีการทำงานของ OCR OCR ย่อมาจาก "การรู้จำอักขระด้วยแสง" และถูกอ้างถึงในภาษาเยอรมันว่าเป็นการรับรู้ข้อความ ซึ่งหมายความว่าคอมพิวเตอร์สามารถรับรู้ข้อความบนภาพที่สแกนโดยใช้ OCR แล้วแปลงเป็นเอกสารข้อความแบบง่าย
นี่คือการทำงานของ OCR
ลองนึกภาพว่าคุณได้รับเอกสารนำเสนอจากเพื่อนร่วมงาน ตอนนี้คุณต้องการแก้ไขสิ่งเหล่านี้บนพีซีเพราะคุณไม่ชอบข้อความเดี่ยว ดังนั้นให้สแกนและไปที่โปรแกรม OCR ของคุณ ต่อไปนี้เกิดขึ้น:
- ซอฟต์แวร์ทำการวิเคราะห์เลย์เอาต์ก่อน เมื่อต้องการทำเช่นนี้เธอดูที่เค้าโครงหน้าและแยกรูปภาพออกจากข้อความ เธอยังบันทึกตำแหน่งของพวกเขาในหน้า จากนั้นจะนับจำนวนย่อหน้าและบันทึกองค์ประกอบแต่ละรายการเช่นหมายเลขหน้า
- ตอนนี้ส่วนที่ยากมา ซอฟต์แวร์จะตรวจสอบแต่ละบล็อคข้อความและแบ่งออกเป็นประโยคต่างๆ ประโยคจะถูกแบ่งออกเป็นคำแต่ละคำและคำเป็นตัวอักษร
- ซอฟต์แวร์ OCR มีรูปแบบของตัวอักษรและตัวอักษร โปรแกรมจะเปรียบเทียบตัวอักษรที่สแกนด้วยรูปแบบเหล่านี้ หากมีความคล้ายคลึงกัน 99% อัลกอริทึมจะตัดสินว่ามันอาจต้องเป็นตัวอักษรนั้น มันแม่นยำมากเพราะสามารถเปรียบเทียบหลายรูปแบบในเวลาอันสั้น ด้วยวิธีนี้เขาประสบความสำเร็จในการแยกความแตกต่างระหว่าง "8" และ "B"
- ดังนั้นตัวอักษรและตัวอักษรจึงค่อยๆถูกจดจำ จากนั้นพวกเขาจะรวมกันอีกครั้งเป็นคำและใส่กลับเข้าไปในประโยคของพวกเขา ทันทีที่ซอฟต์แวร์เสร็จสิ้นสิ่งทั้งหมดจะถูกบันทึกไว้ในเอกสารปกติซึ่งคุณสามารถแก้ไขได้ ทำ!
คุณต้องการทดสอบความรู้ด้านซอฟต์แวร์ของคุณหรือไม่? เป็นส่วนหนึ่งในแบบทดสอบซอฟต์แวร์ขนาดใหญ่ของเรา!