กระโดดไปยังแผงนำทาง

ประเมินผล Jingjo รุ่น 0.5.0 7 August 2008 9:48 am

บันทึกโดย Mr. PeeTai ใน : การสร้างซอฟต์แวร์, ข่าวสาร, Open Source , 4 ความคิดเห็น

ตามปรกติแล้วเมื่อนักวิทยาศาสตร์ทำการทดลองใด ๆ ก็จำเป็นที่จะต้องสรุปผล พร้อมทั้งประเมินวิธีในการแก้ปัญหาที่จะเกิดขึ้นให้ครบสมบูรณ์

ผมเองก็พบ bug ตัวใหญ่ 3 ตัวใน Jingjo รุ่น 0.5.0 เช่นกัน โดยจะอธิบายให้ทราบดังนี้

1.   อ่านไม่ได้จบศัพท์ จับไปกระเดียด

ลักษณะของ bug คือ คำ ๆ นั้นจริง ๆ ถูกอยู่แล้วถ้าอ่านให้มันจบซะก่อน แต่เป็นเพราะอ่านยังไม่ทันจบ ก็เลยคิดไปเองว่ามันผิด ยกตัวอย่างเช่น คำว่า สร้างสรรค์ เป็นต้น

2.   คำผสมไม่ผิด แต่คำโดดดันบอกว่าผิด

เพราะภาษาไทยมีทั้งคำโดดและคำผสม ดังนั้นถ้าคำโดดสะกดอย่างโดดเดี่ยว ก็เป็นไปได้ที่คำนั้นอาจจะผิด แต่หากว่าคำโดดดังกล่าวสะกดผสมกับคำโดดอื่นด้วย ก็จะกลายเป็นว่าคำโดดดังกล่าวถูกต้องไป ยกตัวอย่างเช่น คำว่า อนุญาต เป็นต้น

3.  เอาลูกเขามาเลี้ยง เอาเมี่ยงเขามาอม

อันนี้เป็น bug ที่ผมโดนแซวกระจุยเลยครับ :-P จริง ๆ แล้วผมก็เห็นตั้งแต่ตอนบันทึกแล้วล่ะ อิ อิ โดย bug ตัวนี้เกิดขึ้นเพราะภาษาไทยเขียนติดกันเป็นพรืด ก็เลยทำให้เกิดการเปรียบเทียบคำที่ผิด ดันเอาพยัญชนะของคนล่ะคำมารวมกันให้เป็นคำใหม่ แล้วชี้ลงไปว่าคำนั้นผิด ยกตัวอย่างเช่น ดัชนีตลาดหลักทรัพย์ เป็นต้น

ผมคิดว่าผมจะเริ่มแก้ bug ตัวที่ 1 ก่อน ซึ่งก็ไม่รู้ว่าจะเสร็จเมื่อไหร่ จากนั้นจึงค่อยแก้ bug ตัวที่ 2 ซึ่งงานนี้คงต้องบรรจุพจนานุกรมไทยฉบับราชบัณฑิตยสถาน พ.ศ. 2540 เข้าไว้ในโค้ดแหง ๆ เลย  และสำหรับ bug ตัวสุดท้ายคงต้องแก้ด้วยการหาอัลกอริธึมในการตัดคำที่สมบูรณ์แบบนั่นเอง ซึ่งผมคิดว่า…มัน…ยากกกกกกกกกมากกกกกกกกกกกก

โดยสรุปแล้ว bug ทั้ง 3 ตัวนั้น ไม่ใช่แก้กันได้โดยง่าย คงต้องใช้เวลาพักใหญ่เลยทีเดียว กว่า Jingjo จะหลุดจากสถานะ alpha เข้าสู่สถานะ beta ได้

การประมวลผลภาษาไทย ช่างยากอะไรเช่นนี้หนอ T-T

Technorati Tags: , , , , , ,