เอสซีบี เท็นเอกซ์ (SCB 10X) เปิดตัว Typhoon Isan ทางการ โมเดล Automatic Speech Recognition (ASR) สำหรับภาษาอีสานที่ออกแบบมาเพื่อถอดเสียงเป็นข้อความและสะกดคำอย่างเป็นระบบเป็นครั้งแรกของไทย พร้อมเผยแพร่เป็นโอเพนซอร์สรวมถึงชุดข้อมูลภาษาอีสานที่เก็บรวบรวมเพื่อการวิจัยและพัฒนาต่อไป
Typhoon Isan เกิดขึ้นภายใต้โครงการ Typhoon
ซึ่งเป็นความริเริ่มด้าน AI แบบเปิดของ SCB 10X ที่มุ่งพัฒนาโมเดลเชิงวิจัยสำหรับบริบทของประเทศไทย โมเดลชุดนี้นอกจากถอดเสียงแล้วยังมีตัวอย่างระบบ TTS (Text-to-Speech) ที่แปลงข้อความเป็นเสียงพูดภาษาอีสานได้อย่างเป็นธรรมชาติ ช่วยยืนยันศักยภาพทั้งด้านการฟังและการพูดของภาษาในท้องถิ่น
ความสำคัญของโครงการนี้อยู่ที่การเติมช่องว่างทางเทคโนโลยีสำหรับภาษาถิ่นที่ถูกมองข้ามมานาน ภาษาอีสานมีผู้ใช้จำนวนมากแต่ได้รับการสนับสนุนจากเทคโนโลยีน้อย การมี ASR/TTS ที่แม่นยำจะช่วยเพิ่มการเข้าถึงบริการดิจิทัล เช่น ศูนย์บริการลูกค้า ระบบฉุกเฉิน การศึกษาออนไลน์ การแปลงเสียงเป็นข้อความในงานวิชาการ และการสร้างคอนเทนต์ด้วยเสียงสำเนียงท้องถิ่น
การเปิดซอร์สและปล่อยชุดข้อมูลยังเป็นสัญญาณสำคัญต่อชุมชนนักพัฒนาและนักวิจัย เพราะเปิดทางให้ทั้งมหาวิทยาลัย สตาร์ทอัพ และหน่วยงานภาครัฐสามารถนำไปต่อยอด ปรับแต่ง ตามกรณีใช้งานจริง หรือนำไปใช้ในโครงการที่ต้องการรองรับหลายสำเนียงภายในภาคอีสาน
SCB 10X ระบุว่า Typhoon ถูกพัฒนาในเชิงวิจัย
และเน้นความโปร่งใสของข้อมูลและโมเดล เพื่อผลักดันการพัฒนา AI ที่เป็นประโยชน์ต่อสังคมและลดช่องว่างทางดิจิทัลในประเทศไทย ขณะเดียวกันทีมงานยังเชิญชวนผู้พัฒนาและชุมชนร่วมทดสอบ ปรับปรุง และนำไปใช้งานในบริบทต่างๆ เพื่อให้โมเดลมีความหลากหลายและใช้งานได้จริงมากขึ้น
โครงการนี้ถือเป็นก้าวสำคัญในการผลักดัน AI ให้เข้าใกล้ผู้คนทุกถิ่น ไม่ใช่แค่ภาษาไทยมาตรฐาน แต่รวมถึงสำเนียงท้องถิ่นอย่างภาษาอีสาน ซึ่งจะช่วยขยายฐานการใช้งานเทคโนโลยีเสียงและสื่อสารดิจิทัลให้ครอบคลุมมากขึ้นในอนาคต
tags : scbx