WabiQA: A Wikipedia-Based Thai Question-Answering System โปรแกรมถามตอบอัตโนมัติจากคลังข้อมูลวิกิพีเดียภาษาไทย

มหาวิทยาลัยมหิดลมุ่งเน้นการพัฒนางานวิจัยที่มีคุณภาพ เพื่อตอบโจทย์ปัญหาที่ท้าทายของสังคมไทยและสังคมโลก เทคโนโลยีปัญญาประดิษฐ์ (AI) นับว่าเข้ามามีบทบาทในการใช้ชีวิตประจำวันมากขึ้นมากกว่าแต่ก่อน หนึ่งในการประยุกต์ใช้เทคโนโลยี AI ก็คือ การช่วยสืบค้นข้อมูลจากคลังข้อมูลขนาดใหญ่ เช่น วิกิพีเดีย เพื่อตอบคำถามอย่างอัตโนมัติ โดยที่ผู้ใช้ไม่จำเป็นต้องเสียเวลาสืบค้นคำตอบนั้นด้วยตนเอง

WabiQA เป็นโปรแกรมถามตอบอัตโนมัติจากคลังข้อมูลวิกิพีเดียภาษาไทย ซึ่งเป็นผลผลิตจากงานวิจัยของ ลลิตา โล่พันธุ์ศิริกุล, ยอดธิดา ยอดเมือง, และ วรรณกานต์ ปรางอ่อน นักศึกษาคณะเทคโนโลยีสารสนเทศและการสื่อสาร (ICT) มหาวิทยาลัยมหิดล โดยมี รศ. ดร. ศุภวงศ์ ทั่วรอบ หัวหน้ากลุ่มวิจัย Machine Intelligence and Knowledge Engineering (MIKE Cluster) และ ดร. ธนพล นรเสฏฐ์ อาจารย์ประจำกลุ่มวิชาวิทยาการคอมพิวเตอร์ เป็นอาจารย์ที่ปรึกษา

งานวิจัย WabiQA กำเนิดขึ้นจากความต้องการระบบอัจฉริยะเพื่อตอบคำถามอย่างอัตโนมัติและสามารถรองรับภาษาไทย โดยคำถามสามารถอยู่ในลักษณะคำถามภาษาไทยทั่วไป เช่น “คณะ ICT มหิดลก่อตั้งเมื่อใด” ซึ่งระบบจะแสดงคำตอบ “วันที่ 20 พ.ค. 2552″ พร้อมทั้งยังแสดงแหล่งที่มาของข้อมูลอีกด้วย โดยมีข้อจำกัดว่า คำตอบทั้งหมดนั้นต้องอยู่ในฐานข้อมูลวิกิพีเดียภาษาไทย (https://th.wikipedia.org/wiki)

การทำงานของโปรแกรม WabiQA เริ่มด้วยการหาบทความวิกิพีเดียที่สอดคล้องกับคำถามที่สุดด้วยวิธี BM25F หลังจากนั้น ก็จะสอนให้โปรแกรมเลียนแบบมนุษย์ในการอ่านบทความทีละคำเพื่อหาคำตอบที่เหมาะสมที่สุดแก่คำถาม ด้วยกระบวนการเรียนรู้เชิงลึก (Deep Learning) แบบ Bi-Directional Long-Short Term Memory (BiLSTM) โดยมีการประยุกต์ใช้ให้เหมาะสมกับบริบทภาษาไทย พร้อมกับการใช้งานชั้นความสนใจ (Attention Layers) เพื่อให้โปรแกรมสามารถเรียนรู้การระบุประโยคที่คาดว่าจะมีคำตอบได้ดียิ่งขึ้น จากการทดสอบพบว่า WabiQA สามารถลดเวลาในการสืบค้นข้อมูลได้ถึง 97.81% โดยผลลัพธ์ที่ได้จากงานวิจัยนี้คือ โปรแกรม WabiQA ที่สามารถใช้งานได้บนโทรศัพท์มือถือ และสามารถถามตอบด้วยเสียง เพื่ออำนวยความสะดวกสำหรับผู้พิการทางสายตาอีกด้วย

งานวิจัย WabiQA ได้รับการตอบรับเพื่อตีพิมพ์ในวารสารวิชาการ Information Processing & Management ซึ่งเป็นวารสารวิชาการนานาชาติชั้นนำระดับควอไทล์ 1 (Q1) ด้านระบบข้อมูล (Information Systems) และวิทยาศาสตร์สารสนเทศ (Information Sciences) ผู้ที่สนใจสามารถอ่านผลงานวิจัยฉบับเต็มได้ที่ https://doi.org/10.1016/j.ipm.2020.102431

ดร. ธนพล นรเสฏฐ์ ยังได้กล่าวอีกว่า “ทางทีมวิจัยมีการร่วมมือกับนักศึกษาและคู่ความร่วมมือเพื่อพัฒนางานวิจัยและนวัตกรรมปัญญาประดิษฐ์เพื่อตอบโจทย์ปัญหาที่ท้าทายและผลักดันขีดความสามารถของเทคโนโลยีอัจฉริยะที่คิดค้นโดยคนไทยอยู่ตลอดเวลา ส่วนตัวรู้สึกภูมิใจในศักยภาพของนักศึกษามหิดลในการสร้างสรรค์งานวิจัยที่มีคุณภาพระดับแนวหน้าของโลกร่วมกันกับอาจารย์ที่ปรึกษา โดยงานวิจัยนี้เป็นตัวอย่างของการประยุกต์เทคโนโลยีปัญญาประดิษฐ์ขั้นสูง มาเรียนรู้การอ่านและทำความเข้าใจข้อความภาษาไทย เทคโนโลยีดังกล่าวสามารถนำไปประยุกต์ใช้ในการวิเคราะห์ข้อมูลภาษาไทยขนาดใหญ่อย่างอัตโนมัติอีกด้วย เช่น การค้นหาและสรุปความคิดเห็นบนสื่อสังคมออนไลน์ที่มีต่อสินค้า เหตุการณ์ หรือ นโยบายต่างๆ”

รู้หรือไม่: ผลงาน WabiQA ได้รับรางวัลชนะเลิศระดับประเทศ จากการแข่งขันพัฒนาโปรแกรมคอมพิวเตอร์แห่งประเทศไทย ครั้งที่ 21 (National Software Contest: NSC) NSC2019 ในหัวข้อ Question answering program from Thai Wikipedia ซึ่งจัดขึ้นโดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ

ภาพเพิ่มเติม

ไอซีที มหิดล

เบอร์ติดต่อ

สถานที่ติดต่อ

อีเมล์

WabiQA: A Wikipedia-Based Thai Question-Answering System โปรแกรมถามตอบอัตโนมัติจากคลังข้อมูลวิกิพีเดียภาษาไทย