FAST: เมื่อข้อความที่โพสต์บนอินเตอร์เน็ตมีความรู้สึก และอาจช่วยพยากรณ์อัตราการทำร้ายตัวเองได้

สถานการณ์การแพร่ระบาดของ COVID-19 ได้สร้างความเสียหายไม่เพียงแต่ทางด้านตัวเลขของเศรษฐกิจโลกเพียงเท่านั้น แต่ผลกระทบทางด้านจิตใจของประชาชนเอง ก็มีความเสียหายในระดับที่รุนแรงเช่นเดียวกัน รศ.ดร. ศุภวงศ์ ทั่วรอบ หัวหน้ากลุ่มวิจัย Machine Intelligence and Knowledge Engineering (MIKE) คณะเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยมหิดล (ICT Mahidol) พร้อมทีมวิจัย ได้ให้ความสนใจในประเด็นผลกระทบที่เกิดขึ้นนี้เช่นเดียวกัน และมีเป้าหมายในการช่วยเหลือปัญหานี้ด้วย framework ปัญญาประดิษฐ์ในชื่อ “FAST”

“จุดเริ่มต้นของงานนี้มาจากช่วงสถานการณ์ COVID-19 เราสังเกตว่านโยบายภาครัฐที่ออกมา อย่างเช่นนโยบายเงินช่วยเหลือ หรือ การล็อคดาวน์ประเทศ นโยบายพวกนี้มันมีผลกระทบต่อสุขภาวะทางจิตของคนไทย มีการเป็นโรคซึมเศร้าเพิ่มมากขึ้นจากการตกงาน การที่ต้องกักตัว ซึ่งนำไปสู่การฆ่าตัวตาย โดยตอนนั้นเราได้ร่วมมือกับสถาบันวิจัยเศรษฐกิจป๋วย อึ๊งภากรณ์ เขาก็อยากจะรู้ว่า เรามีวิธีอะไรที่จะสอดส่องสุขภาวะทางจิตของคนไทยมั้ย นอกจากวิธีการส่งแบบสอบถาม เนื่องจากวิธีนี้มันค่อนข้างเสียเวลาและเสียทรัพยากร เราไม่สามารถพิสูจน์สุขภาวะในระดับรายเดือนหรือรายวัน เพราะไม่สามารถส่งแบบสอบถามไปบ่อยๆ จะส่งได้แค่เดือนละครั้ง หรือ ไตรมาสละครั้งเท่านั้นเอง”

Social Media ของประชากรไทย เป็นพื้นที่ที่ดีสำหรับศึกษาสุขภาวะทางจิตในช่วง COVID-19 โดยทีมวิจัยเริ่มเก็บข้อมูลจากข้อความทวีตบนแพลตฟอร์ม Twitter (ปัจจุบันคือ X) ของผู้ใช้งานคนไทย และนำแต่ละทวีตมาดึงสัญญาณทางอารมณ์ด้วยโมเดลปัญญาประดิษฐ์ Sentiment Analysis ซึ่งได้ผลลัพธ์ออกมาในรูปแบบค่าบวก ค่าลบ ซึ่งเป็นสถานะอารมณ์ในมิติต่างๆ และยังได้ข้อมูลแนวโน้มการฆ่าตัวตายด้วย สิ่งที่ทีมวิจัยอยากรู้ลำดับถัดมาคือ สัญญาณที่ออกมาเหล่านี้ มีความสามารถในการพยากรณ์แนวโน้มได้หรือไม่?

“เรานำสัญญาณแต่ละสัญญาณที่รวบรวมมาตลอดหลายเดือน ไปหาค่าความสัมพันธ์ (correlation) กับจำนวนคนที่ทำร้ายตัวเองของประเทศ ซึ่งพบว่าสัญญาณอารมณ์ทางด้านลบ มีค่าความสัมพันธ์ที่ค่อนสูงเท่ากับจำนวนคนฆ่าตัวตาย แต่เราอยากนำสัญญาณเหล่านี้ ไปต่อยอดมากขึ้น เราอยากนำข้อมูลมาทำนายจำนวนคนที่ฆ่าตัวตายจริงๆ ในอนาคต ซึ่งถ้าเราทำได้ ผลงานที่นำเสนอชิ้นนี้จะทำให้ผู้วางนโยบายของภาครัฐ สามารถออกแบบกระบวนการแก้ไข (intervention mechanism) ในการที่จะไปช่วยกลุ่มคนเหล่านี้ได้ เราเลยเริ่มคิด framework ในชื่อ “FAST” ขึ้นมา”

FAST เป็น framework ที่ออกแบบมาเพื่อใช้ข้อมูลจากสื่อสังคมออนไลน์ในการทำนาย การพยากรณ์ จำนวนคนที่ทำร้ายตัวเองได้อย่างอัตโนมัติ โดย FAST จะรวบรวมข้อมูลจากทวิตเตอร์ โดยข้อมูลจากหนึ่งทวิตจะมี AI สกัดอารมณ์ในมิติต่างๆ ออกมา ซึ่งจะได้ข้อมูลอารมณ์ 8 ด้าน แนวโน้มของการฆ่าตัวตาย และ ผลอารมณ์/ ความรู้สึก (sentiment) บวก ลบ ออกมา จากนั้นจะนำสัญญาณเหล่านี้ไปฝึกสอนโมเดล Machine Learning เพื่อที่จะใช้ในการทำนายจำนวนคนที่ทำร้ายตัวเองในอนาคต ซึ่งคนที่ทำร้ายตัวเอง สามารถแบ่งออกได้เป็น 2 กรณี กรณีที่หนึ่งคือทำร้ายตัวเองแล้วบาดเจ็บ และกรณีที่สองคือ ทำร้ายตัวเองแล้วเสียชีวิต ผลลัพธ์จากการทดสอบ framework นี้กับทั้ง 2 กรณี พบว่า FAST สามารถทำนายจำนวนคนที่ทำร้ายตัวเองจนตายและบาดเจ็บได้แม่นยำกว่าวิธีปกติถึง 36 – 43 เปอร์เซ็นต์

รศ.ดร. ศุภวงศ์ ทั่วรอบ ยังได้ให้ข้อมูลเพิ่มเติมเกี่ยวกับงานชิ้นนี้ ในแง่ปัญหาที่พบในระหว่างการดำเนินงานว่า “ปัญหาสำคัญที่เจอ คือการสอน AI ให้สกัด sentiment ออกมา เนื่องจาก FAST ต้องใช้ชุดข้อมูลฝึกสอน AI ให้เรียนรู้การแปลความหมาย ซึ่งทวิตที่นำมาศึกษานั้นเป็นภาษาไทย แต่เราขาดแคลนชุดข้อมูลฝึกสอนภาษาไทย ดังนั้น ตอนแรกเราจึงแก้ปัญหาด้วยการแปลข้อความไทยเป็นอังกฤษด้วยโปรแกรมแปลภาษา (translator) แต่ก็ไม่ได้ผล เพราะภาษาบนสื่อสังคมออนไลน์เป็นภาษาที่ไม่ทางการ ทำให้การแปลมีความหมายคลาดเคลื่อนไป เราเลยลองมาใช้ Language-agnostic model ซึ่งเป็นโมเดลที่สามารถประมวลผลข้อความได้หลายภาษา โดยการหาภาษากลางที่ทุกภาษาสามารถสื่อสารกันได้ เราเลยเอาข้อมูลทวิตภาษาไทยไปแปลงเป็นภาษากลาง แล้วค่อยนำมาใช้ หลังจากนั้นเราพบว่า Language-agnostic model ช่วยให้การทำงานของ AI มีประสิทธิภาพที่เพิ่มสูงขึ้น และสามารถแก้ไขปัญหาการไม่มีชุดข้อมูลฝึกสอนเป็นภาษาไทยได้ด้วย”

สุดท้ายนี้ รศ.ดร. ศุภวงศ์ ทั่วรอบ ยังได้ให้ข้อเสนอแนะเพิ่มเติมเกี่ยวกับงานชิ้นนี้และการนำไปต่อยอดในอนาคต โดยงานวิจัยนี้ เป็นงานวิจัยที่บูรณาการระหว่างศาสตร์ทางด้าน AI และสังคมศาสตร์ ซึ่งการบูรณาการ 2 ศาสตร์นี้จะทำให้เกิดนวัตกรรมที่มีประโยชน์ต่อสังคม แต่ในประเทศไทยยังมีอยู่ค่อนข้างน้อย ซึ่งหากมีการนำข้อมูลไปใช้มากขึ้น จะส่งผลดีต่อทางด้านวิชาการ และด้านการขับเคลื่อนประเทศด้วย อย่างเช่นงานนี้ ก็สามารถไปต่อยอดประเด็นอื่นเพิ่มได้อีก ไม่ใช่เพียงแต่ด้านสุขภาวะ เช่น การนำ framework ไปทำนายตัวแปรเชิงเศรษฐกิจต่างๆ อาทิ ค่า GDP ตัวชี้วัดตลาดแรงงาน หรือความคาดหวังทางเศรษฐกิจ เพราะหลักการของงานวิจัยนี้คือการใช้สื่อสังคมเป็นตัวสะท้อนสิ่งที่อยู่ในความคิดของประชากรไทยนั่นเอง

ดาวน์โหลดผลงานตีพิมพ์เรื่อง Forecasting National-Level Self-Harm Trends With Social Networks (FAST) ได้ที่: https://ieeexplore.ieee.org/document/10162177

ติดตามผลงานของ รศ.ดร. ศุภวงศ์ ทั่วรอบ : https://sites.google.com/mahidol.edu/stuarob