Quantifying the Impact of Data Characteristics on the Transferability of Sleep Stage Scoring Models: จากโมเดลตรวจจับการนอนหลับ สู่อุปกรณ์สวมใส่แห่งอนาคต

จากความสำเร็จในการพัฒนาโมเดล “TinySleepNet” ซึ่งเป็นหนึ่งในหมุดหมายสำคัญของการพิสูจน์เกี่ยวกับการใช้คลื่นสัญญาณเพียงคลื่นเดียวบริเวณจุดกึ่งกลางระหว่างศีรษะ และหน้าผาก ที่สามารถวัดประสิทธิภาพของการนอนหลับ (Sleep Stage Scoring) ได้ โดยโมเดลนี้ถูกนำไปต่อยอดในกลุ่มผู้พัฒนาต่างๆ หลังตีพิมพ์ผลงาน แต่เพราะเหตุใด ผศ.ดร. อัคร สุประทักษ์ อาจารย์ประจำกลุ่มวิชาวิทยาการคอมพิวเตอร์ คณะ ICT ม.มหิดล ต้องกลับมาศึกษาผลงานนี้อีกครั้ง?

Quantifying the Impact of Data Characteristics on the Transferability of Sleep Stage Scoring Models เป็นผลงานการวิจัยที่ต่อยอดการศึกษาจากผลงานวิจัย “TinySleepNet: An Efficient Deep Learning Model for Sleep Stage Scoring Based on Raw Single-Channel EEG” ในปี พ.ศ. 2563 ซึ่งเป็นผลงานที่ว่าด้วยการพัฒนาโมเดลวิเคราะห์ และให้คะแนนระดับการนอนหลับ โดยใช้ข้อมูลจากการวัดคลื่นไฟฟ้าสมอง ซึ่งหลังจากผลงานนี้ถูกตีพิมพ์ โมเดลของ TinySleepNet ได้ถูกนำไปต่อยอดเป็นจำนวนมากแต่ไม่มีงานวิจัยไหนเลยที่ศึกษาวิธีการนำเอาโมเดลไปใช้งานสำหรับอุปกรณ์สวมใส่ (Wearable Device)

“ผมตามงานวิจัยมาเรื่อย ๆ ผมเห็นว่างานวิจัยของผมในปัจจุบันมีหลายคนพัฒนาโมเดลจากที่ผมทำไปเยอะมาก แต่ไม่มีใครเคยไปดูว่า โมเดลแต่ละอันที่เขาพัฒนาขึ้น มีความสามารถที่จะถูกนำไปใช้ในอุปกรณ์สวมใส่ต่าง ๆ ได้จริงเท่าไหร่ คือมีแต่คนสร้างโมเดล โดยมีสมมติฐานเหมือนเดิมคือตำแหน่งในการวัด/ตรวจจับคลื่นสัญญาณบริเวณหน้าสมองน่าจะเป็นตำแหน่งที่ดีที่สุด แต่ไม่มีใครไปดูหรือเก็บข้อมูลเลยว่า พอมันถูกนำไปใช้งานต่อยอดในอุปกรณ์สวมใส่จริง ๆ โมเดลมันจะยังทำงานได้ดีอยู่เหมือนเดิมหรือเปล่า? พอมีคำถามนี้ ผมเลยทำงานวิจัยนี้ขึ้นมา”

ผศ.ดร. อัคร สุประทักษ์ ได้เล่าถึงแกนหลักของการศึกษาในครั้งนี้ ซึ่งคือการหาคำตอบของคำถามที่ว่า “ถ้าเราต้องนำโมเดลที่เราพัฒนาไปใช้งานต่อยอดให้มันสามารถไปอยู่ในอุปกรณ์สวมใส่ต่าง ๆ ได้ และมีราคาที่ไม่สูงเกิน ประสิทธิภาพการทำงานของโมเดลจะลดลงประมาณเท่าไหร่?”

Overall architectures of TinySleepNet and U-Time.

“งานวิจัยนี้ตอบคำถามที่ว่าถ้าเกิดคุณอยากจะนำโมเดลไปติดตั้งในอุปกรณ์สวมใส่ Performance ของโมเดลมันจะทำงานได้ดีเทียบเท่าเดิมประมาณไหน หรือมันจะลดลงไปประมาณเท่าไหร่ เพื่อให้ผู้สนใจทราบคร่าว ๆ ก่อนที่เขาจะไปดีไซน์อุปกรณ์ในอนาคต ทำให้ประหยัดต้นทุนการผลิตและการทำการทดลอง ก็เลยเป็นที่มาของงานนี้”

ผศ.ดร. อัคร สุประทักษ์ ได้เก็บข้อมูลเริ่มต้นจากการหาปัจจัยต่าง ๆ ของ Wearable Device ที่คาดว่าจะส่งผลกับ Performance ของโมเดล ซึ่งในครั้งนี้ ได้ศึกษาทั้งหมด 3 ปัจจัย ได้แก่

Recording Channels (or Positions) ตำแหน่งที่ใช้ในการเก็บคลื่นความถี่สมอง
Recording Environments สภาพแวดล้อมและอุปกรณ์ที่ใช้ในการวัดและจัดเก็บข้อมูล
Subject Conditions สถานะของคนไข้เป็นมีการนอนหลับที่ปกติหรือผิดปกติ

Transferability matrices from TinySleepNet and U-Time models.

หลังจากได้ปัจจัยต่าง ๆ สำหรับการวิเคราะห์มาแล้วนั้น ผศ.ดร. อัคร สุประทักษ์ จึงเริ่มทดสอบกับโมเดลที่ได้พัฒนาไว้ทีละชุด จากนั้นจึงนำการทดลองมาสรุปผล ซึ่งผลการศึกษาพบว่า การเก็บข้อมูลในสภาพแวดล้อมที่ต่างกัน (Different recording environments) นั้น ส่งผลต่อการ Degrade Performance มากที่สุด โดย ส่งผลให้ประสิทธิภาพการทำงานของโมเดล ลดสูงสุดคือ 14%

“ผมศึกษาโดยมีข้อมูล Dataset ที่เป็นสาธารณะ อันหนึ่งเป็นของโรงพยาบาล A อันหนึ่งเป็นของโรงพยาบาล B ซึ่งผมฝึกสอนโมเดลโดยใช้ข้อมูลของโรงพยาบาล A แล้วผมเอาโมเดลที่ฝึกสอนแล้วแบบไม่ปรับอะไรเลย ไปใช้กับ Dataset โรงพยาบาล B การทำแบบนี้จะทำให้ Degrade สูงสุดอยู่ที่ 14% ซึ่งอันนี้เป็น 14% โดยเฉลี่ย สมมุติว่าผมเคยทำงานได้ดี 90% ใน Setting แบบเดียวกัน พอเอาไปใช้ในสภาพแวดล้อมที่อุปกรณ์บันทึกข้อมูลไม่เหมือนกัน จะคาดการณ์ได้เลยว่า Performance จะลดลงเริ่มต้นที่ 14% จาก 90% ก็เป็น 76% หรือน้อยกว่า”

โดยระหว่างการศึกษาผลงานนี้ ผศ.ดร. อัคร สุประทักษ์ ได้เล่าถึงปัญหาที่เจอระหว่างทาง 2 ประเด็น ได้แก่ การที่ไม่สามารถศึกษาครอบคลุมทุกตัวแปร (Variation) ที่ต้องการศึกษาได้ เนื่องจากมีข้อจำกัดด้านชุดข้อมูล (Dataset) ที่ศึกษาได้จากชุดข้อมูลสาธารณะ (Public Dataset) ที่มีอยู่เท่านั้น และการฝึกสอนโมเดลใช้เวลาค่อนข้างนาน เนื่องจากมีตัวแปรในการเรียนรู้เป็นจำนวนมาก แต่อย่างไรก็ตาม ผศ.ดร.อัคร สุประทักษ์ ยังได้พูดถึงการต่อยอดผลงานนี้ในอนาคต โดยผลงานที่กำลังศึกษาอยู่นั้น จะเกี่ยวกับการทำนายผลการฝึกสอนของโมเดลแต่ละชุดว่าจะ Degrade เท่าไหร่ โดยไม่ต้องฝึกสอนโมเดลอะไรเพิ่ม ซึ่งทำให้ทราบถึงความคาดหวังในอนาคตเกี่ยวกับผลงานต่างๆ ที่กำลังจะเกิดขึ้น ในฐานะผู้ริเริ่มงานวิจัยนี้

“ถ้าเราสามารถสร้างความร่วมมือกับโรงพยาบาลในประเทศไทย และงานวิจัยที่ใช้ในการทำนายที่กำลังทำนี้สำเร็จ ผมเชื่อว่าเราจะเข้าใกล้เรื่องที่ทุกคนจะมีอุปกรณ์ในการวัดคุณภาพในการนอนได้ดีกว่าการใส่นาฬิกาข้อมือมากยิ่งขึ้น เนื่องจากนาฬิกาจะวัดประสิทธิภาพการนอนของเราจาก Heart Rate + Movement ที่วัดได้จากข้อมือ แต่การวัดที่แม่นยำที่สุดจะอยู่บริเวณด้านหน้าสมอง ผมเลยได้แต่หวังว่าในท้ายที่สุด เราจะมีอุปกรณ์ที่วัดแล้วเข้าใกล้ Medical-device Grade มากที่สุดเท่าที่จะทำได้ คือถ้าคนเริ่มสงสัยแล้วว่าตัวเองมีปัญหาทางด้านการนอนหรือเปล่า อุปกรณ์นี้มันก็จะเป็น Early Warning ได้ว่าสิ่งที่เราทำอาจจะไม่ดีต่อการนอนของเรา สามารถระบุพฤติกรรมของเราออกมาเป็นตัวเลขได้ดีกว่านาฬิกา เช่น มีการให้คะแนนการนอนว่าดี/ไม่ดี ซึ่งสอดคล้องกับตัวเราที่ตื่นนอนมาแล้วสดชื่น/ไม่สดชื่น เพื่อให้เขาได้ตัดสินใจกับตัวเองได้ว่า เขาควรจะไปพบแพทย์ หรือต้องเริ่มเปลี่ยนพฤติกรรมของตัวเองได้แล้วหรือยัง ซึ่งผมหวังว่ามันจะได้อุปกรณ์สวมใส่ที่ดีขึ้น ถ้าเกิดว่ามีข้อมูลที่ครอบคลุมกับตัวแปรที่ต้องการศึกษาเยอะขึ้น ผนวกกับงานวิจัยผมสมบูรณ์ เราก็จะก้าวไปอีกขั้นหนึ่งได้”

ดาวน์โหลดผลงานตีพิมพ์เรื่อง Quantifying the impact of data characteristics on the transferability of sleep stage scoring models ได้ที่ >>> https://doi.org/10.1016/j.artmed.2023.102540