CAMELON: A System for Crime Metadata Extraction and Spatiotemporal Visualization from Online News Articles: เมื่อข่าวอาชญากรรมคือฐานข้อมูลสำคัญของความปลอดภัย

ข่าวประเภท “อาชญากรรม” ที่ถูกนำเสนอในแต่ละวัน ทั้งภายในประเทศไทยและต่างประเทศ มีจำนวนเพิ่มมากขึ้นเรื่อยๆ ซึ่งสร้างความกลัวและวิตกกังวลในการใช้ชีวิตประจำวัน จึงเป็นคำถามว่า “ในยุคที่ภัยคุกคามอยู่ใกล้ตัวเรามากกว่าที่คิด เราจะมีอะไรที่เข้ามาช่วยให้รู้สึกปลอดภัยมากขึ้นจาก “อาชญากรรม” ที่อยู่รอบๆ ตัวเรา?” ดร. ศิริเพ็ญ พงษ์ไพเชฐ ผู้ช่วยคณบดีฝ่ายสารสนเทศและระบบ คณะเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยมหิดล (ICT Mahidol) และทีมวิจัย เป็นหนึ่งในผู้ที่ตระหนักถึงภัยใกล้ตัวของอาชญากรรมในปัจจุบัน และได้ร่วมกันพัฒนาสิ่งที่เรียกว่า “CAMELON” ขึ้นมา

CAMELON หรือ Crime and Accident Monitoring: An Estimation from Large Scale Online News Article เป็นผลงานจากวิชา Senior Project ของศิษย์เก่า ICT รุ่นที่ 17 หลักสูตรวิทยาศาสตรบัณฑิต สาขาวิชาเทคโนโลยีสารสนเทศและการสื่อสาร (ICT หลักสูตรนานาชาติ) ประกอบไปด้วย นายกันตพงศ์ มาตังครัตน์ นายชาญชีพ มหาเจริญสุข นายพัทธดนย์ สิงหจันทร์ โดยมี ดร. ศิริเพ็ญ พงษ์ไพเชฐ เป็นอาจารย์ที่ปรึกษา

CAMELON คือเว็บไซต์ที่รวบรวมข่าวอาชญากรรมจากทั่วประเทศและนำมาแสดงผลเพื่อสะท้อนความปลอดภัยในแต่ละท้องที่ของประเทศไทย โดยมี “Criminometer” เป็นตัวชี้วัดการเกิดอาชญากรรมในแต่ละท้องถิ่น โดย Criminometer เป็นค่าที่วัดมาจากหลายส่วนของข้อมูลของแต่ละท้องที่ ไม่ว่าจะเป็น ประเภทของอาชญากรรมที่เกิดขึ้น จำนวนครั้งที่เกิดอาชญากรรมขึ้น ความรุนแรง จำนวนประชากรของท้องที่นั้นๆ เป็นต้น โดยอาศัยข้อมูลจากแหล่งข่าวออนไลน์ที่มีความน่าเชื่อถือ และนำมาเสนอเป็นแผนที่ Crime Map รูปแบบต่าง ๆ เช่น Pin Map, Heat Map, และ Choropleth Map เป็นต้น

“จุดเริ่มต้นของงานนี้ มาจากการที่เราได้ยินข่าวอาชญากรรมตามโทรทัศน์ และ Social Media บ่อยๆ จนบางทีก็รู้สึกว่ามันเยอะเหลือเกินในปัจจุบัน แล้วก็มาจากการเห็น Crime Map ของต่างประเทศที่การแสดงแผนที่ของอาชญากรรม เช่น Chicago Maps หรือ Los Angeles Crime-mapping เขามีระบบที่แสดงผลว่ามีการเกิดอาชญากรรมที่ไหน ซึ่งเรารู้สึกว่า ถ้ามีแผนที่แบบนี้มาช่วยให้เราได้ระมัดระวังตัวเองมากขึ้นในประเทศไทย รู้ว่าแหล่งไหนอันตราย ควรจะระมัดระวังในความปลอดภัยมากขึ้น ก็น่าจะดี รวมถึงน่าจะช่วยให้เจ้าหน้าที่และผู้วางนโยบายด้านความปลอดภัยของประชาชน ได้มีข้อมูลที่ real-time ในหลายมิติที่เป็นประโยชน์ เพื่อนำไปประกอบการตัดสินใจได้ง่ายด้วย”

 

CAMELON มีกระบวนการทำงาน 3 ส่วนหลักๆ ส่วนแรกคือส่วนของการรวบรวมข้อมูล ซึ่งได้มาจากการดึงข่าวออนไลน์ต่างๆ เช่น ข่าวการจี้ปล้น ข่าวทำร้ายร่างกาย ข่าวฆาตกรรม เป็นต้น จากนั้น นำเอามาสกัดทำเป็น Metadata และนำเนื้อข่าวมาวิเคราะห์เพื่อแบ่งประเภทของข่าวอาชญากรรมโดยอัตโนมัติ โดยใช้ Machine Learning ในการทำนายออกมา เมื่อได้ประเภทของอาชญากรรมแล้ว ทีมวิจัยนำมาใช้ประกอบในการระบุระดับความรุนแรงของเหตุการณ์ดังกล่าวได้ด้วย ทั้งนี้ ในระหว่างทำงาน ทีมวิจัยได้ระมัดระวังข้อมูลที่ละเอียดอ่อน และข้อมูลที่เกี่ยวข้องกับพระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคล (PDPA) ด้วยเช่นเดียวกัน

ส่วนที่สองคือการเตรียมข้อมูลเชิงลึกเพื่อใช้ในการวิเคราะห์ ซึ่งทีมวิจัยได้รับความช่วยเหลือจาก รศ.ดร. ศุภวงศ์ ทั่วรอบ อาจารย์ประจำกลุ่มวิชาวิทยาการคอมพิวเตอร์ และหัวหน้ากลุ่มวิจัย Machine Intelligence and Knowledge Engineering (MIKE) พร้อมด้วย ผศ.ดร. ธนพล นรเสฏฐ์ ผู้ช่วยคณบดีฝ่ายการศึกษา ในการพัฒนา Machine Learning และ Natural Language Processing ให้แก่ CAMELON โดยในส่วนนี้ เป็นการนำเนื้อข่าวมาแยกแยะข้อมูลเป็นหลายๆ ด้านที่เกี่ยวข้องการเหตุการณ์ของอาชญากรรม ได้แก่ สถานที่เกิดเหตุ ผู้กระทำความผิด การกระทำที่เกิดขึ้น ผู้รับเคราะห์ และไทม์ไลน์การเกิด ทำให้สามารถวิเคราะห์ข้อมูลได้ละเอียดขึ้น เช่น เดือนมกราคม กรุงเทพฯ มีเหตุการณ์อะไรเกิดขึ้นบ้าง และมีการทำ Application Programing Interface (API) ซึ่งเป็นกลไกที่สำคัญ สำหรับใช้สำหรับการเชื่อมโยงทั้ง 3 ส่วนหลักเข้าด้วยกัน

และในส่วนสุดท้าย คือการนำเสนอข้อมูล โดยทีมวิจัยได้วิเคราะห์ลักษณะการใช้งานของระบบ และนำออกแบบ UX (User Experience) และ UI (User Interface) ในการนำเสนอข้อมูลเพื่อตอบโจทย์กลุ่มผู้ใช้เป้าหมาย โดยทีมวิจัยมุ่งเน้นให้ผู้ใช้งานได้เห็นข้อมูลที่จำเป็นในแต่ละพื้นที่ พร้อมสามารถกรองข้อมูลที่เฉพาะเจาะจงได้ และมีการนำเสนอแผนที่ และกราฟ ของข้อมูลที่เข้าใจง่าย

ทั้งนี้ ปัญหาที่พบในการศึกษาครั้งนี้คือ ข้อมูลที่มีจำนวนมาก และความซ้ำซ้อนของข้อมูล ทำให้ใช้เวลานานในการรวบรวมข้อมูลให้มีคุณภาพ นอกจากนี้ รายละเอียดของข้อมูลที่ดึงออกจากข่าวก็อาจจะไม่ครบหรือไม่ถูกต้อง ส่งผลให้ในการมอนิเตอร์ ยังระบุตำแหน่งของเหตุการณ์ที่เกิดขึ้นได้ไม่ละเอียด ในบางครั้งก็จะได้รับข้อมูลเพียงระดับจังหวัดเท่านั้น ยังไม่สามารถลงไปถึงอำเภอหรือตำบลได้ จึงต้องใช้เวลาในการปรับปรุงระบบให้สามารถสกัดข้อมูลให้ถูกต้องแม่นยำ และต้องทำการป้อนข้อมูลให้ Machine Learning เรียนรู้ในการแยกประเภทของอาชญากรรมให้แม่นยำขึ้นเช่นเดียวกัน

ดร. ศิริเพ็ญ พงษ์ไพเชฐ ในฐานะหัวหน้าโครงงาน ได้พูดถึงอนาคตของผลงานชิ้นนี้ ในแง่ของการต่อยอดในอนาคต ไว้ดังนี้

“กลุ่มเป้าหมายของเราคือผู้ใช้งานทั่วๆ ไปที่อยากระวังตัวเองเมื่อออกเดินทางไปข้างนอก อีกกลุ่มคือเจ้าหน้าที่ตำรวจ เพื่อที่เขาจะได้สำรวจพื้นที่ที่เขาดูแลอยู่ รวมถึงเราจะได้ข้อมูลจากเจ้าหน้าที่ตำรวจหลังจากออกตรวจด้วย เพราะบางอาชญากรรมที่เขาได้รับแจ้งความก็ไม่ได้ออกข่าว ข้อมูลที่เจ้าหน้าที่ตำรวจสรุปในแต่ละเดือนหรือแต่ละปี เหล่านี้มีสำคัญ และอีกกลุ่มเป้าหมายที่คาดหวังในอนาคตคือ ผู้ที่ทำงานเกี่ยวข้องกับการวางนโยบายระดับประเทศ เพราะถ้าเขาเห็นพื้นที่ที่มีความเสี่ยงสูงจาก CAMELON เขาจะสามารถวางแผน พร้อมสร้างนโยบายที่สามารถเข้าไปเพื่อช่วยเหลือกลุ่มคนในพื้นที่นั้นได้ ซึ่งถ้าในอนาคต เราสามารถทำให้บุคคลทั่วไป เจ้าที่ตำรวจ ผู้วางแผนนโยบาย สามารถใส่ข้อมูล และแสดงผลแบบ Real-time ใน CAMELON ได้ อาชญากรรมน่าจะน้อยลง และบุคคลทั่วไปสามารถระมัดระวังในพื้นที่ที่กำลังจะไปได้มากยิ่งขึ้น”

สามารถเข้าเยี่ยมชมเว็บไซต์ CAMELON ได้ที่: https://camelon-project.web.app

ดาวน์โหลดผลงานตีพิมพ์เรื่อง CAMELON: A System for Crime Metadata Extraction and Spatiotemporal Visualization from Online News Articles ได้ที่ >>> https://ieeexplore.ieee.org/abstract/document/10424974