ข้อมูลที่ใช้พัฒนางานชิ้นนี้ ทีมงานได้เก็บรวบรวมจากเว็บไซต์สำนักข่าวในประเทศไทยที่น่าเชื่อถือและมีผู้ใช้งานจำนวนมาก จากการจัดอันดับของ Reuters Institute for the Study of Journalism ในปี 2023 และมีการจัดโครงสร้างเว็บไซต์ที่เป็นระบบ ทำให้สามารถเก็บรวบรวมข้อมูลได้ ข้อมูลในงานชิ้นนี้ จึงไม่ได้ครอบคลุมข่าวทั้งหมดที่มีในประเทศไทย แต่มาจาก 5 เว็บไซต์ข่าวออนไลน์ที่สำคัญ
เนื่องจากแต่ละสำนักข่าวมีจำนวนข่าวที่ไม่เท่ากัน จึงทำให้เทรนด์ที่พบในงานนี้ได้รับอิทธิพลจากสำนักข่าวที่มีจำนวนข่าวเยอะเป็นพิเศษ
55.8 %
21.1 %
12.3 %
7.7 %
3.0 %
สำนักข่าวแต่ละแห่งได้แบ่งการนำเสนอข่าวไว้เป็นหมวดหมู่ที่แตกต่างกัน ทีมงานจึงทำการคัดเลือก ตัดทอน และนำมาจำแนกหมวดหมู่ใหม่เป็น 9 ประเภท เพื่อการนำเสนอข้อมูลอย่างมีระบบ ทั้งนี้ อาจมีข่าวบางหมวดหมู่ที่ไม่ได้รวมอยู่ในการวิเคราะห์ข้อมูลครั้งนี้
เลื่อน
ข้อมูลที่ใช้ในงานมาจากการดึงข้อมูล (data scraping) บนเว็บไซต์สำนักข่าวด้วยเครื่องมือ python library selenium ผ่าน Google Colab ทั้งนี้ เว็บไซต์สำนักข่าวที่มีปริมาณข่าวค่อนข้างมากอย่างไทยรัฐออนไลน์ มีการใช้ API ของเว็บไซต์มาช่วยดึงข้อมูลด้วย โดยข้อมูลที่ถูกดึงมาใช้ประกอบด้วย พาดหัวข่าว วันที่ลงข่าว ประเภทข่าว และลิงก์ URL ของข่าว ข้อมูลดังกล่าวถูกรวมและสร้างเป็น Pandas DataFrame เพื่อ export เป็นไฟล์นามสกุล CSV ตามลำดับ
บอกได้มั้ย ข่าวไหนเกิดก่อน
กดที่พาดหัวข่าวด้านล่าง แล้วลากขึ้น-ลง เพื่อเรียงลำดับเหตุการณ์ก่อน-หลัง