ไขประเด็นวิเคราะห์ Faked Data “รู้-แก้” ให้ตรงจุด
เวลาที่เราค้นข้อมูล เราจะทราบได้อย่างไรว่า ข้อมูลผิด หรือเป็น Faked Data” บางความคิด บอกว่า ส่วนหนึ่งเป็นเรื่องของทักษะด้านข้อมูล (Data Literacy) ที่จะต้องใช้ตรรกะและองค์ความรู้แยกให้ได้ว่าข้อมูลใดเป็นข้อมูลจริงหรือเท็จ ข้อมูลมาจากแหล่งที่น่าเชื่อถือหรือไม่ บ่อยครั้งที่มักจะพบว่าข้อมูลจากการวิเคราะห์ ที่แสดงเป็นรายงานอย่างสวยงามนั้น เมื่อนำเสนอต่อผู้บริหาร หรือผู้เชี่ยวชาญแล้วบุคคลเหล่านั้นบอกว่า “ข้อมูลผิด” และสิ่งหนึ่งที่มักได้ยินบ่อยๆ ในหลายองค์กรก็คือว่า ข้อมูลจำนวนมากที่เก็บอยู่ในองค์กรเป็นขยะ กล่าวคือ ข้อมูลไม่ถูกต้อง ทำให้การนำไปวิเคราะห์ย่อมได้ผลลัพธ์ที่ผิดพลาดตามมา ดังนั้นหลายคนอาจสงสัยว่า เราจะทราบได้อย่างไรว่า ข้อมูลผิด หรือเป็น Faked Data” บางความคิด บอกว่า ส่วนหนึ่งเป็นเรื่องของทักษะด้านข้อมูล (Data Literacy) ที่จะต้องใช้ตรรกะและองค์ความรู้แยกให้ได้ว่าข้อมูลใดเป็นข้อมูลจริงหรือเท็จ ข้อมูลมาจากแหล่งที่น่าเชื่อถือหรือไม่ แต่บังเอิญคำถามนี้กลายเป็นว่า ข้อมูลดังกล่าวมาจากแหล่งต้นทางที่เราคิดว่าน่าจะถูกต้อง มีความน่าเชื่อถือ แต่กลับกลายเป็นว่ามีข้อมูลดิบบางส่วนที่ผิดอยู่ด้วย ที่ผ่านมา ผมทำงานกับข้อมูลดิบมาอย่างยาวนาน และบ่อยครั้งก็จะพบว่า ข้อมูลจากแหล่งต้นทางผิดจริง แต่ก็ใช่ว่าจะผิดมากมาย ส่วนใหญ่อาจผิดพลาดเพราะการใส่ตัวเลขผิดพลาด หรือมีการเก็บข้อมูลคาดเคลื่อน เรื่องเหล่านี้เป็นเรื่องปกติของการวิเคราะห์ข้อมูล (Data Analytics) ยิ่งข้อมูลมีขนาดใหญ่ (Big Data)…