Category: Data Science

ประเภทของข้อมูลที่คนทำงานด้านข้อมูลต้องเข้าใจ

ประเภทของข้อมูล (data type) และ สเกล (scale) ที่นักวิจัย และ ผู้ที่ทำงานเกี่ยวกับข้อมูลต้องรู้จัก มี 4 ประเภทใหญ่ๆ คือ nomial, ordinal, interval, และ ratio นักศึกษาที่เรียนการวิจัยและการประมวลผลข้อมูลมันจะสับสน จำสลับ หรือจำผิดๆถูกๆ ดังนั้นบทความนี้จึงจะนำเสนอนิยามของประเภทของข้อมูลทั้ง 4 เอาไว้เพื่อให้นักศึกษาใช้เป็นแหล่งอ้างอิง (รู้หรือไม่ว่าคนที่คิดคำทั้ง 4 มาให้พวกเราได้ใช้กันคือ Stanley Stevens) 1. Nominal ข้อมูลประเภท nominal คือข้อมูลที่ไม่ใช่ตัวเลข หรือ เชิงปริมาณ (quantitative) ดังนั้นข้อมูลประเภทนี้จึงไม่สามารถนำมาคำนวณ หรือ เปรียบเทียบในทางคณิตศาสตร์ได้ เราอาจจะเรียกข้อมูลชนิดนี้ว่าเป็น “ป้าย” หรือ “ฉลาก” (label) ที่เอาไว้กำกับชื่อของสิ่งใดๆ วิธีจำให้ง่ายก็คือ nominal ก็คือ name มันคือป้ายชื่อดีๆนี่เอง ตัวอย่างของข้อมูลประเภทนี้เช่น เพศชาย เพศหญิง สีดำ สีเขียว ประเทศไทย หรือ รองเท้า เป็นต้น...

Data Scientist

คำว่า “Data Scientist” เริ่มเป็นที่แพร่หลายเมื่อไม่กี่ปีที่ผ่านมา หลายองค์กรเร่งหา Data Scientist เข้ามาประจำการเพื่อเสริมศักยภาพให้กับธุรกิจเพื่อที่จะคงขีดสามารถทางการแข่งขัน และพัฒนาธุรกิจให้เติบโตต่อเนื่อง อาชีพ Data Scientist จึงติดโผ 1 ใน 20 อาชีพที่เป็นที่ต้องการที่สุดของทศวรรตนี้ หลายคนเริ่มใช้คำนี้ติดปากมากขึ้น แต่น้อยคนที่จะเข้าใจว่า Data Scientist คืออะไร และอาชีพนี้ ถึงแม้จะใช้ความรู้สถิติ และคณิตศาสตร์เป็นพื้นฐานสำคัญ พวกเขาต่างจากนักสถิติ หรือ คณิตกรอย่างไร ศาสตร์ Data Science (วิทยาการข้อมูล) กำเนิดจากแวงวงเทคโนโลยี​ โดยเริ่มจากการนำข้อมูลไปวิเคราะห์เพื่อจัดอันดับเว็บไซต์ของ Google หรือ การวิเคราะห์เครือข่าย Social Media ของ Facebook หลังจากนั้นศาสตร์นี้ก็ได้แพร่ขยายเข้าสู่วงการอื่นๆ เช่น การค้าปลีก โทรคมนาคม เกษตร และวิทย์-สุขภาพ ผู้ที่เป็นตัวจักรสำคัญคือ Data Scientist (นักวิทยาการข้อมูล) ซึ่งคนเหล่านี้มีหน้าที่วิเคราะห์ข้อมูล หลังจากนั้นจึงนำข้อมูลไปทดลองทำเป็นโครงการ หรือ แคมเปญต่างๆ โดยเฉพาะแคมเปญแบบ online และท้ายที่สุด data scientist...