ชุดข้อมูล (อังกฤษ: Data Set หรือ Dataset) เป็นชุดของข้อมูล ในกรณีตารางข้อมูล ชุดข้อมูลอาจจะมีเพียงหนึ่งตารางหรือมากกว่านั้น โดยที่ทุกคอลัมน์ของตารางแสดงถึงตัวแปรเฉพาะ ข้อมูลของทุก ๆ แถวจะสอดคล้องกับเอกสารที่กำหนดรายละเอียดของชุดข้อมูล โดยชุดข้อมูลแสดงรายการตามค่าของตัวแปรแต่ละตัว เช่น ความสูงและน้ำหนักของคุณสมบัติสมาชิกของชุดข้อมูลแต่ละตัว นอกจากนั้น ชุดข้อมูลยังสามารถประกอบด้วยชุดของเอกสารหรือไฟล์[1]

ในข้อมูลแบบเปิด จำนวนชุดข้อมูลถือเป็นหน่วยหนึ่งในการวัดปริมาณข้อมูลที่เผยแพร่ให้แก่สาธารณะชน เว็บท่าที่รวบรวมลิงก์เว็บไซต์ และบทความต่าง ๆ ของยุโรป Data.europa.eu รวบรวมชุดข้อมูลมากกว่าหนึ่งล้านชุดข้อมูล[2] ในประเทศไทยมีการให้บริการศูนย์กลางข้อมูลเปิดภาครัฐภายใต้ชื่อ Data.go.th รวบรวมชุดข้อมูลมากกว่าหนึ่งหมื่นชุดข้อมูล[3]

ตัวอย่างชุดข้อมูล แก้

ชุดข้อมูลพื้นฐานหลายชุดข้อมูลถูกนำมาใช้อย่างกว้างขวางในงานทางด้านสถิติ

ชุดข้อมูลดอกไม้ไอริส (Iris Flower Data Set) – ชุดข้อมูลหลายตัวแปรแนะนำโดย Ronald Fisher (2479) ให้บริการชุดข้อมูลออนไลน์โดยใช้พื้นที่เก็บข้อมูลการเรียนรู้ของเครื่อง มหาวิทยาลัยแคลิฟอร์เนีย วิทยาเขตเออร์ไวน์[4]

อ้างอิง แก้

  1. Snijders, C.; Matzat, U.; Reips, U.-D. (2012). "'Big Data': Big gaps of knowledge in the field of Internet". International Journal of Internet Science. 7: 1–5. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2019-11-23. สืบค้นเมื่อ 2022-01-05.
  2. "Statistics". data.europa.eu. 23 กันยายน 2565.{{cite web}}: CS1 maint: url-status (ลิงก์)
  3. "ชุดข้อมูล - Open Government Data of Thailand". data.go.th.
  4. "UCI Machine Learning Repository". archive.ics.uci.edu (ภาษาอังกฤษ).

แหล่งข้อมูลอื่น แก้