ผลต่างระหว่างรุ่นของ "การแบ่งประเภทข้อมูล"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
Horus (คุย | ส่วนร่วม)
ไม่มีความย่อการแก้ไข
Azoma (คุย | ส่วนร่วม)
เก็บกวาดทันใจด้วยสจห.
บรรทัด 1:
ใน[[วิทยาการคอมพิวเตอร์]] '''การแบ่งประเภทข้อมูล''' ({{lang-en|data classification}}) เป็นปัญหาพื้นฐานของ[[การเรียนรู้แบบมีผู้สอน]] โดยปัญหาคือการทำนายประเภทของวัตถุจาก[[คุณสมบัติ]]ต่าง ๆ ของวัตถุ ซึ่งการเรียนรู้แบบมีผู้สอนจะสร้าง[[ฟังก์ชัน]]เชื่อมโยง ระหว่างคุณสมบัติของวัตถุ กับประเภทของวัตถุจากตัวอย่างสอน แล้วจึงใช้ฟังก์ชันนี้ทำนายประเภทของวัตถุที่ไม่เคยพบ เครื่องมือหรือขั้นตอนวิธีที่ใช้สำหรับการแบ่งประเภทข้อมูลเช่น โครงข่ายประสาทเทียม ต้นไมตัดสินใจ
 
== นิยามของปัญหา ==
กำหนดตัวอย่างสอน <math>E = \{(x_1,y_1), (x_2,y_2),\dots, (x_n,y_n) \}</math> ให้ <math>x_i</math> เป็นเวกเตอร์แสดงคุณสมบัติของวัตถุ ซึ่ง <math>x_i \in A_1 \times A_2 \times \cdots \times A_m</math> โดยที่ <math>A_i</math> เป็นเซตจำกัดระบุคุณสมบัติ และ <math>y \in C</math> เป็นประเภทของวัตถุ ซึ่งกำหนดไว้ในเซตจำกัด <math>C</math>
ต้องการหาฟังก์ชัน <math>f (x) </math> ซึ่งให้ค่า <math>y</math> จากเวกเตอร์ <math>x</math> ที่กำหนด โดยที่ความผิดพลาดของการทำนายตัวอย่างสอนมีค่าน้อยที่สุด
หรือมีค่า <math>e</math> น้อยที่สุด โดยกำหนด <math>e = \sum_{i=1}^{n} t (f(x_i),y_i) </math> ซึ่ง
<math>t (a,b) = \begin{cases}0, \mbox{if } a=b \\ 1,
\mbox{if }a \neq b \end{cases}</math>