ผลต่างระหว่างรุ่นของ "ขั้นตอนวิธีการค้นหาเพื่อนบ้านใกล้สุด k ตัว"

เพิ่มกล่องข้อมูล
(เพิ่มกล่องข้อมูล)
{{ลิงก์ไปภาษาอื่น}}
 
{{Machine learning bar}}
 
ขั้นตอนวิธีการเพื่อนบ้านใกล้ที่สุด ({{lang-en|K-Nearest Neighbour Algorithm}}) เป็นวิธีที่ใช้ในการจัดแบ่งคลาส โดยเทคนิคนี้จะตัดสินใจว่า คลาสใดที่จะแทนเงื่อนไขหรือกรณีใหม่ๆ ได้บ้าง โดยการตรวจสอบจำนวนบางจำนวน (“K” ในขั้นตอนวิธีการเพื่อนบ้านใกล้ที่สุด) ของกรณีหรือเงื่อนไขที่เหมือนกันหรือใกล้เคียงกันมากที่สุด โดยจะหาผลรวม (Count Up) ของจำนวนเงื่อนไข หรือกรณีต่างๆ สำหรับแต่ละคลาส และกำหนดเงื่อนไขใหม่ๆ ให้คลาสที่เหมือนกันกับคลาสที่ใกล้เคียงกันมากที่สุด
 
'''ตัวอย่าง''' [[ไฟล์: Knn-Class.png|thumb|left|ตัวอย่างการจัดกลุ่มข้อมูลของขั้นตอนวิธีการเพื่อนบ้านใกล้ที่สุด]]
[[ไฟล์:Knn-Class.png|alt=|center|200x200px]]
กำหนดให้จุดที่พิจารณาคือ วงกลมสีเขียว ควรจัดกลุ่มให้จุดที่สนใจไปอยู่ใน <u>คลาสแรกของสี่เหลี่ยมสีน้ำเงิน</u> หรือ ''คลาสสองของสามเหลี่ยมสีแดง''
 
* ถ้า k=3 แล้ว วงกลมสีเขียวจะอยู่ใน''คลาสสอง'' เพราะมี <u>สี่เหลี่ยม</u> 1 รูป และ ''สามเหลี่ยม'' 2 รูป อยู่ในวงกลมวงใน
* ถ้า k=5 แล้ว วงกลมสีเขียวจะอยู่ใน<u>คลาสแรก</u> เพราะมี <u>สี่เหลี่ยม</u> 3 รูป และ ''สามเหลี่ยม'' 2 รูป อยู่ในวงกลมวงนอก
 
== ขั้นตอนวิธี ==
การนำเทคนิคของขั้นตอนวิธีการเพื่อนบ้านใกล้ที่สุดไปใช้นั้น เป็นการหาระยะห่างระหว่างแต่ละตัวแปร(Attribute) ในข้อมูล จากนั้นก็คำนวณค่าออกมา ซึ่งวิธีนี้จะเหมาะสำหรับข้อมูลแบบตัวเลข แต่ตัวแปรที่เป็นค่าแบบไม่ต่อเนื่องนั้นก็สามารถทำได้ เพียงแต่ต้องการการจัดการแบบพิเศษเพิ่มขึ้น อย่างเช่น ถ้าเป็นเรื่องของสี เราจะใช้อะไรวัดความแตกต่างระหว่างสีน้ำเงินกับสีเขียว ต่อจากนั้นเราต้องมีวิธีในการรวมค่าระยะห่างของ Attribute ทุกค่าที่วัดมาได้ เมื่อสามารถคำนวณระยะห่างระหว่างเงื่อนไขหรือกรณีต่างๆ ได้ จากนั้นก็เลือกชุดของเงื่อนไขที่ใช้จัดคลาส มาเป็นฐานสำหรับการจัดคลาสในเงื่อนไขใหม่ๆ ได้แล้วเราจะตัดสินได้ว่าขอบเขตของจุดข้างเคียงที่ควรเป็นนั้น ควรมีขนาดใหญ่เท่าไร และอาจมีการตัดสินใจได้ด้วยว่าจะนับจำนวนจุดข้างเคียงตัวมันได้อย่างไร โดยขั้นตอนวิธีการเพื่อนบ้านใกล้ที่สุดมีขั้นตอนโดยสรุป ดังนี้
72,281

การแก้ไข