ผลต่างระหว่างรุ่นของ "การทำเหมืองข้อความ"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
Jinapattanah (คุย | ส่วนร่วม)
การแทนเอกสารด้วยแบบจำลองเวกเตอร์สเปซ (อังกฤษ: Vector Space Model) และการให้น้ำหนักคำ
Jinapattanah (คุย | ส่วนร่วม)
บรรทัด 9:
 
;การแบ่งกลุ่มเอกสารข้อความ (Document clustering)
:จัดแบ่งเอกสารข้อความออกเป็นกลุ่ม โดยใช้การวัดความคล้ายคลึงและความแตกต่างของคุณลักษณะของเอกสารข้อความ เพื่อนำไปใช้ประโยชน์ในด้านการข่าว ข้อมูลเอกสารจะถูกแปลงให้เป็นชุดข้อมูลตัวเลขโดยวิธีการ DFxIDF[[DF หรือเีรียกว่าIDF]] โดยอาศัยวิธีการแทนเอกสารด้วยแบบจำลอง[[เวกเตอร์สเปซ]] ({{lang-en|Vector Space Model}}) และการให้[[น้ำหนักคำ]] ({{lang-en|Term Weighting}})จากนั้นถึงใช้ขั้นตอนวิธี[[การแบ่งกลุ่มข้อมูล]] ได้แก่ K-Mean, Unsupervised Learning Neural Networks, Hierarchical Clustering
 
== ขั้นตอนการทำเหมืองข้อความ ==