ผลต่างระหว่างรุ่นของ "แบบจำลองปริภูมิเวกเตอร์"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
Jinapattanah (คุย | ส่วนร่วม)
หน้าใหม่: ===การแทนเอกสารด้วยแบบจำลองเวกเตอร์สเปซ=== การแทนเอกสารด้วยแบ...
(ไม่แตกต่าง)

รุ่นแก้ไขเมื่อ 18:49, 15 มกราคม 2555

การแทนเอกสารด้วยแบบจำลองเวกเตอร์สเปซ

การแทนเอกสารด้วยแบบจำลองเวกเตอร์สเปซ (Vector Space Model: VSM) [1] และการให้น้ำหนักคำ (Term Weighting) เป็นหนึ่งในวิธีการแทนเอกสารที่ไม่มีโครงสร้าง (Unstructured Text Document) ด้วยแบบจำลองเวกเตอร์สเปซ โดยกำหนดให้เอกสารแต่ละฉบับเปรียบเสมือนเวกเตอร์ของคำ ขนาดของเวกเตอร์ขึ้นอยู่กับจำนวนของคำที่ปรากฏอยู่ในเอกสารฉบับนั้น กำหนดให้ Wik คือน้ำหนักของคำ K ที่ปรากฏในเอกสารฉบับที่ i เวกเตอร์สำหรับเอกสาร Di เขียนแทนด้วย Di = (Wi1, Wi2,…, Wit) ซึ่ง t คือจำนวนของคำที่ไม่ซ้ำกัน ในชุดของเอกสารทั้งหมด ดังนั้นในช่องว่าง (Space) ของเอกสารชุดหนึ่งจะมีมิติเท่ากับ t -มิติ เช่นเวกเตอร์ของเอกสารใน 3 มิติ แสดงได้ดังภาพที่ 1

ภาพที่ 1 เวกเตอร์ของเอกสารใน 3 มิติ

Jinapattanah 18:49, 15 มกราคม 2555 (ICT)

อ้างอิง

  1. Normal 0 false false false MicrosoftInternetExplorer4 Raghavan, V.V. and S.K.M. Wong. 1986. A critical analysis of vector space model for information retrieval. Journal of the American Society for Information Science. 37(5): 279-87.