ลูซีน
ลิงก์ข้ามภาษาในบทความนี้ มีไว้ให้ผู้อ่านและผู้ร่วมแก้ไขบทความศึกษาเพิ่มเติมโดยสะดวก เนื่องจากวิกิพีเดียภาษาไทยยังไม่มีบทความดังกล่าว กระนั้น ควรรีบสร้างเป็นบทความโดยเร็วที่สุด |
ลูซีน (Lucene) เป็นซอฟต์แวร์เสรีและซอฟต์แวร์โอเพนซอร์สสำหรับใช้เป็นส่วนต่อประสานโปรแกรมประยุกต์ในการค้นคืนสารสนเทศ แต่เดิมลูซีนถูกเขียนขึ้นโดยใช้ภาษาจาวา โดย Doug Cutting ซึ่งสนับสนุนโดยมูลนิธิซอฟต์แวร์อาแพชี และเผยแพร่โดยใช้สัญญาอนุญาตซอฟต์แวร์อาแพชี ลูซีนถูกย้ายไปเขียนขึ้นด้วยภาษาอื่น ๆ นอกจากภาษาจาวาด้วย ได้แก่ ภาษาเพิร์ล ภาษาซีชาร์ป ภาษาซีพลัสพลัส ภาษาไพทอน ภาษารูบี้ และภาษาพีเอชพี
นักพัฒนา | มูลนิธิซอฟต์แวร์อาแพชี |
---|---|
รุ่นเสถียร | 2.3.2
/ 6 พฤษภาคม 2551 |
ที่เก็บข้อมูล | |
ระบบปฏิบัติการ | ข้ามแพลตฟอร์ม |
ประเภท | การค้นหาข้อมูล and การสร้างดัชนี ส่วนต่อประสานโปรแกรมประยุกต์. |
สัญญาอนุญาต | สัญญาอนุญาตซอฟต์แวร์อาแพชี |
เว็บไซต์ | lucene.apache.org |
ลูซีนเหมาะกับการใช้งานใดที่ต้องการการสร้างดัชนีข้อความอย่างเต็มรูปแบบ (Full-text indexing) และความสามารถในการค้นคืนข้อความแบบเต็มรูปแบบ (Full-text searching) ลูซีนได้รับการยอมรับอย่างกว้างขวางในการนำไปใช้สร้างเครื่องมือช่วยค้นหาข้อมูลสำหรับอินเทอร์เน็ต หรือ ภายในองค์กร หรือ เฉพาะในเว็บไซต์เดียว ซึ่งบางครั้งก็มีผู้เข้าใจผิดว่าลูซีนเป็นเครื่องมือช่วยค้นหาข้อมูลเต็มรูปแบบ ที่มีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML ด้วย ทั้งนี้โปรแกรมที่ใช้งานลูซีนจะต้องมีมีเครื่องมือรวบรวมเว็บเพจ (Web crawler) และโปรแกรมแจงโครงสร้างภาษา HTML โดยแยกออกจากลูซีน
สิ่งที่อยู่ในแก่นของสถาปัตยกรรมเชิงตรรกะของลูซีนคือแนวคิดว่าเอกสารประกอบไปด้วยเขตข้อมูลของข้อความ ซึ่งทำให้ส่วนต่อประสานโปรแกรมประยุกต์ของลูซีนยืดหยุ่นพอที่จะไม่ขึ้นอยู่กับรูปแบบไฟล์ ข้อความจากไฟล์ในรูปแบบ PDF HTML เอกสารไมโครซอฟท์เวิร์ด และรูปแบบอื่น ๆ อีกมากมายสามารถนำมาสร้างดัชนีได้ตราบเท่าที่สามารถสกัดข้อความจากเอกสารได้
โครงการที่ใช้ลูซีน
แก้- วิกิพีเดียใช้ลูซีนในการค้นหาแบบเต็มรูปแบบ
- บีเกิลใช้ลูซีนที่ย้ายไปเขียนด้วยภาษาซีชาร์ป ชื่อว่า Lucene.Net สำหรับสร้างดัชนี
- Docco (โฮมเพจ) ใช้ลูซีนในการค้นหาในเครื่องส่วนบุคคล (Desktop search)
- DSpace (โฮมเพจ) ใช้ลูซีน