Wednesday, June 10, 2009

Apache Lucene

10/06/09

วันนี้ตื่นสายมาก็หาหนังสือมาอ่านเกี่ยวกับเรื่อง Information Retrieval อีกซะหน่อย ... ยังข้องใจ เหมือนตัวเองยังศึกษามาดีไม่พอยังไงยังงั้น

เปิดๆ ดูจากที่โหลดๆ เก็บๆ ไว้ (เพราะที่หอจะต่อ internet ไม่ได้ในช่วงเช้า 8:40 - 16:30) พบว่ามี slide ของคุณ James H. Martin เขียนไว้ดีมากครับ ... เลยคิดว่า "ทำไมเราไม่รู้จักอ่านอันนี้น้า .... แล้วทำสุ่มๆ ไปเนี่ย ... เสียเวลาจริง" อีกใจนึงก็ทำให้คิดได้ว่า "ผลของการไม่เข้าใจในศาสตร์อย่างถ่องแท้ ก็ให้ผลแบบสุ่มๆ เช่นนั้นแหละ ... จะเสียใจไปใยเล่า" เป็นกรรมจริงๆ ... แค่นี้ก็พิสูจน์เล็กๆ แล้วว่าเป็นเรื่องของกรรม ... T_T

ส่วนหนึ่งของ slide lecture ของเขาก็ใช้หนังสือ IIR ที่อาจารย์กานดาเคยให้ลิงค์ผมเพื่ออ่านเหมือนกันครับ เป็นหนังสือที่ดีมากเล่มหนึ่งครับ (แต่ผมก็อ่านไม่จบอีกเหมือนเคยแฮะ)

พอได้อ่าน slide lecture แล้ว ก็เห็นว่าเค้าเขียนได้ดีมากครับ ... อ่านแล้วเข้าในง่ายดี ... ตอนนี้ก็เลยคิดว่าจะเปลี่ยนเป็นใช้วิธีที่เขาให้ assignment ดีหรือเปล่าหว่า ... ถ้ามันลดเวลาลงเยอะๆ ได้ ... ผมว่าเปลี่ยนก็ดีแฮะ ... คืนนี้ว่าจะลองเล่นดูครับ ซึ่งใน assignment เขาแนะให้ใช้ Apache Lucene ที่เป็น Java library สำหรับจัดการ index และการค้นหาที่มีประสิทธิภาพตัวนึง ... ผมไปเจอ lucene tutorial เข้าโดย google ที่เป็นล่าสุด (กระมัง) ... คืนนี้แหละ ... ขอชำแหละหน่อยเถอะนะ ... คริคริ

ว่าแต่ ... จะเก็บ index ลงในฐานข้อมูลเนี่ย ... ใช้ lucene ยังไงหว่า ? ... ใครรู้มั่งขอรับ T_T เง้อ ...


Tutorial มันก็มีแยะแฮะ
- http://www.devx.com/Java/Article/27728/0/page/1
- http://darksleep.com/lucene/
- http://www.onjava.com/pub/a/onjava/2003/03/05/lucene.html
- http://kalanir.blogspot.com/2008/06/creating-search-index-in-database.html
- http://oak.cs.ucla.edu/cs144/projects/lucene/index.html

No comments:

Post a Comment

ZAMACHITA - I AM ZAM