MMBase Lucene module

8
MMBase Lucene module Wouter Heijke

description

MMBase Lucene module. Wouter Heijke. Kenmerken Lucene. Apache Software License Snel/Efficient Java API Query Language Maatwerk nodig voor MMBase. Architectuur. Lucene MMBase module. MMBase objecten MMBase security context Instelbaar via XML file (builders/velden) - PowerPoint PPT Presentation

Transcript of MMBase Lucene module

Page 1: MMBase Lucene module

MMBase Lucene module

Wouter Heijke

Page 2: MMBase Lucene module

Kenmerken Lucene

• Apache Software License• Snel/Efficient• Java API• Query Language• Maatwerk nodig voor MMBase

Page 3: MMBase Lucene module

Architectuur

MMBase

Configuratie

Page 4: MMBase Lucene module

Lucene MMBase module

• MMBase objecten• MMBase security context• Instelbaar via XML file (builders/velden)• Velden hernoemen om uniformiteit te

waarborgen• Word / PDF parsing en indexering

(Attachments)• Resultaat is een lijst met nodes• Indexeren op interval basis

Page 5: MMBase Lucene module

Lucene configuratie

<?xml version="1.0" encoding="UTF-8"?><lucenemodule> <index name="MyNews"> <table name="news"> <field name="title" /> <field name="subtitle" /> <field name="intro">introduction</field> <field name="body" /> <related name="attachments"> <field name="title">rel.title</field> <field name="handle" type="binary">rel.body</field> </related> </table> <table name="mags"> <field name="title" /> <field name="body" /> </table> </index></lucenemodule>

Page 6: MMBase Lucene module

Todo Lucene module

• Taglib voor zoekresultaten

• HTML (crawling)

• On submit

• Scheduler (crontab module Kees Jongenburger)

• Ontsluiten meer Lucene functionaliteit (oa sorteren, score)

Page 7: MMBase Lucene module

Ervaring zoeken met MMBase

• MMBase: lage performance, query syntax (4en5mei)

• Ht://Dig: blackbox, crawler (4en5mei/Leeuwarden)

• Lucene: maatwerk, object based (Het KNMI, EGEM)

Page 8: MMBase Lucene module

Einde

Voor meer Lucene informatiehttp://jakarta.apache.org/lucene