Post on 25-Jan-2016
description
MMBase Lucene module
Wouter Heijke
Kenmerken Lucene
• Apache Software License• Snel/Efficient• Java API• Query Language• Maatwerk nodig voor MMBase
Architectuur
MMBase
Configuratie
Lucene MMBase module
• MMBase objecten• MMBase security context• Instelbaar via XML file (builders/velden)• Velden hernoemen om uniformiteit te
waarborgen• Word / PDF parsing en indexering
(Attachments)• Resultaat is een lijst met nodes• Indexeren op interval basis
Lucene configuratie
<?xml version="1.0" encoding="UTF-8"?><lucenemodule> <index name="MyNews"> <table name="news"> <field name="title" /> <field name="subtitle" /> <field name="intro">introduction</field> <field name="body" /> <related name="attachments"> <field name="title">rel.title</field> <field name="handle" type="binary">rel.body</field> </related> </table> <table name="mags"> <field name="title" /> <field name="body" /> </table> </index></lucenemodule>
Todo Lucene module
• Taglib voor zoekresultaten
• HTML (crawling)
• On submit
• Scheduler (crontab module Kees Jongenburger)
• Ontsluiten meer Lucene functionaliteit (oa sorteren, score)
Ervaring zoeken met MMBase
• MMBase: lage performance, query syntax (4en5mei)
• Ht://Dig: blackbox, crawler (4en5mei/Leeuwarden)
• Lucene: maatwerk, object based (Het KNMI, EGEM)
Einde
Voor meer Lucene informatiehttp://jakarta.apache.org/lucene