Evaluatie BI-tool: Pentaho · 2011-02-12 · Al bij al is Pentaho een krachtige en...
Transcript of Evaluatie BI-tool: Pentaho · 2011-02-12 · Al bij al is Pentaho een krachtige en...
Evaluatie BI-tool: Pentaho
Katholieke Hogeschool Kempen Campus Geel Departement Handelswetenschappen en Bedrijfskunde 3de jaar Toegepaste Informatica
Business Intelligence
Dries VAN LOOY (3TI3)
Wesley VAN VLERKEN(3TI3)
Veerle VERHEYEN (3TI3)
Academiejaar 2010 -2011
Pagina | 1
Pentaho
Achtergrondinformatie
Pentaho is ontwikkeld door The Pentaho BI Project, dit bestaat uit een team van veteranen uit de
Business Intelligence industrie. Het is een open source applicatie, die bestaat sinds 2004.
Pentaho bestaat uit 5 componenten:
• Analysis Services
• Reporting
• Data Mining
• Data Integration
• Dashboard
Analysis Services
Met behulp van de analyzer tool kunnen gebruikers data verkennen en analyseren om er zo meer
inzicht in te krijgen. De resultaten worden duidelijk voorgesteld zodat je er in één oogopslag een
goed beeld van krijgt. Met behulp van multidimensionele drag-and-drop elementen kan je zo een
rapport of grafiek opbouwen . De nodige filter- en sorteeropties zijn voorzien.
Pagina | 2
Reporting
In Pentaho word rapportering beschouwd als een essentieel deel van BI. Via deze rapporten kan je op
een eenvoudige manier een overzicht krijgen van je informatie en deze delen met anderen. Deze
rapporten kunnen opgesteld worden vanuit verschillende soorten databronnen zoals relationele,
OLAP of XML-gebaseerde databronnen. Via een handige wizard kan je snel een rapport aanmaken en
ook aan deze rapporten kan je grafieken koppelen, er zijn 15 verschillende aanpasbare soorten
grafieken beschikbaar. Je kan deze rapporten ook exporteren naar formaten zoals HTML, PDF, Excel,
RTF of plain text. Ook kan je het rapport rechtstreeks op de BI-server publiceren.
Data Mining
Met Data Mining kan je verborgen patronen en indicaties van toekomstige trends ontdekken,
hierdoor leer je de industrie beter kennen en kan je beter anticiperen op trends. Pentaho voorziet
hiervoor een kant-en-klare oplossing met behulp van een wizard, maar geeft je ook de mogelijkheid
om een eigen, aangepaste voorstelling te maken door gebruik te maken van Java objecten en Java
Server Pages. Er zijn ingebouwde algoritmes voor deze data mining. Pentaho werkt hiervoor samen
met WEKA (Waikato Environment for Knowledge Analyis), een open-source tool. De output kan je
grafisch bekijken of kan je omvormen tot een rapport.
Pagina | 3
Data Integration (ETL)
Pentaho Data Integration baseert zich op metadata bij het ETL proces. Het ondersteunt meer dan 30
database platformen en bestanden. Ook hier kan je gebruik maken van drag-and-drop elementen en
is een grafische voorstelling mogelijk. Deze integratie maakt de informatie toegankelijk voor
gebruikers en andere functies in de BI Suite. De Data Integration kan enorme hoeveelheden data
verwerken.
Dashboards
Dashboards geven je onmiddellijk een duidelijk zicht over informatie. Pentaho biedt grafisch erg
mooie dashboards, ze zijn erg interactief en werken op basis van Adobe Flash. Deze kan je eenvoudig
opbouwen aan de hand van wizards. Er wordt gebruik gemaakt van metrics en KPIs. Je kan onderzoek
doen naar onderliggende details en uitzonderingen opzoeken.
Pagina | 4
De tool
Interface
Pentaho heeft een mooie, nette interface. Je krijgt de belangrijkste mogelijkheden voorgeschoteld.
Achter elk van deze knoppen schuilt een wizard waarmee je onmiddellijk aan de slag kan gaan.
Gebruiksvriendelijkheid
Er worden twee consoles gebruikt: één voor de gewone gebruiker en één om de administratieve
kant. Een gewone gebruiker krijgt na het inloggen bovenstaand scherm te zien. De administrator kan
databronnen beheren, gebruikers beheren, servers beheren en andere configuraties beheren.
Talen
Je kan kiezen uit meerdere talen, hier zit echter een fout in, als je bijvoorbeeld Nederlands kiest,
wordt niet alles vertaald. In het hoofdmenu krijg je dan: Nieuw Analyzer Rapport en New Report zoals
je hieronder kan zien.
Pagina | 5
Kostprijs
Uit de volgende grafiek kan je aflezen wat de kostprijs van Pentaho is tegenover gevestigde BI-tools.
Zoals je kan zien zijn deze bijzonder laag.
Pagina | 6
Reporting & Dashboarding in Pentaho
Ad hoc rapport
Wizard om snel eenvoudige rapporten te maken. Weer wordt een gebruiksvriendelijk interface
gehanteerd. Je kan previews bekijken en thema’s kiezen om de algemene opmaak te bepalen. Er zijn
verschillende opties om de opmaak aan te passen en om de gegevens te sorteren. Ook hier blijft de
relatie tussen de gegevens aanwezig en worden de gegevens dus dynamisch aangepast aan de
veranderingen die je doorvoert.
Analyzer Rapport
Met deze wizard kan je snel een analyserapport samenstellen. Het voordeel aan deze wizard is dat je
de structuur van de data niet moet kennen, je krijgt namelijk alle mogelijke tabellen en velden
voorgeschoteld. De relaties worden steeds goed bijgehouden, waardoor de data dynamisch
veranderd als je een veld toevoegt dat hiermee in relatie ligt. Zoals onderstaand voorbeeld, eerst zie
je het resultaat als “Department” het hoofdcriterium is, daarna zie je het resultaat als “Region” het
hoofdcriterium wordt.
Je krijgt een interactieve interface voorgeschoteld waar je nieuwe velden met behulp van drag-and-
drop kan toevoegen. Je kan gemakkelijk filters, subtotalen en berekende velden toevoegen. Erg
handig is dat je deze data ook snel kan omzetten naar een grafiek met onderstaande knop. Je kan ook
kiezen uit verschillende soorten grafieken.
Pagina | 7
Het rapport of de grafiek die je hier maakt, kan je later in een dashboard implementeren. Ook kan je
kiezen om de data te exporteren, dit kan naar .pdf, Excel of CSV. Metadata zoals auteur, gebruikte
filters, … wordt mee opgenomen in deze bestanden zoals je ziet in onderstaand voorbeeld. De auteur
was hier “Joe”.
Bij een .pdf krijg je deze informatie op de laatste pagina te zien als samenvatting, je ziet dat er hier
geen filters gebruikt werden en er wordt duidelijk vermeld welke velden gebruikt werden.
Pagina | 8
In een Excel staat deze informatie bovenaan op de pagina.
Uitgebreid rapport
Met een aparte tool kan je ook erg uitgebreid rapporten maken, hierbij kan je echt in de tabellen
gaan snuffelen. Dit kan via een grafische omgeving maar ook via SQL-code. Verder kan je de opmaak
van het rapport tot in detail bepalen. In deze rapporten kan je ook grafieken toevoegen. Hoewel dit
erg complex en uitgebreid kan worden, wordt het allemaal toch via een gebruiksvriendelijke en
intuïtieve manier aangesproken. Als je klaar bent met je rapport kan je dit publiceren op de server.
Dashboards
Je kan zelf je eigen dashboards uitbouwen waarvan je de indeling, het thema en de inhoud helemaal
zelf bepaald. Voor de indeling kies je bijvoorbeeld 2x2, dus vier vakken verspreidt over je dashboard.
Als thema kies je Cool Blue en als inhoud test je eens alle mogelijkheden uit. Dan krijg je ongeveer
onderstaand voorbeeld.
Pagina | 9
Zoals je ziet kan je grafieken, tabelresultaten, websites en rapporten op je dashboard plaatsen. In de
grafieken kan je gemakkelijk de schaal aanpassen of labels bij de x-as en y-as plaatsen om je
weergave te verduidelijken.
De tabelresultaten zijn een selectie die je zelf maakt, je kiest zelf welke velden je meeneemt en welke
niet. Deze kan je dan naar eigen wens filteren en sorteren. Ook zijn er opties voor paging voorzien.
In je dashboard kan je ook een website plaatsen, de website van het bedrijf bijvoorbeeld.
Het rapport dat je rechtsonder ziet, was op voorhand aangemaakt, je kan eigen rapporten dus
eenvoudig implementeren.
Vergelijking Pentaho vs Qlikview
Qlikview Pentaho
Installatie Gemakkelijk en snel Duurt lang, veel
ingewikkelder door gebruik
van meerdere servers
Intuïtieve interface Duidelijk, mooi Duidelijk, mooi
Documentatie Tutorial van 227 pagina’s op
de website. Veel informatie
op internet.
Bij het downloaden krijg je
een account voor toegang
tot de knowledge base en
een handleiding/tutorial van
65 pagina’s.
Scripting Eigen scriptingmethodes Alles grafisch of via SQL-code
Gebruiksgemak Veranderingen zijn snel
gemaakt, je kan je selectie
verfijnen gewoon door
enkele velden aan te duiden
Als je aanpassingen wilt
maken, moet je meestal
eerst naar een ander
venster, terug naar de
wizard. Simpele opties zoals
filteren en sorteren gaan wel
direct.
Mobiele versie Ja Nee
Databronnen Access, Excel, XML, ODBC,
OLEDB, ERP, …
Access, Excel, XML, CSV,
JDBC, RSS, …
In Magic Quadrant Gartner Ja Nee
Open source Nee Ja
Gratis Nee Nee
Pagina | 10
Bevindingen Forrester & Gartner
Forrester
Results Of The Forrester Wave™: Open Source Business Intelligence (BI), Q3 2010
“If you seek a full BI suite, then the options are BEE, Jaspersoft, Pentaho, and SpagoBI. Some critical
components of enterprise-grade BI capabilities like integrated metadata management are not even
fully addressed by the open source community at this point.”
“Pentaho takes it up yet another notch with the availability of even more components in its
community version.”
“Using this approach for Forrester's 157-criteria evaluation of open source BI vendors, we found that
Actuate BIRT led the pack because of richness of reporting functionality. Jaspersoft Enterprise,
SpagoBI, Pentaho Enterprise, and Pentaho Community are close behind”
Gartner
Magic Quadrant for Business Intelligence Platforms 2009
Although Pentaho did not get placed in the actual Quadrant they did receive praise from Gartner:
“However, while they don’t meet the revenue requirement, Pentaho has emerged as viable player in
the BI platform market and as such we invited this firm to take part in the Magic Quadrant user
survey. This open source vendor provides comprehensive BI platform capabilities that is comparable
to traditional BI platform vendors. A key part of this vendor’s strategy is to forge OEM relationships
with commercial independent software vendors (ISVs) looking to easily embed BI functionality at a
low price point. Pentaho enables ISVs to OEM open-source BI components without being bound by
the GNU General Public License (GPL) terms and conditions. Given its subscription-based model, this
vendor need to provide exemplary support. This was in evidence in the MQ reference survey,
Pentaho scored strongly on the customer support question — higher than any of the megavendors.”
Additionally, the Gartner report goes on to summarize the Pentaho platform, which is very
comprehensive and feature-rich considering its open-source foundation:
“Pentaho, after just four years in existence, has put together a comprehensive open-source BI
platform that includes data integration and data mining capabilities. In 2008, Pentaho was
noticeably more aggressive, openly competing against traditional BI platform vendors. Like
Jaspersoft, Pentaho is affordable and also offers a subscription-based model that avoids an initial
large payment for the software license. Some of the significant features Pentaho introduced in
2008 include an automatic table designer that analyzes relational schemas and data patterns,
performs a cost-benefit analysis of aggregation at different levels, and generates and populates
those aggregate tables. Despite a handful of large customers, Pentaho reference survey
respondents more frequently indicated that they had more departmental deployments (versus
enterprisewide) and smaller data volumes compared with the other vendors.”
Pagina | 11
Conclusie
Al bij al is Pentaho een krachtige en gebruiksvriendelijke BI-tool. Alles wordt grafisch weergegeven,
wat het gemakkelijk maakt om mee te werken. Pentaho hoeft zeker niet onder te doen voor andere
BI-tools zoals bijvoorbeeld Qlikview. Het feit dat het open source software is, is zeker een voordeel
voor dit product. Op deze manier verschijnen er namelijk geregeld updates voor de software, en blijft
de prijs lager dan traditionele BI-tools. Je betaalt geen kosten voor licenties en onderhoud. Maar wel
voor training en support. Het is een zeer gebruiksvriendelijke en intuïtief systeem, maar de wizards
maken het soms onnodig moeilijk. Anderzijds gebeurt alles grafisch of via SQL-code, waar QlikView
zijn eigen scriptingsmethodes heeft. De dashboards van QlikView zijn echter veel uitgebreider. De
meningen over welke de beste tool is, zijn binnen ons team verdeeld. Ze vullen elkaar perfect aan in
elkaars voor- en nadelen. Een combinatie van de twee zou de perfecte BI-tool kunnen vormen.
Bronnen
http://www.pentaho.com/
http://blogs.forrester.com/boris_evelson/10-08-10-
results_forrester_wave%E2%84%A2_open_source_business_intelligence_bi_q3_2010
http://sherlockinformatics.com/wordpress/business-intelligence-technology/pentaho-receives-
attention-from-gartner
http://www.enixe.nl/Upload/Productvergelijk/enixe-it-solutions-BI-Platforms-2009.pdf
Demo’s Als je meer wil zien van hoe Pentaho werkt en welke mogelijkheden er zijn, vindt je hieronder twee links naar demo's. Eentje gaat over rapportering, de andere gaat over dashboarding.
Video - Reporting with Pentaho
http://www.youtube.com/watch?v=FGdyPLjLjIk
Video - Pentaho Dashboard Demonstration
http://www.youtube.com/watch?v=Yu_8duRM4PA
Pagina | 12
Presentatie
Inhoud
• Voorstelling Pentaho
• Achtergrondinformatie
• Mogelijkheden
• Vergelijking met QlikView
• Conclusie
Pagina | 13
Voorstelling Pentaho
• Open source BI-tool
• Bestaat sinds 2004
• bestaat uit 5 componenten:
– Analysis Services
– Reporting
– Data Mining
– Data Integration
– Dashboard
Voorstelling Pentaho
• Analysis Services
Data verkennen & analyseren
Voorstelling Pentaho
Pagina | 14
• Reporting
Eenvoudig overzicht van je informatie
Voorstelling Pentaho
• Data Mining
Patronen en indicaties van toekomstige trends
Voorstelling Pentaho
Pagina | 15
• Data Integration
Baseert zich op metadata bij het ETL proces
Voorstelling Pentaho
• Dashboards
Duidelijk en interactief zicht over de informatie
Voorstelling Pentaho
Pagina | 16
Achtergrondinformatie
• Interface
• Gebruiksvriendelijkheid (2 consoles)
Achtergrondinformatie
• Talen
• Kostprijs
Pagina | 17
Mogelijkheden
• Ad hoc rapport
Eenvoudige rapporten
• Analyzer rapport
Mogelijkheden
Snel omzetten naar grafiek:
• Export-functies (.pdf , Excel, CSV)
Pagina | 18
Mogelijkheden
• Export-functies (.pdf , Excel, CSV)
• Uitgebreid rapport
• Dashboards
Vergelijking met QlikView
Pagina | 19
Conclusie
Voordelen:
• Krachtig & gebruiksvriendelijk
• Hoeft niet onder te doen voor andere BI-tools
• Geen kosten voor licenties & onderhoud
Nadelen:
• Wizards maken het soms lastig werken
Conclusie
Voordelen:
• Krachtig & gebruiksvriendelijk
• Hoeft niet onder te doen voor andere BI-tools
• Geen kosten voor licenties & onderhoud
Nadelen:
• Wizards maken het soms lastig werken