Evaluatie BI-tool: Pentaho · 2011-02-12 · Al bij al is Pentaho een krachtige en...

21
Evaluatie BI-tool: Pentaho Katholieke Hogeschool Kempen Campus Geel Departement Handelswetenschappen en Bedrijfskunde 3de jaar Toegepaste Informatica Business Intelligence Dries VAN LOOY (3TI3) Wesley VAN VLERKEN(3TI3) Veerle VERHEYEN (3TI3) Academiejaar 2010 -2011

Transcript of Evaluatie BI-tool: Pentaho · 2011-02-12 · Al bij al is Pentaho een krachtige en...

Evaluatie BI-tool: Pentaho

Katholieke Hogeschool Kempen Campus Geel Departement Handelswetenschappen en Bedrijfskunde 3de jaar Toegepaste Informatica

Business Intelligence

Dries VAN LOOY (3TI3)

Wesley VAN VLERKEN(3TI3)

Veerle VERHEYEN (3TI3)

Academiejaar 2010 -2011

Pagina | 1

Pentaho

Achtergrondinformatie

Pentaho is ontwikkeld door The Pentaho BI Project, dit bestaat uit een team van veteranen uit de

Business Intelligence industrie. Het is een open source applicatie, die bestaat sinds 2004.

Pentaho bestaat uit 5 componenten:

• Analysis Services

• Reporting

• Data Mining

• Data Integration

• Dashboard

Analysis Services

Met behulp van de analyzer tool kunnen gebruikers data verkennen en analyseren om er zo meer

inzicht in te krijgen. De resultaten worden duidelijk voorgesteld zodat je er in één oogopslag een

goed beeld van krijgt. Met behulp van multidimensionele drag-and-drop elementen kan je zo een

rapport of grafiek opbouwen . De nodige filter- en sorteeropties zijn voorzien.

Pagina | 2

Reporting

In Pentaho word rapportering beschouwd als een essentieel deel van BI. Via deze rapporten kan je op

een eenvoudige manier een overzicht krijgen van je informatie en deze delen met anderen. Deze

rapporten kunnen opgesteld worden vanuit verschillende soorten databronnen zoals relationele,

OLAP of XML-gebaseerde databronnen. Via een handige wizard kan je snel een rapport aanmaken en

ook aan deze rapporten kan je grafieken koppelen, er zijn 15 verschillende aanpasbare soorten

grafieken beschikbaar. Je kan deze rapporten ook exporteren naar formaten zoals HTML, PDF, Excel,

RTF of plain text. Ook kan je het rapport rechtstreeks op de BI-server publiceren.

Data Mining

Met Data Mining kan je verborgen patronen en indicaties van toekomstige trends ontdekken,

hierdoor leer je de industrie beter kennen en kan je beter anticiperen op trends. Pentaho voorziet

hiervoor een kant-en-klare oplossing met behulp van een wizard, maar geeft je ook de mogelijkheid

om een eigen, aangepaste voorstelling te maken door gebruik te maken van Java objecten en Java

Server Pages. Er zijn ingebouwde algoritmes voor deze data mining. Pentaho werkt hiervoor samen

met WEKA (Waikato Environment for Knowledge Analyis), een open-source tool. De output kan je

grafisch bekijken of kan je omvormen tot een rapport.

Pagina | 3

Data Integration (ETL)

Pentaho Data Integration baseert zich op metadata bij het ETL proces. Het ondersteunt meer dan 30

database platformen en bestanden. Ook hier kan je gebruik maken van drag-and-drop elementen en

is een grafische voorstelling mogelijk. Deze integratie maakt de informatie toegankelijk voor

gebruikers en andere functies in de BI Suite. De Data Integration kan enorme hoeveelheden data

verwerken.

Dashboards

Dashboards geven je onmiddellijk een duidelijk zicht over informatie. Pentaho biedt grafisch erg

mooie dashboards, ze zijn erg interactief en werken op basis van Adobe Flash. Deze kan je eenvoudig

opbouwen aan de hand van wizards. Er wordt gebruik gemaakt van metrics en KPIs. Je kan onderzoek

doen naar onderliggende details en uitzonderingen opzoeken.

Pagina | 4

De tool

Interface

Pentaho heeft een mooie, nette interface. Je krijgt de belangrijkste mogelijkheden voorgeschoteld.

Achter elk van deze knoppen schuilt een wizard waarmee je onmiddellijk aan de slag kan gaan.

Gebruiksvriendelijkheid

Er worden twee consoles gebruikt: één voor de gewone gebruiker en één om de administratieve

kant. Een gewone gebruiker krijgt na het inloggen bovenstaand scherm te zien. De administrator kan

databronnen beheren, gebruikers beheren, servers beheren en andere configuraties beheren.

Talen

Je kan kiezen uit meerdere talen, hier zit echter een fout in, als je bijvoorbeeld Nederlands kiest,

wordt niet alles vertaald. In het hoofdmenu krijg je dan: Nieuw Analyzer Rapport en New Report zoals

je hieronder kan zien.

Pagina | 5

Kostprijs

Uit de volgende grafiek kan je aflezen wat de kostprijs van Pentaho is tegenover gevestigde BI-tools.

Zoals je kan zien zijn deze bijzonder laag.

Pagina | 6

Reporting & Dashboarding in Pentaho

Ad hoc rapport

Wizard om snel eenvoudige rapporten te maken. Weer wordt een gebruiksvriendelijk interface

gehanteerd. Je kan previews bekijken en thema’s kiezen om de algemene opmaak te bepalen. Er zijn

verschillende opties om de opmaak aan te passen en om de gegevens te sorteren. Ook hier blijft de

relatie tussen de gegevens aanwezig en worden de gegevens dus dynamisch aangepast aan de

veranderingen die je doorvoert.

Analyzer Rapport

Met deze wizard kan je snel een analyserapport samenstellen. Het voordeel aan deze wizard is dat je

de structuur van de data niet moet kennen, je krijgt namelijk alle mogelijke tabellen en velden

voorgeschoteld. De relaties worden steeds goed bijgehouden, waardoor de data dynamisch

veranderd als je een veld toevoegt dat hiermee in relatie ligt. Zoals onderstaand voorbeeld, eerst zie

je het resultaat als “Department” het hoofdcriterium is, daarna zie je het resultaat als “Region” het

hoofdcriterium wordt.

Je krijgt een interactieve interface voorgeschoteld waar je nieuwe velden met behulp van drag-and-

drop kan toevoegen. Je kan gemakkelijk filters, subtotalen en berekende velden toevoegen. Erg

handig is dat je deze data ook snel kan omzetten naar een grafiek met onderstaande knop. Je kan ook

kiezen uit verschillende soorten grafieken.

Pagina | 7

Het rapport of de grafiek die je hier maakt, kan je later in een dashboard implementeren. Ook kan je

kiezen om de data te exporteren, dit kan naar .pdf, Excel of CSV. Metadata zoals auteur, gebruikte

filters, … wordt mee opgenomen in deze bestanden zoals je ziet in onderstaand voorbeeld. De auteur

was hier “Joe”.

Bij een .pdf krijg je deze informatie op de laatste pagina te zien als samenvatting, je ziet dat er hier

geen filters gebruikt werden en er wordt duidelijk vermeld welke velden gebruikt werden.

Pagina | 8

In een Excel staat deze informatie bovenaan op de pagina.

Uitgebreid rapport

Met een aparte tool kan je ook erg uitgebreid rapporten maken, hierbij kan je echt in de tabellen

gaan snuffelen. Dit kan via een grafische omgeving maar ook via SQL-code. Verder kan je de opmaak

van het rapport tot in detail bepalen. In deze rapporten kan je ook grafieken toevoegen. Hoewel dit

erg complex en uitgebreid kan worden, wordt het allemaal toch via een gebruiksvriendelijke en

intuïtieve manier aangesproken. Als je klaar bent met je rapport kan je dit publiceren op de server.

Dashboards

Je kan zelf je eigen dashboards uitbouwen waarvan je de indeling, het thema en de inhoud helemaal

zelf bepaald. Voor de indeling kies je bijvoorbeeld 2x2, dus vier vakken verspreidt over je dashboard.

Als thema kies je Cool Blue en als inhoud test je eens alle mogelijkheden uit. Dan krijg je ongeveer

onderstaand voorbeeld.

Pagina | 9

Zoals je ziet kan je grafieken, tabelresultaten, websites en rapporten op je dashboard plaatsen. In de

grafieken kan je gemakkelijk de schaal aanpassen of labels bij de x-as en y-as plaatsen om je

weergave te verduidelijken.

De tabelresultaten zijn een selectie die je zelf maakt, je kiest zelf welke velden je meeneemt en welke

niet. Deze kan je dan naar eigen wens filteren en sorteren. Ook zijn er opties voor paging voorzien.

In je dashboard kan je ook een website plaatsen, de website van het bedrijf bijvoorbeeld.

Het rapport dat je rechtsonder ziet, was op voorhand aangemaakt, je kan eigen rapporten dus

eenvoudig implementeren.

Vergelijking Pentaho vs Qlikview

Qlikview Pentaho

Installatie Gemakkelijk en snel Duurt lang, veel

ingewikkelder door gebruik

van meerdere servers

Intuïtieve interface Duidelijk, mooi Duidelijk, mooi

Documentatie Tutorial van 227 pagina’s op

de website. Veel informatie

op internet.

Bij het downloaden krijg je

een account voor toegang

tot de knowledge base en

een handleiding/tutorial van

65 pagina’s.

Scripting Eigen scriptingmethodes Alles grafisch of via SQL-code

Gebruiksgemak Veranderingen zijn snel

gemaakt, je kan je selectie

verfijnen gewoon door

enkele velden aan te duiden

Als je aanpassingen wilt

maken, moet je meestal

eerst naar een ander

venster, terug naar de

wizard. Simpele opties zoals

filteren en sorteren gaan wel

direct.

Mobiele versie Ja Nee

Databronnen Access, Excel, XML, ODBC,

OLEDB, ERP, …

Access, Excel, XML, CSV,

JDBC, RSS, …

In Magic Quadrant Gartner Ja Nee

Open source Nee Ja

Gratis Nee Nee

Pagina | 10

Bevindingen Forrester & Gartner

Forrester

Results Of The Forrester Wave™: Open Source Business Intelligence (BI), Q3 2010

“If you seek a full BI suite, then the options are BEE, Jaspersoft, Pentaho, and SpagoBI. Some critical

components of enterprise-grade BI capabilities like integrated metadata management are not even

fully addressed by the open source community at this point.”

“Pentaho takes it up yet another notch with the availability of even more components in its

community version.”

“Using this approach for Forrester's 157-criteria evaluation of open source BI vendors, we found that

Actuate BIRT led the pack because of richness of reporting functionality. Jaspersoft Enterprise,

SpagoBI, Pentaho Enterprise, and Pentaho Community are close behind”

Gartner

Magic Quadrant for Business Intelligence Platforms 2009

Although Pentaho did not get placed in the actual Quadrant they did receive praise from Gartner:

“However, while they don’t meet the revenue requirement, Pentaho has emerged as viable player in

the BI platform market and as such we invited this firm to take part in the Magic Quadrant user

survey. This open source vendor provides comprehensive BI platform capabilities that is comparable

to traditional BI platform vendors. A key part of this vendor’s strategy is to forge OEM relationships

with commercial independent software vendors (ISVs) looking to easily embed BI functionality at a

low price point. Pentaho enables ISVs to OEM open-source BI components without being bound by

the GNU General Public License (GPL) terms and conditions. Given its subscription-based model, this

vendor need to provide exemplary support. This was in evidence in the MQ reference survey,

Pentaho scored strongly on the customer support question — higher than any of the megavendors.”

Additionally, the Gartner report goes on to summarize the Pentaho platform, which is very

comprehensive and feature-rich considering its open-source foundation:

“Pentaho, after just four years in existence, has put together a comprehensive open-source BI

platform that includes data integration and data mining capabilities. In 2008, Pentaho was

noticeably more aggressive, openly competing against traditional BI platform vendors. Like

Jaspersoft, Pentaho is affordable and also offers a subscription-based model that avoids an initial

large payment for the software license. Some of the significant features Pentaho introduced in

2008 include an automatic table designer that analyzes relational schemas and data patterns,

performs a cost-benefit analysis of aggregation at different levels, and generates and populates

those aggregate tables. Despite a handful of large customers, Pentaho reference survey

respondents more frequently indicated that they had more departmental deployments (versus

enterprisewide) and smaller data volumes compared with the other vendors.”

Pagina | 11

Conclusie

Al bij al is Pentaho een krachtige en gebruiksvriendelijke BI-tool. Alles wordt grafisch weergegeven,

wat het gemakkelijk maakt om mee te werken. Pentaho hoeft zeker niet onder te doen voor andere

BI-tools zoals bijvoorbeeld Qlikview. Het feit dat het open source software is, is zeker een voordeel

voor dit product. Op deze manier verschijnen er namelijk geregeld updates voor de software, en blijft

de prijs lager dan traditionele BI-tools. Je betaalt geen kosten voor licenties en onderhoud. Maar wel

voor training en support. Het is een zeer gebruiksvriendelijke en intuïtief systeem, maar de wizards

maken het soms onnodig moeilijk. Anderzijds gebeurt alles grafisch of via SQL-code, waar QlikView

zijn eigen scriptingsmethodes heeft. De dashboards van QlikView zijn echter veel uitgebreider. De

meningen over welke de beste tool is, zijn binnen ons team verdeeld. Ze vullen elkaar perfect aan in

elkaars voor- en nadelen. Een combinatie van de twee zou de perfecte BI-tool kunnen vormen.

Bronnen

http://www.pentaho.com/

http://blogs.forrester.com/boris_evelson/10-08-10-

results_forrester_wave%E2%84%A2_open_source_business_intelligence_bi_q3_2010

http://sherlockinformatics.com/wordpress/business-intelligence-technology/pentaho-receives-

attention-from-gartner

http://www.enixe.nl/Upload/Productvergelijk/enixe-it-solutions-BI-Platforms-2009.pdf

Demo’s Als je meer wil zien van hoe Pentaho werkt en welke mogelijkheden er zijn, vindt je hieronder twee links naar demo's. Eentje gaat over rapportering, de andere gaat over dashboarding.

Video - Reporting with Pentaho

http://www.youtube.com/watch?v=FGdyPLjLjIk

Video - Pentaho Dashboard Demonstration

http://www.youtube.com/watch?v=Yu_8duRM4PA

Pagina | 12

Presentatie

Inhoud

• Voorstelling Pentaho

• Achtergrondinformatie

• Mogelijkheden

• Vergelijking met QlikView

• Conclusie

Pagina | 13

Voorstelling Pentaho

• Open source BI-tool

• Bestaat sinds 2004

• bestaat uit 5 componenten:

– Analysis Services

– Reporting

– Data Mining

– Data Integration

– Dashboard

Voorstelling Pentaho

• Analysis Services

Data verkennen & analyseren

Voorstelling Pentaho

Pagina | 14

• Reporting

Eenvoudig overzicht van je informatie

Voorstelling Pentaho

• Data Mining

Patronen en indicaties van toekomstige trends

Voorstelling Pentaho

Pagina | 15

• Data Integration

Baseert zich op metadata bij het ETL proces

Voorstelling Pentaho

• Dashboards

Duidelijk en interactief zicht over de informatie

Voorstelling Pentaho

Pagina | 16

Achtergrondinformatie

• Interface

• Gebruiksvriendelijkheid (2 consoles)

Achtergrondinformatie

• Talen

• Kostprijs

Pagina | 17

Mogelijkheden

• Ad hoc rapport

Eenvoudige rapporten

• Analyzer rapport

Mogelijkheden

Snel omzetten naar grafiek:

• Export-functies (.pdf , Excel, CSV)

Pagina | 18

Mogelijkheden

• Export-functies (.pdf , Excel, CSV)

• Uitgebreid rapport

• Dashboards

Vergelijking met QlikView

Pagina | 19

Conclusie

Voordelen:

• Krachtig & gebruiksvriendelijk

• Hoeft niet onder te doen voor andere BI-tools

• Geen kosten voor licenties & onderhoud

Nadelen:

• Wizards maken het soms lastig werken

Conclusie

Voordelen:

• Krachtig & gebruiksvriendelijk

• Hoeft niet onder te doen voor andere BI-tools

• Geen kosten voor licenties & onderhoud

Nadelen:

• Wizards maken het soms lastig werken

Pagina | 20

Bedankt voor uw aandacht!

Zijn er nog vragen?