Big Data Fundamentals

8
BIG DATA Fundamentals Diepgaande introductie opleiding voor een succesvolle implementatie van uw Big Data project Ontwikkel slimme data-producten voor new business development Ontdek de potentie van big data tools als MapReduce, Hadoop en andere methodieken Maak kennis met geavanceerde analyse technieken vanuit data mining Benut de hands-on kennis van bol.com om uw eigen big data roadmap vorm te geven Data: 22 & 29 mei, 5, 12 & 19 juni 2015 Locatie: Coengebouw, Amsterdam In samenwerking met www.iir.nl/opleiding_bigdata 6 e editie

Transcript of Big Data Fundamentals

Page 1: Big Data Fundamentals

Big Data Fundamentals

Diepgaande introductie opleiding voor een succesvolle implementatie van uw Big Data project

• Ontwikkel slimme data-producten voor new business development

• Ontdek de potentie van big data tools als MapReduce, Hadoop en andere methodieken

• Maak kennis met geavanceerde analyse technieken vanuit data mining

• Benut de hands-on kennis van bol.com om uw eigen big data roadmap vorm te geven

Data: 22 & 29 mei, 5, 12 & 19 juni 2015Locatie: Coengebouw, Amsterdam

In samenwerking met

www.iir.nl/opleiding_bigdata www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata

6e editie

Page 2: Big Data Fundamentals

Big Data Fundamentals

Diepgaande introductie opleiding voor een succesvolle implementatie van uw Big Data project

De verkorte opleiding Big Data Fundamentals geeft u een vol-ledige en toepasbare introductie van de impact van big data binnen uw organisatie. Zowel praktisch als theoretisch komen alle aspecten van a tot Z aan bod. Benut deze opleiding als springplank om uw eigen big data team samen te stellen en uw project vorm te geven.

Na afronding van deze opleiding; 1. beschikt u over allround kennis die u nodig heeft om een realisti-

sche inschatting te maken van de impact en mogelijkheden van big data in uw organisatie

2. heeft u kennis gemaakt met verschillende toepassingen en tools voor het verzamelen, opslaan, analyseren en visualiseren van grote en ongestructureerde databestanden

3. beschikt u over de juiste handvaten om als project manager Big Data uw eigen big data projecten te ontwerpen en te leiden

www.iir.nl/opleiding_bigdata www.iir.nl/opleiding_bigdata

Doel & resultaat

Module opbouwDe tweewekelijkse opbouw van het programma stelt u in staat om deze opleiding eenvoudig te combineren met uw dagelijkse werkzaamheden. Daarbij creëert deze opbouw voor u de ruimte om vragen te stellen die tussentijds op de werkvloer naar boven zijn gekomen.

Compacte kennisIn slechts vijf dagen ontwikkelt u zich tot project manager Big Data om goed beslagen ten ijs te komen bij de implementatie van uw big data project. Doe de kennis op die u nodig heeft om een realistische inschatting te maken van de impact en mogelijkheden van big data.

Interactief programmaNaast gedegen theoretische kennisoverdracht gaat u ook zelf aan de slag. U wordt zelf voor de uitdaging gesteld om aan de slag te gaan met een praktijk case en u sluit de opleiding af met een individuele opdracht.

Uw voordelen op een rij

Page 3: Big Data Fundamentals

Big Data kenmerkt zich door grote hoeveelheden gestructureerde én ongestructureerde data. in deze module leert u hoe u de relevante data verzamelt vanuit een breed spec-trum van bronnen en welke tools u hiervoor in zet. aan de hand van de doelstellingen van het Big Data project leert u wat de belangrijkste data is die u moet verzamelen.

09:00 Introductie big data • Inleidend kader: wat is big data en waarom is het van belang?

Gestructureerde data: combineren en filteren van uw databases Binnen uw organisatie heeft u te maken met verschillende type databases van verschillende groottes. In deze sessie gaan we kijken welke kansen er liggen in de informatie die u al heeft in uw organisatie.• wat zijn de verschillende type databases?• hoe past u uw big data vraag in bestaande datawarehousing omgevingen?• hoe vertaalt u uw business vraag in bruikbare datasets vanuit de verschillende bronnen? • hoe combineert u verschillende typen gestructureerde data? • hoe maakt u deze data werkbaar? • hoe bewaakt u de datakwaliteit?

12:30 Lunch

13:30 Ongestructureerde data en social data verzamelen• Wat is nou precies ongestructureerde data en waarom gebruiken we steeds meer

ongestructureerde data?• Welke nieuwe uitdagingen brengt ongestructureerde data met zich mee t.o.v.

gestructureerde data?• Welke vormen van ongestructureerde data zijn interessant en/of komen vaak voor? • Hoe transformeert u ongestructureerde data naar een vorm die te analyseren is?

Specifieke vorm: social data• Welke informatie kunt u uit social data halen? Waarom is deze data interessant? • Hoe stellen social media (en andere bronnen) social data beschikbaar? Hoe verkrijgt u

deze data?

Opdracht - Specifieke toepassing: data collectieU gaat zelf aan de slag om social data te verzamelen. De verzamelde data zal getransformeerd moeten worden naar een bruikbare vorm. Dit kunt u zelf doen, maar tevens zal er een simpele tooling beschikbaar zijn om dit uit te voeren. Deze opdracht dient ter voorbereiding op Module III over data mining en Gephi tooling.

Erik tromp, Data Scientist and Scala Engineer for Hire

17:00 Einde programma

Module I Data verzamelen voor uw Big Data project

Inclusief interactieve leeromgevingAlle presentaties, video’s, artikelen en huiswerk staan op onze online leeromgeving. Zo heeft u alle cursusinformatie op één plek! Ook kunt u hier makkelijk contact houden met andere deelnemers, of vragen stellen aan uw docent.

Inhoudelijk contact met uw opleidings-adviseur? Neem dan contact op met onze opleidings-adviseur Jeremy Stevens via 020 – 58 05 455 of stuur een e-mail naar [email protected]

Informeer ook naar de mogelijkheden voor groepskorting

www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata

Page 4: Big Data Fundamentals

Module I Data verzamelen voor uw Big Data project

Een overzicht met technische tint van Hadoop en NoSQL gerelateerde thema’s. aan de hand van praktijk gerelateerde voorbeelden leert u over verschillende technologieën en programmeermodellen om data te ontsluiten.

09:00 Parallel rekenen: het datacenter is uw computer• Horizontaal en verticaal opschalen• Wat is er nieuw aan Hadoop? - De MapReduce abstractie - Het Hadoop Distributed File System - De hype voorbij: voor welke type cases werkt het nou echt?• Investeren in kennis en informatie: wat is de rol van de data scientist?• Het ecosysteem Hadoop : Pig, Hive and HBase

Machiel Jansen, Groupleader eScience & cloud services, SURFsara

12:30 Lunch

13:30 NoSQL• NoSQL vs tradionele SQL databases aan de hand van het ACID model• Sharding: het opdelen van data voor fout tolerantie of betere performance• Overzicht NoSQL databases: wat gebruik ik wanneer?• CouchDB demo: opschalen naar miljoenen taken • NoSQL ecosysteem • Vergelijking ‘database as a service’ diensten zoals Amazon’s S3• uitkomst innovatie projecten

Jan Bot, Adviseur, SURFsara

17:00 Einde programma

Module II Techniek: Big Data Tools

Ook InCompany

Wilt u deze opleiding voor uw gehele afdeling volgen? Vanaf 5 personen kunt u deze training InCompany volgen. Het programma wordt specifiek afgestemd op uw organisatie, in overleg wordt een datum, locatie en tijdstip bepaald. Een ander voordeel van een InCompany traject is dat uw hele team hetzelfde niveau bereikt en u tegelijkertijd aan teambuilding werkt.

Neem voor inhoudelijke informatie vrijblijvend contact op met onze adviseur Saskia van Berkel: tel. 020 - 58 05 440 of stuur een e-mail naar [email protected]

ICT Academy

De IIR ICT Academy leidt jaarlijks honderden professionals op. Onze trainingen variëren van 1-daagse workshops tot uitgebreide verkorte opleidingen.

Tijdens onze trainingen is daarom altijd veel ruimte om te sparren met uw vakgenoten. Zo leert u niet alleen van onze topdocenten, maar ook van elkaar!

Bekijk het aanbod van alle ICT opleidingen op www.iir.nl/ict

www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata www.iir.nl/opleiding_bigdata

Page 5: Big Data Fundamentals

09:00 Data Mining in het (big data) analytics proces• Hoe valt data mining in het (big data) analytics proces - Introductie data mining; supervised data mining, unsupervised data mining en

association learning• Het data mining proces: welke stappen zijn er nodig om van vraagstuk naar antwoord te

komen? 1. Vraagstuk 2. Information retrieval 3. Data transformatie 4. Feature extraction 5. Mining; model constructie & training, test en validatie stappen 6. Evaluatie model 7. Toepassing model• Hoe rijmen data mining en big data zich? - Data mining op ongestructureerde data; tekstuele en logging data• Laatste ontwikkelingen in data mining

12:30 Lunch

13:30 Aan de slag met data mining en social data• Leg uw eigen use case voor; op welke manier kunt u hier mee aan de slag? De docent

gebruikt uw use case om data mining op social data toe te passen.

Opdracht - specifieke toepassing: data collectie• Data mining op social data met de data die u tijdens de eerste dag heeft verzameld• Gebruik van de tool Gephi; algoritmen in Gephi en betekenis daarvan• Gewenste uitkomsten vanuit Gephi

Conceptuele afronding• Terugkoppeling plek data mining binnen het (big data) analytics proces• ‘The art of data mining’; het belang en de moeilijkheid van deze stap

Erik tromp, Data Scientist and Scala Engineer for Hire

17:00 Einde programma

Module II Techniek: Big Data Tools Module III Analyse: data mining

www.iir.nl/opleiding_bigdata www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata

Deze bedrijven gingen u voor: • ABN AMRO BANK • ABZ NEDERLAND • AGRIMORE• ANDARR • ARISTO MUSIC TECHNOLOGY• BDO HOLDING• BOL.COM• CENDRIS• DBC ONDERHOUD• DELA HOLDING• ESSENT IT • FINAVISTA• FRIESLAND BANK• GEMEENTE HAARLEMMERMEER• GFK• HOGESCHOOL WINDESHEIM• INERGY ANALYCITAL SOLUTIONS • ING BANK• INTERNATIONAL FLAVORS & FRAGRANCES IFF • KAMPHUISGROEP

• KLPD• KPN • MARKETING QUEENS• MINISTERIE VAN DEFENSIE• MN• NATIONALE NEDERLANDEN• PETER APPEL TRANSPORT• RABOBANK NEDERLAND• RDW (RIJKSDIENST VOOR • HET WEGVERKEER)• RED DATA• SAXION ENSCHEDE• SNS BANK• UNIVERSITEIT VAN AMSTERDAM• USG PEOPLE • UWV• VAN LANSCHOT BANKIERS• WEGENER MEDIA • WINDESHEIM FLEVOLAND• ZIGGO

Page 6: Big Data Fundamentals

Nadat u op basis van uw business vraag de belangrijkste data hebt verzameld en geanalyseerd, is het inzichtelijk maken van de data de volgende onmisbare stap. Met een scherpe visualisatie communiceert u op overtuigende wijze uw bevindingen naar de rest van de business en weet u aan te zetten tot de juiste beslissingen.

09:00 Case: Big Data bij bol.com • The long tail; big data als business strategie• Hoeveelheden data bij bol.com• Clickstream• Schaalbaarheid• De business case: big data toepassingen bij bol.com

12:30 Lunch

13:30 Hadoop cluster en analyse in de praktijk Tijdens deze praktijk middag gaat u zelf aan de slag met Hadoop. Hierin zult u ervaren hoe diverse tools op Hadoop gebruikt kunnen worden ter ondersteuning van data analyse. Na de training kunt u verder experimenteren met het Hadoop cluster dat u tijdens de training zult installeren en gebruiken.

17:00 Einde programma

Module III Analyse: data mining Module IV Praktijkdag: bol.com big data case

in deze laatste module wordt alle kennis samengebracht en gaat u een Big Data project vormgeven. alle belangrijkste stappen komen aan bod, van het formuleren van de juiste business case en, het gebruiken en bewerken van de databronnen om te komen tot een data driven strategie.

09:00 Data visualisatie Het overtuigend visualiseren van data is onmisbaar in elk Big Data project. Tijdens deze module wordt op basis van de achterliggende theorie bekeken wat de rol is van informatie visualisatie binnen Big Data projecten.

De volgende onderwerpen zullen o.a. de revue passeren:• Waarom is het zinvol om visualisatie in te zetten wanneer je met data werkt?• Op welke manieren kun je data visualisatie inzetten?• Hoe evalueer je een visualisatie?• Welke tools kun je gebruiken voor het visualiseren van data?

Joshua de Haseth, Information Analyst, Provincie Flevoland

12:30 Lunch

13:30 Ontwerp een Big Data business case• Toepassing (big data) analytics proces in de praktijk• Problematiek en uitdagingen in de praktijk; keuze tooling en aanpak• Samenvatting opdracht - Bespreken resultaten en uitkomsten - Reflectie van het proces dat de deelnemers hebben doorlopen naar het (big data)

analytics proces• Uitwerking van de verschillende use cases • Roundup

Erik tromp, Data Scientist and Scala Engineer for Hire

17:00 Einde programma

Module V Visualisatie & business case

www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata

Page 7: Big Data Fundamentals

www.iir.nl/opleiding_bigdata www.iir.nl/opleiding_bigdata

Erik Tromp Erik Tromp is een getalenteerde en bekroonde data scientist . Hij is momenteel werkzaam als freelance data scientist annex software engineer, op het snijvlak van machine learning en scalable software building. Daarnaast is Erik trainer en geeft lezingen over big data en data science in de praktijk.

Jan Bot Jan Bot werkt als adviseur bij de eScience & Cloud services group van van SURFsara, het Nederlandse HPC center. Hij studeerde Bioinformatica bij de TU Delft & Universiteit Leiden. Hij werkt veel met de Dutch Life Science Grid en heeft zijn eigen distributiesysteem ontwikkeld op basis van CouchDB. Hij heeft de SURFnet Enlighten Your Research 3 competitie gewonnen en werkt als e-Architect binnen het e-BioGrid programma.

Machiel Jansen Machiel Jansen is groepsleider van de groep eScience & cloud services bij SURFsara. SURFsara biedt hoogwaardige High Performance Computing (HPC) diensten, waarbij Hadoop al enkele jaren een belangrijk onderdeel van de infrastructuur is. Machiel promoveerde en doceerde aan de Universiteit van Amsterdam en was, tot hij in 2007 bij SARA in dienst trad, werkzaam bij Gridline BV en Collexis BV als technisch consultant op het gebied van ‘information retrieval’ en natuurlijke taal verwerkende software.

Joshua de HasethJoshua de Haseth is ruim 11 jaar werkzaam bij de provincie Flevoland als beleidsonderzoeker en informatieanalist. In zijn werk gebruikt Joshua datavisualisatie voor het analyseren en communiceren van overheidsinformatie. Van grafieken in een rapport voor intern gebruik tot interactieve visualisaties op het internet voor de politiek en burger. Omdat er op het gebied van data visualisatie veel winst te behalen is deelt hij daarom graag zijn kennis in de context van overheid en business.

Uw docenten

Deze opleiding is ontwikkeld voor:• Informatie managers• Business/ data analisten• Database professionals en database managers• Business intelligence managers • Business developers met een achtergrond in IT

Werkzaam bij:• Overheid• Retailers• Financiële instellingen• Energiebedrijven• Telecombedrijven• Industrie• Onderwijsinstellingen

www.iir.nl/opleiding_bigdata

Page 8: Big Data Fundamentals

Big Data Fundamentals

Diepgaande introductie opleiding voor een succesvolle implementatie van uw Big Data project

IIR B.V., Kabelweg 37, 1014 BA Amsterdam:

Meld u aan met uw VIPcode:

Blijf op de hoogte via social media:

Word lid van de IIR LinkedIn groep Big Data Forum en discussieer mee

Volg @Data_Academy en blijf op de hoogte van het laatste nieuws

aanmeldenMeld u aan voor de verkorte opleiding Big Data Fundamentals in Amsterdam.

3 makkelijke manieren om u aan te melden:1. Via internet: www.iir.nl/opleiding_bigdata2. Stuur een e-mail naar [email protected]. Bel Lorelei Mendoza van customer service: 020 - 580 5400

5-daagse opleiding € 4099,-

gegevensregistratieUw gegevens worden door IIR geregistreerd en gebruikt om u op de hoogte te houden van onze producten en die van zorgvuldig geselecteerde bedrijven. Mochten uw gegevens niet correct zijn of wenst u dat uw gegevens niet gebruikt wordt voor deze doel-einden, neem dan contact op met onze database afdeling op 020 - 580 5470 of e-mail [email protected]

algemene voorwaardenOp alle aanbiedingen zijn onze algemene voorwaarden van toepassing. Deze zijn gedeponeerd bij de K.v.K te Amsterdam, onder nummer 33200358. De algemene voorwaarden zijn te downloaden op onze website www.iir.nl/algemene_voorwaarden en worden op verzoek kosteloos toegezonden.

Alle prijzen zijn per persoon en exclusief BTW en inclusief documentatie, koffie/thee en lunch.

www.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdatawww.iir.nl/opleiding_bigdata

stevensj
Typewritten Text
TAD/JS