Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel...

4
Tijd voor verdieping In deze cursus behandelen we een aantal methoden die u kunt gebruiken om ‘big data’ te analyseren. Het resultaat zal zijn dat u meer grip hebt op de verzamelde data, beter in staat zult zijn om relevante informatie te vergaren en goede voorspellingen kunt doen. Zowel traditionele statistische methoden als relatief nieuwe analysemethoden afkomstig uit de informatica zullen tijdens de cursus aan bod komen.De masterclass omvat behalve een theo- retisch gedeelte, een groot praktisch gedeelte. U gaat zelf aan de slag met de verschillende technieken, waarbij u aan de hand van (eigen) datasets met de verschillende statistische methoden oefent en ervaart wat de gebruiksmogelijkheden zijn voor in de praktijk. Opzet Tijdens de Masterclass Data Analyse – Grip krijgen op Big Data worden vier, breed inzetbare data-analyse methoden behandeld. De theorie achter de methoden komt uitgebreid aan bod. Tegelijkertijd is er veel aandacht voor het zelf kunnen toepassen van de methoden. Om dit te bereiken wordt er naast de uitleg van de belangrijkste theoretische aspecten, aandacht besteed aan het gebruik van software om de analyses uit te voeren. Dit gebeurt door gebruik te maken van het programma R. R is een programmeer- taal en omgeving voor statistische analyses, datamanipulatie, berekeningen en grafische weergave. Het verzamelen van gegevens is met de toegenomen computer- capaciteit en -snelheid voor de meeste bedrijven en instanties een eenvoudige zaak geworden. Als gevolg hiervan worden op grote schaal enorme hoeveelheden data verzameld en opgeslagen, de zogenaamde ‘big data’. Uit deze enorme dataverzameling dient bruikbare informatie gedestilleerd te worden. Doel is om betrouwbare voorspellingen te kunnen doen. Veelal echter zonder het beoogde resultaat. De gebruikelijke statistische methoden kunnen in sommige gevallen helpen, maar vaak vereist de specifieke aard van de grote hoeveelheden data een andere aanpak. Steeds meer bedrijven en organisaties verzamelen grote hoeveel- heden gegevens. Deze zogenaamde ‘big data’ wordt gezien als een belangrijk productiemiddel. Het bevat cruciale informatie over gedragingen en voorkeuren. De Masterclass Data Analyse – Grip krijgen op Big Data van Erasmus Academie, leert u hoe u via diverse, geavanceerde methoden van data-analyse ook echt vat krijgt op de verzamelde gegevens. Het verzamelen van big data is namelijk slechts het begin, het moeilijkste deel is de data mining. Deze vierdaagse masterclass leert u de juiste vragen te stellen en via diverse analysemethoden bruikbare informatie te oogsten om betere voorspellingen te kunnen doen. Een bijzondere voorkennis van statistiek is hiervoor niet vereist. Data Analyse Grip krijgen op Big Data Start 24 november 2017

Transcript of Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel...

Page 1: Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel bedrijven als (semi-)publieke organisaties die moeten werken met grote datasets en

Tijd voor verdieping

In deze cursus behandelen we een aantal methoden die u kunt

gebruiken om ‘big data’ te analyseren. Het resultaat zal zijn dat u

meer grip hebt op de verzamelde data, beter in staat zult zijn om

relevante informatie te vergaren en goede voorspellingen kunt

doen.

Zowel traditionele statistische methoden als relatief nieuwe

analysemethoden afkomstig uit de informatica zullen tijdens de

cursus aan bod komen.De masterclass omvat behalve een theo-

retisch gedeelte, een groot praktisch gedeelte. U gaat zelf aan de

slag met de verschillende technieken, waarbij u aan de hand van

(eigen) datasets met de verschillende statistische methoden

oefent en ervaart wat de gebruiksmogelijkheden zijn voor in de

praktijk.

OpzetTijdens de Masterclass Data Analyse – Grip krijgen op Big Data

worden vier, breed inzetbare data-analyse methoden behandeld.

De theorie achter de methoden komt uitgebreid aan bod.

Tegelijkertijd is er veel aandacht voor het zelf kunnen toepassen

van de methoden. Om dit te bereiken wordt er naast de uitleg van

de belangrijkste theoretische aspecten, aandacht besteed aan het

gebruik van software om de analyses uit te voeren. Dit gebeurt door

gebruik te maken van het programma R. R is een programmeer-

taal en omgeving voor statistische analyses, datamanipulatie,

berekeningen en grafische weergave.

Het verzamelen van gegevens is met de toegenomen computer-

capaciteit en -snelheid voor de meeste bedrijven en instanties

een eenvoudige zaak geworden. Als gevolg hiervan worden op

grote schaal enorme hoeveelheden data verzameld en opgeslagen,

de zogenaamde ‘big data’. Uit deze enorme dataverzameling

dient bruikbare informatie gedestilleerd te worden.

Doel is om betrouwbare voorspellingen te kunnen doen. Veelal

echter zonder het beoogde resultaat.

De gebruikelijke statistische methoden kunnen in sommige

gevallen helpen, maar vaak vereist de specifieke aard van de

grote hoeveelheden data een andere aanpak.

Steeds meer bedrijven en organisaties verzamelen grote hoeveel­

heden gegevens. Deze zogenaamde ‘big data’ wordt gezien als

een belangrijk productiemiddel. Het bevat cruciale informatie

over gedragingen en voorkeuren. De Masterclass Data Analyse

– Grip krijgen op Big Data van Erasmus Academie, leert u hoe u

via diverse, geavanceerde methoden van data­analyse ook echt

vat krijgt op de verzamelde gegevens. Het verzamelen van big

data is namelijk slechts het begin, het moeilijkste deel is de data

mining. Deze vierdaagse masterclass leert u de juiste vragen te

stellen en via diverse analysemethoden bruikbare informatie te

oogsten om betere voorspellingen te kunnen doen.

Een bijzondere voorkennis van statistiek is hiervoor niet vereist.

Data AnalyseGrip krijgen op Big Data Start 24 november 2017

Page 2: Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel bedrijven als (semi-)publieke organisaties die moeten werken met grote datasets en

Dag 4: Support vector machines (SVM)

• U begrijpt wat het basisidee is achter support vector machines.

• U bent in staat om de werking van de ‘kernel trick’ te doorzien

waardoor het mogelijk is de niet lineaire SVM te gebruiken.

• U bent in staat om een SVM te ‘trainen’ en de beste SVM

te selecteren.

• U bent in staat probleemstellingen te formuleren die m.b.v.

data mining technieken te benaderen zijn.

• U kunt voor verschillende probleemstellingen de juiste/beste

methode selecteren en die methode ook zelf gebruiken om

data te analyseren en de resultaten van de analyse zinvol te

interpreteren.

ResultaatAan het eind van de masterclass bent u in staat om:

• Relevante onderzoeksvragen te formuleren aan de hand

van de aanwezige data;

• Vast te stellen welke methode(n) geschikt is/zijn om de

onderzoeksvraag te beantwoorden;

• De analyse zelf uit te voeren;

• De kwaliteit en betekenis van de resultaten te beoordelen.

‘Deze masterclass biedt een goede hands-on inleiding in Big

Data-methoden. De docent weet de materie op een goede en

begrijpelijke manier uit te leggen. Ook vragen die iets verder gaan

dan de basis kan hij goed beantwoorden omdat hij de methoden

ook zelf gebruikt. Na deze vier dagen heb ik een goede basis om

de methoden in de praktijk in te zetten én een goed startpunt voor

verdere exploratie van dit vakgebied’.

Arthur van der Harg - BMC (najaarseditie december 2016)

DoelgroepDe Masterclass Data Analyse – Grip krijgen op Big Data is bedoeld

voor beginnende en meer gevorderde data-analisten bij zowel

bedrijven als (semi-)publieke organisaties die moeten werken

met grote datasets en die (nog) niet in staat zijn de data goed

te analyseren.

KerndocentMichel van de Velden is universitair hoofddocent (UHD) Statistiek

bij het Econometrisch Instituut van de Erasmus School of

Economics. Zijn onderzoekinteresses gaan uit naar het ontwikke-

len en verbeteren van visualisatie methoden voor multivariate

data en de toepassing van dergelijke, vaak niet parametrische,

methoden op zogenaamde big data. Zijn toegepast werk bestrijkt

een breed gebied variërend van archeologie tot transport

wetenschappen.

Michel van de Velden promoveerde in 2000 aan de Universiteit

van Amsterdam. Na zijn promotie verwierf hij een Grotius Grant

en een Marie Curie Fellowship die hem achtereenvolgens in staat

stelden onderzoek te doen aan de rijksuniversiteit Groningen en

de Universitat Pompeu Fabra te Barcelona. Sinds 2004 is

Michel van de Velden verbonden aan het Econometrisch Instituut.

Meer informatie is te vinden op zijn persoonlijke website

http://people.few.eur.nl/vandevelden/

Het is beschikbaar voor Windows, Linux en Mac en via

www.r-project.org gratis te downloaden.

De opzet van de vier cursusdagen is telkens zo dat na een algemene

introductie een van de methoden wordt behandeld. Hoewel de

theorie en de berekeningen hierbij ruimschoots aan bod komen,

ligt de nadruk op het praktische aspect: wat doet de methode,

wanneer is het nuttig, welke vragen kan ik ermee beantwoorden

en waar moet ik op letten bij het interpreteren van de resultaten?

Na de uitvoerige theoretische behandeling wordt iedere methode

direct gevolgd door een sessie waarin u zelf aan de slag gaat met

een dataset.

Inhoud Naast algemene aspecten die van belang zijn bij de analyse van

grote databestanden, komen de volgende specifieke methoden

aan bod:

• clusteranalyse,

• dimensie reductie methoden en data visualisatie methoden,

• beslissingsbomen en ensembles van beslissingsbomen,

support vector machines (SVM).

Dag 1: Introductie R, Dimensie Reductie & Data Visualisatie

• U leert op een gestructureerde manier te kijken naar (big) data

en het formuleren van relevante probleemstellingen.

• U bent in staat data op verwerkbare wijze te structureren en

elementaire handelingen te verrichten met R.

• U begrijpt wat dimensiereductie is, wat het doet en welke

keuzes er nodig zijn (en: hoe die keuzes te maken). U leert wat

de rol is van dimensiereductie bij datavisualisatie methoden,

hoe en wanneer u deze methoden kunt uitvoeren, en hoe u

resultaten kunt interpreteren.

Dag 2: Cluster analyse

• U begrijpt wat cluster analyse is, wat het doet, welke keuzes er

nodig zijn (en ook hoe die keuzes tot stand komen). U leert

hoe en wanneer u clusteranalyse kunt uitvoeren en u leert

resultaten te interpreteren

Dag 3: Beslissingsbomen, ensembles & validatie van

voorspelmethoden

• U maakt kennis met het basisidee achter de beslissingsbomen

en hoe dit geïmplementeerd kan worden.

• U onderkent de sterktes (interpretatie, snelheid) en zwaktes

(overfitting, hoge variantie) van beslissingsbomen.

• U begrijpt de gedachte achter zogenaamde ensemble methodes

en de toepassing hiervan bij beslissingsbomen.

• U ziet in wat wel en niet vergeleken kan worden in termen

van validatie en voorspelmethoden en begrijpt welke kwaliteits-

maten niet en, vooral, wel zinvol zijn.

Page 3: Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel bedrijven als (semi-)publieke organisaties die moeten werken met grote datasets en

Waar & WanneerDe cursusdagen van de Masterclass Data Analyse – Grip krijgen

op Big Data vinden plaats op Erasmus Universiteit Rotterdam

(complex Woudestein) of op een externe locatie in de directe

nabijheid van de universiteit op de volgende vrijdagen van

09.30 tot 17.00 uur:

• 24 november 2017

• 1 december 2017

• 8 december 2017

• 15 december 2017

Meer Informatie & InschrijvenInschrijven voor de Masterclass Data Analyse – Grip krijgen

op Big Data kan via: www.erasmusacademie.nl/data-analyse

U kunt voor meer informatie over de Masterclass Data Analyse

– Grip krijgen op Big Data contact opnemen met:

drs. Esther van den Heuvel, Programmamanager Erasmus

Academie

T: 010-408 25 22

E: [email protected]

Wij zien uw inschrijving graag tegemoet.

BijzonderhedenU wordt geacht in bezit te zijn van een laptop waarop het free-

ware programma R is gedownload en waarmee u de statistische

berekeningen kunt uitvoeren. Indien u wilt, kunt u werken met

eigen datasets.

Prijs & Aantal deelnemersDe investering in deze masterclass bedraagt € 2.595,-

Alumni van Erasmus Academie ontvangen 10% korting op de

cursusprijs.

Alumni van de EUR en RSM Executive Education ontvangen 5%

korting op de cursusprijs.

(Alle bedragen zijn vrijgesteld van btw.)

Het cursusgeld is inclusief het dagarrangement,

cursusmateriaal en parkeren.

Maximaal aantal deelnemers: 20

Studielast & CertificaatDe studielast omvat de tijd die nodig is voor bijvoorbeeld het

voorbereiden en volgen van colleges, lezen van literatuur en het

schrijven van werkstukken. De ervaring leert dat de studielast voor

deze masterclass ongeveer 28 uur bedraagt.

Wanneer u de Masterclass Data Analyse – Grip krijgen op

Big Data met goed gevolg afrond ontvangt u een certificaat van

Erasmus Academie. Voorwaarde is dat u alle bijeenkomsten ook

daadwerkelijk heeft gevolgd.

OpleidingsniveauU heeft geen uitgebreide kennis van statistiek nodig om de

Master class Data Analyse – Grip krijgen op Big Data te volgen,

basiskennis van statistiek is in principe voldoende. De verschil-

lende technieken en methoden worden stap voor stap uitge-

werkt en geoefend. Wel wordt van u gevraagd dat u computer-

vaardigheden en ervaring heeft met het werken met

dataprogramma’s, in het bijzonder Excel, en basiskennis

van R.

Page 4: Tijd voor verdieping Data Analyse · voor beginnende en meer gevorderde data-analisten bij zowel bedrijven als (semi-)publieke organisaties die moeten werken met grote datasets en

Over Erasmus Academie

Tijd voor verdieping

Ruimte maken om je ergens in te verdiepen, dat is voor ons tijd

voor verdieping. Jezelf letterlijk de tijd geven om nieuwe kennis,

inzichten en vaardigheden op te doen. Tijd ook om geinspireerd te

raken. Zo ontstaan vernieuwende ideeën en verrassende perspec-

tieven, heel motiverend. Voor uzelf en uw organisatie.

is het centrale motto van Erasmus Academie.

Wij bieden kennisintensieve opleidingen voor professionals, een

combinatie van wetenschappelijke theorie en praktische toepas-

sing. Zo faciliteren wij innovatie.

Onze opleidingen zijn inhoudelijk gespecialiseerd en kwalitatief

hoogstaand. U krijgt les van universitair docenten of erkende

specialisten uit uw werkwerld. Zij hebben de opleidingen mede

ontwikkeld en begeleiden u bij het toepassen van de stof op

uiteenlopende voorbeelden uit uw praktijk, of die van andere

deelnemers.

Waarom kiezen voor Erasmus Academie?

• Omdat we onderdeel zijn van Erasmus Universiteit Rotterdam;

• Onze opleidingen mede daardoor van hoge kwaliteit zijn;

• Er veel aandacht is voor de toepassing van wat u leert in uw

eigen praktijk.

Voor wie?

Voor iedereen met een universitaire of hbo-opleiding, of een

vergelijkbaar werk- en denkniveau.

En voor iedereen die behoefte heeft aan tijd voor verdieping!

Zo bereikt u ons

www.erasmusacademie.nl

[email protected]

Telefoon: 010 408 18 39

(op werkdagen van 09:00-17:00 uur)

Twitter: @erasmusacademie

LinkedIn: www.linkedin.com/company/

erasmus-academie

Facebook: www.facebook.com/

erasmusacademie

Bezoekadres:

Erasmus Universiteit Rotterdam,

complex Woudestein

Van der Goot (M)- gebouw, kamers M6-13/20

Burg. Oudlaan 50

3062 PA Rotterdam

Bereikbaarheid

De EUR is zowel per openbaar vervoer (metro

Kralingse Zoom, tram 21 en 24) als per auto

(A16, afslag Kralingen of Centrum) goed

bereikbaar.

Komt u als deelnemer met de auto, dan kunt u

gratis gebruik maken van de uitgebreide

parkeerfaciliteiten. Op www.erasmusacademie.

nl/contact leest u meer over bereikbaarheid en

route.

Algemene Voorwaarden

Onze Algemene Voorwaarden vindt u op onze

website. Een exemplaar kunnen wij u op ver-

zoek toezenden.

Erasmus Academie bestaat sinds 1996

Copyright © Erasmus Academie BV 2015

Wij zijn erkend door

CEDEO voor zowel maatwerk bedrijfsopleidin-

gen als open bedrijfsopleidingen.

Nederlandse Orde van Advocaten

Centraal Register Kort Beroepsonderwijs