Stages 2012-2013 @ iAdvisehonim.typepad.com/...graph_databaseiadvisegroep.docx  · Web viewOok de...

4

Click here to load reader

Transcript of Stages 2012-2013 @ iAdvisehonim.typepad.com/...graph_databaseiadvisegroep.docx  · Web viewOok de...

Page 1: Stages 2012-2013 @ iAdvisehonim.typepad.com/...graph_databaseiadvisegroep.docx  · Web viewOok de talrijke webshops hebben dit begrepen. Meerdere keren per dag word je online via

Bedrijf: iAdvise Groep(IntoData)

Adres: Veldkant 33B2550 Kontich

Telefoon: 03 - 451 93 28Website: www.iadvise.eu Contactpersoon: Frederik Vallaeys

Company blog: iadviseblog.wordpress.com Email: [email protected]

De iAdvise groep

De iAdvise groep is een consultancybedrijf dat zich vooral richt op het aanreiken en uitwerken van kwalitatief hoogstaande IT-oplossingen. Onze groep van enthousiaste en gemotiveerde consultants streeft er steeds naar om hierin uit te blinken met respect voor elkaar en andere organisaties.

Kennis delen is hierin van primair belang voor iAdvise: door middel van werkgroepen, seminaries, workshops en een eigen blog zorgen we ervoor dat onze kennis zo snel en zo goed mogelijk wordt doorgegeven aan onze consultants, stagiairs en klanten. We gaan er dan ook prat op dat we telkens mee zijn met de laatste ontwikkelingen.

Binnen de iAdvise groep hebben we het sub-bedrijf IntoData dat zich vooral richt op het aanreiken en uitwerken van kwalitatief hoogstaande IT-oplossingen binnen het Data werk domein. IntoData heeft verschillende partnerships met grote gekende data softwareproducenten zoals Oracle, Talend en Informatica. We gaan er dan ook prat op dat we telkens mee zijn met de laatste ontwikkelingen. Een stage bij IntoData is dus een unieke kans als je interesse hebt in één van de verschillende data georiënteerde domeinen.

We hebben in het verleden reeds vele stage opdrachten gehad die mooie resultaten hebben opgeleverd. De opdrachten zijn specifiek genoeg om te weten ”waar en hoe” te starten, maar er wordt voldoende ruimte gelaten voor verdere analyse en ontwikkeling. Je werkt steeds aan een volwaardig project voor een fictieve externe of interne klant en krijgt op die manier een realistisch beeld van het leven in de bedrijfswereld.We kennen de eisen van je hogeschool/universiteit en stagebegeleider, en zorgen voor een uitstekende begeleiding wat betreft je verslag en presentatie. Je wordt volledig in onze groep opgenomen gedurende de stage en je bent welkom bij alle activiteiten; zowel professioneel als “plezier”! Onze deuren staan dan ook dag en nacht voor je open.

Wij zorgen voor een project, uitstekende begeleiding en opvolging, en daarnaast verwachten van jou een maximale inzet.Naast kennis (delen) en kwaliteit van het werk vinden wij de manier van samenwerken, zelfstandigheid, en “tot oplossingen komen” belangrijk. Dit zijn de kwaliteiten die nadien in de bedrijfswereld het verschil zullen maken tussen een goede consultant en een zeer goede consultant. Behoor je tot de laatste categorie, dan zullen we graag met je verder werken na het behalen van je diploma.

Page 2: Stages 2012-2013 @ iAdvisehonim.typepad.com/...graph_databaseiadvisegroep.docx  · Web viewOok de talrijke webshops hebben dit begrepen. Meerdere keren per dag word je online via

Academiejaar: 2016 – 2017Project: Graph Database

Opdrachtgever: iAdvise Groep(IntoData)Stagebegeleider: Jan Huyzentruyt ([email protected] - 03 451 93 28)

Intodata Team

Voor Intodata staat data centraal. Wij verzorgen de dataondersteuning in diverse soorten van projecten, tools en frameworks. Hiervoor staat een team van mensen garant dat zich aangetrokken voelt tot elk data gerelateerd aspect binnen een informatiseringstraject.

data structuring (relational, dimensional modeling) data integratie (etl-elt, data movement, migration, replication) voor operationele systemen of

datawarehouses data quality en master data management (MDM) data delivery (visualization, reporting, BI / BA) data governance

De dataservices-markt evolueert razendsnel. Vermits wij de klant steeds een stapje voor willen blijven, moeten wij niet alleen een duidelijk beeld hebben van de noden en trends die binnen onze markt doorbreken, wij moeten eveneens in een vroeg stadium inzicht hebben in de nieuwste technologieën en tools.

Stage opdracht:

Data is de “nieuwe olie” voor een bedrijf: de data kan net als olie er voor zorgen dat de radertjes (lees: business processen) goed draaien, het is de grondstof tot informatie/kennis , het is de brandstof die bedrijven toelaat om meer business/omzet te genereren.

Ook de talrijke webshops hebben dit begrepen. Meerdere keren per dag word je online via allerlei advertentieblokken gelokt naar hun shop en via allerlei kanalen word je aangemoedigd je persoonlijke gegevens achter te laten. Hoe meer deze webshops over je te weten komen, hoe gerichter zij hun marketing campagnes kunnen sturen. Maar zijn deze gegevens wel steeds correct? Zo kan je je bv. makkelijk meerdere keren met een ander e-mailadres registreren. Ook je adres gegevens ga je niet spontaan up to date houden.Daarom kampen bedrijven zoals webshops vaak met onjuiste data: dubbels, verkeerde adressen, ... Misschien doet je partner bovendien nog eens hetzelfde; of je broer of zus waarmee je nog samen onder hetzelfde dak woont ...

Voor bepaalde domeinen, zoals klantgegevens, producten, ... is het dus noodzakelijk om een “single version of the truth” te bepalen in een Master Data Management systeem. Het uiteindelijke doel van een MDM is om een “golden record” te stockeren van belangrijke business domeinen in een centrale master data hub. Een heel belangrijke stap in dit proces is het achterhalen van potentiële dubbels. Bij dit ontdubbelingsproces kan

Ofwel gebruik gemaakt worden van pre-build MDM software, zoals Talend, Informatica, … Ofwel zelf iets gebouwd worden met behulp van bv. Graph databases (Neo4J) in combinatie

met een programmeertaal zoals Python

Graph databases bieden een alternatieve manier om databases te bouwen, die zich perfect leent voor ontdubbeling van data. Graph databases representeren hun data in “nodes” (knooppunten) en “edges” (pijlen met een richting). Een node staat voor een bepaald object, zoals bv. een klant, en is steeds uniek.

Page 3: Stages 2012-2013 @ iAdvisehonim.typepad.com/...graph_databaseiadvisegroep.docx  · Web viewOok de talrijke webshops hebben dit begrepen. Meerdere keren per dag word je online via

De edges geven de relaties weer tussen de nodes. Op die manier is bijna alle informatie te ordenen als “wolken van nodes” met een wirwar aan pijlen om hun onderlinge relaties weer te geven. Dubbels zijn op die manier makkelijk herkenbaar. Als extraatje zou het zelfs interessant zijn om “households” in kaart te kunnen brengen volgens gelijkaardige algoritmes.

Het doel van deze stage is om onderzoek te doen naar de mogelijkheden van een Graph database (met name Neo4J) meer specifiek verschillen, voor- en nadelen uitlijsten in vergelijking met een traditionele

RDBMS Aantonen hoe een Graph database in combinatie met Python kan gebruikt worden om

gegevens te ontdubbelen (“golden record”) en records te linken aan elkaar (“household”). De resultaten van dit onderzoek moet het IntoData-team beter in staat te stellen de juiste

keuzes te maken bij de vragen van hun klanten rond deze problematiek.

Voor deze stageplaats zijn wij op zoek naar een informatica-profiel met een grote leergierigheid en de wil om nieuwe technologieën te bestuderen en de passie om met data te werken.

De Begeleiding

Er wordt uiteraard gezorgd voor de nodige opleiding en begeleiding door een vooraf samengesteld team. Tijdens je stage werk je in de context van een echt project; dit wil zeggen dat je een “klant” krijgt die je tijdens je eerste stagedag(en) zijn noden uitlegt en vertelt welke functionaliteit geautomatiseerd moet worden, en met welke vereisten en beperkingen. Daarnaast worden enkele technische mensen voorgesteld die geregeld met je samenzitten voor het bespreken van oplossingen en het helpen bij eventuele problemen.

We proberen alle onderdelen van een goed project aan bod te laten komen, zowel op technisch als op menselijk vlak. Buiten analyse en ontwikkeling zijn communicatie, teamwerk, motivatie en doorzettingsvermogen noodzakelijke onderdelen die niet mogen ontbreken