Big Data presentatie #dido12 - Maurice Beerthuyzen

27
Het verhaal waarin we verschillende databronnen aan elkaar koppelden om zo nieuwe inzichten te vergaren in de wondere wereld van stroomstoringen Arend Zwanenveld (@arend) Dirk Franssens (@dxfransssens) Jules Stuifbergen (@zjuul) Maurice Beerthuyzen (@Maurisico) Online Dialogue (@onlinedialogue) Guiding you to digital maturity

Transcript of Big Data presentatie #dido12 - Maurice Beerthuyzen

Page 1: Big Data presentatie #dido12 - Maurice Beerthuyzen

Het verhaal waarin we verschillende databronnen

aan elkaar koppelden om zo nieuwe inzichten te

vergaren in de wondere wereld van

stroomstoringen

Arend Zwanenveld (@arend)

Dirk Franssens (@dxfransssens)

Jules Stuifbergen (@zjuul)

Maurice Beerthuyzen (@Maurisico) Online Dialogue (@onlinedialogue)

Guiding you to digital maturity

Page 2: Big Data presentatie #dido12 - Maurice Beerthuyzen

Wie is Liander?

Page 3: Big Data presentatie #dido12 - Maurice Beerthuyzen

Online Dialogue verbetert bij

Liander de online klantdialogen

• Onderzoeken en monitoren van uitingen

op sociale media

• Trainen en adviseren webcareteams

• Adviseren op continue verbetering van

klantdialogen

• En ook bij de ongestructureerde sociale

dialoog doen we dat zoveel mogelijk met

behulp van data

Page 4: Big Data presentatie #dido12 - Maurice Beerthuyzen

De social promoter score

Positief:61-100 Uitmuntend

Positief: 41-60 Zeer Goed

Positief: 21-40 Goed

Positief: 1-20 Ruim voldoende

Neutraal: -19 0 Voldoende

Negatief: -39 -20 Onvoldoende

Negatief: -59 -40 Ruim onvoldoende

Negatief: -79 -60 Slecht

Negatief: -80 -100 Zeer slecht

Iedere social media uiting krijgt waardering mee: positief-neutraal of negatief. Hoe scoort Liander hierop als je positieve opmerkingen aftrekt van negatieve opmerkingen?

Page 5: Big Data presentatie #dido12 - Maurice Beerthuyzen

Het probleem van de netwerken

Bedrijf SPS Aantal berichten

NS -7 (16%-23%) 1.003.000

Vodafone -16 (13%-29%) 510.000

T-Mobile -9 (12%-21%) 164.000

Ziggo -3 (14%-17%) 289.000

UPC -16 (13%-29%) 239.000

Telfort -8 (15%-23%) 71.000

Xs4all -12 (11%-23%) 52.000

Page 6: Big Data presentatie #dido12 - Maurice Beerthuyzen

Liander 2012: Organisatie webcare is zichtbaar

6

MAAND: POSITIEF NEGATIEF VOLUME GEBEURTENIS

JANUARI 16% 47% 384

FEBRUARI 7% 74% 953 EXTREME KOUDE?

MAART 7% 49% 681

APRIL 9% 71% 758

MEI 4% 75% 770

JUNI 11% 51% 638 K&S SLUIT AAN MET DRIE MEDEWERKERS?

JULI 8% 51% 653

AUGUSTUS 12% 58% 457

SEPTEMBER 11% 58% 517

OKTOBER 9% 43% 589 TSC SLUIT AAN MET VIER MEDEWERKERS?

NOVEMBER 17% 37% 571

DECEMBER 12% 52% 767

Verklaring tabel: Een overzicht van de positief en negatief sentiment van Liander. In juni sluit K&S

aan. Dit zorgt ervoor dat het negatieve sentiment structureel onder de 60% duikt. TSC sluit aan in

oktober. Op dat moment duikt het negatieve sentiment onder de 40%.

Page 7: Big Data presentatie #dido12 - Maurice Beerthuyzen

Stroomstoringen: volume en

sentiment

Rondom stroomstoringen zien we op sociale media dus meer volume en een negatief sentiment. Best logisch toch?

Page 8: Big Data presentatie #dido12 - Maurice Beerthuyzen

Maar wat als het kouder wordt?

Heeft de kou invloed op het

gedrag van mensen?

Page 9: Big Data presentatie #dido12 - Maurice Beerthuyzen

Liander kent het fenomeen

Page 10: Big Data presentatie #dido12 - Maurice Beerthuyzen

Men herkent het, maar…

Page 11: Big Data presentatie #dido12 - Maurice Beerthuyzen

Onze hypothesen

• Hoe kouder het is, hoe meer stroomstoringen er voor komen

• Hoe kouder het is hoe groter het volume op twitter

• Hoe kouder het is hoe negatiever het sentiment

Page 12: Big Data presentatie #dido12 - Maurice Beerthuyzen

Situatie op ‘stroomstoringen’ op

Twitter 2009-2013

637??

Zien we de “Liander-trend” terug bij stroomstoringen algemeen?

Page 13: Big Data presentatie #dido12 - Maurice Beerthuyzen

Alle tweets van 2010:

?

Page 14: Big Data presentatie #dido12 - Maurice Beerthuyzen

Opeens zijn we op 4 juni 2010

massaal gaan Twitteren?

Page 15: Big Data presentatie #dido12 - Maurice Beerthuyzen

Oorzaak piek? Massamedia?

• Eerste piek in juni 2010

• De oorzaak?

• Heb ik iets

ontdekt?

Page 16: Big Data presentatie #dido12 - Maurice Beerthuyzen

Nou nee…..

Data rondom stroomstoringen op Twitter nog te

onvolwassen.

Pas in 2012 echte volumes

Page 17: Big Data presentatie #dido12 - Maurice Beerthuyzen

Welke data hebben tot onze

beschikking?

• Het aantal tweets waarin “Liander” in combinatie met het woord ‘Stroomstoring’ is gebruikt

• Het sentiment van die tweets

• Het aantal ingekomen telefoontjes

• Het aantal middenspanningsstoringen

• Het aantal afgehandelde klachten

• De gemiddelde temperatuur van 2012

Page 18: Big Data presentatie #dido12 - Maurice Beerthuyzen

Probleem: Te algemene data

• Data van Liander ( telefoon, aantal

storingen) op maandniveau

• Is er ook data op dagniveau

beschikbaar?

© Urosk | Dreamstime Stock Photos & Stock Free Images

“Wel beschikbaar,

maar

daar hebben we nu

geen tijd voor”

Page 19: Big Data presentatie #dido12 - Maurice Beerthuyzen

Aan de slag!

• Methode: het berekenen van de correlatie

tussen de verschillende variabelen.

• Meer vragen?

• Vraag het aan Dr. Dirk

Page 20: Big Data presentatie #dido12 - Maurice Beerthuyzen

Onze bevindingen:

• Het aantal calls hangt positief samen met het aantal tweets, dus wanneer er meer calls zijn dan wordt er ook meer getweet – Corr = 0,536

• Het aantal calls hangt samen met het aantal

storingen (maar verband is niet zo sterk) – Corr = 0,371

• Het aantal storingen zorgt relatief voor meer tweets – Corr = 0,677

Page 21: Big Data presentatie #dido12 - Maurice Beerthuyzen

Wat willen we weten: • Het aantal storingen en het aantal

telefoontjes hebben minder correlatie dan

je zou verwachten.

Is locatie van de

storing bepalend

voor de

Rumour around

Liander??

Page 22: Big Data presentatie #dido12 - Maurice Beerthuyzen

Onze oorspronkelijke

hypothesen

• Temperatuur hangt niet samen met het aantal stroomstoringen

– corr =0,0789

• Hoe kouder het is, hoe groter het volume op Twitter

– corr =-0,31

• Hoe kouder het is, hoe negatiever het sentiment

– corr = -0,007

• Hoe meer storingen, hoe negatiever het sentiment

– corr =-0,388

• Er is een verband tussen het toenemende aantal calls en dalende temperaturen

– Corr = -0,734

Page 23: Big Data presentatie #dido12 - Maurice Beerthuyzen

Voorzichtige conclusies

• Er zijn niet meer storingen als het koud is

• Dalende temperatuur heeft minder invloed

op het aantal tweets

• De dalende temperatuur zorgt niet voor

een negatiever sentiment

• Als het kouder wordt, wordt er wel meer

gebeld!

Page 24: Big Data presentatie #dido12 - Maurice Beerthuyzen

Wat willen we weten? • Wel meer telefoontjes als het koud is?

Hoe komt dat?

• Verschil in correlatie telefoon en tweets.

Wordt er over andere onderwerpen

getwitterd dan gebeld?

Page 25: Big Data presentatie #dido12 - Maurice Beerthuyzen

Actiepunten:

• Leren of verschillende regio’s een

stroomstoring anders ‘ontvangen’

• Begrijpen of er verschil is tussen bellers

en tweeters ( kwalitatieve analyse)

• Data verder verdiepen. Naast temperatuur

ook info over storingen, calls en tweets op

het uur van de dag, type storing, duur

storing etc

Page 26: Big Data presentatie #dido12 - Maurice Beerthuyzen

Leerpunten

• Bereid je organisatie voor op je project

• Heb je niet meteen alle data? Begin dan gewoon met wat je hebt, wie weet wat je ontdekt

• Blijf kritisch, check drie maal je data en blijf de uitkomsten bediscussieren

• Bediscussieer je ontdekkingen met je collega’s, zij roepen in een opwelling vaak hele nuttige dingen

• We staan slechts aan het begin: meer data roept meer vragen op

Wordt vervolgd!

Page 27: Big Data presentatie #dido12 - Maurice Beerthuyzen

@onlinedialogue @maurisico

Subscribe to our free newsletter at our site!

Maurice Beerthuyzen

www.onlinedialogue.com

[email protected]

Tel: +3130 4100 177