Big data is geen toekomstmuziek

Click here to load reader

 • date post

  10-Mar-2016
 • Category

  Documents

 • view

  213
 • download

  1

Embed Size (px)

description

Op zijn meest simpelst gesteld is ‘Big Data’ gewoon meer data en heeft het meer variëteiten aan gegevens, dan met een conventionele database kan worden behandeld. De term ‘Big Data’ verwijst ook naar de vele toepassingen en technieken. Leer in dit hoofdstuk waarom 'Big Data' geen toekomstmuziek is, maar realiteit!

Transcript of Big data is geen toekomstmuziek

 • !Lorem&Ipsum&

  !!!

  VANANALOOGNAARDIGITAAL.NU!

  BIG DATA IS GEEN TOEKOMSTMUZIEK!

 • Voor het eerst in de geschiedenis heeft een hoog gerechtshof in Duitsland geoordeeld dat toegang hebben tot

  het internet tot de eerste levensbehoefte van mensen behoort. Als providers in gebreke blijven, bijvoorbeeld als

  de verbinding bij hun klanten uitvalt, dan moeten zij de klant voor dit gemis compenseren. Stel je voor: internet

  is nu net zo belangrijk als eten, kleding en veiligheid. Deze uitspraak zal ongetwijfeld in Europa navolging

  vinden en zal tegelijkertijd ook voor content leveranciers gevolgen krijgen. Dit is het signaal dat de transitie van

  analoog naar digitaal in de maatschappij is ingedaald. Het internet draait nu echt op volle toeren. Het

  volledige voorwoord en eerdere voorpublicaties kun je hier lezen.

  Dit is een voorpublicatie van een hoofdstuk dat in zijn geheel of gedeeltelijk terug zal komen in ons e-book. Wil

  je op de hoogte blijven van onze voorpublicaties schrijf je dan hier in vananaloognaardigitaal.nu

  VANANALOOGNAARDIGITAAL.NU1

 • 'Big Data' is geen toekomstmuziekOp zijn meest simpelst gesteld is Big Data gewoon meer data en heeft het meer

  variteiten aan gegevens, dan met een conventionele database kan worden behandeld.

  De term Big Data verwijst ook naar de vele toepassingen en technieken, die zijn

  ontstaan om waardevolle informatie te verkrijgen uit de enorme stortvloed van data. Het

  is niet alleen de opslag van informatie, het is de mogelijkheid om deze te analyseren voor

  verbetering van de klantrelatie, inzicht in de relatie, of beide. Veel van deze nieuwe

  technieken verlagen de kosten van data mining, het gericht zoeken naar (statistische)

  verbanden. Open-source software, zoals bijvoorbeeld Hadoop helpt hierbij. De

  beschikbaarheid van cloud diensten hebben de prijs drastisch verlaagd om succesvol

  aan de slag te gaan met Big Data. Daarnaast is analyse ook gedemocratiseerd, omdat

  vele datasets en machine learning-software vaak gratis beschikbaar zijn.

  Machine learning? Google zet in haar strijd tegen onnatuurlijke manipulatie van

  zoekresultaten steeds vaker machine learning in om in al haar Big Data-patronen voor

  spamherkenning bloot te leggen. Waar voorheen handmatig gekeken werd op welke 2 3

  factoren een onnatuurlijke link herkend kan worden, kan nu een zelflerend systeem

  enorm gecompliceerde patronen in de enorme berg data onderzoeken naar n enkel

  herkenningspunt. Waar nieuwe trucs ontstaan, leert het systeem bij iedere update de

  daarbij horende patronen te herkennen.

  Kijkende naar de technologische revolutie, die gaande is, dan zie je dat er een

  ongekende hoeveelheid informatie beschikbaar is voor analyse en actie. Iedere

  Facebook- post of like, iedere piep van een supermarkt-scanner, elk knipperend lampje

  van een medisch hulpmiddel kan worden uitgelezen en geanalyseerd, en is daarmee een

  potentile waardevolle bron van informatie. De mogelijkheid om deze waardevolle

  informatie uit te pluizen, op zoek naar verbindingen, die niet voor de hand liggend zijn,

  wordt ook Big Data genoemd.

  Onlangs kwam Mike Gualtieri, analist bij Forrester Research, met een pragmatische

  definitie: Big Data is het vermogen van een bedrijf om gegevens op te slaan, te verwerken

  en zichzelf toegang te verschaffen tot die gegevens, waardoor het bedrijf effectiever kan

  werken, beslissingen nemen, risico's verminderen en klanten bedienen. Wat ons betreft

  een goede werkbare definitie, maar we zijn wel van mening dat de term Big Data, net als

  VANANALOOGNAARDIGITAAL.NU2

 • de term social media, allebei container begrippen zijn. Wanneer Big Data zijn

  volwassen stadium bereikt, zal de term Big Data gewoon weer data genoemd worden en

  is het de normaalste zaak van de wereld geworden, net als de termen e-mail en website.

  Toch heerst er verwarring

  Er heerst nog verwarring als het gaat om de definitie van Big Data. Een veel

  voorkomende en terugkerende benadering is het kijken naar het model van de drie Vs,

  (zie model boven), een korte uitleg:

  de V van Volume: Miljarden computers, smartphone-gebruikers en objecten zijn nu actief verbonden via het internet en hebben interactie met elkaar, ze genereren

  meer dan een exabyte, (afgekort EB) is 1000 petabytes of

  1.000.000.000.000.000.000 bytes (1018B), aan gegevens per dag.

  de V van Variteit: Veel van de gegevens zijn ongestructureerd, dat betekent dat ze vaak niet passen in een standaard relationele database. Ongestructureerde

  data zijn bijvoorbeeld: een review op Amazon, een commentaar op een blog, een

  video op YouTube, een podcast, een tweet, een post, een like enzovoort.

  VANANALOOGNAARDIGITAAL.NU3

 • en de V van Velociteit: Een smartphone gebruiker is voortdurend in beweging, de locatie-data verandert snel, en is daarmee van waarde voor bijvoorbeeld een

  aanbieder van diensten of producten. Of neem nu de snelheid van het enorme

  aantal Tweets dat per dag voorbij komt. Deze snelle updates van gegevens zorgen

  voor nieuwe uitdagingen binnen informatiesystemen.

  Volgens Neil Biehn, die onlangs een artikel schreef op het blog van Wired, missen er nog

  twee Vs aan het 3V-model. Hij stelt dat je eerst de levensvatbaarheid van gegevens

  moet beoordelen. Met zoveel soorten gegevens en variabelen dien je voor de bouw van

  een effectief (voorspellend) datamodel de kosten te overwegen. De relevantie van

  bepaalde variabelen, de vierde V, zou kunnen worden toegevoegd aan het bovenstaande

  model. Zodra de levensvatbaarheid van de data is bevestigd, kan er vervolgens een

  model worden gebouwd, dat geavanceerdere queries beantwoordt, een contra-intutief

  inzicht levert en dus een unieker inzicht creert. Pas dan ben je in staat voorspellende

  acties en gedragingen te definiren en begin je de vijfde V van Big Data: Value (=

  waarde) aan te boren, aldus Biehn.

  Verandering in de muziekindustrie

  Muziekmaatschappijen en muziekuitgeverijen, alsmede muzikanten bevinden zich

  midden in een grote verandering (herinner je het hoofdstuk hierover?), waarin nieuwe

  businessmodellen en digitale mediaproducten een belangrijke rol spelen. Digitalisering,

  internet en nieuwe consumentenvoorkeuren bedreigen de traditionele

  muziekmaatschappijen en muziekuitgeverijen. Zij hebben hedentendage te maken met

  meer concurrentie en verlies van de grip op doelgroepen en content.

  De prijs van muziek verschuift op termijn naar bijna nul. Via social media ontstaan er nu

  directe relaties tussen muzikanten en luisteraars. De meeste inkomsten genereren

  muzikanten of bands al een tijd niet meer met hun CDs of downloads. Die verdienen zij

  met het geven van de live optredens. Muziek is daarmee meer een beleving of vehikel,

  dan een fysiek product. Distributie tussen luisteraars onderling is gemeengoed en de

  schaarste verplaatst zich van aanbod naar aandacht.

  Deze verandering vindt ook plaats in tal van andere markten. Gelukkig biedt digitalisering

  ook nieuwe kansen. Productie en vooral distributie van digitale content is goedkoop.

  VANANALOOGNAARDIGITAAL.NU4

 • Distributie via internet levert bovendien het voordeel op dat er geprofiteerd kan worden

  van het long tail-effect: veel nicheproducten blijven beschikbaar en kunnen gedurende

  lange tijd omzet genereren. Prijzen van digitale mediaproducten zijn aan fluctuatie

  onderhevig, vaak dalen ze op termijn wat de aantrekkingskracht voor de consument

  vergroot. En fans kunnen gebruik maken van nieuwe diensten, zoals abonnementen op

  muziek in plaats van het downloaden er van.

  Muziekmaatschappijen en muziekuitgeverijen, alsmede muzikanten zijn en blijven

  afhankelijk van levensvatbare doelgroepen. In de digitale wereld zijn deze doelgroepen

  kleiner en specifieker. Versnippering van het aanbod en convergentie zijn enerzijds een

  bedreiging, maar leveren anderzijds nieuwe mogelijkheden om de eigen doelgroep te

  versterken en te binden. Contenteigenaren, dus bijvoorbeeld de muziekindustrie, bieden

  hun content aan over alle beschikbare platforms: print, radio, televisie en internet. Het

  verdienmodel dat hierbij hoort laat ook een versnippering zien naar meerdere

  inkomstenbronnen. In ons hoofdstuk De veranderde muziekindustrie en haar kansen

  wordt de rol van data steeds duidelijker. Data is voor de muziekindustrie eigenlijk de

  nieuwe levensbron, en daarmee een nieuw businessmodel, wat ons betreft.

  Toegang is dus data

  Het staat al geruime tijd vast dat toegang tot content een sleutelrol speelt voor