Big data is geen toekomstmuziek

Click here to load reader

  • date post

    10-Mar-2016
  • Category

    Documents

  • view

    213
  • download

    1

Embed Size (px)

description

Op zijn meest simpelst gesteld is ‘Big Data’ gewoon meer data en heeft het meer variëteiten aan gegevens, dan met een conventionele database kan worden behandeld. De term ‘Big Data’ verwijst ook naar de vele toepassingen en technieken. Leer in dit hoofdstuk waarom 'Big Data' geen toekomstmuziek is, maar realiteit!

Transcript of Big data is geen toekomstmuziek

  • !Lorem&Ipsum&

    !!!

    VANANALOOGNAARDIGITAAL.NU!

    BIG DATA IS GEEN TOEKOMSTMUZIEK!

  • Voor het eerst in de geschiedenis heeft een hoog gerechtshof in Duitsland geoordeeld dat toegang hebben tot

    het internet tot de eerste levensbehoefte van mensen behoort. Als providers in gebreke blijven, bijvoorbeeld als

    de verbinding bij hun klanten uitvalt, dan moeten zij de klant voor dit gemis compenseren. Stel je voor: internet

    is nu net zo belangrijk als eten, kleding en veiligheid. Deze uitspraak zal ongetwijfeld in Europa navolging

    vinden en zal tegelijkertijd ook voor content leveranciers gevolgen krijgen. Dit is het signaal dat de transitie van

    analoog naar digitaal in de maatschappij is ingedaald. Het internet draait nu echt op volle toeren. Het

    volledige voorwoord en eerdere voorpublicaties kun je hier lezen.

    Dit is een voorpublicatie van een hoofdstuk dat in zijn geheel of gedeeltelijk terug zal komen in ons e-book. Wil

    je op de hoogte blijven van onze voorpublicaties schrijf je dan hier in vananaloognaardigitaal.nu

    VANANALOOGNAARDIGITAAL.NU1

  • 'Big Data' is geen toekomstmuziekOp zijn meest simpelst gesteld is Big Data gewoon meer data en heeft het meer

    variteiten aan gegevens, dan met een conventionele database kan worden behandeld.

    De term Big Data verwijst ook naar de vele toepassingen en technieken, die zijn

    ontstaan om waardevolle informatie te verkrijgen uit de enorme stortvloed van data. Het

    is niet alleen de opslag van informatie, het is de mogelijkheid om deze te analyseren voor

    verbetering van de klantrelatie, inzicht in de relatie, of beide. Veel van deze nieuwe

    technieken verlagen de kosten van data mining, het gericht zoeken naar (statistische)

    verbanden. Open-source software, zoals bijvoorbeeld Hadoop helpt hierbij. De

    beschikbaarheid van cloud diensten hebben de prijs drastisch verlaagd om succesvol

    aan de slag te gaan met Big Data. Daarnaast is analyse ook gedemocratiseerd, omdat

    vele datasets en machine learning-software vaak gratis beschikbaar zijn.

    Machine learning? Google zet in haar strijd tegen onnatuurlijke manipulatie van

    zoekresultaten steeds vaker machine learning in om in al haar Big Data-patronen voor

    spamherkenning bloot te leggen. Waar voorheen handmatig gekeken werd op welke 2 3

    factoren een onnatuurlijke link herkend kan worden, kan nu een zelflerend systeem

    enorm gecompliceerde patronen in de enorme berg data onderzoeken naar n enkel

    herkenningspunt. Waar nieuwe trucs ontstaan, leert het systeem bij iedere update de

    daarbij horende patronen te herkennen.

    Kijkende naar de technologische revolutie, die gaande is, dan zie je dat er een

    ongekende hoeveelheid informatie beschikbaar is voor analyse en actie. Iedere

    Facebook- post of like, iedere piep van een supermarkt-scanner, elk knipperend lampje

    van een medisch hulpmiddel kan worden uitgelezen en geanalyseerd, en is daarmee een

    potentile waardevolle bron van informatie. De mogelijkheid om deze waardevolle

    informatie uit te pluizen, op zoek naar verbindingen, die niet voor de hand liggend zijn,

    wordt ook Big Data genoemd.

    Onlangs kwam Mike Gualtieri, analist bij Forrester Research, met een pragmatische

    definitie: Big Data is het vermogen van een bedrijf om gegevens op te slaan, te verwerken

    en zichzelf toegang te verschaffen tot die gegevens, waardoor het bedrijf effectiever kan

    werken, beslissingen nemen, risico's verminderen en klanten bedienen. Wat ons betreft

    een goede werkbare definitie, maar we zijn wel van mening dat de term Big Data, net als

    VANANALOOGNAARDIGITAAL.NU2

  • de term social media, allebei container begrippen zijn. Wanneer Big Data zijn

    volwassen stadium bereikt, zal de term Big Data gewoon weer data genoemd worden en

    is het de normaalste zaak van de wereld geworden, net als de termen e-mail en website.

    Toch heerst er verwarring

    Er heerst nog verwarring als het gaat om de definitie van Big Data. Een veel

    voorkomende en terugkerende benadering is het kijken naar het model van de drie Vs,

    (zie model boven), een korte uitleg:

    de V van Volume: Miljarden computers, smartphone-gebruikers en objecten zijn nu actief verbonden via het internet en hebben interactie met elkaar, ze genereren

    meer dan een exabyte, (afgekort EB) is 1000 petabytes of

    1.000.000.000.000.000.000 bytes (1018B), aan gegevens per dag.

    de V van Variteit: Veel van de gegevens zijn ongestructureerd, dat betekent dat ze vaak niet passen in een standaard relationele database. Ongestructureerde

    data zijn bijvoorbeeld: een review op Amazon, een commentaar op een blog, een

    video op YouTube, een podcast, een tweet, een post, een like enzovoort.

    VANANALOOGNAARDIGITAAL.NU3

  • en de V van Velociteit: Een smartphone gebruiker is voortdurend in beweging, de locatie-data verandert snel, en is daarmee van waarde voor bijvoorbeeld een

    aanbieder van diensten of producten. Of neem nu de snelheid van het enorme

    aantal Tweets dat per dag voorbij komt. Deze snelle updates van gegevens zorgen

    voor nieuwe uitdagingen binnen informatiesystemen.

    Volgens Neil Biehn, die onlangs een artikel schreef op het blog van Wired, missen er nog

    twee Vs aan het 3V-model. Hij stelt dat je eerst de levensvatbaarheid van gegevens

    moet beoordelen. Met zoveel soorten gegevens en variabelen dien je voor de bouw van

    een effectief (voorspellend) datamodel de kosten te overwegen. De relevantie van

    bepaalde variabelen, de vierde V, zou kunnen worden toegevoegd aan het bovenstaande

    model. Zodra de levensvatbaarheid van de data is bevestigd, kan er vervolgens een

    model worden gebouwd, dat geavanceerdere queries beantwoordt, een contra-intutief

    inzicht levert en dus een unieker inzicht creert. Pas dan ben je in staat voorspellende

    acties en gedragingen te definiren en begin je de vijfde V van Big Data: Value (=

    waarde) aan te boren, aldus Biehn.

    Verandering in de muziekindustrie

    Muziekmaatschappijen en muziekuitgeverijen, alsmede muzikanten bevinden zich

    midden in een grote verandering (herinner je het hoofdstuk hierover?), waarin nieuwe

    businessmodellen en digitale mediaproducten een belangrijke rol spelen. Digitalisering,

    internet en nieuwe consumentenvoorkeuren bedreigen de traditionele

    muziekmaatschappijen en muziekuitgeverijen. Zij hebben hedentendage te maken met

    meer concurrentie en verlies van de grip op doelgroepen en content.

    De prijs van muziek verschuift op termijn naar bijna nul. Via social media ontstaan er nu

    directe relaties tussen muzikanten en luisteraars. De meeste inkomsten genereren

    muzikanten of bands al een tijd niet meer met hun CDs of downloads. Die verdienen zij

    met het geven van de live optredens. Muziek is daarmee meer een beleving of vehikel,

    dan een fysiek product. Distributie tussen luisteraars onderling is gemeengoed en de

    schaarste verplaatst zich van aanbod naar aandacht.

    Deze verandering vindt ook plaats in tal van andere markten. Gelukkig biedt digitalisering

    ook nieuwe kansen. Productie en vooral distributie van digitale content is goedkoop.

    VANANALOOGNAARDIGITAAL.NU4

  • Distributie via internet levert bovendien het voordeel op dat er geprofiteerd kan worden

    van het long tail-effect: veel nicheproducten blijven beschikbaar en kunnen gedurende

    lange tijd omzet genereren. Prijzen van digitale mediaproducten zijn aan fluctuatie

    onderhevig, vaak dalen ze op termijn wat de aantrekkingskracht voor de consument

    vergroot. En fans kunnen gebruik maken van nieuwe diensten, zoals abonnementen op

    muziek in plaats van het downloaden er van.

    Muziekmaatschappijen en muziekuitgeverijen, alsmede muzikanten zijn en blijven

    afhankelijk van levensvatbare doelgroepen. In de digitale wereld zijn deze doelgroepen

    kleiner en specifieker. Versnippering van het aanbod en convergentie zijn enerzijds een

    bedreiging, maar leveren anderzijds nieuwe mogelijkheden om de eigen doelgroep te

    versterken en te binden. Contenteigenaren, dus bijvoorbeeld de muziekindustrie, bieden

    hun content aan over alle beschikbare platforms: print, radio, televisie en internet. Het

    verdienmodel dat hierbij hoort laat ook een versnippering zien naar meerdere

    inkomstenbronnen. In ons hoofdstuk De veranderde muziekindustrie en haar kansen

    wordt de rol van data steeds duidelijker. Data is voor de muziekindustrie eigenlijk de

    nieuwe levensbron, en daarmee een nieuw businessmodel, wat ons betreft.

    Toegang is dus data

    Het staat al geruime tijd vast dat toegang tot content een sleutelrol speelt voor