Pentapolitica.nl - Introductie

Post on 29-Jun-2015

760 views 1 download

description

Korte inleiding op PentaPolitica.nl, gemaakt voor developers bijeenkomst van het PoliticalMashup project (politicalmashup.nl) gehouden op 19 oktober 2010. Beschrijving van de momenteel beschikbare data, ’current work’ en plannen voor de toekomst.

Transcript of Pentapolitica.nl - Introductie

PentaPolitica.nl

• In 2009 op eigen initiatief gestart na project met kamervragen

• ‘Trias Politica’ (Montesquieu)

PentaPolitica.nl

• Data over personen en partijen (‘statisch’)

• Namen, zittingen, nevenfuncties, opleidingen, etc.

• Uitingen in social media (‘dynamisch’)

• Tweets, video’s (YouTube), foto’s, blogs, etc.

Technische details• Importeren

• Verschillende API’s

• Python

• Dataopslag

• MySQL

• Frontend

• CakePHP

Partijen

• Naam

• Afkorting

• Datum van oprichting

• Logo

• Lidzittingen

‘Personalia’• Voornaam• Achternaam• Roepnaam• Initialen• Titels• Geslacht *• Biografie• Foto *• PDC-code• Geboorteplaats en -datum• Plaats en datum van overlijden

• Levensfilosofie • Loopbaan *

• Periode, instituut, functie• Nevenfuncties *

• Periode, instituut, functie• Opleidingen *

• Periode, instituut, functie• ‘Lidzittingen’

• Periode, Kamer en partij

* niet altijd volledig

Bronnen: parlement.com, tweedekamer.nl, eerstekamer.nl

Feeds

• Foto’s in verschillende formaten (gedownload)*

• Metadata van foto’s (datum, locatie, tags, etc.)

• Gebruikersinformatie (aanmaakdatum account, aantal views, etc.)

• Titel, beschrijving, tags, etc.

• De video zelf (in hoogst beschikbare kwaliteit)

• ‘Statistieken’ van video’s (aantal views, beoordelingen, etc.)

• Gebruikersinformatie (vrienden, aantal abonnementen, etc.)

• Tweets (inhoud, datum, reply op, RT, Geo-info, etc.)

• Gebruikersinformatie (van screen_name tot URL van profielachtergrondafbeelding)

• Followers en following door de tijd heen *

• (Hyves-) blogs, partijnieuws, podcasts, etc.

• Titel, samenvatting, datum van publicatie, etc.

• Downloaden van achterliggende pagina (of andere documenten; HTML + CSS + IMG, podcasts, PDF’s, afbeeldingen)

RSS

• Tweede Kamer- en kabinetsleden van Balkenende IV

• (Handmatig) geverifieerde personalia

• (Handmatig) gevonden feeds

• (Automatisch geïmporteerde) feeditems

Wat hebben we?

Wat hebben we?

• Onzekerheid over volledigheid m.b.t. feeditems

• Alleen Balkenende IV en Rutte I (exclusief ministers)

• Rijkere informatie (nog) niet opgenomen

• ‘Archief van verwijzingen’; bron kan ‘dood’ zijn

‘Onvolkomenheden’

• Importeerproces herschrijven

• Formele procedures voor het toevoegen en beheren van personen, partijen en feeds

• Uitgebreidere personalia (automatisch) verzamelen

Wat doen we nu?

• Front-end uitbreiden (compatible met ‘nieuwe’ data)

• Meer kabinetten, meer kamers

• Normalisatie van personalia

• API

• ...

Wat willen we nog?

Vragen?