Een korte introductie
Justin van [email protected] @justin_v_w
Bart de [email protected] @bartdegoede
PentaPolitica.nl
• In 2009 op eigen initiatief gestart na project met kamervragen
• ‘Trias Politica’ (Montesquieu)
PentaPolitica.nl
• Data over personen en partijen (‘statisch’)
• Namen, zittingen, nevenfuncties, opleidingen, etc.
• Uitingen in social media (‘dynamisch’)
• Tweets, video’s (YouTube), foto’s, blogs, etc.
Technische details• Importeren
• Verschillende API’s
• Python
• Dataopslag
• MySQL
• Frontend
• CakePHP
Partijen
• Naam
• Afkorting
• Datum van oprichting
• Logo
• Lidzittingen
‘Personalia’• Voornaam• Achternaam• Roepnaam• Initialen• Titels• Geslacht *• Biografie• Foto *• PDC-code• Geboorteplaats en -datum• Plaats en datum van overlijden
• Levensfilosofie • Loopbaan *
• Periode, instituut, functie• Nevenfuncties *
• Periode, instituut, functie• Opleidingen *
• Periode, instituut, functie• ‘Lidzittingen’
• Periode, Kamer en partij
* niet altijd volledig
Bronnen: parlement.com, tweedekamer.nl, eerstekamer.nl
Feeds
• Foto’s in verschillende formaten (gedownload)*
• Metadata van foto’s (datum, locatie, tags, etc.)
• Gebruikersinformatie (aanmaakdatum account, aantal views, etc.)
• Titel, beschrijving, tags, etc.
• De video zelf (in hoogst beschikbare kwaliteit)
• ‘Statistieken’ van video’s (aantal views, beoordelingen, etc.)
• Gebruikersinformatie (vrienden, aantal abonnementen, etc.)
• Tweets (inhoud, datum, reply op, RT, Geo-info, etc.)
• Gebruikersinformatie (van screen_name tot URL van profielachtergrondafbeelding)
• Followers en following door de tijd heen *
• (Hyves-) blogs, partijnieuws, podcasts, etc.
• Titel, samenvatting, datum van publicatie, etc.
• Downloaden van achterliggende pagina (of andere documenten; HTML + CSS + IMG, podcasts, PDF’s, afbeeldingen)
RSS
• Tweede Kamer- en kabinetsleden van Balkenende IV
• (Handmatig) geverifieerde personalia
• (Handmatig) gevonden feeds
• (Automatisch geïmporteerde) feeditems
Wat hebben we?
Wat hebben we?
• Onzekerheid over volledigheid m.b.t. feeditems
• Alleen Balkenende IV en Rutte I (exclusief ministers)
• Rijkere informatie (nog) niet opgenomen
• ‘Archief van verwijzingen’; bron kan ‘dood’ zijn
‘Onvolkomenheden’
• Importeerproces herschrijven
• Formele procedures voor het toevoegen en beheren van personen, partijen en feeds
• Uitgebreidere personalia (automatisch) verzamelen
Wat doen we nu?
• Front-end uitbreiden (compatible met ‘nieuwe’ data)
• Meer kabinetten, meer kamers
• Normalisatie van personalia
• API
• ...
Wat willen we nog?
Vragen?