Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

14

Click here to load reader

Transcript of Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

Page 1: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 1

E-Politieke geschiedenisSlimmer zoeken en Distant Reading

Maarten Marx

Informatica Institute, Universiteit van Amsterdam

Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen,

2013-09-13

Page 2: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 2

Inhoud

• Ik laat 2 manieren zien om computers in te zetten om onderzoek

te doen in Politieke Geschiedenis.

• Onderzoek is steeds comparatief en diachronisch. (Vaak landen

vergelijken door de tijd).

Page 3: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 3

E-geschiedenis bedrijven

Twee manieren om met gigantische collecties gedigitaliseerde

bronenn om te gaan:

1. Lekker makkelijk zoeken Alles handig thuis bij de hand.

Verder net als vroeger, zelf lezen en interpreteren. “Close reading”

2. Distant reading laat de computer patronen en verbanden zichtbaar

maken (niet ontdekken, dat moet je zelf doen) door datasets

onderling en door de tijd te vergelijken.

Page 4: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 4

Zoeken

• Jullie zijn vast welbekend met zoeken in

statengeneraaldigitaal.nl en kbkranten.nl.

• Ik laat zien hoe dat net weer wat beter kan.

Page 5: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 5

Zoeken in expliciet gestructureerde tekst

• Maak structuur die impliciet aanwezig is in documenten ook voor

de machine leesbaar en gebruik die structuur in je zoekmachine.

• Voorbeeld: zoek naar toespraken over fascisme in het parlement

• http://search.politicalmashup.nl

• Zoek op fascis*, en vraag speeches terug.

Page 6: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 6

Voordelen

• Meer mogelijkheden om resultaten te ordenen en om granulariteit

in te stellen.

• Direct naar de juiste plek in het document. Maar met context.

• Documenten bevatten extra informatie en zijn verbonden met

andere bronnen (hier biografieen)

Page 7: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 7

Uitgebreid zoeken in kranten

• Niet alles in mogelijk met een zoekmachine.

• Bijvoorbeeld prefix-queries als “welke samenstellingen worden er

gemaakt met fascist/fascisme?”

• Query van de vorm *fascis*• Kan met reguliere expressies, maar duurt wat langer

• http://kbkranten.politicalmashup.nl en zoek op

\w+fascis\w+.• Dit is slechts 0.1 promille van het hele KB kranten corpus.

• Zoek wat er allemaal fascistisch wordt gevonden:

\bfascistische\b \b\w+\b

Page 8: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 8

E-geschiedenis bedrijven

Twee manieren om met gigantische collecties gedigitaliseerde

bronenn om te gaan:

1. Lekker makkelijk zoeken Alles handig thuis bij de hand.

Verder net als vroeger, zelf lezen en interpreteren. “Close reading”

2. “Distant reading”: Laat de computer patronen en verbanden

zichtbaar maken (niet ontdekken, dat moet je zelf doen) door

datasets onderling en door de tijd te vergelijken.

Page 9: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 9

Distant reading

• Voorbeeld: onderzoek naar populistische partijen in parlement (de

Vreese/van de Brug/Vliegenthart).

• Vergelijk taalgebruik in verschillende parlementen door de tijd.

• Stel zelfde query in verschillende talen

’immigra* OR minderhe* OR vreemdeling OR ethni* ORasiel* OR (ras AND relaties) OR migra*’,

’immigra* OR minorit* OR ethni* OR asylum* OR (raceAND relations) OR migrat*’

Page 10: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 10

Wie gebruikt in NL parlement fascisme?

• Haal de speeches op, en zet ze om in een (Excel) spreadsheet.

• Google Fusion table:

https://www.google.com/fusiontables/DataSource?docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U

• Tel hoeveel hits per persoon, en per partij

Page 11: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 11

Per persoon

bash-3.2$ cat fascisme.csv |awk -F$’\t’ ’{print $2}’ |sort|uniq -c|sort -nr65 Rutte5 Pechtold4 Wilders3 Timmermans3 Middel3 Kox3 Halsema2 Van Gennip2 Roemer2 De Roon2 Bosma1 Werner

PS: ook heel makkelijk te doen in Excel/Fusion Tables: add

summary, choose the Speaker column.

Page 12: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 12

per partij

bash-3.2$ cat fascisme.csv |awk -F$’\t’ ’{print $5}’ |sort|uniq -c|sort -nr9 PVV9 D668 PvdA7 VVD7 SP6 GroenLinks64 CDA1 speaker-party1 Groep Wilders1 CD1 ""

Page 13: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 13

Netwerk

• Wie gebruikt fascisme tijdens hetzelfde debat en waar gaat dat

dan over?

• https://www.google.com/fusiontables/DataSource?docid=162Tm-WJV6yYpUV5fcM4C33zWFqkaeuw6fuzW-9U

Page 14: Expertmeeting, E-humanities en politieke geschiedenis, Nijmegen, 2013-09-13

E-Politieke geschiedenis 14

Tot slot

• Computers bieden veel meer voor geschiedenis-onderzoek dan

“gewoon zoeken”.

• Zeker voor politieke geschiedenis is er heel veel prachtig materiaal

digitaal beschikbaar: http://search.politicalmashup.nl

• En er komt nog meer: NWO ExPoSe project (Jaap Kamps,

Maarten Marx en heel veel erfgoed instellingen)