Historicidagen 2017 'Collectie-ontsluiting next level: de ijsberg zichtbaar maken'.

158
Sessie: de ijsberg zichtbaar maken #histoijsberg

Transcript of Historicidagen 2017 'Collectie-ontsluiting next level: de ijsberg zichtbaar maken'.

Sessie de ijsberg zichtbaar maken

histoijsberg

Voorstellen

bull Wie zijn wij en waarom zijn wij hier

bull Wie bent u en waarom bent u hier

Ons doel

bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water

bull Nieuwe methoden om bronnen toegankelijk te maken

bull De ijsberg zichtbaar te maken

De uitdaging vindbaar en bruikbaar

Uw doel

bull Wat kun je hiermee als historicus

bull Hoe gaat dit onderzoek veranderen

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Voorstellen

bull Wie zijn wij en waarom zijn wij hier

bull Wie bent u en waarom bent u hier

Ons doel

bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water

bull Nieuwe methoden om bronnen toegankelijk te maken

bull De ijsberg zichtbaar te maken

De uitdaging vindbaar en bruikbaar

Uw doel

bull Wat kun je hiermee als historicus

bull Hoe gaat dit onderzoek veranderen

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Ons doel

bull Kijkje in de keuken waar zijn archiefinstellingen mee bezig wat zit er onder water

bull Nieuwe methoden om bronnen toegankelijk te maken

bull De ijsberg zichtbaar te maken

De uitdaging vindbaar en bruikbaar

Uw doel

bull Wat kun je hiermee als historicus

bull Hoe gaat dit onderzoek veranderen

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

De uitdaging vindbaar en bruikbaar

Uw doel

bull Wat kun je hiermee als historicus

bull Hoe gaat dit onderzoek veranderen

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Uw doel

bull Wat kun je hiermee als historicus

bull Hoe gaat dit onderzoek veranderen

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

De ijsberg zichtbaar maken

1 VAN ANALOOG NAAR DIGITAAL

bull Volautomatische Archiefontsluiting Edwin Klijn (NOB)

bull De ijsberg zichtbaar maken serie-archieven Ceciel Huitema (Nationaal

Archief) en Nico Vriend (Noord-Hollands Archief)

2 WAT ALS HET DIGITAAL IS

bull Events modelling Marieke van Erp (VUKNAW Humanities Cluster)

bull Koppelen Personenportal WO2 Lizzy Jongma (NOB)

bull Contextualisering Wikipedia Verzetskrantenproject Olaf Janssen

(Koninklijke Bibliotheek)

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

1 Van analoog naar digitaal

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Edwin KlijnNetwerk Oorlogsbronnen Historicidagen 2017

Volautomatische archiefontsluiting

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Netwerk Oorlogsbronnen (NOB)

bull Sinds 2010

bull Samenwerkingsverband van instellingen met WO2-collecties

bull Onderwerp Tweede Wereldoorlog

bull Doel vergroten gebruik Collectie WO2 Nederland

bull Perspectief archieven musea instituten etc (+- 400)

bull Programma 2016-2019

bull Digitaal verbinden van collecties

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Onderzoeksteam

bull Rafael Carrasco Isabel Martiacutenez (IMPACT Centre of Competence)

bull Martin Reynaert (Centre for Language and Speech Technology Nijmegen)

bull Anne Gorter Liesbeth Keijser Joop Korswagen (Nationaal Archief)

bull Edwin Klijn (Netwerk Oorlogsbronnen)

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Doel

bull In hoeverre is het zinvol om getypte of hybride archiefdocumenten te OCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

bull Met welke settings krijg je de beste OCR

bull Meten meten meten

bull Volautomatisch

bull Eindrapport met conclusie en aanbevelingen (okt 2016) zie httpswwwoorlogsbronnennlvolauto

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Ontsluiting op DOCUMENT-niveau

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stappen

3 Voorbewerking

4 Transcriptie

(OCR of HTR)

Machineleesbaardocument

5 Postcorrectie

Origineel document

2 Scannen

1 Selectie

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Selectie testset

bull 89 scans

bull Centraal Archief Bijzondere Rechtspleging

bull Geen gewogen representatieve selectie

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Word Accuracy Rate (ongewogen)

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Word accuracy rates (gewogen)

bull 8106 word accuracy rate (volgorde onafhankelijk ldquobag of wordsrdquo)

bull 7595 word accuracy rate (volgorde afhankelijk)

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Waar houdt OCR-software niet van

bull Doorslagen

bull Tabellen kolommen complexe lay-out

bull Handgeschreven notities in de tekst

bull 1rsquotjes en Irsquotjes en lrsquotjes

bull Onregelmatige inktdikte van tekst

bull Weinig contrast achtergrond en tekst

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Slecht 5286 word accuracy rate(volgorde onafhankelijk)

bebendaldDeze lljaten werden ingaleverd bij do Ohef van de SBDoze Hoekte hiervan een doorlopende 11 jat en met diana advlaa ging de 11 jat naar da Befahlehaber dor SlcharampeltddlenatDeze beellate dan wat ar set de pevanpanensoaat gebeurenongeveer vier weken voor do atrijd om Groningen bevonden aldhneg vereehlllende arrestanten ia het Halo van Bewaring te 9roalagenock hier

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Slecht een bloemlezing

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Waar houdt OCR-software wel van

bull Eenvoudige lay-out (portret geen tabellen of kolommen)

bull Tekst met een gelijkmatige inktdikte

bull Duidelijk contrast tussen tekstgebieden en lichte achtergrond

bull Rechte tekstregels

bull Ruimte tussen de woorden

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Koploper 9831 word accuracy rate(volgorde onafhankelijk)

zich ophield Mijn zuster deelde mij mede dat deze man de volgen( de Maandag zou terugkomen Ik ben toen Maandags naar de woning van mijn zuster gegaan Ik bevond mij in de woning van mijn zus ter toen volgens mijn zuster de zelfde persoon die enige dagen terag aan haar woning was geweest zich daar vervoegde Mijn zuster heeft deze man toen aan de deur van haar woning te woord ge

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Gemiddeld 8195 word accuracy rate(volgorde onafhankelijk)

Naam en voornamen achternaamvoornaam Geboortepaats en-datum Zaandam 29 October 1897 Echtgenoote van Beroep voorheen agent van Politie t Laatste woonptaatsen adres Kanaalstraat 25 II Amsterdam Persoonsbewijs-noz 2 01239 afgegeven te Leeuwarden Nationaiiteit (evt vroeger) Nederlander die ervan verdacht wordt joodschepersonen in macht van den vijand te hebben gebrachtterwijl hij in dienst was van de SD Terzake gehoord verkiaarde verdachte mij het votgende dat hij in dienst was getreden van Lippmann en Rosenthal voor de inventarisatie van joodsche goederenvervolgensovergegaan naar de SDafdeeling joodsche zaken te Amsterdam Verdachte heb ik optastvan den Chef Opsporingsdienst DPM op 28 Mei 1945 bewaring togesteid in het Huis van Bewaring I te Amsterdam POD Amsterdam Mode A

Domeinspecifieke woorden bewaring agent van Politie Persoonsbewijs vijand joodsche goederen verdachte verdacht Mode A in dienst was getredenPersonen achternaam voornaam joodsche personen Nederlander Chef Opsporingsdienst DPMOrganisaties SD Opsporingsdienst DPM Lippmann en Rosenthal afdeeling joodsche zaken te Amsterdam PODGeografische lokatie Zaandam Kanaalstraat 25 II Amsterdam Amsterdam Huis van Bewaring LeeuwardenDatum 29 October 1897 28 Mei 1945

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Postcorrectie met bestaande lijsten

bull Geografie Westerbora Wester- 6^ Boumlrk Imsterdam Sittara JoaseneScnouwbarg Pen Helder Ulterwaardestraat AMSTERDAM

bull Organisaties Zentrallstelle fampr jEdische Auswanderung Bevolkiageregiecircter

bull Namen HENNEIOKE CHRISTCF^EL LEOPuumlLD

bull Datum t943 25 Ootober 1545 2 October l9uuml6

bull Woorden ltolshorloge recnercneur

bull WO2-woorden volkagonoo- ten geacutedeumlpUrteerd gevwgenan die JGdinSophie cndorgc okoamp

bull Ook spellingsfouten in origineel verbeteren

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Algemene conclusie

In hoeverre is het zinvol om getypte of hybride archiefdocumenten teOCRrsquoen en nader toegankelijk te maken met ldquonamed entity recognitionrdquo-tools

Ja het is zinvol

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Kansen automatisch sorteren

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO)

bull Partners Nationaal Archief NIOD Huygens ING NOB

bull Doel analoog archief omvormen naar digitaal bruikbaar onderzoeksarchief

bull Optical Character Recognition en data-verrijking wie wat waar en wanneer

bull 2016-2019

bull Pilot Centraal Archief Bijzondere Rechtspleging

bull KNAW onderzoeksfonds

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

31

De ijsberg zichtbaar

maken

Ceciel Huitema (Nationaal Archief) amp

Nico Vriend (Noord-Hollands Archief)

Historicidagen Utrecht 25 augustus 2017

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

De ijsberghellip

Boven water (online)bull Beschrijvingen van documenten

bull lsquoMachine leesbarersquo indexen databases

bull Scans van documenten

Illustratie Shutterstock copy grop

Onder waterbull Kilometers aan documenten

bull Geschreven getypte en gedrukte indexen

bull Informatie in documenten zelf

Illustratie Shutterstock copy grop

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Seriearchieven in de ijsberg

Soms meer dan 75

bull Bij lsquoverbaalstelselrsquo ministeries

1813-1940

bull Overgrote deel Nederlandse

overheidsarchieven

Berekening Charles Jeurgens

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Een voorbeeld

bull 140 meter aan documenten

bull Tien jaarhellip

Archief Ministerie van Kolonien 1910-1919

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Toegankelijk

bull Beschrijvingen van afzonderlijke stukken zijn lsquoonzichtbaarrsquo

bull Zoekopdrachten (bijvoorbeeld lsquoSnouck Hurgronjersquo) leveren niets ophellip

Online ziet het er zo uit

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Maar er zijn weacutel beschrijvingen beschikbaarhellip

bull Destijds aangemaakt (1910-1919)

bull 4 meter lsquoindexenrsquo maken 140 meter aan documenten toegankelijk

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Analoge situatie

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

De index als sleutel

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Voorbeeld index

Kenmerkenbull Kolommenstructuurbull Handgeschrevenbull Van ieder onderliggend document van wie amp korte inhoudbull Verwijzingen naar de stukken (lsquoverbalenrsquo)

Online doorzoekbaar te maken

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Hoe komen we van dithellip

Illustratie Shutterstock copy grop

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

hellipnaar dit

Illustratie Shutterstock copy grop

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

voor handgeschreven bronnen Naar een

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Handwritten Text Recognition (HTR)

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Full-text zoeken wordt mogelijk Maar is er niet zomaar

bull Handmatige transcipties aanleveren (eerste hellip paginarsquos)bull Lay-out analyse tekstvelden worden herkend (wel vaak bijstellen)

bull HTR resultaat 10 foutmarge op karakterbasis acceptabel bull Controle door The Crowd

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Voor- en nadelen index

bull Voordelen

bull Uniform qua lay-out

bull Weinig verschillende handschriften

bull Meeste overheidsarchieven grotendeels op dezelfde manier gestructureerd

bull Nadelen

bull (Nog) niet de teksten van de onderliggende documenten doorzoekbaar maar metadata in bulk

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

De ijsberg zichtbaar maken

Wat we willen1) Pilots op verschillende archieven

bull Ministerie van Kolonieumln 1910-1919 (Nationaal Archief)

bull Gemeentebestuur Haarlem 1886-1898 (Noord-Hollands Archief)

2) HTR testen

3) Crowdsourcingprojecten op resultaten HTR

bull Marktpartijen zoeken

4) Samenwerken met gebruikers

bull Historici

Interessebull cecielhuitemanationaalarchiefnl

bull nicovriendnoord-hollandsarchiefnl

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

2 Wat als het digitaal is

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Ontsluiten wat er iacuten zit

Marieke van Erp merpeltje

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Tekst in collecties

bull Zoeken en koppelen gebeurt vaak via gestructureerde databasevelden

bull In vrije tekstvelden kan via trefwoorden gezocht worden

bull Maar trefwoorden vertellen je niet dat ldquobrandrdquo en ldquovuurrdquo gerelateerde concepten zijn

bull Voor next-level collectie-ontsluiting moeten we ook kijken naar wat er iacuten de tekstvelden staat en dat koppelen aan thesauri enof andere collecties

Image source httpscdnpixabaycomphoto201705281601wave-2351346_960_720jpg

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Domeinen

Geschiedenis

Semantisch

Web

Taal-

technologie

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Taaltechnologie

bull Onderzoek en ontwikkeling van manieren om informatie uit

teksten te extraheren

bull information retrieval automatisch vertalen deep reading

bull meerderheid van datasets in het domein zijn contemporaine

kranten

bull Digital Humanities taaltechnologen onderzoeken hoe deze

technologie zich gedraagt in een ander domein

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Semantisch Web

bull Onderzoekt en ontwikkelt mogelijkheden om een machine

leesbaar Web te creeumleren

bull kennismodelering formaten kennisrepresentatie data delen

bull Linked Open Data wolk is de portal tot een rijkdom aan

gestructureerde databronnen

bull Semantisch Web technologie heeft moeite gebruikers buiten

het domein te bereiken

Image source httplod-cloudnetversions2017-02-20lodpng

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Geschiedenis

bull Geiumlnteresseerd in

bull mensen

bull gebeurtenissen

bull Veel historici zijn geiumlnteresseerd in

bull analyse van grotere datasets

bull kwantitatieve methoden

image source httpsuploadwikimediaorgwikipediacommons774York_Pioneers_social_re-union_St_Georges_Hall_Toronto_March_3_1911_(HS85-10-23694)jpg

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Taal-

technologie

Components

Geschiedenis

Semantisch Web

kennismodellering

amp representatie

kennis

kennis

informatie

extractie

event extractie

named entity

recognition and linking

vocabulaires

vocabulaires

entiteit

netwerken

standaardisatie

personen amp gebeurtenissen

kwalitatief en kwantitatief

onderzoek

gestructureerde data

gestructureerde data

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

2009 - 2013

bull Doel van het project relaties leggen tussen Rijksmuseum en Beeld en Geluid collecties

bull Digital Hermeneutics

bull Herkennen van gebeurtenissen en participanten in objectbeschrijvingen (Taaltechnologie)

bull Modelleren van gebeurtenissen en narratieven (Semantisch Web)

bull Marieke van Erp Johan Oomen Roxane Segers Chiel van den Akker Lora Aroyo Geertje Jacobs Susan Legecircne Lourens van der Meij Jacco van Ossenbruggen and Guus Schreiber (2011) Automatic Heritage Metadata Enrichment with Historic Events Museums and the Web 2011 Philadelphia PA USA April 6-9 2011

bull Van Den Akker C Legecircne S Van Erp M Aroyo L Segers R van Der Meij L Van Ossenbruggen J Schreiber G Wielinga B Oomen J and Jacobs G 2011 June Digital hermeneutics Agora and the online understanding of cultural heritage In Proceedings of the 3rd International Web Science Conference (p 10) ACM

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Taal-

technologie

Components

Geschiedenis

Semantisch Web

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

image source httpsstaticpexelscomphotos7096people-woman-coffee-meetingjpg

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpmariekevanerpcom

Wat kan taaltechnologie voor jouw

collectieonderzoekhobbyproject betekenen

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Lizzy JongmaNetwerk Oorlogsbronnen Historicidagen 2017

Personenportal WO2

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Van lsquoweb of documentsrsquohellip

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Naar lsquoweb of datarsquo

httpwwwkampwesterborknl

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Naar lsquoweb of datarsquo

httpwwwkampamersfoortnl

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Naar lsquoweb of datarsquo

Geonames

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpsgithubcomNetwerkOorlogsBronnenpilot-geocoderenZelhem

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpislandsofmeaningnlprojectsfalsepositivesBunschoten-Spakenburg

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Naar lsquoweb of datarsquo

WO2-thesaurus

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Semantic web

ldquoThe Semantic Web is not a separate Web but an extension of the current one in which information is given well-defined meaning better enabling computers and people to work in cooperationrdquo (Tim Berners-Lee Scientific American 2001)

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

WO2 thesaurus

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

WO2 thesaurus

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Partners personenportal WO2

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Per bron overzicht matches

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Overzicht personen

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Detailpagina

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Te weinig om te matchen

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Personenportal Pilot ndash Hoe we matchen

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Open data Wikipedia en crowdsourcing voor ondergrondse kranten uit WO2

Olaf Janssen Koninklijke Bibliotheek

Historicidagen 2017 Utrecht 25 augustus

olafjanssenkbnl - ookgezellig - slidesharenetOlafJanssenNL

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Tijdens WO2 zijn veel verzetsbladen

uitgegeven

In allerlei soorten en matenhellip

htt

p

ww

w4

en5

mei

amst

erd

amn

lat

tach

men

t4

74

54

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpresolverkbnlresolveurn=ddd010436323 httpresolverkbnlresolveurn=ddd010442948

httpresolverkbnlresolveurn=ddd010447825 httpresolverkbnlresolveurn=ddd010450508

Van de grote bekende titels

(oa Parool Vrij Nederland Trouw de Waarheid)

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

tot hele kleine onbekende eenmalige uitgavenhellip (pamfletten 1-2 velletjes)

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Na de oorlog heeft het NIOD plusmn 1300 titels verzameld bewaardhellip

httpscommonswikimediaorgwikiFileVerzetskrant_in_archiefdozen_bij_het_NIODjpg ndash CC-BY-SA - OlafJanssen

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpopac-gonextoclcorg8180DB=8XMLPRS=YPPNPPN=107123223

en in bibliotheekcatalogi beschreven(1300 titels)

Bibliografische metadata

Illegale studentenkrant uit Den HaagLeiden

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

In 2010 zijn deze ondergrondse kranten gedigitaliseerdhellip

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

wwwdelphernlkranten

hellipen staan nu in Delpher(1300 titels)

Verzamelplaats voor historische full-text bull Krantenbull Boekenbull Tijdschriften

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Dus ook De Geus onder studenten

httpwwwdelphernlnlkrantenresultscoll=dddtitelampcql[]=ppn+any+(107123223)

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Op Delpher kun je deze krant lezen en op woordniveau (full-text) doorzoekenhellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Maar stel ik wil meer over deze krant wetenbull Wat voor soort verzetskrant was De Geus bull Wat is de geschiedenis van deze krant bull Wie werkten aan de krant bull Waar werd deze krant gedruktbull Hoe werd De Geus verspreidbull Waren er relaties met andere verzetskrantengroepenbull Etchellip

De antwoorden vindt je niet op Delpher

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Gebrek in Delpher

Geen contextuele informatie over illegale kranten

httpsthejungleisneutralfileswordpresscom201311lostjpg

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Waar zouden veel mensen die meer over De Geus willen weten eerst gaan kijken

Wikipedia zeer vermoedelijk (via Google)

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-text in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

http2bpblogspotcom_BWzuYwiS6-ITMgeRsFd3mIAAAAAAAAElw3cvgbZSPWcss1600doctor+macro+judy+scaredjpg

Informatie over Nederlandse ondergrondse kranten was verspreid over verschillende ongekoppelde bronnen

1 Beschrijvingen (metadata in bieb-cat 1300 titels)2 Content (full-texts in Delpher 1300 titels) 3 Context (in Wikipediahellip althans )

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Dit Wikipedia-artikel is een zorgvuldig gekozen uitzondering

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpsnlwikipediaorgwikiCategorieIllegale_pers_in_de_Tweede_Wereldoorlog

1 Er zijn maar weinig ondergrondse kranten met een eigen WP-artikel

2 Het overzicht van deze kranten op Wikipedia is (erg) incompleet

ltltlt 1300 titels

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben beide problemen aangepakt

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

tinyurlcomverzetskranten

Groot publieksbereik

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpsthejungleisneutralfileswordpresscom201311lostjpg

We hadden dringend behoefte aan contextuele info over de kranten

Hoe kwamen we daaraan

De Ondergrondse Pers 1940-1945

Lydia E Winkel H de Vries 1989

Bevat beschrijvingen van vrijwel alle

1300 ondergrondse krantenuit WO2

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Lemma 199 ndash De Geus (onder studenten)

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Metadata

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Uniek ID

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Plaats van uitgave

Krantentitel Plaats van uitgave

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Contextueleinformatie

Ruw materiaal voor Wikipedia-artikel

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Bij deze krant betrokken personen

Krantentitel Personen

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

IDs van gerelateerde kranten

Deze krantentitel Andere titels

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek gescand en als PDF met vrije licentie online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrije licentie (CC-BY-SA)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dit boek geOCRed + als PDF onder CC-BY-SA online gezet

httpwwwniodnlnlde-ondergrondse-pers-1940-1945 (PDF)

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Database-expert

Gerard Kuys

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Converteer PDF naar database

Koppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

VIAF

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Beschikbaar online (PDF platte file)

Vrij voor hergebruik (CC-BY-SA licentie)

---------------------------------------------------

Converteer PDF naar databaseKoppel titels plaatsen personen andere titels

Koppel titels bieb-cat (metadata) en Delpher (full-text)

Koppel titels personen amp plaatsens externe bronnen

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Zomer 2016 - Unieke database

Eerste keer dat data over verzetskranten systematisch online bijeengebracht en gekoppeld is

htt

ps

w

ww

pin

tere

stc

om

fre

eth

ewro

nge

dw

orl

d-w

ar-i

i

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Wikiproject Verzetskranten

ldquoop Wikipedia systematisch en uniform beschrijven van alle plusmn 1300 Nederlandse verzetskranten die tijdens WO2 zijn uitgegevenrdquo

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelen gaan genereren

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

We hebben dus een database met informatie over 1300 verzetskranten

Mbv een artikelsjabloon kunnen we vervolgens systematisch uniforme WP-artikelbeginnetjes genereren

htt

ps

c1

sta

ticf

lickr

co

m9

82

81

76

99

23

19

18

_11

a73

56

c38

_bjp

g

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Database + sjabloon = WP-artikelbeginnetje

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Niet-grijs = Wikipedia artikelbeginnetje

Automatisch uit database gegenereerd mbv sjabloon

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Dit is handmatig toegevoegd om van het beginnetjeeen volwaardig artikel te maken

Crowdsourcing door Nederlandse Wikipedia-gemeenschap

httpsnlwikipediaorgwikiDe_Geus_onder_studenten_(verzetsblad)

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Wikipedia-vrijwilligers breiden de1300 beginnetjes uithellip

hellipen maken langzaam maar zeker steeds meer volwaardige artikelen

Door Sebastiaan ter Burg [CC BY 20 (httpcreativecommonsorglicensesby20)] via Wikimedia Commons

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Voacuteoacuter het project

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stapje voor stapjehellip

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

hellip Nederlanders weer wat wijzer amp blijer

htt

p

ww

wf

orm

erd

ays

com

20

11

05

du

tch

-lib

erat

ion

htm

l

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Vielen Dankolafjanssenkbnl - ookgezellig

tinyurlcomverzetskranten

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stellingen

1 Universiteiten en erfgoedinstellingen moeten meer gaan samenwerken op het gebied van collectieontsluiting

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stellingen

2 Historici moeten leren programmeren

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stellingen

3 Als een bron niet digitaal is bestaat ie niet

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied

Stellingen

4 Digital Humanities-onderzoek gaat voor wetenschappelijke doorbraken zorgen in ons vakgebied