Presentatie Dirk Roorda E4DS (onderzoeker)
-
Upload
rene-van-horik -
Category
Data & Analytics
-
view
59 -
download
0
Transcript of Presentatie Dirk Roorda E4DS (onderzoeker)
Helpt datamanagement de
onderzoeker?ja ... maar de praktijk is
weerbarstig
Den Haag , 2014-04-10 en [email protected]
Geleerdenbrieven
Data en traditie
text + linguistics =
> data
+ re
sear
ch =
>
Wido van Peursen
Wat zien we ervan?
wivu wivu hebrew
Wat valt je op?
De eerste hits zijn voor de archieven, de infrastructuren
De onderzoekers zelf en hun instituten komen later pas
Wat mis je?
metadata: beschrijvingen, handleidingen, coderingen
analyses: hoe hebben andere wetenschappers de data gebruikt?
instrumenten: tools om deze data aan te pakken
de data zelf!
Hoe is dit te verklaren?
Deze onderzoekers zijn begonnen vóór internet
ze hebben een fantastische datacreatie workflow ontwikkeld op hun instituut
de WIVU heeft een behoorlijk dikke celwand gekregen
research data cycle ?religious
communities
theol. scholars
theol. scholars
enlightened lay people
linguists
comp. hum
Research Data Archiving
DANS
CLARINSHEBANQLAF-Fabric
stap 2: demo (2012)
stap 3: deponeren (2012)
wat is er gedeponeerd?
stap 4: project (2013)SHEBANQ
System for Hebrew Text: ANnotations for Queries
CLARIN-NL project
data curation: LAF
demonstrator: query saver
#!/etc bc
LAF? Yes, ISOLinguistic Annotation Framework
ISO 24612:2012
Nancy Ide, Laurent Romary
Inside LAF
Metadata: features, ISOcat isocat.org
stap 5: tool (2014)
excursie: data en tools
data is niet los verkrijgbaar
er is altijd een instrument nodig: software
kijken/checken
transporteren
transformeren
kijken/checken
transporteren
transformeren
scripten
shell
perl, python, rubi
xslt
programmeren
C, C++, Java
Hoe kan ik de computer zo snel mogelijk voor mij aan
het werk zetten?
ik maak een model, compileer, bouw, hou overal rekening mee, en lever een product
af. O ja, de eigenlijke taak, die kun je nu heel snel
uitvoeren
ik geef een paar commandos
en ga koffie drinkende computer werkt op
100%
waar vallen wetenschappers voor?
het zijn geen software ontwikkelaars
maar ze programmeren wel
ze exploreren data, kneden, masseren
hun product is geen programma
maar analyse, visualisatie, publicatie
scientific computing
meer dan (i)Python
meer dan een interface
meer dan een ekosysteem
een cultuur:
cultuur
fragmenten uit een video van Fernando Perez
4:19 onderzoekers en computing - 7:37
17:00 tools en de data life cycle - 20:26
42:09 data en publiceren - 44:20 / 49:22
trees f
or Data Orie
nted Parsing
stap 6: oversteken (2014)
Rens Bod: ling/dighum
Data Oriented Parsing
stap 7: meer (toekomst)
meer projecten
meer disciplines
meer databronnen
meer wetenschappelijke output
betere positie in de competitie
impact
Pierre van Hecke:
Hebrew/ling
Rens Bod: ling/dighum
VolkstellingenCEDAR
NLP-LABWouter van Atteveldt
Jan Klein NijenhuisPiek Vossen
Frank van Harmelen
Nicolai Winther-Nielsen
Wido van Peursen
turn-turn-turnreligious
communities
theol. scholars
theol. scholars
enlightened lay people
linguists
comp. hum
Research Data Archiving
DANS
research environment
data / standards
tools / processing
examples / teaching
linking / products
ISO-LAF
LAF-Fabric/EMDROS
iPython notebooks
apps and articles
DANS/ISOcat
GitHub
GitHub
Github/journals
is dit een success verhaal?
dat staat nog te bezien ...
pas na 6 jaar tekenen van versnelling
vaak de gelegenheid grijpen
overmatig overtuigen
technische diepgang
affiniteit met de bronnen en het onderzoek
investeringen vooraf
waarom gaat het niet sneller?
de groep heeft zich efficiënt georganiseerd
veel is onder controle
nieuwe methoden zijn nog niet bewezen
technische support is schaars en moeilijk te betalen voor alfa-groepen
welke factoren dragen bij?
personele veranderingen in de vakgroep
nieuwe projecten
nieuwe eisen van NWO (open access)
competitie en samenwerking over disciplines
door de al maar doorgaande dynamiek van meer-beter-sneller-werkbaarder:
komt de digitale wereld steeds dichter bij steeds meer mensen
Helpt data management de onderzoeker?
ja, als zij inziet waar archivering en hergebruik goed voor is
ja, als hij de weg naar het archief weet te vinden
ja, als het archief relevant voor haar weet te zijn
ja, als het archief alert omgaat met de ontwikkelingen in ICT
Niets hiervan is
vanzelfsprekend