Presentatie Dirk Roorda E4DS (onderzoeker)

35
Helpt datamanagement de onderzoeker? ja ... maar de praktijk is weerbarstig Den Haag , 2014-04-10 en 2014-05-08 [email protected]

Transcript of Presentatie Dirk Roorda E4DS (onderzoeker)

Page 1: Presentatie Dirk Roorda E4DS (onderzoeker)

Helpt datamanagement de

onderzoeker?ja ... maar de praktijk is

weerbarstig

Den Haag , 2014-04-10 en [email protected]

Page 2: Presentatie Dirk Roorda E4DS (onderzoeker)

Geleerdenbrieven

Page 3: Presentatie Dirk Roorda E4DS (onderzoeker)

Data en traditie

Page 4: Presentatie Dirk Roorda E4DS (onderzoeker)

text + linguistics =

> data

+ re

sear

ch =

>

Wido van Peursen

Page 5: Presentatie Dirk Roorda E4DS (onderzoeker)

Wat zien we ervan?

wivu wivu hebrew

Page 6: Presentatie Dirk Roorda E4DS (onderzoeker)

Wat valt je op?

De eerste hits zijn voor de archieven, de infrastructuren

De onderzoekers zelf en hun instituten komen later pas

Page 7: Presentatie Dirk Roorda E4DS (onderzoeker)

Wat mis je?

metadata: beschrijvingen, handleidingen, coderingen

analyses: hoe hebben andere wetenschappers de data gebruikt?

instrumenten: tools om deze data aan te pakken

de data zelf!

Page 8: Presentatie Dirk Roorda E4DS (onderzoeker)

Hoe is dit te verklaren?

Deze onderzoekers zijn begonnen vóór internet

ze hebben een fantastische datacreatie workflow ontwikkeld op hun instituut

de WIVU heeft een behoorlijk dikke celwand gekregen

Page 9: Presentatie Dirk Roorda E4DS (onderzoeker)

research data cycle ?religious

communities

theol. scholars

theol. scholars

enlightened lay people

linguists

comp. hum

Research Data Archiving

DANS

CLARINSHEBANQLAF-Fabric

Page 10: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 1: website (2008)

wivu.dans.knaw.nl

Page 11: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 2: demo (2012)

Page 12: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 3: deponeren (2012)

Page 13: Presentatie Dirk Roorda E4DS (onderzoeker)

wat is er gedeponeerd?

Page 14: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 4: project (2013)SHEBANQ

System for Hebrew Text: ANnotations for Queries

CLARIN-NL project

data curation: LAF

demonstrator: query saver

#!/etc bc

Page 15: Presentatie Dirk Roorda E4DS (onderzoeker)

LAF? Yes, ISOLinguistic Annotation Framework

ISO 24612:2012

Nancy Ide, Laurent Romary

Page 16: Presentatie Dirk Roorda E4DS (onderzoeker)

Inside LAF

Page 17: Presentatie Dirk Roorda E4DS (onderzoeker)

Metadata: features, ISOcat isocat.org

Page 18: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 5: tool (2014)

Page 19: Presentatie Dirk Roorda E4DS (onderzoeker)

excursie: data en tools

data is niet los verkrijgbaar

er is altijd een instrument nodig: software

kijken/checken

transporteren

transformeren

Page 20: Presentatie Dirk Roorda E4DS (onderzoeker)

kijken/checken

Page 21: Presentatie Dirk Roorda E4DS (onderzoeker)

transporteren

Page 22: Presentatie Dirk Roorda E4DS (onderzoeker)

transformeren

scripten

shell

perl, python, rubi

xslt

programmeren

C, C++, Java

Hoe kan ik de computer zo snel mogelijk voor mij aan

het werk zetten?

ik maak een model, compileer, bouw, hou overal rekening mee, en lever een product

af. O ja, de eigenlijke taak, die kun je nu heel snel

uitvoeren

ik geef een paar commandos

en ga koffie drinkende computer werkt op

100%

Page 23: Presentatie Dirk Roorda E4DS (onderzoeker)

waar vallen wetenschappers voor?

het zijn geen software ontwikkelaars

maar ze programmeren wel

ze exploreren data, kneden, masseren

hun product is geen programma

maar analyse, visualisatie, publicatie

Page 24: Presentatie Dirk Roorda E4DS (onderzoeker)

scientific computing

meer dan (i)Python

meer dan een interface

meer dan een ekosysteem

een cultuur:

Page 25: Presentatie Dirk Roorda E4DS (onderzoeker)

cultuur

fragmenten uit een video van Fernando Perez

4:19 onderzoekers en computing - 7:37

17:00 tools en de data life cycle - 20:26

42:09 data en publiceren - 44:20 / 49:22

Page 27: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 6: oversteken (2014)

Rens Bod: ling/dighum

Data Oriented Parsing

Page 28: Presentatie Dirk Roorda E4DS (onderzoeker)

stap 7: meer (toekomst)

meer projecten

meer disciplines

meer databronnen

meer wetenschappelijke output

betere positie in de competitie

Page 29: Presentatie Dirk Roorda E4DS (onderzoeker)

impact

Pierre van Hecke:

Hebrew/ling

Rens Bod: ling/dighum

VolkstellingenCEDAR

NLP-LABWouter van Atteveldt

Jan Klein NijenhuisPiek Vossen

Frank van Harmelen

Nicolai Winther-Nielsen

Wido van Peursen

Page 30: Presentatie Dirk Roorda E4DS (onderzoeker)

turn-turn-turnreligious

communities

theol. scholars

theol. scholars

enlightened lay people

linguists

comp. hum

Research Data Archiving

DANS

Page 31: Presentatie Dirk Roorda E4DS (onderzoeker)

research environment

data / standards

tools / processing

examples / teaching

linking / products

ISO-LAF

LAF-Fabric/EMDROS

iPython notebooks

apps and articles

DANS/ISOcat

GitHub

GitHub

Github/journals

Page 32: Presentatie Dirk Roorda E4DS (onderzoeker)

is dit een success verhaal?

dat staat nog te bezien ...

pas na 6 jaar tekenen van versnelling

vaak de gelegenheid grijpen

overmatig overtuigen

technische diepgang

affiniteit met de bronnen en het onderzoek

investeringen vooraf

Page 33: Presentatie Dirk Roorda E4DS (onderzoeker)

waarom gaat het niet sneller?

de groep heeft zich efficiënt georganiseerd

veel is onder controle

nieuwe methoden zijn nog niet bewezen

technische support is schaars en moeilijk te betalen voor alfa-groepen

Page 34: Presentatie Dirk Roorda E4DS (onderzoeker)

welke factoren dragen bij?

personele veranderingen in de vakgroep

nieuwe projecten

nieuwe eisen van NWO (open access)

competitie en samenwerking over disciplines

door de al maar doorgaande dynamiek van meer-beter-sneller-werkbaarder:

komt de digitale wereld steeds dichter bij steeds meer mensen

Page 35: Presentatie Dirk Roorda E4DS (onderzoeker)

Helpt data management de onderzoeker?

ja, als zij inziet waar archivering en hergebruik goed voor is

ja, als hij de weg naar het archief weet te vinden

ja, als het archief relevant voor haar weet te zijn

ja, als het archief alert omgaat met de ontwikkelingen in ICT

Niets hiervan is

vanzelfsprekend

[email protected]