Presentatie Dirk Roorda E4DS (onderzoeker)

Post on 29-Jul-2015

59 views 0 download

Transcript of Presentatie Dirk Roorda E4DS (onderzoeker)

Helpt datamanagement de

onderzoeker?ja ... maar de praktijk is

weerbarstig

Den Haag , 2014-04-10 en 2014-05-08dirk.roorda@dans.knaw.nl

Geleerdenbrieven

Data en traditie

text + linguistics =

> data

+ re

sear

ch =

>

Wido van Peursen

Wat zien we ervan?

wivu wivu hebrew

Wat valt je op?

De eerste hits zijn voor de archieven, de infrastructuren

De onderzoekers zelf en hun instituten komen later pas

Wat mis je?

metadata: beschrijvingen, handleidingen, coderingen

analyses: hoe hebben andere wetenschappers de data gebruikt?

instrumenten: tools om deze data aan te pakken

de data zelf!

Hoe is dit te verklaren?

Deze onderzoekers zijn begonnen vóór internet

ze hebben een fantastische datacreatie workflow ontwikkeld op hun instituut

de WIVU heeft een behoorlijk dikke celwand gekregen

research data cycle ?religious

communities

theol. scholars

theol. scholars

enlightened lay people

linguists

comp. hum

Research Data Archiving

DANS

CLARINSHEBANQLAF-Fabric

stap 1: website (2008)

wivu.dans.knaw.nl

stap 2: demo (2012)

stap 3: deponeren (2012)

wat is er gedeponeerd?

stap 4: project (2013)SHEBANQ

System for Hebrew Text: ANnotations for Queries

CLARIN-NL project

data curation: LAF

demonstrator: query saver

#!/etc bc

LAF? Yes, ISOLinguistic Annotation Framework

ISO 24612:2012

Nancy Ide, Laurent Romary

Inside LAF

Metadata: features, ISOcat isocat.org

stap 5: tool (2014)

excursie: data en tools

data is niet los verkrijgbaar

er is altijd een instrument nodig: software

kijken/checken

transporteren

transformeren

kijken/checken

transporteren

transformeren

scripten

shell

perl, python, rubi

xslt

programmeren

C, C++, Java

Hoe kan ik de computer zo snel mogelijk voor mij aan

het werk zetten?

ik maak een model, compileer, bouw, hou overal rekening mee, en lever een product

af. O ja, de eigenlijke taak, die kun je nu heel snel

uitvoeren

ik geef een paar commandos

en ga koffie drinkende computer werkt op

100%

waar vallen wetenschappers voor?

het zijn geen software ontwikkelaars

maar ze programmeren wel

ze exploreren data, kneden, masseren

hun product is geen programma

maar analyse, visualisatie, publicatie

scientific computing

meer dan (i)Python

meer dan een interface

meer dan een ekosysteem

een cultuur:

cultuur

fragmenten uit een video van Fernando Perez

4:19 onderzoekers en computing - 7:37

17:00 tools en de data life cycle - 20:26

42:09 data en publiceren - 44:20 / 49:22

stap 6: oversteken (2014)

Rens Bod: ling/dighum

Data Oriented Parsing

stap 7: meer (toekomst)

meer projecten

meer disciplines

meer databronnen

meer wetenschappelijke output

betere positie in de competitie

impact

Pierre van Hecke:

Hebrew/ling

Rens Bod: ling/dighum

VolkstellingenCEDAR

NLP-LABWouter van Atteveldt

Jan Klein NijenhuisPiek Vossen

Frank van Harmelen

Nicolai Winther-Nielsen

Wido van Peursen

turn-turn-turnreligious

communities

theol. scholars

theol. scholars

enlightened lay people

linguists

comp. hum

Research Data Archiving

DANS

research environment

data / standards

tools / processing

examples / teaching

linking / products

ISO-LAF

LAF-Fabric/EMDROS

iPython notebooks

apps and articles

DANS/ISOcat

GitHub

GitHub

Github/journals

is dit een success verhaal?

dat staat nog te bezien ...

pas na 6 jaar tekenen van versnelling

vaak de gelegenheid grijpen

overmatig overtuigen

technische diepgang

affiniteit met de bronnen en het onderzoek

investeringen vooraf

waarom gaat het niet sneller?

de groep heeft zich efficiënt georganiseerd

veel is onder controle

nieuwe methoden zijn nog niet bewezen

technische support is schaars en moeilijk te betalen voor alfa-groepen

welke factoren dragen bij?

personele veranderingen in de vakgroep

nieuwe projecten

nieuwe eisen van NWO (open access)

competitie en samenwerking over disciplines

door de al maar doorgaande dynamiek van meer-beter-sneller-werkbaarder:

komt de digitale wereld steeds dichter bij steeds meer mensen

Helpt data management de onderzoeker?

ja, als zij inziet waar archivering en hergebruik goed voor is

ja, als hij de weg naar het archief weet te vinden

ja, als het archief relevant voor haar weet te zijn

ja, als het archief alert omgaat met de ontwikkelingen in ICT

Niets hiervan is

vanzelfsprekend

dirk.roorda@dans.knaw.nl