Marc Rietveld (UMC Utrecht) - Big Data en Research IT

15
ICT voor Research Seminar Dutch Health Hub 23 november 2011 Marc Rietveld

description

De presentatie van Marc Rietveld (UMC Utrecht) tijdens de conferentie 'Big Data in de Zorg' van 23 november 2011 in Almere. Op deze conferentie werd het officiële startschot gegeven voor Almere DataCapital en de Dutch Health Hub.

Transcript of Marc Rietveld (UMC Utrecht) - Big Data en Research IT

Page 1: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

ICT voor Research

Seminar Dutch Health Hub23 november 2011

Marc Rietveld

Page 2: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

2

Kans Dutch Health Hub in onderzoek

» Goedkope en flexibele basisvoorziening voor storage en rekencapaciteit» Mits:

– Flexibel / hoog serviceniveau– Goedkoop– Snelle netwerkverbindingen!– Samenwerking– Veel aandacht voor beveiliging

Werken aan vertrouwen

Page 3: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

3

Inhoud

» Trends in onderzoek» Situatie in UMC Utrecht» Situatie landelijk» Bottlenecks / vragen / issues» Mogelijke bijdrage Dutch Health Hub aan onderzoek

Page 4: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

4

2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

Trends in medisch / farmaceutisch onderzoek

Enorme groei data:- Digitalisering en

verbeteringen in meetapparatuur

- Digitalisering zorgdata- Alles opslaan, want

misschien is het bruikbaar- Koppeling & bewerking

bestaande datasets

Prof. Peter van der Spek

“De hoeveelheid

data in research

zullen 6 tot 7 keer zo groot worden als in

de zorg.”

Page 5: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

5

100.000 ACTG per experiment 50.000.000.000

3 uur Tijd per experiment 7 uur

2 jaarTijd voor humaan

genoom2 weken

€300.000.000Kosten voor humaan

genoom€3.000

Ter ilustratiesequencing ‘old style’ vs ‘new style’

Nu:240 GB / dag

Page 6: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

6

Trends medisch / farmaceutisch onderzoek

» Nieuwe mogelijkheden van en voor onderzoek– Patroonherkenning in grote hoeveelheden MRI’s

of CT-scans– Statistisch minder evidente causale relaties bij

grotere databases– Betere en effectievere bewaking van nieuwe

behandelingen en medicijnen door gebruik zorgdata

» Concurrentie tussen landen– Nederland scoort vooralsnog hoog wat

betreft kwaliteit van onderzoekers en infrastructuur

– Maar: Nederland is klein wat betreft bevolking

Page 7: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

7

Situatie UMC Utrecht

» Strategiestudie ICT voor Research 2010 – 2011– Observaties

• (Digitale) zorggegevens zijn bruikbaar voor onderzoek• Van ‘zelf doen’ naar gebruik van meer centrale dienstverlening• Differentiatie van nieuwe specialismen in

onderzoeksondersteuning• Kwaliteit / monitoring onderzoek steeds belangrijker

– Plannen . • Integratie gegevensverzameling zorg en onderzoek• Research Data Platform• Ondersteuning en monitoring van onderzoeker via

Onderzoeksportaal• Basis infrastructuur: storage, high performance computing,

netwerk

Page 8: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

8

Integratie zorg & onderzoek bij dataverzamelingGewenste situatie

Geïntegreerde zorg- en onderzoeksinformatie

Zorg- / research pad

Intake, anamnese en IC

Intake, anamnese en IC

Self reporting MyUMC

Self reporting MyUMC

Page 9: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

9

Research Data Platform Gewenste situatie : RDP als onderdeel UMC-breed datawarehouse

OLAPBronsystemen Data storeETL

EZIS

SAP BW

Lab / medicatie

Uitvoer BI portal

Rapportxyz

Rapportxyz

Dataset

Samples

Beeld

Vragenlijsten

META DATAMETA DATA

Dataset

Dataset

• Kern ‘Research Data Platform’

• Centrale storage voorziening

• Standaarden metadatering

• Selectie tooling

• Catalogus

• Doel: data mining vs datakerkhoven

Page 10: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

10

OnderzoeksportaalGewenste situatie

» Ondersteuning van gehele onderzoeksproces

» Toegang tot relevante expertise en ondersteuning

» Toegang tot beveiligde storage omgeving

» Delen met onderzoekers wereldwijd

» Kwatliteitsmonitoring

Page 11: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

11

NetwerkNetwerk

ICT InfrastructuurGewenste situatie

StorageStorage

RekenkrachtRekenkracht

RekencentrumRekencentrum

Waardevolle gegevens in een goed beheerd RC

Goede/snelle verbindingen binnen UMCU

Hoge bandbreedte naar buiten

Open access & identity management

Storage als basisvoorziening

Schaalbare, flexibele storage tegen lage kosten

Gedeeltelijk eigen beheer

Metadatering om data op langere termijn te beheersen

Toegankelijk

Rekencapaciteit als basisvoorziening

Voldoende voor onderzoek op bijv. beeldmateriaal

Flexibel: (externe) voorzieningen / afspraken om pieken in rekenbehoefte op te kunnen vangen

Met energie / koeling / beveiliging goed geregeld

Hogere eisen aan security / privacy

Page 12: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

12

LifelinesLifelines

Situatie landelijkVeel partijen, veel lijntjes, veel steigers

SURFSURF SARASARANBICNBIC

UUUU ULUL UvAUvA RUGRUG EUREUR UMUM VUVU

UMCUUMCU LUMCLUMC AMCAMC UMCGUMCG AZMAZM VUMCVUMCErasmusMCErasmusMC

KUNKUN

RadboudMCRadboudMC

LSHLSH

NFUNFU ZonMWZonMW

KNAWKNAW

CTMMCTMMBMMBMM

PSIPSIBBMRIBBMRI

IndustrieIndustrie

RIVM e.a.RIVM e.a.

Programma’s & projecten

project

project

project

projectprojectproject

TI PharmaTI Pharma

project

……

ESFRIESFRI

IMIIMI

OPSOPSPROTECTPROTECT

……FP7FP7

BioShareBioShare

BioImagingBioImaging ……

Page 13: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

13

Gewenste situatie: samen werken aan toekomstvaste voorzieningen

» Samenhangende lokale voorzieningen waar mogelijk, centraal waar nodig

SURFSURF

SARASARA

NBICNBIC

UUUU ULUL UvAUvA RUGRUG EUREUR UMUM VUVU

UMCUUMCU LUMCLUMC AMCAMC UMCGUMCG AZMAZM VUMCVUMCErasmusMCErasmusMC

KUNKUN

RadboudMCRadboudMC

NFUNFUZonMWZonMW

KNAWKNAW

IndustrieIndustrie

RIVM e.a.RIVM e.a.

Nationale ICT

infrastructuur

» Van projectgedreven naar instituutsgedreven

DHH?

Page 14: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

14

Issues / bottlenecks / vragen

Not invented here!

Flexibiliteit & kosten

Snelle toegangBeveiligingeigen data

Samenwerking?

Page 15: Marc Rietveld (UMC Utrecht) - Big Data en Research IT

15

Mogelijke bijdrage Dutch Health Hub

» Centrale voorziening voor storage en High Performance Computing» Aansluiten bij landelijke ontwikkelingen rond standaarden voor semantiek

en metadata» Afstemmen met andere soortgelijke initiatieven zoals DANS en TARGET» Randvoorwaarden:

– Flexibel / hoog serviceniveau– Goedkoop– Snelle netwerkverbindingen!– Samenwerking– Veel aandacht voor beveiliging