Nederlands Tweeling Register koppelen met Achmea
description
Transcript of Nederlands Tweeling Register koppelen met Achmea
1
Nederlands Tweeling Register
koppelen met Achmea
2
Nederlands Tweeling Register
Aantallen in de 2 cohorten: adolescenten (1986-1994) n= 3904 kinderen (april 1998-2011) n= 27045
Overzicht zorggebruik voor geselecteerd cohorten medicijngebruik, ziekenhuisopnames, huisartsbezoeken
Koppelbestand NAW kind/adolescenten Naam, initialen en geboortedatum moeder (kinderen) Meerdere records per persoon door verhuizingen ID-nr, cohort, familie-nr, datum adres, nog actief(datum),
geboorteland
3
Achmea Health Data Base 2 databases:
Achmea Health Database (AHD) : 4,4 miljoen verzekerden (vanaf 2006)
AGIS database: 1 miljoen verzekerden (vanaf 2000)
Opstartproblemen
Koppelbestand: bestand met verzekerden AHD Selectie op geboortejaar: 1,6 miljoen records
Alle bewerkingen met privacy gevoelige data alleen bij ACHMEA : koppelgegevens blijven daar op een hard disk (encryptie)
Alle controles voor de validatie ook uitgevoerd bij Achmea
Op eigen laptops, geen toegang tot Achmea netwerk
4
Data sets (% ingevuld)
* 100 % door afronding
NTR AHD
1 achternaam 100,00 100,00
2 voornamen 37,09
3 roepnaam 99,91 16,51
4 voorletters 99,99 100,00*
5 geboortedatum 100,00 100,00
6 geslacht 100,00* 100,00
7 huisnummer 100,00 100,00
8 woonplaats 100,00 99,99
9 postcode 6 100,00 100,00
5
Koppelen
Onbekend percentage initialen in NTR geïmputeerd (roepnaam)
Initialen en geslacht belangrijk om tweelingen te kunnen identificeren: 298 tweelingen (596 personen) binnen NTR niet te onderscheiden op
initialen, en geslacht
Tweelingen in AHD kruislings ingevoerd:
“Robin” met initalen “B”, en “Bo” met initialen “R”
Probabilistische (Jaro Winkler) en deterministische koppelingen uitgevoerd: ongeveer 25% van de NTR personen kunnen koppelen
Voor tweelingen waarvan 1 persoon met zekerheid gekoppeld was, polisnummer geïdentificeerd om andere helft tweeling te bevestigen
6
Stand van zaken
Validatie uitgevoerd voor eigen koppeling
Mondriaan koppeling volgt nog in mei/juni
Lijst met huidige koppelingen naar Achmea voor extractie van de zorggegevens uit de AHD
Volgende week start NTR met inhoudelijke validatie?
7
Nederlands Tweeling Registerkoppelen met Achmea
9
Resultaten
Categorie
Characteristics Pairs(dupl)
links Agree on all identifiers 2689 (0)
more likely links
(uncertain)
Mostly missing firstname, only one person of twin has given
permission
79 (0)
more likely links
(distinguisable)
Mostly missing firstname, twins have different sex or different
initial
3939 (0)
more likely links
(indistinguisable)
Mostly missing firstname, twins have same sex and initial
40 (12)
possibly links Mostly missing firstname, and postal code and housenumber do
not agree
1261 (76)
possibly links(conflicting identifiers)
Agree on surname, DOB, sex, but conflicting firstname and initial
24 (0)