Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode-...

19
NPSO lezingendag Veldwerkmonitoring, 20 september, 2018 Bayesian adaptive survey design Barry Schouten (CBS en Universiteit Utrecht)

Transcript of Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode-...

Page 1: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

NPSO lezingendag Veldwerkmonitoring, 20 september, 2018

Bayesian adaptive survey design

Barry Schouten (CBS en Universiteit Utrecht)

Page 2: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Opzet presentatie

1. Monitoring en doelgroepenbenadering via een Bayesiaanse analyse;2. Voorbeeld 1: Monitoring van de Gezondheidsenquête;3. Voorbeeld 2: Optimalisatie van EU-SILC;4. Open onderzoeksgebieden;5. Discussie

Zie ookwww.badennetwork.com (Bayesian Adaptive survey Design Network)NPSO lezingendag Adaptive Survey Design

2

Page 3: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Doelgroepenbenadering

In een doelgroepenbenadering krijgen verschillende deelpopulatiesverschillende benaderstrategieën gericht op een optimale kwaliteit –kosten afweging.

Elementen:1. Expliciete kwaliteit- en kosten criteria;2. Stratificatie van de populatie in relevante deelgroepen;3. Designkenmerken;4. Optimalisatie tactiek;

Bouwstenen: stratum respons-, kosten- en doelvariabele parametersOptimalisatie: Toewijzingskansen van strata aan design kenmerken

3

Page 4: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Model - survey design parameters

Drie type survey design parameters zijn voldoende om de meestekwaliteit- en kostenfuncties te berekenen:

• 𝜌𝜌𝑖𝑖(𝑠𝑠) : Responsgeneigdheid voor een eenheid i onder strategie s;• 𝐶𝐶𝑖𝑖(𝑠𝑠) : Kosten voor een eenheid i onder strategie s;• 𝑌𝑌𝑖𝑖 𝑠𝑠 : Doelvariabele 𝑦𝑦 voor een eenheid i onder strategie s;

Nonrespons kan verder uitgesplitst worden naar geen contact, weigering, etc.

Voor monitoring worden design parameters geschat met regressie modellen waarin interactie effecten grotendeels worden weggelaten.

4

Page 5: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Kwaliteit en kosten (type 1)

Voorbeelden (𝑑𝑑𝑖𝑖= steekproefgewicht):

• Responscijfer: 𝑅𝑅𝑅𝑅(𝑠𝑠) = 1𝑁𝑁∑𝑖𝑖=1𝑛𝑛 𝑑𝑑𝑖𝑖𝜌𝜌𝑖𝑖 (𝑠𝑠)

• Totale kosten: 𝐵𝐵(𝑠𝑠) = ∑𝑖𝑖=1𝑛𝑛 𝑐𝑐𝑖𝑖 (𝑠𝑠)

• R-indicator responsgeneigdheden met X

𝑅𝑅 𝑋𝑋, 𝑠𝑠 = 1 − 2 1𝑁𝑁∑𝑖𝑖=1𝑛𝑛 𝑑𝑑𝑖𝑖(𝜌𝜌𝑖𝑖 𝑠𝑠 − 𝑅𝑅𝑅𝑅 𝑠𝑠 )2

• CV van responsgeneigdheden met X

𝐶𝐶𝐶𝐶 𝑋𝑋, 𝑠𝑠 = 1−𝑅𝑅(𝑋𝑋,𝑠𝑠)2𝑅𝑅𝑅𝑅(𝑠𝑠)

5

Page 6: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Kwaliteit en kosten (type 2)

• Methode effect tegen een benchmark design BM:

𝐷𝐷 𝑌𝑌𝑘𝑘 ,𝑋𝑋, 𝑠𝑠;𝐵𝐵𝐵𝐵 =∑𝑖𝑖=1𝑛𝑛 𝑑𝑑𝑖𝑖𝜌𝜌𝑖𝑖(𝑠𝑠) 𝑌𝑌𝑘𝑘,𝑖𝑖 𝑠𝑠 −𝑌𝑌𝑘𝑘,𝑖𝑖 𝐵𝐵𝐵𝐵

∑𝑖𝑖=1𝑛𝑛 𝑑𝑑𝑖𝑖𝜌𝜌𝑖𝑖(𝑠𝑠)

• Fraction Missing Information (FMI) voor X:

FMI 𝑌𝑌𝑘𝑘,𝑋𝑋, 𝑠𝑠 = (1−𝑅𝑅𝑅𝑅 𝑠𝑠 )1−𝐶𝐶𝐶𝐶(𝑌𝑌𝑘𝑘 𝑠𝑠 ,𝑋𝑋))𝑅𝑅𝑅𝑅 𝑠𝑠 +(1−𝑅𝑅𝑅𝑅(𝑠𝑠)(1−𝐶𝐶𝐶𝐶(𝑌𝑌𝑘𝑘 𝑠𝑠 ,𝑋𝑋))

• Predicted nonresponse bias (NRB) voor X:

NRB 𝑌𝑌𝑘𝑘 ,𝑋𝑋, 𝑠𝑠 = cov(𝑌𝑌𝑘𝑘 𝑠𝑠 ,𝜌𝜌 𝑠𝑠 )𝑅𝑅𝑅𝑅(𝑠𝑠)

6

Page 7: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Bayesiaanse analyse

WerkwijzeRegressie coëfficiënten en varianties in respons, kosten, doelvariabelemodellen krijgen vooraf een kansverdeling (prior) die wordt aangepast met survey resultaten (posterior). Posterior is de nieuwe prior voor vervolg.

Prior kansverdeling parameters (hyperparameters):• Expert kennis;• Historische survey data

Numerieke benadering van posterior kansverdeling via MCMC;

7

Page 8: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 1 - Gezondheidsenquête

Probleemstelling:– Maandelijks doorlopend onderzoek met Web → F2Fdesign– Kernvariabelen: wel/niet goede gezondheid, BMI en wel/niet roken– Criteria: Methode-effecten op kernvariabelen, kosten, CV– Strata: Leeftijd (drie klassen), geslacht, wel/niet afbreken in Web – Design kenmerken: geen F2F, F2F kort, F2F lang

– Priors gebaseerd op historisch GEZO data met twee variantienivo’s(één maand en drie maanden)

– Posteriors berekend na 1, 3, 6, 12 maanden;

8

Page 9: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 1 – kosten, CV en responscijfer

Posteriors voor verwachte kosten, CV en responscijfer

9

Page 10: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Case study - Properties

Properties method effect, FMI and NRB for BMI

10

Page 11: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 1 – methode-effect, FMI en NRB

Posteriors voor methode-effect, FMI en NRB van wel/niet roken

11

Page 12: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 1 – dashboard wel/niet gezond

12

Hoe verschillende signalen uit indicatoren te combineren?

Page 13: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 2 – EU-SILC

Probleemstelling:– EU-SILC 2003 – 2016: Telefoon en werving vanuit EBB/LFS– EU-SILC vanaf 2016: Web → telefoon– Jaarlijks onderzoek, uitgevoerd in drie maandsteekproeven;– Criteria: CV, budget, aantallen respons– Strata: inkomensdecielen, wel/niet >1 persoon in HH kern– Design kenmerken: wel/niet telefoon, wel/niet beloning

Priors gebaseerd op expert inschattingen met bestaande surveys(EBB, BO, WOON, SocSam).In studie twee variantienivo’s voor priors (n=1000 en n=10000).

13

Page 14: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 2 - posteriors respons

14

Web

Telefoon(conditioneel)

Beloning (+) Geen beloning (-)

Page 15: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Voorbeeld 2 - gecombineerde respons

15

Beloning (+)

Geen beloning (-)

Web–Tel Web

Page 16: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

OptimalisatieDit voorbeeld: Tien strata met elk vier mogelijke strategieën

Page 17: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Bayesian ASD – onderzoeksgebieden

– Afleiden van prior kansverdelingen via expert kennis;– Omgaan met tijd verandering in survey design parameters;– Optimalisatie tactieken in Bayesiaanse context;– Uitbreidingen naar administratieve bronnen en big data;

17

Page 18: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Afleiden van prior uit expert kennis

Constructie van prior voor nieuwe survey. Hoe te doen?

Voorstel: Baseer onzekerheid op gelijkenis met nieuwe survey volgensexperts:1. Onderwerpen survey vergelijkbaar?2. Doelpopulatie dezelfde?3. Tijdverschil tegen nieuwe survey?4. Waarneemeenheid dezelfde?5. Modestrategie is dezelfde?6. Beloningstrategie is dezelfde?7. Gevraagde inspanning respondent gelijk?8. Uitvoering door hetzelfde bureau?

Hoe sterker de gelijkenis van een survey, hoe groter de bijdrage aan de prior. Deze gelijkenis wordt vertaald naar een zogenaamde power prior.

18

Page 19: Bayesian adaptive survey design - NPSO. NPSO 20-09-18... · 2018-09-24 · – Criteria: Methode- effecten op kernvariabelen, kosten, CV – Strata: Leeftijd (drie klassen), geslacht,

Discussie

19

– In hoeverre kunnen historische data en ervaring van experts ingezteworden bij verwachtingen over nieuwe surveys?

– Hoe priors af te leiden, vooral bij nieuwe surveys?

– Kwaliteitsindicatoren over doelvariabelen maken impliciete (MAR) aannames. Hoe daarmee om te gaan?

– Zinvol om breed scala aan indicatoren te monitoren?