Neurofysiologische testontwikkeling

17
ENT: E vidence Based N eurofysiologische T estontwikkeling: praktische richtlijnen gebaseerd op princiepes van evidence based medicine om een klinische test te ontwerpen. Samenvatting De klinische neurofysiologie heeft als doel de verworvenheden van het basis wetenschappelijk onderzoek naar de hogere corticale functies door middel van electrofysiologische technieken om te vormen tot een set van testen die nuttig kunnen zijn in de dagdagelijkse psychiatrische neurocognitieve kliniek. Wij geven een methodiek aan , genoemd 4 stappenplan volgens Nash Boutros, om dit proces op valiede (EBM) wijze in goede banen te leiden. Tevens laat de eenvoudige methode aan de lezer toe een betere greep te krijgen op de groeiende literatuurberg en zeer snel lacunes te ontwaren. Voor wie actief is op dit veld wordt het dan snel een onmisbaar werkinstrument op toegepast onderzoek op te zetten op een wijze die gans de gemeenschap ten goede komt. Inleiding Neuropsychologische research en neurocognitieve kliniek zijn uiteraard twee interactieve, deels overlappende of toch sterk geaffilieerde gebieden waarbij nochtans elk ook gehoorzaamt aan specifieke vereisten en begrenzingen. Waar de eersten vooral de onderzoeksgebonden neurowetenschappelijke exploratie van hogere corticale functies beogen, proberen de neuropsychiaters op het klinisch veld deze inzichten en verworvenheden te vertalen naar een klinisch instrumentarium dat nuttig kan en moet zijn om zowel diagnose als therapie op gevalideerde wijze te ondersteunen. Het is uiterst belangrijk dat dergelijke translatie oefening gebeurt op een methodologisch gezonde wijze (lees: conform onderzoeksmethodieken van evidence besed medicine) om zowel over- als ondergebruik van de klinische neurofysiologie te vermijden. Het hoeft geen

description

beschrijving van de techniek der 4 stappen volgens Prof Nash Boutros.Details betreffende "effect size".

Transcript of Neurofysiologische testontwikkeling

Page 1: Neurofysiologische testontwikkeling

ENT: Evidence Based Neurofysiologische Testontwikkeling: praktische richtlijnen gebaseerd op princiepes van evidence based medicine om een klinische test te ontwerpen.

Samenvatting

De klinische neurofysiologie heeft als doel de verworvenheden van het basis wetenschappelijk onderzoek naar de hogere corticale functies door middel van electrofysiologische technieken om te vormen tot een set van testen die nuttig kunnen zijn in de dagdagelijkse psychiatrische neurocognitieve kliniek. Wij geven een methodiek aan , genoemd 4 stappenplan volgens Nash Boutros, om dit proces op valiede (EBM) wijze in goede banen te leiden. Tevens laat de eenvoudige methode aan de lezer toe een betere greep te krijgen op de groeiende literatuurberg en zeer snel lacunes te ontwaren. Voor wie actief is op dit veld wordt het dan snel een onmisbaar werkinstrument op toegepast onderzoek op te zetten op een wijze die gans de gemeenschap ten goede komt.

Inleiding

Neuropsychologische research en neurocognitieve kliniek zijn uiteraard twee interactieve, deels overlappende of toch sterk geaffilieerde gebieden waarbij nochtans elk ook gehoorzaamt aan specifieke vereisten en begrenzingen. Waar de eersten vooral de onderzoeksgebonden neurowetenschappelijke exploratie van hogere corticale functies beogen, proberen de neuropsychiaters op het klinisch veld deze inzichten en verworvenheden te vertalen naar een klinisch instrumentarium dat nuttig kan en moet zijn om zowel diagnose als therapie op gevalideerde wijze te ondersteunen. Het is uiterst belangrijk dat dergelijke translatie oefening gebeurt op een methodologisch gezonde wijze (lees: conform onderzoeksmethodieken van evidence besed medicine) om zowel over- als ondergebruik van de klinische neurofysiologie te vermijden. Het hoeft geen betoog dat de cognitieve neuropsychiatrie in zijn geheel en de cognitieve neurofysiologie in het bijzonder gebieden zijn in volle ontwikkeling en dus snel evolueren. De neiging om bepaalde technieken prematuur op de kliniek “los te laten” zonder voorafgaande validering of standaardisatie is dan ook reden geweest van veel wildgroei, hype en ontgoocheling (vb neurofeedback) met als gevaar toch ook een zich instillerend scepticisme dat kan resulteren negatieve vooroordelen en premature rejectie van potentieel waardevolle technieken. Anderzijds gaat een ongebreideld gebruik of wildgroei aan testonderzoek zonder relatie tot de kliniek zelf, snel zorgen voor een stijgend kostenplaatje dat niet altijd in relatie staat tot klinisch nut in de zin van meetbare verbetering van de kwaliteit in diagnostiek en behandeling.

EBM en Psychiatrie

Hoewel dit niet als valide excuus te gebruiken is moet gezegd worden dat er in de psychiatrie helaas weinig traditie bestaat in het werken met principes van evidence based medicine zoals bij gebruik van labo testologisch onderzoek in de somatische geneeskunde. Daar is men stilaan gewoon geraakt om testen te evalueren op basis van

Page 2: Neurofysiologische testontwikkeling

hun ROC curven, specificiteit en sensitiviteit, size effectt, predictieve waarde, gebruikswaarde in functie van prior probabiliteiten etc.Als men weet dat er wel degelijk guidelines bestaan om te kunnen oordelen over het nut van een bepaalde test en om ons te helpen een gevalideerde beslissing te nemen betreffende de klinische bruikbaarheid ervan, is er geen excuus om deze methodologie die zo waardevol gebleken is in de andere domeinen van de geneeskunde, niet aan te wenden op vlak van cognitieve neuropsychiatrie die toch als primair doel heeft de psychiatrie op stevige wijze in de neurowetenschap te verankeren.

Een vier stappenplan

Deze methodologie die de klinisch werkzame neurowetenschapper kan gebruiken is gebaseerd op het seminale werk van Sackett en volgt de criteria van STARD (Standard for reporting diagnostic tests). Het werd zeer gedetailleerd , operationeel praktisch en met duidelijke werkvoorbeelden geillustreerd beschreven door Nash Boutros et al.. De auteurs brengen een eenvoudig en duidelijk vier stappenplan naar voor, als een “roadmap en kompas” voor elkeen die een valide test wil ontwikkelen zonder daarbij het evidentie noorden kwijt te geraken wat, gezien de massale literatuurstroom van de laatste jaren betreffende ERP, geen denkbeeldig gevaar is. Zelfs voor de lezer die niet deze ambitie heeft is het toch belangrijk vertrouwd te zijn met deze 4 staps princiepes daar ze hem/haar toelaten literatuurgegevens veel correcter te evalueren en dit zonder al te veel noodzaak aan hogere mathematische statistiek. Enkel de kennis en de eenvoudige berekening zal al snel een stevige basis kunnen bezorgen. In deze tekst worden de belangrijkste princiepes uiteengezet en praktische links worden anagereikt waarmee de lezer direkt aan de slag kan.

Het vier stappen plan van Nash Boutros

Stap 1

Men denkt , via observatie , een bepaalde electrofysiologische afwijking te hebben vastgesteld bij een bepaalde aandoening (vb gedaalde amplitudo van de P300 bij schizofrenie). Om uit te maken of dit effect werkelijkheid is dan wel op louter toeval berust gaat men een kliene studie opzetten waarbij men een zorgvuldig geselecteerde groep patienten met die bepaalde aandoening vergelijkt met de resultaten van dezelfde test bij een controle groep patienten met zelfde karakteristieken die enkel van de patientgroep verschillen door het feit dat ze de ziekte niet hebben. Men tracht dus zoveel mogelijk andere variabelen die invloed zouden kunnen hebben op de test uit te sluiten (vb sex, leeftijd, opleiding, voorgeschiedenis opdat het vastgestelde effect wel degelijk zou kunnen toegeschreven worden aan d epathologie en niet aan een andere ongeziene variabele. Elementen van selectie, randomisatie etc komen hier aan bod. Zoals steeds gaat men uit van een statistische nul hypothese nl dat het vastgesteld verschil louter toeval is en tracht men met een bepaalde zekerheid (95%), de beroemde significantie “p” waarde, deze hypothese te verwerpen. Dergelijke studies noemt men dus type 1a studies. Zij zijn dus bedoeld om uit te maken of het vastgestelde effect echt in relatie staat tot de bestudeerde pathologie of niet. Een totaal van 95% zekerheid is OK maar dat betekent

Page 3: Neurofysiologische testontwikkeling

nog steeds dat er 5% kans bestaat dat het toch om een toevalsvondst gaat. Het zal dus eveneens belangrijk zijn deze studies te herhalen liefst ook (met identieke techniek) door andere niet geaffilieerde groepen van klinische onderzoekers. Studies die dergelijke test-hertest effect beorgen noemt men Type 1b studies. Type 1b studies zijn dus belangrijk omdat ze de aandacht vestigen op de robuustheid en de reproduceerbaarheid (test-hertest stabiliteit) van deze vondst. Belangrijk hierbij is dat niet alleen de eigen groep er in slaagt deze bevindingen te reproduceren maar dat ook andere (liefst) niet verbonden groepen de bevindingen kunnen reproduceren of te bevestigen liefst al via een geblindeerde benadering.

Stap 2

In deze stap zal men de nadruk leggen op het aantonen van het klinische nut van de test. Vergelijking tussen patiënten en normalen is niet langer voldoende, men moet ook bij de patiëntgroep vergelijkbare condities zoals deze in de lijst van differentiaal diagnose van de aandoening voorkomen includeren. Het gaat hier dus om een onderzoek naar de klinische specificiteit waarbij men het gedrag van de test evalueert over gekende diagnostische entiteiten rekening houdend met de mogelijkheden ervan om endofenotypes te identificeren. In deze fase is het belangrijk de diagnostische categorisatie van de DSM-IV, hoe nuttig ook binnen een klinische realiteit van overlap en co-morbiditeit naar waarde te schatten en waar nodig te relativeren.Afwijkingen met duidelijke specificiteit dwz duidelijk verschillende prevalentie in klinische condities die vaak dicht bij elkaar aanleunen in de differentiaaldiagnostische lijsten zullen dus vroeger kunnen overgaan naar stap 3 ook al kunnen andere minder specifieke bevindingen wel grote wetenschappelijke waarde vertonen. Een test die toelaat een eerste opstoot van schizofrenie geprecipiteerd door cannabisgebruik te onderscheiden van een zuivere drugpsychose beantwoordt bvb aan dergelijk profiel. Globaal kan men stellen dat de overgang van stap 2 naar stap 3 gedetermineerd wordt door de klinische waarden van de specificiteit. Schatten van het “effect size” is een goede maatstaf voor deze beslissing.

Stap 3:

Hier is het moment aangebroken om de karakteristieken van de test numeriek te bepalen: ROC curve, sensitiviteit, specificiteit, positief en negatief predictieve waarde die ons toelaten om de waarde van de test te bepalen zo we hem toevoegen in het diagnostisch bilan en dat ten opzichte van een bestaande gouden standaard. In de psychiatrie is deze vaak de meest waarschijnlijke consensus diagnose van een groep experten. Wat is de geëvalueerde accuraatheid in de keuze van het optimaal antidepressivum voor de behandeling van een patiënt: ? 50% dus (helaas) random. Als we een test kunnen ontwikkelen die deze predictieaccuraatheid verbeterd hebben we ongewtijfeld een belangrijke stap voorwaarts gezet in een kwalitetaief betere behandeling van depressie in het algemeen. In deze fase zal men ook bepalen of de test toelaat bepaalde subgroepen te specificeren of de test kan differentiëren naar duur van aandoening, lopende behandeling etc. Studies die dit beogen catalogeert om als studie Type 3.

Page 4: Neurofysiologische testontwikkeling

Stap 4

In deze finale stap 4 gaat het om grote multicenter studies (studies Type 4) om de test op degelijke wijze te valideren en de optimale standaardisatie uit te werken. Dit gaat niet meer om beperkte pilootstudies met monsters van 10 tot 15 patiënten maar om grote en genormaliseerde databases met referentiele capaciteit in functie oa van geslacht, leeftijd of andere belangrijke co-varianten. Kost benefiet analyses op korte en lange termijn en outcome studies horen hier thuis.Dit laatste is zeker in d epsychiatrie geen eenvoudige zaak en zal vaak individueel in functie van aard, stadium en type van pathologie dienen bepaald te wordenj.

Overzicht van de 4 stadia

Stap Studie ontwerp Doel Gewenste outcome1 Target groep

versus normalen

1/ Demonstratie van een significant verschil in d target groep2/ Demonstratie van test – retest betrouwbaarheid

Aantonen van een consistente biologische abnormaliteit in de target groep

2 Target groep versus gezonden en andere patiënt groepen met differentiaal diagnostisch belang

Aantonen van een significant prevalentieverschil in specifieke groepen of subgroepen

Demonstratie van potentieel klinische bruikbaarheid

3 Target versus aangepaste controle groepen of subpopulaties van d target groep

Definitie van numerieke testkarakteristieken

Definitie van klinisch nut

4 Idem als drie maar grote groepen en multicentrische studies

Demonstratie en standaardisatie van klinische test

Opstellen van standaarden naar klinisch gebruik

Page 5: Neurofysiologische testontwikkeling

Deze vier stap methodologie zoals vooropgesteld door de auteurs (Boutros et al) geven ons een bijzonder solide methodologie om ter attentie van een bepaalde test of meting de al bestaande literatuur te evalueren en er de gepaste besluiten uit te halen.

Studies: STAP 1 Studies STAP 2 Studies STAP 3 Studies STAP 4Type 1a: Studies die een effect evalueren bij een bepaalde patienten populatie ten opzichte van de groep normalen

Idem als type 1a maar met inclusie van patientgroepen met condities die differentieel diagnostisch belangrijk zijn

Sudies die de statististische karakteristieken van een test bepalen (sensitiviteit, specificiteit etc.;)

Grote multicentrische studies op grote aantallenStandaardisatiestudies en studies die de Database en referentiele data collectie studies

Type 2bStudies die de reproduceerbaarheid van een effect type 1a proberen aan te tonen

Statistiek en besliskunde

Statistiek doet reeds zijn intrede vanaf type 1 studies. Stel dat we geinteresseerd geraakt zijn in de waarde van de MMN amplitudo (Mismatch negativiteit) bij patienten met chronisch ethylisme. (MMN is Een ERP die optreedt tussen 200 a 250 msec bij deviantie van een stimulus in een overigens regulaire reeks). In werkelijkheid willen we komen tot een uitspraak die handelt over de ganse populatie van chronische ethylikers. Gezien niemand de tijd noch de middelen heeft om gans de populatie effectief te onderzoeken moet men zich noodgedwongen beperken tot wat men als een representatief staal uit deze populatie betitelt. Echte representativiteit is van essentieel belang want selectiebias is soms zeer subtiel. Als ons sample niet echt representatief is dan zullen veel uitspraken over de populatie uiteraard totaal foutief zijn ook al lijken alle berekeningen correct. Een (karikaturaal) voorbeeld: in een studie over het druggebruik bij jonge mensen doet men een bevraging bij studenten geneeskudne aan de deuren van het auditorium anatomopathologie. Men krijgt antwoorden van 500 studenten en noteert een gemiddleld cannabis gebruik van slechts 2%. De onderzoekers besluiten dat het nogal mee zit met het cannabisgebruik bij onze jeugd … akoord ? :-)

Als men een representatief staal van de populatie heeft gaat men het gemeten gemiddelde in dit staal gebruiken om het populatiegemiddelde in te schatten. Hoe meer samples van dit type (representtaief) des te nauwkeuriger zal deze schatting zijn. Men spreekt van

Page 6: Neurofysiologische testontwikkeling

standard error of the mean; namelijk SEM: standaard deviatie/vkw van samplegrotte. Dat is dus de gemiddelde afwijking van de sample means tov het “echte” gemiddelde dwz van het populatie gemiddelde. Aan de hand van die waarde kunnen we gemakkelijk een confidentie interval berekenen dat ons aangeeft hoe ver we met onze sample van het echte (populatie) gemiddelde afzitten: het confidentieinterval is het sample gemiddelde plus min 2 SEM waarde.

Maar eigenlijk gaat het hier niet over een enkel gemiddelde maar wel over twee daar we willen uitvissen of in een staal van patienten ten opzichte van een staal van normalen een verschil in een bepaalde meting betekent dat er in werkelijkheid (dwz tussen de beide populaties een essentieel verschil bestaat. Wie een dergelijke studie type n1 opzet wil inderdaad aan de hand van zijn metingen weten of het vastgestelde effect berust op werkelijkheid dan wel of het een loutere toevalsassociatie betreft. Hier komt de beroemde student “t” test op de proppen. De t test of t statistiek laat ons toe met een bepaalde waarschijnlijkheid te besluiten of een gemeten effect inderdaad wijst op een populatieverschil dan wel of het gewoon kan verklaard worden door toevallige factoren (sample bias) . De berekening is vrij eenvoudig: men deelt het verschil van de gemidelde waarde in patient en controlegroep door de gepoolde varianties:

Een praktisch voorbeeld:

Stel dat men vanuit klinische observatie de indruk heeft dat bij patienten met chronisch ethylisme de amplitudo van de mismatch nagetiviteit zoals gemeten over Fz verschilt van die waarde bij normalen. Men kan deze indruk krijgen door de opeenvolging van enkele flagrante voorbeelden of door iets dat men gelezen heeft en waarbij men d eidnruk krijgt dat er “iets aan de hand is”. Men kan uiterard niet zomaar op een subjectieve indruk afgaan (hoe sterk men er ook wil in geloven) en moet dus een objectieve bewijsvoering zien aan te brengen. Hier komt onze studie type 1 op de proppen. Men doet dus een vergelijkende studie met een totaal van 30 personen waarvan 15 ethyliekers en 15 perfect gematchte controles. Men vindt in de patientgroep over de frontale electrode Fz een gemiddelde amplitudo op MMN van 1.35 µV en variantie 0.25 terwijl in de groep normalen een gemiddelde amplitudo van 1.71 µV bedraagt en een variantie 0.71 wordt opgetekend. .Het ziet er – op het eerste zicht althans- naar uit dat de onze aanvankelijke indruk bevestigd wordt (1.75 is toch groter dan 1.35 nietwaar) maar d evraag stelt zich “hoe beduidend is dit verschil” ? mag ik uit dit verschil besluiten dat alle chronische ethyliekers met d ekarakteristieken van d epatienten die ik geselecteerd heb een lagere MMN amplitudo vertonen over Fz ?Met andere wooden : is dat verschil nu ook statistisch significant ? We berekenen onze “t” statistiek volgens de gekende formule

Page 7: Neurofysiologische testontwikkeling

Hier formule

De waarde bedraagt 1.42. Als vuistregel kan men stellen dat om significant te zijn deze waarde groter moet zijn dan 2.

Deze t waarde hangt af van de (totale) sample grootte en vinden we terug in berekende tabellen

Sample size T waarde4 4.3020 2.1030 2.0560 2.00100 1.99oneindig 1.96

Dus voor onze groep van 30 deelnemers aan de studie is deze waarde veel te laag.

Dus in tegenstelling met onze aanvankelijke klinische indruk blijkt dat het gemeten effect in deze studie niet significant is om een dergelijke uitspraak over de populatie te kunnen doejn. We kunnen natuurlijk d estudie hernemen met een veel grootere sample grootte en zien waar we dan uitkomen. Als we bvb op 20000 subjecten meten en we vinden een t van 1.74 dan kunnen we al vrij zeker zijn dat het vastgestelde varband een fata morgana was. Mensen zijn gevoelige patroonontdekkers maar zijn ook gemakkelijk te misleiden ompatronen te zien waar er geen zijn. Dat is uiteraard geen schande maar het illustreert de noodzaak om een goede statistische onderbouwing van onze besluitvorming te doen.

De statistische significantie voorbij: enters “effect size” of de weg van “t” over “p” naar “d”

Stel dat we wel een goede t resultaat krijgen en dus een p waarde die statistische significantie reflecteert: mogen nu onder het salken van triomfreten ene gat in de lucht springen ? Ja en neen. Hoewel in veel studies de p waarde wordt aangegeven als graad van statistische significantie en dus ook wel belangrijk is geeft het ons echter slechts een eerste aspect van gans het verhaal. Statistische significantie is OK maar hoe belangrijk is het waargenomen effect ?. Niet alleen of een verband statistisch significant is maar ook de grootte van dit verband moet ons immers bezig houden en dat leren we niet uit de p waarde.

Om het wat karikaturaal te stellen het volgende voorbeeld. Als miljoenen mensen een lottobiljetje insturen en we vergelijken de gemiddelde winst tov een evengrote groep die dat niet doen dan is de kans van winst in de lottospellers uiteraard statistisch significant hoger dan in de groep van diegenen die dat niet doen.

Page 8: Neurofysiologische testontwikkeling

Een wat meer klinisch voorbeeld. In een dubbel blind placebo gecontroleerde studie over 5 jaar betreffende eventuele beschermende effecten van aspirine ter preventie van coronaire aandoeningen, participeren 22.074 artsen. Zij worden random in twee groepen opgedeeld: de eerste helft (de behandelde groep) neemt elke morgen een pilletje dat 100 mg salicilaat bevat terwijl in de pil van de controlegroep enkel placebo bevat. Op het einde van de studie ziet men hartinfarct bij 1.7% van de placebogroep tov 0.94% in de behandelde groep. Dit resultaat is statistisch zeer significant. Men zou dus kunnen besluiten dat het nemen van aspirine het risico op hartinfarct halveert. Dat is wel correct maar over welke grootteorde van effect gaat het hier ?. Die grootteorde is de effect size aangegeven als Cohen “d”. De berekende d waarde (Cohen d) in deze studie bedraagt 0.06 wat zeer klein is. Met andere woorden men gaat het risico op harinfarct door innemen van aspirine wel degelijk verlagen maar dan verlagen van “zeer klein” naar een nog ietsje meer “zeer klein”. Inderdaad zonder al te veel wiskunde ziet men toch dat 98% van alle deelnemers geen infarct doormaakt ongeacht of ze nu aspirine nemen of niet. Men spreekt van een zeer kleine effect size. Effect size is een belangrijke parameter waarvan men natuurlijk gebruik zal maken om zinvolle beslissingen te nemen. Vindt ik het de moeite om dagelijks een aspirientje in te nemen om dat reeds kliene risico nog te verder te halveren ? daarbij zal ook andere elementen in beeld komen zoals effect size van nevenwerkingen vb maagbloeding ? Dezelfde vraag stelt zich voor de lottospeler: ga ik elke week een biljetje invullen omwille van ene kansje van een cent op die gfelbegeerde prijs. Mij niet gezien maar gelukkig voor de belgische Lotto dat miljoenen mensen geen kaas geeten hebben van t testen en effect size.

Het is dus pas als men de effect size van een relatie in overwegeing neemt dat men ten gronde kan evalueren of het sop de kool wel waard is. Bemerk dat effect size sterk gerelateerd is aan de grootteorde van het aantal deelnemers (sample grootte) in een studie. Een fenomeen met grote effect size zal snel duidelijk worden maar om een klein effectsize aan te tonen zal een studie met vele deelnemers nodig zijn.

Hoe kunnen we deze effect size berekenen ? . Hier wordt het pas echt interessant. Er zijn diverse mogelijkheden om vanuit gepubliceerde studies (of ze nu t testen aangeven dan wel F statistiek) de waarde van Cohen “d” te achterhalen. Zijn ze door de auteurs zelf berekend dan is het uiteraard nog gemakkelijker maar ze zelf berekenen geeft soms de voldoening dat je nog beter kijk hebt op de echte waarde van een effect dan de autuer(s) zelf.

Een leuke formule is deze

D: is gelijk aan t maal wortel… cfr blz. 38 Gekwadrateerd spreekt men van yte: de proportie van variantie in de dependente variabele die kan verklaard worden door de independente.

Belangrijk is echter te weten wat groot of klein is in effect size

Page 9: Neurofysiologische testontwikkeling

Tabel

Cohen's Standard Effect Size

  2.0

  1.9

  1.8

  1.7

  1.6

  1.5

  1.4

  1.3

  1.2

  1.1

  1.0

  0.9

GROOT 0.8

  0.7

  0.6

MEDIUM 0.5

  0.4

  0.3

KLEIN 0.2

  0.1

  0.0

Indicator Klein Medium Grootd 0.2 0.5 0.8

Enkele praktische voorbeelden:

Aan de hand van een voorbeeld (ADHD en betekenis van theta toename op qEEG) tonen de auteurs aan hoe zoiets in de praktijk kan toegepast worden. (J. Neuropsychiatry Clin Neurosci 17:4 , Fall 2005 pp 455 - 464). We raden iedereen die een test verder wil uitwerken ten sterkste aan grondig kennis te nemen van de door deze auteurs gebruikte methodiek. Het is als het ware een blauwdruk waarop de eigen procedure naadloos kan ingepast worden en dat de wetenschappelijkheid van de verdere ontplooiing van de klinische neurofysiologie enkel ten goede kan komen.

Page 10: Neurofysiologische testontwikkeling

De auteurs komen bovendien vanuit de literatuurstudie van deze applicatie (ADHD) tot een aantal interessante algemene vaststellingen:

1/ Er bestaat een neiging om vele testen en procedures voorbarig in de kliniek te gebruiken alvorens alle noodzakelijke 4 stap stadia doorlopen zijn. Dit is niet enkel het geval voor de psychofysiologie. Zo is ook de dexamethasone suppressietest daarvan ene voorbeeld. Het gevaar bestaat dan dat potentieel waardevolle testen door onvoldoende standaardisatie of onvoldoende selectie van subgroepen valse verwachtingen induceren wat resulteert in verwerping van een potentieel waardevolle test.

2/ En gouden standaard zoals de anatomopathologie kan bieden voor de somatische geneeskunde is helaas een utopie inde psychiatrie waar de expert consensus tot op heden dit betekent hoewel zelfs in de meest ideale gevallen deze consensus zelden een kappa waarde van 0.69 overtreft. Wil een test aanvaardbaar worden dan zal er moeten aangetoond wordend at hij de clinicus hierbij kan verbeteren.

3/ Elementen van kost efficiëntie zijn steeds moeilijk absoluut te standaardiseren gezien ze dependent zijn van veel variabelen oa klinische.

4/ Wil men testen invoeren om de accuraatheid van de klinische diagnostiek te verbeteren dan is het essentieel dat er kan aangetoond worden dat bij de methodologie om deze testen te ontwikkelen de STARD richtlijnen nauwgezet werden gevolgd opdat alle vormen van design gerelateerde bias kunnen uitgesloten worden.

Deze guidelines en 4 stappenplan zoals door de auteurs uitgetekend vormen ene perfecte interface om het dynamische werk van de cognitieve neuropsychologische reserach op valide wijze te kunnen vertalen naar het klinische domein. Het zal garant staan om vroegtijdige “release” en hype te vermijden en anderzijds toelaten dat testen robuust en gestandaardiseerd in multicenter studies gevalideerd zijn alvorens in het arsenaal van de klinische neuropsychiater opgenomen te worden.

Evaluatie van de gekende literatuur over spectrale analyse bij ADHD toont aan dat effect size van deze methodologie van dien aard en grootteorde is dat de test zich leent tot stadium 3 en Vier van het 4 stappenplan. Hierbij is het belangrijk zich te realiseren dat DSLM-IV categorieën vaak multicausaal zijn. Indien een test erin slaagt om alle gevallen in de target groep (vb psychose) te identificeren dan betreft het vermoedelijk een test die gevoelig is aan de “final common pathway”. Is hij echter specifieker vb wel drugpsychose en niet eerste schizofrenie opstoot dan meet hij een meer pathogeen gebonden procesfactor.

Een ander praktisch voorbeeld aan de hand van literatuurstudie

Reserach heeft aangetoond dat bij schizofrenie er al zeer vroeg in de sensoriele informatieverwerking belangrijke stoornissen kunnen optreden die dan misschien

Page 11: Neurofysiologische testontwikkeling

stroomopwaarts aan de basis kunnen liggen van bepaalde denk- of waarnemingsstoornissen. Op optisch vlak bestaan er duidelijke afwijkingen van de dorsale visuele stroom op zijn beurt veroorzaakt door gestoorde functie van de magnocellulaire banen (retina, V1, pars dorsalis van corpus geniculatum laterale). Deze M functie zijn cellen die vooral reageren op grof contrast en die overeenkomen met de P1 piek in de visueel geëvokeerde potentiaal. Het parvocellulaire systeem reageert op kleur en zal dus best gestimuleerd worden met chromatisch contrast bij isoluminantie. Een hoog achromatisch contrast stimuleert dus beide systemen (Mixed M en P)In een studie om deze effecten te bestuderen bij schizofreniepatiënten ten opzichte van controles (een type 1 studie dus) gebruikten Schechter et al (Clin. Neurophysiology, 200(; 116 (2204-2215) deze drie stimulatietypes. Zij noteren statistisch significante significante (p<0.05) resultaten op vlak van P1 amplitudo bij laag contrast (M ), C1 latentie bij chromatisch contrast en C1 amplitudo, C1 en P1 latentie bij hoog contrast. Als we het effect size van deze zaken berekenen dan krijgen we voor enkele van deze parameters zeer hoge waarden gaande van 1.02 (C1 latentie bij chromatisch contrast), 0.8 (P1 amplitudo bij laag contrast) en C1 en P1 latentie bij hoog contrast. Vooral de P1 amplitudo en latentie bij laag en hoog contrast lijken dus de moeite waard om verder onderzocht te worden temeer daar deze (in contrast met C1 en N1) niet dependent zijn van de gezichtsscherpte.Op deze wijze kan men via een eenvoudige berekening van effect size snel die parameters kerkennen die beloftevol genoeg zijn om door te groeien naar hogere stadia van studieontwerp. Al deze berekeningen hoeven niet uit het hoofd geleerd te worden. Op de website van psychofysiologie.be (hoofdstuk EBM) worden gratis exell tools ter beschikkinge gesteld voor de geinteresseerde lezer.

==============================================================