Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...

24
Faculteit Geneeskunde en Gezondheidswetenschappen Academiejaar 2010-2011 Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak Ine Van den Berghe Dorien Van der Kerken Promotor: Prof. Dr. Corthals Scriptie voorgedragen tot het behalen van de graad van master in de logopedische en audiologische wetenschappen

Transcript of Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...

  • Faculteit Geneeskunde en Gezondheidswetenschappen

    Academiejaar 2010-2011

    Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak

    Ine Van den Berghe

    Dorien Van der Kerken

    Promotor: Prof. Dr. Corthals

    Scriptie voorgedragen tot het behalen van de graad van master in de logopedische en

    audiologische wetenschappen

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 2

    Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak

    Ine Van den Berghe

    Dorien Van der Kerken

    Promotor: Prof. Dr. Corthals

    Abstract

    Spraakverstaanbaarheid wordt internationaal erkend als een zeer belangrijke maat voor de

    ernst van de pathologische conditie van een persoon met een spraakstoornis. Ze geeft

    informatie over de beperking en handicap die de persoon in kwestie ondervindt in de

    maatschappij. Om de spraakverstaanbaarheid van personen met een spraakstoornis te

    onderzoeken zijn in het Nederlandse taalgebied een aantal methoden ter beschikking.

    Enerzijds zijn er beoordelingsschalen voor dysartrie en anderzijds is er het instrumenteel

    Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of kortweg NSVO. Deze studie reikt een

    nieuwe methode aan waarbij “ruisbestendigheid” wordt gebruikt als indicator voor

    spraakverstaanbaarheid van afwijkende spraak en dit voor verscheidene

    spraakproblematieken. In dit onderzoek kregen twintig proefpersonen de opdracht een aantal

    spraakstalen perceptueel te ordenen van best tot slechtst verstaanbaar, waarbij zowel woorden

    als zinnen aan bod kwamen. Aan twintig andere proefpersonen werden dezelfde fragmenten

    aangeboden gemengd met verschillende graden van ruis, beginnend bij de meest verstoorde

    versie. Hierbij werd onderzocht vanaf welke signaal-ruisverhouding de spraak werd verstaan.

    Uit de resultaten blijkt een sterke correlatie tussen beide luiken, waarbij het sterkste verband

    gevonden wordt op zinsniveau. Dit betekent dat het meten van verstaanbaarheid op basis van

    de ruisbestendigheid van spraak vergelijkbare resultaten oplevert met een globale perceptuele

    beoordeling van verstaanbaarheid. De methode gebaseerd op ruisbestendigheid kan aldus

    gehanteerd worden in de klinische praktijk om verstaanbaarheid van afwijkende spraak te

    meten.

    Keywords: Spraakverstaanbaarheid beoordeling, pathologische spraak, ruismenging

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 3

    Abstract

    Speech intelligibility is internationally recognized as a very important measure for the

    severity of the pathological condition of a person with a speech disorder. It gives information

    about the disabilities and handicap the person is experiencing in the society. In the Dutch

    language, speech intelligibility of people with a speech disorder can be investigated with a

    number of methods. On one hand, there are assessment scales for dysarthria and, on the other

    hand, there is the instrumental Dutch Intelligibility Assessment or simply DIA. This study

    introduces a new method where “noise resistance” is used as an indicator for intelligibility of

    deviant speech and namely for several speech problems. In this study twenty subjects were

    asked to rank perceptually a number of speech samples from most to least intelligible. Both

    words and phrases were present in the speech samples. Twenty other subjects were offered the

    same speech fragments mixed with various degrees of noise, starting with the most disturbed

    version. This data was examined from which signal-to-noise ratio speech is understood. The

    results show a strong correlation between the two parts, where the strongest correlation is

    found at sentence level. This means that measuring speech intelligibility based on the noise

    resistance of speech gives similar results to a perceptual assessment of intelligibility. The

    method based on noise resistance can thus be used in clinical practice to measure

    intelligibility of deviant speech.

    Keywords: Speech intelligibility assessment, pathological speech, noise resistance

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 4

    Introductie

    Spraakverstaanbaarheid kan in verschillende mate aangetast zijn bij aandoeningen zoals

    gehoorstoornissen, afwijkingen van de spraakorganen, dysartrie en laryngectomie. Het

    verbeteren van de spraakverstaanbaarheid is het hoofddoel van logopedische therapie bij

    personen met een congenitale of verworven spraakstoornis (Versonnen, De Bodt, Van

    Borsel,& Wuyts, 2004). Spraakverstaanbaarheid wordt internationaal erkend als een zeer

    belangrijke maat voor de ernst van de pathologische conditie.

    Het begrip ‘spraakverstaanbaarheid’

    Verstaanbaarheid wordt door Yorkston, Strand en Kennedy (1996) en Kent, Weismer, Kent

    en Rosenbek (1989) gedefinieerd als wat door de luisteraars begrepen wordt van de fonetische

    realisatie van spraak. Spraakverstaanbaarheid zegt dus enkel en alleen iets over de spraak van

    de persoon. Begrijpelijkheid is een ruimer begrip en houdt ook rekening met de pragmatische

    en semantische aspecten van taal (Yorkston et al., 1996). Daarnaast moet het verschil tussen

    de begrippen spraakverstaanbaarheid en spraakverstaan duidelijk zijn. Dit onderscheid wordt

    door Versonnen et al. (2004) verduidelijkt. Met spraakverstaanbaarheid wordt bedoeld de

    mate waarin een persoon zich door middel van spraak verstaanbaar kan maken.

    Verstaanbaarheid heeft dus betrekking op de spreker zelf. Dit mag niet verward worden met

    het begrip spraakverstaan, wat iets zegt over de mate waarin een persoon spraak kan

    begrijpen. Spraakverstaan heeft betrekking op de luisteraar in kwestie.

    Klinische relevantie van spraakverstaanbaarheidsonderzoek

    Het model van de International Classification of Function, Disability and Health (World

    Health Organisation Collaborating Centre for the Family of International Classifications

    [WHO-FIC], 2002) geeft informatie over het menselijk functioneren van een persoon met een

    aandoening of ziekte. Dit model, toegepast op personen met een spraakstoornis,wordt

    voorgesteld in figuur 1. Zoals uit het schema blijkt, heeft een spraakstoornis een impact op de

    activiteiten en participatie van het individu, met andere woorden: ze geeft informatie over de

    beperking en handicap die de persoon in kwestie ondervindt in de maatschappij. Met

    ‘beperking’ wordt in dit opzicht de spraakverstaanbaarheid van het individu bedoeld. Verder

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 5

    volgt uit het model dat verstaanbaarheid van afwijkende spraakbepaald wordt door functies

    van een individu en zijn anatomische eigenschappen. ‘Functies’ verwijzen naar de mate van

    functioneren van vier subsystemen van spraak: fonatie, articulatie, resonantie en prosodie. De

    impact van een bepaald subsysteem varieert naargelang de spraakstoornis (De Bodt,

    Hernández-Díaz Huici, & Van De Heyning, 2002). ‘Anatomische eigenschappen’ refereren

    naar de aan- of afwezigheid van afwijkingen van het lichaam, bijvoorbeeld van de

    spraakorganen. In het schema zijn ook externe en persoonlijke factoren opgenomen om te

    tonen dat ook zij van invloed kunnen zijn op iemands gezondheidstoestand. De mate van

    verstaanbaarheid van een persoon wordt dus gebruikt om de impact van een stoornis op het

    communicatief functioneren van de spreker te bepalen.

    Figuur 1: International Classification of Function, Disability and Health (WHO-FIC Collaborating Centre,

    2002),toegepast op personen met een spraakstoornis.

    Daarnaast kan een kwalitatieve analyse van het probleem met behulp van een

    verstaanbaarheidsonderzoek van nut zijn voor diagnose en therapie. Scores

    voorspraakverstaanbaarheid kunnen een middel zijn om de evolutie in de spraakproductie op

    te volgen. Dit kan enerzijds toegepast worden om progressieve of recupererende

    ziektebeelden in kaart te brengen, anderzijds geeft het informatie over het effect van therapie

    (Ansel & Kent, 1992).

    Verder bewijst spraakverstaanbaarheidsonderzoek zijn nut als een test voor de effectiviteit

    van hulpmiddelen voor gehoorgestoorden: gehoorgestoorde kinderen met een cochleair

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 6

    implant zijn verondersteld verstaanbaarder te spreken. Zo is op basis van

    spraakverstaanbaarheidsonderzoek de effectiviteit van een cochleair implant aangetoond in

    vergelijking met hoorapparaten (Baudonck, Dhooge, D’haeseleer, & Van Lierde, 2010;

    Baudonck, Dhooge,& Van Lierde, 2010).

    Bestaande methoden voor het meten van spraakverstaanbaarheid

    In de klinische praktijk is perceptueel onderzoek de gouden standaard voor wat betreft het

    meten van spraakverstaanbaarheid van afwijkende spraak. Enerzijds zijn er

    beoordelingsschalen, waarbij een ruwe algemene index voor verstaanbaarheid wordt

    bekomen. Voor het Nederlands is er de vertaalde versie van het Frenchay Dysarthria

    Assessment (Enderby, 1980) en het logopedisch dysartrieprotocol van Druyts, Kalmeijer en

    De Bodt (1998). Anderzijds is er het onderzoek gebaseerd op het gebruik van

    meetinstrumenten. Men spreekt van een meetinstrument als een score bekomen wordt op basis

    van een zuivere meting en niet op basis van een schatting.Bij meetinstrumentenwordt gebruik

    gemaakt van lijsten van woorden en zinnen. Het enige meetinstrument dat geconstrueerd is

    specifiek voor het Nederlands is het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of

    kortweg NSVO (Middag, Martens, Van Nuffelen, & De Bodt, 2009b; Van Nuffelen, De Bodt,

    Guns, Wuyts, & Van de Heyning, 2008; Van Nuffelen, De Bodt, Middag, & Martens, 2009)..

    Met dit perceptueel onderzoek wordt het percentage correct geïdentificeerde fonemen

    bekomen. Er bestaat ook een versie op zinsniveau. Later is er een geautomatiseerde versie van

    NSVO ontwikkeld, waarbij een computer in de plaats wordt gesteld van de menselijke

    luisteraar (Middag, Martens, Van Nuffelen, & De Bodt, 2009a; Middag, Van Nuffelen,

    Martens, & De Bodt, 2008).Deze methode is objectiever dan de originele versie.

    Deze studie: een nieuwe methode

    In deze studie wordt getracht een methode te ontwikkelen om spraakverstaanbaarheid op een

    nieuwe manier te beoordelen. Hiervoor wordt “ruisbestendigheid” gebruikt als een indicator

    voor spraakverstaanbaarheid. We definiëren “ruisbestendigheid” als de signaal-

    ruisverhouding waarvoor spraak nog verstaanbaar is.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 7

    Een groep proefpersonen krijgt de opdracht een aantal spraakstalen perceptueel te ordenen

    van best verstaanbaar tot slechtst verstaanbaar. Het betreft spraakstalen van zowel kinderen

    als volwassenen met een spraakstoornis gaande van licht tot ernstig afwijkend. Zowel

    woorden als korte frasen komen aan bod. Aan een andere groep proefpersonen worden

    dezelfde spraakfragmenten aangeboden gemengd met verschillende graden van ruis,

    beginnend bij het meest verstoorde spraakstaal. Hierbij wordt onderzocht vanaf welke

    signaal-ruisverhouding de spraak wordt verstaan.

    De hypothese die vooropgesteld wordt is dat er een verband bestaat tussen enerzijds de

    globale perceptuele beoordeling van verstaanbaarheid en anderzijds de “ruisbestendigheid”

    van spraak.

    Werkwijze

    Deze studie beschrijft een nieuwe methode om de verstaanbaarheid van afwijkende spraak te

    bepalen. Daartoe werd ruisbestendigheid gebruikt als een indicator voor

    spraakverstaanbaarheid. Het onderzoek bestaat uit twee verschillende luiken.

    Methode

    In een eerste luik wordt aan twintig normaalhorende, niet-ervaren beoordelaars gevraagd om

    de woorden en frasen te beoordelen op spraakverstaanbaarheid. Dit gebeurt via een

    toernooisysteem, wat uiteindelijk leidt tot een volledige rangschikking van de spraakstalen

    van best tot slechtst verstaanbaar. Het toernooisysteem voor de woorden a tot p, 24

    spraakstalen, bestaat uit 60 verschillende paren die moeten worden beoordeeld. Een te

    beoordelen paar van spraakstalen noemen we een “match”. Het spraakstaal dat als best wordt

    beoordeeld gaat door naar een volgende ronde en komt dan uit tegen het best beoordeelde

    spraakstaal uit een andere match. Het toernooisysteem voor de zinnen a tot x wordt grafisch

    voorgesteld in figuur 2. Voor de korte zinnen, of frasen, wordt eenzelfde toernooisysteem

    gehanteerd. Hier worden 16spraakstalen gebruikt, die in 32 verschillende paren worden

    beoordeeld. Figuur 3 geeft een grafische voorstelling van het toernooisysteem voor zinnen.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 8

    Voor het tweede luik van het onderzoek werden de spraakstalen met ruis gemengd. Op die

    manier werden dertien verschillende versies van elk spraakstaal gecreëerd met elk een

    verschillend niveau van signaal-ruisverhouding. Twintig normaalhorende, niet-ervaren

    proefpersonen, verschillend van de beoordelaars uit het eerste luik, beoordelen in dit tweede

    luik de met ruis gemengde spraakstalen. De opdracht die ze hierbij krijgen is aangeven wat er

    in het spraakstaal wordt gezegd. Ze krijgen de spraakstalen aangeboden startend met de meest

    verstoorde versie van het spraakstaal. Daarna wordt steeds een andere versie van het

    spraakstaal aangeboden met een opklimmende, dus gunstiger wordende, graad van signaal-

    ruisverhouding. Van zodra de beoordelaars mondelingkunnen aangeven wat in het spraakstaal

    wordt gezegd of wanneer het hoogste niveau van signaal-ruisverhouding wordt bereikt, wordt

    overgegaan op een volgend spraakstaal. Het mondeling gegeven antwoord wordt per

    verschillend niveau van signaal-ruisverhouding door de testleider genoteerd. De woorden

    worden als correct beschouwd wanneer alle fonemen worden herkend. De zinnen worden als

    correct beschouwd wanneer alle woorden worden verstaan. De proefpersonen hoeven hierbij

    niet zeker te zijn van hun antwoord, een correcte gok wordt meegerekend. In laatste instantie

    werden de scores van beide luiken met elkaar gecorreleerd.

    Figuur 2: Overzicht beoordelingstoernooi voor woorden. Dit beoordelingstoernooi bestaat uit vier rondes, de

    winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking bekomen van de

    twaalf best beoordeelde spraakstalen, links bevinden zich de twaalf slechtst beoordeelde spraakstalen.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 9

    Figuur 3: Overzicht beoordelingstoernooi voor zinnen. Dit beoordelingssysteem bestaat uit vier rondes, de

    winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking van de acht best

    beoordeelde spraakstalen bekomen, links bevinden zich de acht slechtst beoordeelde spraakstalen.

    Materiaal

    Om de spraakverstaanbaarheid door middel van ruismenging na te gaan werd gebruik

    gemaakt van diverse spraakstalen. Alle spraakstalen zijn afwijkend: zowel articulatie-, stem-,

    en gehoorstoornissen als laryngectomie- en dysartriepatiënten komen aan bod. Die

    verscheidenheid werd gebruikt met het doel van deze studie voor ogen. We willen immers een

    nieuw systeem ontwerpen om spraakverstaanbaarheid bij verscheidene stoornissen te

    beoordelen.

    Spraakstalen werden bekomen via onze promotor Prof. Dr. Corthals. Andere spraakstalen

    werden geselecteerd uit het Dutch Corpus of Pathological and Normal Speech (Van Nuffelen

    & De Bodt, 2011).

    Daaruit werden 24 woorden en 16 frasen geselecteerd, waarin diverse graden van

    spraakverstaanbaarheid vertegenwoordigd zijn. Dit is gebaseerd op de eigen perceptuele

    beoordeling van de auteurs. De meerderheid, zeventien, van de woorden bestaan uit twee

    syllaben. Verder zijn er vier woorden bestaande uit drie syllaben, twee woorden van vier

    syllaben en één monosyllabisch woord. De frasen bestaan gemiddeld uit 6,4 woorden, met een

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 10

    minimum van 4 en een maximum van 9 woorden. Een overzicht van de doelwoorden en -

    zinnen is terug te vinden in bijlage. Het intensiteitsniveau van de verschillende spraakstalen

    werd in Praat (Boersma & Weenink, 1996) gelijkgesteld tot een niveau van 80dB.

    Voor het tweede luik van het onderzoek, werden de spraakstalen met ruis gemengd. Dit

    gebeurde via een script in Praat (Corthals, P.). Zo werden per woord en frase dertien versies

    bekomen met elk een verschillende signaal-ruisverhouding, dit gaande van een signaal-

    ruisverhouding van -15dB tot +18dB, in stapjes van 3dB. De dertiende versie die werd

    gebruikt, is de versie zonder ruis.

    Beoordelaars

    Voor het eerste luik van het onderzoek, het bekomen van een volledige rangschikking via het

    toernooisysteem, gebeurde de beoordeling door twintig niet-ervaren normaalhorende

    proefpersonen. Allen hebben een niet-sprekersberoep of zijn studenten uit een niet-talige

    richting. De gemiddelde leeftijd van deze groep beoordelaars is 26,5jaar. De minimumleeftijd

    bedraagt 18 en de maximumleeftijd 53jaar. Aan de beoordelaars werd in vrij veld telkens een

    paar van twee verschillende spraakstalen aangeboden. De beoordelaars kregen de

    mogelijkheid om elk spraakstaal per “match” maximaal twee maal te beluisteren. Daarna

    moesten ze aangeven welke van de twee volgens hen het best verstaanbaar is, zonder hier

    dieper op in te gaan.

    Voor het tweede luik van het onderzoek, de beoordeling van wat er gezegd wordt in de

    spraakstalen met ruismenging, werd eveneens beroep gedaan op twintig niet-ervaren

    beoordelaars. Van de werkende proefpersonen heeft geen enkele persoon een sprekersberoep,

    hiernaast zijn ook studenten uit een niet-talige richting vertegenwoordigd. De gemiddelde

    leeftijd van deze groep beoordelaars is 30jaar. De minimum- en maximumleeftijd bedraagt

    respectievelijk 19 en 53 jaar. De spraakstalen werden in vrij veld aangeboden en elk niveau

    van ruismenging mocht slechts éénmaal worden beluisterd. Startend met de meest verstoorde

    versie van het spraakstaal werd hen individueel gevraagd aan te geven wat er in het

    spraakstaal gezegd werd. De spraakstalen worden aangeboden met een steeds groter

    wordende signaal-ruisverhouding totdat de beoordelaar correct aangeeft wat er gezegd wordt.

    Hiertoe geeft de proefpersoon mondeling aan wat hij meent te hebben verstaan. Dit antwoord

    wordt, per graad van signaal-ruisverhouding, genoteerd door de testleider.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 11

    Resultaten

    Voor het eerste luik, de perceptuele beoordeling via het toernooisysteem, werd per

    proefpersoon een volledige rangschikking van woorden en frasen apart bekomen. Vervolgens

    werd van elk item de gemiddelde plaats in de rangschikking, over de twintig beoordelaars,

    berekend.

    De beoordeling via ruismenging in het tweede luik resulteerde in een niveau van

    ruisbestendigheid per spraakstaal en per proefpersoon. Zoals eerder vermeld, werden er

    maximaal dertien verschillende versies aangeboden. Zodoende kon hier een score gaande van

    1, coderend voor een signaal-ruisverhouding van -15 dB waarop het spraakstaal werd

    verstaan, tot een score van 14 worden bekomen. Een score van 12 codeert voor een signaal-

    ruisverhouding van +18 dB. Wanneer het spraakstaal enkel zonder toegevoegde ruis werd

    verstaan, werd een score van 13 gegeven. Bijkomend werd een score van 14 toegekend

    wanneer het spraakstaal zelfs bij het hoogste niveau van signaal-ruisverhouding nog niet werd

    verstaan. De gemiddelde plaats in de rangschikking en de gemiddelde score overeenkomstig

    de ruisbestendigheid wordt per spraakstaal weergegeven in tabel 1.

    Tabel 1:

    Gemiddelde plaats in rangschikking en gemiddelde score voor ruisbestendigheid per item

    Itema Gemiddelde plaats

    in rangschikking

    Gemiddelde score

    voor ruisbestendigheid

    Itema Gemiddelde plaats

    in rangschikking

    Gemiddelde score

    voor ruisbestendigheid

    Za 11,65 13,2 We 9,7 6

    Zb 3,45 11,35 Wf 4,65 5,4

    Zc 15,2 14 Wg 9 8,55

    Zd 6,1 11,8 Wh 19,3 4,75

    Ze 3,35 10,5 Wi 12,05 8,1

    Zf 11,45 11,15 Wj 10,75 7,1

    Zg 7,15 12,65 Wk 4,6 7,4

    Zh 11,1 12,75 Wl 20,7 13,95

    Zi 14,65 14 Wm 4,2 6,75

    Zj 7,05 7,25 Wn 16,4 5,8

    Zk 9,75 9,05 Wo 23,4 13,8

    Zl 1,95 3,2 Wp 7,6 7,75

    Zm 5,45 4,85 Wq 3,85 5,6

    Zn 12,65 14 Wr 17,4 14

    Zo 8,65 12,75 Ws 15,7 13,55

    Zp 6,4 6,4 Wt 15,1 9,45

    Wa 14,45 4,5 Wu 16,7 13,3

    Wb 7,55 3,35 Wv 9,1 9,15

    Wc 22,4 14 Ww 19 13,4

    Wd 9,5 12,55 Wx 6,9 12,75 a Z: zin, W: woord

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 12

    Met deze nieuwe waarden, de gemiddelden, kan voor de woorden en frasen afzonderlijk een

    nieuwe rangschikking worden bekomen. Zo wordt een rangschikking bekomen voor de

    woorden, waarbij elk woord een plaats krijgt binnen een top 24voor enerzijds de globale

    rangschikking en anderzijds de beoordeling via ruismenging. Voor de frasen wordt, ook voor

    zowel de globale beoordeling als voor de beoordeling via ruismenging een top 16bekomen.

    Het is met deze rangschikking dat de statistische berekeningen worden gedaan.

    Per item werd het verschil in rang berekend tussen de perceptuele beoordeling via het tornooi

    en deze via ruismenging. Een positief verschil wijst op een betere beoordeling via

    ruismenging dan via de globale rangschikking. Daarentegen duidt een negatief verschil op een

    minder goede beoordeling via ruismenging. De grootte van het verschil geeft aan hoeveel

    plaatsen een item opschuift in de rangschikking.

    Figuur 4 stelt die veranderingen voor de frasen voor. De veranderingen vanaf 25% of 4

    plaatsen worden als opvallend beschouwd. De 5 plaatsen achteruitgang van zin b in de

    beoordeling via ruismenging en 4 plaatsen voor zinnen d en e zijn frappant. Zinnen f en k

    daarentegen worden merkelijk beter beoordeeld via de ruismenging, ze stijgen 5 plaatsen in

    de rangschikking.

    Figuur 4: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per zin.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 13

    De veranderingen voor woorden worden gevisualiseerd in figuur 5. Opnieuw worden

    veranderingen vanaf 25% als opvallend beschouwd. Die verandering van 25% komt bij de

    woorden overeen met een opschuiving in rang van 6 plaatsen. Met deze drempelwaarde blijkt

    de achteruitgang van woord x met 12 plaatsen, woord k met 7 plaatsen en woorden d en m

    met 6 plaatsen in beoordeling via ruismenging opvallend. Grote vooruitgang in beoordeling

    via ruismenging ten opzichte van de globale rangschikking uit luik 1 zien we bij woorden h, a

    en n. Respectievelijk schuiven ze 18, 12 en 11 plaatsen op.

    Figuur 5: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per woord.

    Zoals hierboven vermeld, werden de berekende gemiddelden gebruikt om een nieuwe

    rangschikking voor beide luiken, dit voor woorden en frasen afzonderlijk, te bekomen. Deze

    gegevens dienen nu als basis voor de correlatieberekening. De correlaties die hier worden

    bekomen geven dus de overeenkomst aan tussen resultaten van de globale perceptuele

    beoordeling en beoordeling via ruismenging.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 14

    De Spearman rangcorrelatiecoëfficiënt die aldus werd bekomen bedraagt voor de zinnen 0.79.

    De significantie van dit resultaat is zeer sterk (p < 0.001). Op woordniveau kon een sterk

    significante relatie (p < 0.01) worden aangetoond, en dit met een Spearman

    rangcorrelatiecoëfficiënt van 0.55. In Figuur 6 wordt deze correlatie uitgezet in een

    spreidingsdiagram.

    Deze resultaten suggereren dat er een samenhang is, voor zowel woorden als frasen, tussen de

    globale beoordeling uit luik 1 enerzijds en de methode via ruismenging anderzijds. De

    correlatie voor de zinnen is hoger dan voor woorden. Dit blijkt eveneens uit het

    spreidingsdiagram.

    Figuur 6: Spreidingsdiagram voor zinnen en woorden.

    rS zin = 0.79

    rS woord = 0.55

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 15

    Discussie

    Interpretatie van de gevonden correlaties

    Met dit onderzoek kon statistisch worden aangetoond dat er een correlatie bestaat tussen de

    globale rangschikking van afwijkende spraak en de nieuw geïntroduceerde methode voor

    beoordeling via ruismenging. Hiermee kan de hypothese die werd gesteld aanvaard worden.

    De gevonden correlatie voor zinnen (0.79) is sterker dan die voor woorden (0.55). In dit

    onderzoek werden 24 spraakstalen van woorden gebruikt en slechts 16 van zinnen. De invloed

    van dit verschil in aantal kan niet worden uitgesloten. Toch dient er rekening gehouden te

    worden met de mogelijkheid dat zinnen meer geschikt zijn voor de beoordeling van

    spraakverstaanbaarheid dan woorden. Spraak op zinsniveau leunt immers dichter aan bij

    spontane spraak dan geïsoleerde woorden. De mogelijkheid bestaat dat beoordelaars voor

    zinnen een gelijkaardige perceptiestrategie gebruikt hebben in beide luiken. Dit is minder

    mogelijk voor losse woorden. De betere correlatie voor zinnen kan zo worden verklaard.

    In beide luiken is er een element aan te halen dat mogelijk een invloed heeft gehad op de

    bekomen correlaties. Ze verhinderen mogelijk het optreden van hogere correlaties. In het

    eerste luik kent de opzet van het beoordelingssysteem met matchen beperkingen. Voordat de

    spraakstalen aan de beoordelaars werden voorgelegd, werden ze onderworpen aan een eerste

    selectie en ordening, gebaseerd op de perceptuele beoordeling van beide auteurs. Deze

    consensusbeoordeling was bepalend voor het verder verloop van het onderzoek. Immers, het

    ontwerp van het toernooisysteem is zo, dat onze rangschikking kan worden bekomen. Een

    aantal andere ordeningen worden hiermee automatisch uitgesloten. Een meer uitgebreide

    voorronde, bij meer dan twee personen, om uiteindelijk het toernooisysteem op te baseren had

    misschien hogere correlaties met zich meegebracht.

    Ook de manier van beoordelen van woorden en zinnen in het tweede luik, via ruismenging,

    kan als beperking worden gezien. De groep beoordelaars werd gevraagd aan te geven welk

    woord of welke zin ze te horen kregen. Hun antwoorden werden gescoord in alles of niets

    fenomenen. Een woord werd immers pas als correct beschouwd wanneer alle fonemen correct

    waren. Zinnen kregen een correcte score indien alle woorden correct werden aangegeven. De

    introductie van scores volgens een percentage correcte fonemen bij woorden of een

    procentuele score van correcte woorden bij zinnen geeft mogelijks een gedifferentieerder

    beeld en betere correlaties.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 16

    Interpretatie van de resultaten op zinsniveau

    Een aantal zinnen dient speciale aandacht te krijgen, hun plaats in rangschikking tussen beide

    luiken kent immers een verschil van minstens 25%. Er wordt dan ook dieper ingegaan op die

    individuele zinnen.

    Voor zinnen b, d en e worden opmerkelijke verschillen in rang vastgesteld tussen beide luiken

    van het onderzoek. Hierbij wordt de beste score gevonden in het eerste luik, dit is de

    beoordeling op verstaanbaarheid. Dit kan wellicht verklaard worden op basis van onderzoek

    naar de prosodie, meer bepaald de intonatie. Elk van deze zinnen heeft immers een incorrecte

    intonatie. Als beoordelaar in het eerste luik is men geneigd de verstaanbaarheid te toetsen

    door louter de aan- of afwezigheid van prosodie te observeren. In elk van deze zinnen is

    prosodie wel degelijk aanwezig, waardoor de luisteraar geneigd is deze spraak als relatief

    goed verstaanbaar aan te duiden. Toch blijkt de analyse van wat de spreker precies verwoordt,

    zoals onderzocht in het tweede luik, complex aangezien de aanwezige intonatie niet de juiste

    is. De proefpersoon wordt in het eerste luik met andere woorden misleid door de

    aanwezigheid van incorrecte prosodie. Een andere mogelijke verklaring voor dit fenomeen is

    de volgende. De beoordelaars in het eerste luik zijn zich mogelijks niet bewust van de impact

    die een foutieve intonatie kan hebben op de verstaanbaarheid. Ze brengen dit aspect niet of

    niet voldoende in rekening bij hun beoordeling. Het is denkbaar dat een ander resultaat wordt

    bekomen indien gewerkt wordt met professionelen in dit vak, en niet met leken zoals hier het

    geval was.

    Er is alsnog een zin, item n, waarbij intonatie duidelijk aanwezig is, maar foutief. Hoe komt

    het dat bij deze zin er geen opmerkelijk verschil te vinden is tussen de resultaten van de

    verschillende onderzoeksluiken? Dit kan verklaard worden door het feit dat bij deze zin niet

    enkel het prosodische aspect meespeelt, maar dat ook de articulatie in deze frase ondermaats

    is. Hierdoor krijgt deze zin bij de beoordeling in het eerste luik reeds een slechte score voor

    verstaanbaarheid toegekend.

    Tot slot is er nog een aspect dat aandacht verdient bij het analyseren van deze zinnen.

    Opvallend is dat twee van deze zinnen afkomstig zijn van gehoorgestoorden. Prosodie is

    immers bij gehoorgestoorden vaak problematisch. Bij zin b, ingesproken door een persoon

    met een stemstoornis, gaat het wellicht om een toevallige prosodische abnormaliteit.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 17

    Zinnen f en k scoren opmerkelijk slechter bij het eerste luik, de perceptuele beoordeling van

    de spraakverstaanbaarheid. De verklaring moet mogelijks gezocht worden bij de startsituatie

    van het opgestelde beoordelingstoernooi. Zinnen f en k moesten het immers reeds in de eerste

    ronde opnemen tegen respectievelijk zinnen e en l, dewelke uiteindelijk de twee best

    verstaanbare zinnen bleken te zijn. Hierdoor kwamen zinnen f en k na de eerste ronde alvast

    terecht bij de acht slechtst verstaanbare zinnen.

    Interpretatie van de resultaten op woordniveau

    Er wordt gekeken naar de individuele woorden waarbij verschillen groter dan 25% in rang

    gezien worden tussen beide onderzoeksluiken.

    De woorden d, k, m en x krijgen opmerkelijk betere scores bij het eerste onderzoeksluik, de

    perceptuele beoordeling van verstaanbaarheid. Een potentiële verklaring hiervoor wordt

    opnieuw gezocht bij de prosodie. Het is namelijk zo dat de klemtoon bij elk van deze woorden

    verkeerd ligt. Niet toevallig gaat het hier ook om spraakstalen van gehoorgestoorden.

    Prosodische abnormaliteiten komen immers frequent voor bij gehoorgestoorden. Opnieuw

    verwijzen we hier, parallel met de verklaring bij de prosodisch gestoorde zinnen, naar de reële

    kans dat beoordelaars in het eerste luik geen of onvoldoende aandacht besteden aan de

    afwijkende klemtoon van deze woorden. De fonemen op zich worden goed verstaan en

    bijgevolg worden deze woorden goed beoordeeld. De mogelijke impact van een foutieve

    klemtoon op de verstaanbaarheid wordt onderschat. In het tweede luik blijkt dan dat foutieve

    klemtoon de identificatie van het doelwoord wel degelijk bemoeilijkt en aldus als

    beïnvloedende factor kan worden beschouwd. Waarom zet deze trend zich niet verder bij de

    andere woorden geproduceerd door gehoorgestoorden? Hier ligt de verklaring wellicht bij het

    aantal lettergrepen dat de woorden bevatten. De kans om een klemtoon verkeerd te leggen bij

    een drie- of vierlettergrepig woord is groter dan bij een tweelettergrepig woord. Dit zien we

    dan ook gebeuren bij de woorden k, m en x. Hoewel de kans om een foutieve klemtoon te

    leggen bij een tweelettergrepig woord kleiner is, is ze zeker niet onbestaande. Dit zien we

    gebeuren bij het tweelettergrepig woord d.

    De woorden a, h en n scoren beduidend beter op het tweede onderzoeksluik, waarbij de

    woorden herkend moeten worden. Elk van deze woorden is afkomstig van een persoon met

    een articulatiestoornis. Mogelijks ligt de oorzaak bij het verschillend uitgangspunt van

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 18

    waaruit de proefpersonen vertrekken voor wat betreft de twee aparte onderzoeksluiken. Bij

    luik twee schenkt de proefpersoon aandacht aan de fonemen die hij in grote lijnen door de ruis

    heen meent te horen. Vervolgens zoekt deze persoon in zijn vocabularium naar een woord dat

    er min of meer op gelijkt. De proefpersoon is met andere woorden niet erg streng bij het

    oproepen van potentiële termen aangezien er ruis mee gemengd is, en aangezien gokken

    toegestaan is. Vanaf het moment dat de fonemenreeks die door de proefpersoon verstaan is

    grosso modo overeenkomt met een woord opgeroepen in het vocabularium, is dit genoeg om

    een gok te wagen. Bij luik één daarentegen, de beoordeling van de verstaanbaarheid, focust de

    proefpersoon zich op het gehele woord waarbij elk foneem in acht wordt genomen. Woorden

    met zelfs maar één foneemsubstitutie kunnen hierop afgestraft worden door zo een lagere

    score voor verstaanbaarheid toegekend te krijgen.

    Vergelijking bestaande methodes voor het bepalen van spraakverstaanbaarheid

    In wat volgt vergelijken wede nieuwe methode voor spraakverstaanbaarheidsbeoordeling via

    ruismenging met de bestaande beoordelingsschalen (Frenchay Dysarthria Assessment

    (Enderby, 1983) en het logopedisch dysartrieprotocol (Druyts et al, 1998)) enerzijds en met

    het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek (Middag et al., 2009b; Van Nuffelen,

    et al., 2008; Van Nuffelen, et al., 2009) anderzijds.

    Een belangrijk voordeel van deze methode ten opzichte van de ernstschalen is de

    bruikbaarheid ervan bij verschillende spraakproblematieken. Dit systeem werd immers, naast

    dysartrie, ook toegepast bij articulatie-, stem-, gehoor- en laryngectomieproblematiek. Een

    ander voordeel ten opzichte van de ernstschalen werd ons aangegeven door de beoordelaars

    zelf. Bij het eerste luik was er veel twijfel bij het vergelijken van de spraakstalen.

    Beoordelaars vroegen frequent om herhaling en ze waren niet steeds zeker van hun antwoord.

    Bij de methode met ruismenging was dit niet het geval, de beoordelaars hadden het woord wel

    of niet verstaan of konden via het overlopen van hun inwendig vocabularium een woord

    selecteren. Dit wijst erop dat de methode via ruismenging eenvoudiger is in gebruik, terwijl

    een globale perceptuele beoordeling steeds twijfel en dus een vorm van onzekerheid en

    onbetrouwbaarheid met zich meebrengt. Een voordeel ten opzichte van het NSVO is de

    incorporatie van prosodie als spraakkenmerk. Dit blijkt een invloed te hebben op de

    spraakverstaanbaarheid en is vaak problematisch bij gehoorgestoorden. Zowel klemtoon als

    intonatie kan de spraakverstaanbaarheid op een negatieve manier beïnvloeden.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 19

    Een nadeel van deze methode ten opzichte van de beoordelingsschalen is de afwezigheid van

    een beoordeling van spontane spraak of eenheden groter dan zinnen. De ernstschalen geven

    een snelle indruk van de spraakverstaanbaarheid, terwijl deze methode complexer is en meer

    tijd in beslag neemt. Ten opzichte van het NSVO is een nadeel van de methode via

    ruismenging dat semantische en pragmatische informatie niet kan worden uitgesloten. Deze

    elementen maken immers, volgens de definitie, geen deel uit van spraakverstaanbaarheid. Ze

    maken wel deel uit van de begrijpelijkheid van spraak. Los van de bestaande Nederlandstalige

    beoordelingssystemen is er een andere beperking van deze methode. De therapeut of de

    persoon die deze methode toepast moet beschikken over een luisteraarspanel aangezien de

    onderzoeker niet als beoordelaar aangesteld mag worden indien hij zelf de opname maakt. De

    spraak mag immers in geen geval op voorhand worden gehoord zonder toegevoegde ruis. Dit

    vormt een belangrijke praktische implicatie van deze methode.

    Suggesties verder onderzoek

    Suggesties voor verder onderzoek zijn het opnieuw berekenen van correlaties op eenzelfde

    manier maar hierbij een meer uitgebreide voorronde voorzien. De spraakstalen dienen op

    voorhand door meerdere personen worden beoordeeld. In dit onderzoek werden twee zinnen

    immers belemmerd in een hogere positie door dit gegeven. Ook kan deze methode worden

    toegepast bij eenheden groter dan zinnen of spontane spraak.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 20

    Conclusie

    De resultaten van dit onderzoek geven een significante correlatie aan voor woorden en zinnen

    tussen de globale perceptuele beoordeling enerzijds en beoordeling via ruismenging

    anderzijds. Vermits een globale perceptuele manier om pathologische spraak te beoordelen

    algemeen aanvaard wordt, is de ruisbestendigheid van spraak een te hanteren hulpmiddel voor

    therapeutische doeleinden.

    De therapeut of persoon die deze methode wenst toe te passen, mag in geen geval zelf als

    beoordelaar aangesteld worden. Voor deze methode heeft de onderzoeker dus een

    luisteraarspanel nodig. Dit vormt een praktische implicatie van cruciaal belang.

    Verder moet binnen deze methode ook rekening gehouden worden met een mogelijk verschil

    in spraakverstaanbaarheid ten opzichte van globale perceptuele beoordeling bij articulatie -en

    gehoorproblematieken. Op woordniveau zorgt de mogelijkheid tot gokken ervoor dat

    articulatiestoornissen beter kunnen worden bevonden via ruismenging. Zowel op woord- als

    op zinsniveau kan prosodie, respectievelijk onder de vorm van klemtoon en intonatie, bij

    gehoorgestoorden een negatieve invloed hebben op de verstaanbaarheid. Vooral bij

    meerlettergrepige woorden is er kans op een slechter resultaat door meer mogelijkheden tot

    het leggen van een foutieve klemtoon.

    Met dank aan

    Het tot stand komen van dit werk was slechts mogelijk dankzij de medewerking van

    verscheidene personen. Bijzondere dank gaat uit naar onze promotor, Prof. Dr. Corthals, voor

    het aanreiken van het onderwerp, het opvolgen van het onderzoeken en het becommentariëren

    van de tekst. Ook willen we hem bedanken voor het aanreiken van spraakstalen en het script

    voor ruismenging in Praat. Daarnaast verdient Prof. Dr. De Bodt een gemeend woord van

    dank voor het beschikbaar stellen van spraakstalen uit het Dutch Corpus of Pathological and

    Normal Speech. Tot slot is een dankwoord verschuldigd aan alle proefpersonen die

    meewerkten aan dit onderzoek. Dankzij hun bijdrage kon dit onderzoek volbracht worden.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 21

    Referenties

    Ansel, B.M.,& Kent R.D. (1992). Acoustic-phonetic contrasts and intelligibility in the

    dysarthria associated with mixed cerebral palsy. Journal of Speech and Hearing

    Research,35, 296-308.

    Baudonck, N., Dhooge, I., D’haeseleer, E.,& Van Lierde, K. (2010). A comparison of the

    consonant production between Dutch children using cochlear implants and children using

    hearing aids. International Journal of Pediatric Otorhinolaryngology, 74,416 – 421.

    Baudonck, N., Dhooge, I., & Van Lierde, K. (2010). Intelligibility as hearing impaired

    children as judged by their parents: A comparison between children using cochlear

    implants and children using hearing aids. International Journal of Pediatric

    Otorhinolaryngology, 74, 1310-1315.

    Boersma, P., & Weenink, D. (2010). PRAAT: Doing phonetics by computer. (Version 5.2)

    [Computer program]. Retrieved September 28, 2010, from: http://www.praat.org/.

    De Bodt, M.S., Hernández-Díaz Huici, M.E., & Van De Heyning, P.H. (2002). Intelligibility

    as a linear combination of dimensions in dysarthric speech. Journal of Communication

    Disorders, 35, 283-292.

    Druyts, N., Kalmeijer, J., & De Bodt, M. (1998). Een logopedisch protocol voor het

    beoordelen van dysartrie. Logopedie, 11, 44-50.

    Enderby, P. (1980). Frenchay dysarthria assessment. International Journal of Language and

    Communication Disorders, 15, 165-173.

    Kent, R.D., Weismer, G., Kent, J.F., & Rosenbek, J.C. (1989).Toward phonetic intelligibility

    testing in dysarthria. Journal of Speech and Hearing Disorders, 54, 482-499.

    Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). Automated intelligibility

    of pathological speech using phonological features. EURASIP Journal on Advances in

    Signal Processing, vol. 2009.

    Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). DIA: a tool for objective

    intelligibility assessment of pathological speech. 6th International workshop on Models

    and Analysis of Vocal Emissions for Biomedical Application,165-167, Firenze, Italy.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 22

    Middag, C., Van Nuffelen, G., Martens J.P., & De Bodt, M. (2008). Objective intelligibility

    assessment of pathological speakers. Interspeech 2008: 9th Annual conference of the

    International Speech Communication Association, 1745-1748, Brisbane, Australia.

    Van Nuffelen, G., De Bodt, M.,Guns, C., Wuyts, F., & Van de Heyning, P. (2008). Reliability

    and clinical relevance of segmental analysis based on intelligibility assessment. Folia

    Phoniatrica et Logopaedica, 60,264–268.

    Van Nuffelen, G., De Bodt, M., Middag, C., & Martens, J.P. (2009). ‘Why an objective

    intelligibility assessment?’ Closing symposium of the SPACE project, February 5-6,

    Leuven. Retrieved from: .

    http://www.esat.kuleuven.be/psi/spraak/projects/SPACE/events/closing/index.php.

    Van Nuffelen, G., & De Bodt, M. (2011). COPAS: Dutch corpus of normal and pathological

    speech. (Version 1.0).

    Versonnen, A., De Bodt, M., Van Borsel, J., & Wuyts, F.L. (2004). Een

    onderzoeksinstrument voor het bepalen van spraakverstaanbaarheid. Toepassing bij

    volwassen dysartriepatiënten. Logopedie, 17, 33-38.

    World Health Organisation Collaborating Centre for the Family of International

    Classifications (2002). Nederlandse vertaling van de ‘International classification of

    functioning, disability and health’ - compilatie. Retrieved from: http://www.rivm.nl/who-

    fic/icf.htm.

    Yorkston, K.M., Strand, E.A., & Kennedy, M.R.T. (1996). Comprehensibility of dysarthric

    speech: Implications for assessment and treatment planning. American Journal of Speech-

    Language Pathology, 5, 55-66.

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 23

    Bijlage

    Zinnen

    a) Ze laat haar geldbeugel liggen.

    b) Nu wil ik eerst afwachten.

    c) Eerst hebben ze een kaart gekocht.

    d) Wat doe ik aan mijn voeten.

    e) Eten voor het slapengaan maakt dik.

    f) Kijk toch eens uit waar je loopt.

    g) Onze wegen liggen er slecht bij door de kou.

    h) Plots toont ze de sleutel.

    i) Wil je liever de thee of de borrel?

    j) Dan stapt ze nog een beetje verder.

    k) Ze betaalt de ober en gaat weer terug weg.

    l) Zondag ben ik naar oma geweest.

    m) Ze letten dan minder goed op.

    n) We slapen te weinig.

    o) Dat het enorm boeiend is met kinderen te werken.

    p) Mijn been doet zo’n pijn.

    Woorden

    a) Appel

    b) Roepen

    c) Slang

    d) Winkel

    e) Eekhoorn

    f) Knoopje

    g) Zaterdag

    h) Ballon

    i) Juffrouw

    j) Bloempot

    k) Handtekening

  • ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 24

    l) Mensen

    m) Evenwicht

    n) Sleutel

    o) Logopedist

    p) Huilen

    q) April

    r) Puzzel

    s) Drinken

    t) Tafel

    u) Horloge

    v) Banaan

    w) Banken

    x) Vulkanen