Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...

Faculteit Geneeskunde en Gezondheidswetenschappen

Academiejaar 2010-2011

Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak

Ine Van den Berghe

Dorien Van der Kerken

Promotor: Prof. Dr. Corthals

Scriptie voorgedragen tot het behalen van de graad van master in de logopedische en

audiologische wetenschappen

ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 2

Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak

Ine Van den Berghe

Dorien Van der Kerken

Promotor: Prof. Dr. Corthals

Abstract

Spraakverstaanbaarheid wordt internationaal erkend als een zeer belangrijke maat voor de

ernst van de pathologische conditie van een persoon met een spraakstoornis. Ze geeft

informatie over de beperking en handicap die de persoon in kwestie ondervindt in de

maatschappij. Om de spraakverstaanbaarheid van personen met een spraakstoornis te

onderzoeken zijn in het Nederlandse taalgebied een aantal methoden ter beschikking.

Enerzijds zijn er beoordelingsschalen voor dysartrie en anderzijds is er het instrumenteel

Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of kortweg NSVO. Deze studie reikt een

nieuwe methode aan waarbij “ruisbestendigheid” wordt gebruikt als indicator voor

spraakverstaanbaarheid van afwijkende spraak en dit voor verscheidene

spraakproblematieken. In dit onderzoek kregen twintig proefpersonen de opdracht een aantal

spraakstalen perceptueel te ordenen van best tot slechtst verstaanbaar, waarbij zowel woorden

als zinnen aan bod kwamen. Aan twintig andere proefpersonen werden dezelfde fragmenten

aangeboden gemengd met verschillende graden van ruis, beginnend bij de meest verstoorde

versie. Hierbij werd onderzocht vanaf welke signaal-ruisverhouding de spraak werd verstaan.

Uit de resultaten blijkt een sterke correlatie tussen beide luiken, waarbij het sterkste verband

gevonden wordt op zinsniveau. Dit betekent dat het meten van verstaanbaarheid op basis van

de ruisbestendigheid van spraak vergelijkbare resultaten oplevert met een globale perceptuele

beoordeling van verstaanbaarheid. De methode gebaseerd op ruisbestendigheid kan aldus

gehanteerd worden in de klinische praktijk om verstaanbaarheid van afwijkende spraak te

meten.

Keywords: Spraakverstaanbaarheid beoordeling, pathologische spraak, ruismenging


Abstract

Speech intelligibility is internationally recognized as a very important measure for the

severity of the pathological condition of a person with a speech disorder. It gives information

about the disabilities and handicap the person is experiencing in the society. In the Dutch

language, speech intelligibility of people with a speech disorder can be investigated with a

number of methods. On one hand, there are assessment scales for dysarthria and, on the other

hand, there is the instrumental Dutch Intelligibility Assessment or simply DIA. This study

introduces a new method where “noise resistance” is used as an indicator for intelligibility of

deviant speech and namely for several speech problems. In this study twenty subjects were

asked to rank perceptually a number of speech samples from most to least intelligible. Both

words and phrases were present in the speech samples. Twenty other subjects were offered the

same speech fragments mixed with various degrees of noise, starting with the most disturbed

version. This data was examined from which signal-to-noise ratio speech is understood. The

results show a strong correlation between the two parts, where the strongest correlation is

found at sentence level. This means that measuring speech intelligibility based on the noise

resistance of speech gives similar results to a perceptual assessment of intelligibility. The

method based on noise resistance can thus be used in clinical practice to measure

intelligibility of deviant speech.

Keywords: Speech intelligibility assessment, pathological speech, noise resistance


Introductie

Spraakverstaanbaarheid kan in verschillende mate aangetast zijn bij aandoeningen zoals

gehoorstoornissen, afwijkingen van de spraakorganen, dysartrie en laryngectomie. Het

verbeteren van de spraakverstaanbaarheid is het hoofddoel van logopedische therapie bij

personen met een congenitale of verworven spraakstoornis (Versonnen, De Bodt, Van

Borsel,& Wuyts, 2004). Spraakverstaanbaarheid wordt internationaal erkend als een zeer

belangrijke maat voor de ernst van de pathologische conditie.

Het begrip ‘spraakverstaanbaarheid’

Verstaanbaarheid wordt door Yorkston, Strand en Kennedy (1996) en Kent, Weismer, Kent

en Rosenbek (1989) gedefinieerd als wat door de luisteraars begrepen wordt van de fonetische

realisatie van spraak. Spraakverstaanbaarheid zegt dus enkel en alleen iets over de spraak van

de persoon. Begrijpelijkheid is een ruimer begrip en houdt ook rekening met de pragmatische

en semantische aspecten van taal (Yorkston et al., 1996). Daarnaast moet het verschil tussen

de begrippen spraakverstaanbaarheid en spraakverstaan duidelijk zijn. Dit onderscheid wordt

door Versonnen et al. (2004) verduidelijkt. Met spraakverstaanbaarheid wordt bedoeld de

mate waarin een persoon zich door middel van spraak verstaanbaar kan maken.

Verstaanbaarheid heeft dus betrekking op de spreker zelf. Dit mag niet verward worden met

het begrip spraakverstaan, wat iets zegt over de mate waarin een persoon spraak kan

begrijpen. Spraakverstaan heeft betrekking op de luisteraar in kwestie.

Klinische relevantie van spraakverstaanbaarheidsonderzoek

Het model van de International Classification of Function, Disability and Health (World

Health Organisation Collaborating Centre for the Family of International Classifications

[WHO-FIC], 2002) geeft informatie over het menselijk functioneren van een persoon met een

aandoening of ziekte. Dit model, toegepast op personen met een spraakstoornis,wordt

voorgesteld in figuur 1. Zoals uit het schema blijkt, heeft een spraakstoornis een impact op de

activiteiten en participatie van het individu, met andere woorden: ze geeft informatie over de

beperking en handicap die de persoon in kwestie ondervindt in de maatschappij. Met

‘beperking’ wordt in dit opzicht de spraakverstaanbaarheid van het individu bedoeld. Verder


volgt uit het model dat verstaanbaarheid van afwijkende spraakbepaald wordt door functies

van een individu en zijn anatomische eigenschappen. ‘Functies’ verwijzen naar de mate van

functioneren van vier subsystemen van spraak: fonatie, articulatie, resonantie en prosodie. De

impact van een bepaald subsysteem varieert naargelang de spraakstoornis (De Bodt,

Hernández-Díaz Huici, & Van De Heyning, 2002). ‘Anatomische eigenschappen’ refereren

naar de aan- of afwezigheid van afwijkingen van het lichaam, bijvoorbeeld van de

spraakorganen. In het schema zijn ook externe en persoonlijke factoren opgenomen om te

tonen dat ook zij van invloed kunnen zijn op iemands gezondheidstoestand. De mate van

verstaanbaarheid van een persoon wordt dus gebruikt om de impact van een stoornis op het

communicatief functioneren van de spreker te bepalen.

Figuur 1: International Classification of Function, Disability and Health (WHO-FIC Collaborating Centre,

2002),toegepast op personen met een spraakstoornis.

Daarnaast kan een kwalitatieve analyse van het probleem met behulp van een

verstaanbaarheidsonderzoek van nut zijn voor diagnose en therapie. Scores

voorspraakverstaanbaarheid kunnen een middel zijn om de evolutie in de spraakproductie op

te volgen. Dit kan enerzijds toegepast worden om progressieve of recupererende

ziektebeelden in kaart te brengen, anderzijds geeft het informatie over het effect van therapie

(Ansel & Kent, 1992).

Verder bewijst spraakverstaanbaarheidsonderzoek zijn nut als een test voor de effectiviteit

van hulpmiddelen voor gehoorgestoorden: gehoorgestoorde kinderen met een cochleair


implant zijn verondersteld verstaanbaarder te spreken. Zo is op basis van

spraakverstaanbaarheidsonderzoek de effectiviteit van een cochleair implant aangetoond in

vergelijking met hoorapparaten (Baudonck, Dhooge, D’haeseleer, & Van Lierde, 2010;

Baudonck, Dhooge,& Van Lierde, 2010).

Bestaande methoden voor het meten van spraakverstaanbaarheid

In de klinische praktijk is perceptueel onderzoek de gouden standaard voor wat betreft het

meten van spraakverstaanbaarheid van afwijkende spraak. Enerzijds zijn er

beoordelingsschalen, waarbij een ruwe algemene index voor verstaanbaarheid wordt

bekomen. Voor het Nederlands is er de vertaalde versie van het Frenchay Dysarthria

Assessment (Enderby, 1980) en het logopedisch dysartrieprotocol van Druyts, Kalmeijer en

De Bodt (1998). Anderzijds is er het onderzoek gebaseerd op het gebruik van

meetinstrumenten. Men spreekt van een meetinstrument als een score bekomen wordt op basis

van een zuivere meting en niet op basis van een schatting.Bij meetinstrumentenwordt gebruik

gemaakt van lijsten van woorden en zinnen. Het enige meetinstrument dat geconstrueerd is

specifiek voor het Nederlands is het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of

kortweg NSVO (Middag, Martens, Van Nuffelen, & De Bodt, 2009b; Van Nuffelen, De Bodt,

Guns, Wuyts, & Van de Heyning, 2008; Van Nuffelen, De Bodt, Middag, & Martens, 2009)..

Met dit perceptueel onderzoek wordt het percentage correct geïdentificeerde fonemen

bekomen. Er bestaat ook een versie op zinsniveau. Later is er een geautomatiseerde versie van

NSVO ontwikkeld, waarbij een computer in de plaats wordt gesteld van de menselijke

luisteraar (Middag, Martens, Van Nuffelen, & De Bodt, 2009a; Middag, Van Nuffelen,

Martens, & De Bodt, 2008).Deze methode is objectiever dan de originele versie.

Deze studie: een nieuwe methode

In deze studie wordt getracht een methode te ontwikkelen om spraakverstaanbaarheid op een

nieuwe manier te beoordelen. Hiervoor wordt “ruisbestendigheid” gebruikt als een indicator

voor spraakverstaanbaarheid. We definiëren “ruisbestendigheid” als de signaal-

ruisverhouding waarvoor spraak nog verstaanbaar is.


Een groep proefpersonen krijgt de opdracht een aantal spraakstalen perceptueel te ordenen

van best verstaanbaar tot slechtst verstaanbaar. Het betreft spraakstalen van zowel kinderen

als volwassenen met een spraakstoornis gaande van licht tot ernstig afwijkend. Zowel

woorden als korte frasen komen aan bod. Aan een andere groep proefpersonen worden

dezelfde spraakfragmenten aangeboden gemengd met verschillende graden van ruis,

beginnend bij het meest verstoorde spraakstaal. Hierbij wordt onderzocht vanaf welke

signaal-ruisverhouding de spraak wordt verstaan.

De hypothese die vooropgesteld wordt is dat er een verband bestaat tussen enerzijds de

globale perceptuele beoordeling van verstaanbaarheid en anderzijds de “ruisbestendigheid”

van spraak.

Werkwijze

Deze studie beschrijft een nieuwe methode om de verstaanbaarheid van afwijkende spraak te

bepalen. Daartoe werd ruisbestendigheid gebruikt als een indicator voor

spraakverstaanbaarheid. Het onderzoek bestaat uit twee verschillende luiken.

Methode

In een eerste luik wordt aan twintig normaalhorende, niet-ervaren beoordelaars gevraagd om

de woorden en frasen te beoordelen op spraakverstaanbaarheid. Dit gebeurt via een

toernooisysteem, wat uiteindelijk leidt tot een volledige rangschikking van de spraakstalen

van best tot slechtst verstaanbaar. Het toernooisysteem voor de woorden a tot p, 24

spraakstalen, bestaat uit 60 verschillende paren die moeten worden beoordeeld. Een te

beoordelen paar van spraakstalen noemen we een “match”. Het spraakstaal dat als best wordt

beoordeeld gaat door naar een volgende ronde en komt dan uit tegen het best beoordeelde

spraakstaal uit een andere match. Het toernooisysteem voor de zinnen a tot x wordt grafisch

voorgesteld in figuur 2. Voor de korte zinnen, of frasen, wordt eenzelfde toernooisysteem

gehanteerd. Hier worden 16spraakstalen gebruikt, die in 32 verschillende paren worden

beoordeeld. Figuur 3 geeft een grafische voorstelling van het toernooisysteem voor zinnen.


Voor het tweede luik van het onderzoek werden de spraakstalen met ruis gemengd. Op die

manier werden dertien verschillende versies van elk spraakstaal gecreëerd met elk een

verschillend niveau van signaal-ruisverhouding. Twintig normaalhorende, niet-ervaren

proefpersonen, verschillend van de beoordelaars uit het eerste luik, beoordelen in dit tweede

luik de met ruis gemengde spraakstalen. De opdracht die ze hierbij krijgen is aangeven wat er

in het spraakstaal wordt gezegd. Ze krijgen de spraakstalen aangeboden startend met de meest

verstoorde versie van het spraakstaal. Daarna wordt steeds een andere versie van het

spraakstaal aangeboden met een opklimmende, dus gunstiger wordende, graad van signaal-

ruisverhouding. Van zodra de beoordelaars mondelingkunnen aangeven wat in het spraakstaal

wordt gezegd of wanneer het hoogste niveau van signaal-ruisverhouding wordt bereikt, wordt

overgegaan op een volgend spraakstaal. Het mondeling gegeven antwoord wordt per

verschillend niveau van signaal-ruisverhouding door de testleider genoteerd. De woorden

worden als correct beschouwd wanneer alle fonemen worden herkend. De zinnen worden als

correct beschouwd wanneer alle woorden worden verstaan. De proefpersonen hoeven hierbij

niet zeker te zijn van hun antwoord, een correcte gok wordt meegerekend. In laatste instantie

werden de scores van beide luiken met elkaar gecorreleerd.

Figuur 2: Overzicht beoordelingstoernooi voor woorden. Dit beoordelingstoernooi bestaat uit vier rondes, de

winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking bekomen van de

twaalf best beoordeelde spraakstalen, links bevinden zich de twaalf slechtst beoordeelde spraakstalen.


Figuur 3: Overzicht beoordelingstoernooi voor zinnen. Dit beoordelingssysteem bestaat uit vier rondes, de

winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking van de acht best

beoordeelde spraakstalen bekomen, links bevinden zich de acht slechtst beoordeelde spraakstalen.

Materiaal

Om de spraakverstaanbaarheid door middel van ruismenging na te gaan werd gebruik

gemaakt van diverse spraakstalen. Alle spraakstalen zijn afwijkend: zowel articulatie-, stem-,

en gehoorstoornissen als laryngectomie- en dysartriepatiënten komen aan bod. Die

verscheidenheid werd gebruikt met het doel van deze studie voor ogen. We willen immers een

nieuw systeem ontwerpen om spraakverstaanbaarheid bij verscheidene stoornissen te

beoordelen.

Spraakstalen werden bekomen via onze promotor Prof. Dr. Corthals. Andere spraakstalen

werden geselecteerd uit het Dutch Corpus of Pathological and Normal Speech (Van Nuffelen

& De Bodt, 2011).

Daaruit werden 24 woorden en 16 frasen geselecteerd, waarin diverse graden van

spraakverstaanbaarheid vertegenwoordigd zijn. Dit is gebaseerd op de eigen perceptuele

beoordeling van de auteurs. De meerderheid, zeventien, van de woorden bestaan uit twee

syllaben. Verder zijn er vier woorden bestaande uit drie syllaben, twee woorden van vier

syllaben en één monosyllabisch woord. De frasen bestaan gemiddeld uit 6,4 woorden, met een


minimum van 4 en een maximum van 9 woorden. Een overzicht van de doelwoorden en -

zinnen is terug te vinden in bijlage. Het intensiteitsniveau van de verschillende spraakstalen

werd in Praat (Boersma & Weenink, 1996) gelijkgesteld tot een niveau van 80dB.

Voor het tweede luik van het onderzoek, werden de spraakstalen met ruis gemengd. Dit

gebeurde via een script in Praat (Corthals, P.). Zo werden per woord en frase dertien versies

bekomen met elk een verschillende signaal-ruisverhouding, dit gaande van een signaal-

ruisverhouding van -15dB tot +18dB, in stapjes van 3dB. De dertiende versie die werd

gebruikt, is de versie zonder ruis.

Beoordelaars

Voor het eerste luik van het onderzoek, het bekomen van een volledige rangschikking via het

toernooisysteem, gebeurde de beoordeling door twintig niet-ervaren normaalhorende

proefpersonen. Allen hebben een niet-sprekersberoep of zijn studenten uit een niet-talige

richting. De gemiddelde leeftijd van deze groep beoordelaars is 26,5jaar. De minimumleeftijd

bedraagt 18 en de maximumleeftijd 53jaar. Aan de beoordelaars werd in vrij veld telkens een

paar van twee verschillende spraakstalen aangeboden. De beoordelaars kregen de

mogelijkheid om elk spraakstaal per “match” maximaal twee maal te beluisteren. Daarna

moesten ze aangeven welke van de twee volgens hen het best verstaanbaar is, zonder hier

dieper op in te gaan.

Voor het tweede luik van het onderzoek, de beoordeling van wat er gezegd wordt in de

spraakstalen met ruismenging, werd eveneens beroep gedaan op twintig niet-ervaren

beoordelaars. Van de werkende proefpersonen heeft geen enkele persoon een sprekersberoep,

hiernaast zijn ook studenten uit een niet-talige richting vertegenwoordigd. De gemiddelde

leeftijd van deze groep beoordelaars is 30jaar. De minimum- en maximumleeftijd bedraagt

respectievelijk 19 en 53 jaar. De spraakstalen werden in vrij veld aangeboden en elk niveau

van ruismenging mocht slechts éénmaal worden beluisterd. Startend met de meest verstoorde

versie van het spraakstaal werd hen individueel gevraagd aan te geven wat er in het

spraakstaal gezegd werd. De spraakstalen worden aangeboden met een steeds groter

wordende signaal-ruisverhouding totdat de beoordelaar correct aangeeft wat er gezegd wordt.

Hiertoe geeft de proefpersoon mondeling aan wat hij meent te hebben verstaan. Dit antwoord

wordt, per graad van signaal-ruisverhouding, genoteerd door de testleider.


Resultaten

Voor het eerste luik, de perceptuele beoordeling via het toernooisysteem, werd per

proefpersoon een volledige rangschikking van woorden en frasen apart bekomen. Vervolgens

werd van elk item de gemiddelde plaats in de rangschikking, over de twintig beoordelaars,

berekend.

De beoordeling via ruismenging in het tweede luik resulteerde in een niveau van

ruisbestendigheid per spraakstaal en per proefpersoon. Zoals eerder vermeld, werden er

maximaal dertien verschillende versies aangeboden. Zodoende kon hier een score gaande van

1, coderend voor een signaal-ruisverhouding van -15 dB waarop het spraakstaal werd

verstaan, tot een score van 14 worden bekomen. Een score van 12 codeert voor een signaal-

ruisverhouding van +18 dB. Wanneer het spraakstaal enkel zonder toegevoegde ruis werd

verstaan, werd een score van 13 gegeven. Bijkomend werd een score van 14 toegekend

wanneer het spraakstaal zelfs bij het hoogste niveau van signaal-ruisverhouding nog niet werd

verstaan. De gemiddelde plaats in de rangschikking en de gemiddelde score overeenkomstig

de ruisbestendigheid wordt per spraakstaal weergegeven in tabel 1.

Tabel 1:

Gemiddelde plaats in rangschikking en gemiddelde score voor ruisbestendigheid per item

Itema Gemiddelde plaats

in rangschikking

Gemiddelde score

voor ruisbestendigheid

Itema Gemiddelde plaats

in rangschikking

Gemiddelde score

voor ruisbestendigheid

Za 11,65 13,2 We 9,7 6

Zb 3,45 11,35 Wf 4,65 5,4

Zc 15,2 14 Wg 9 8,55

Zd 6,1 11,8 Wh 19,3 4,75

Ze 3,35 10,5 Wi 12,05 8,1

Zf 11,45 11,15 Wj 10,75 7,1

Zg 7,15 12,65 Wk 4,6 7,4

Zh 11,1 12,75 Wl 20,7 13,95

Zi 14,65 14 Wm 4,2 6,75

Zj 7,05 7,25 Wn 16,4 5,8

Zk 9,75 9,05 Wo 23,4 13,8

Zl 1,95 3,2 Wp 7,6 7,75

Zm 5,45 4,85 Wq 3,85 5,6

Zn 12,65 14 Wr 17,4 14

Zo 8,65 12,75 Ws 15,7 13,55

Zp 6,4 6,4 Wt 15,1 9,45

Wa 14,45 4,5 Wu 16,7 13,3

Wb 7,55 3,35 Wv 9,1 9,15

Wc 22,4 14 Ww 19 13,4

Wd 9,5 12,55 Wx 6,9 12,75 a Z: zin, W: woord


Met deze nieuwe waarden, de gemiddelden, kan voor de woorden en frasen afzonderlijk een

nieuwe rangschikking worden bekomen. Zo wordt een rangschikking bekomen voor de

woorden, waarbij elk woord een plaats krijgt binnen een top 24voor enerzijds de globale

rangschikking en anderzijds de beoordeling via ruismenging. Voor de frasen wordt, ook voor

zowel de globale beoordeling als voor de beoordeling via ruismenging een top 16bekomen.

Het is met deze rangschikking dat de statistische berekeningen worden gedaan.

Per item werd het verschil in rang berekend tussen de perceptuele beoordeling via het tornooi

en deze via ruismenging. Een positief verschil wijst op een betere beoordeling via

ruismenging dan via de globale rangschikking. Daarentegen duidt een negatief verschil op een

minder goede beoordeling via ruismenging. De grootte van het verschil geeft aan hoeveel

plaatsen een item opschuift in de rangschikking.

Figuur 4 stelt die veranderingen voor de frasen voor. De veranderingen vanaf 25% of 4

plaatsen worden als opvallend beschouwd. De 5 plaatsen achteruitgang van zin b in de

beoordeling via ruismenging en 4 plaatsen voor zinnen d en e zijn frappant. Zinnen f en k

daarentegen worden merkelijk beter beoordeeld via de ruismenging, ze stijgen 5 plaatsen in

de rangschikking.

Figuur 4: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per zin.


De veranderingen voor woorden worden gevisualiseerd in figuur 5. Opnieuw worden

veranderingen vanaf 25% als opvallend beschouwd. Die verandering van 25% komt bij de

woorden overeen met een opschuiving in rang van 6 plaatsen. Met deze drempelwaarde blijkt

de achteruitgang van woord x met 12 plaatsen, woord k met 7 plaatsen en woorden d en m

met 6 plaatsen in beoordeling via ruismenging opvallend. Grote vooruitgang in beoordeling

via ruismenging ten opzichte van de globale rangschikking uit luik 1 zien we bij woorden h, a

en n. Respectievelijk schuiven ze 18, 12 en 11 plaatsen op.

Figuur 5: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per woord.

Zoals hierboven vermeld, werden de berekende gemiddelden gebruikt om een nieuwe

rangschikking voor beide luiken, dit voor woorden en frasen afzonderlijk, te bekomen. Deze

gegevens dienen nu als basis voor de correlatieberekening. De correlaties die hier worden

bekomen geven dus de overeenkomst aan tussen resultaten van de globale perceptuele

beoordeling en beoordeling via ruismenging.


De Spearman rangcorrelatiecoëfficiënt die aldus werd bekomen bedraagt voor de zinnen 0.79.

De significantie van dit resultaat is zeer sterk (p < 0.001). Op woordniveau kon een sterk

significante relatie (p < 0.01) worden aangetoond, en dit met een Spearman

rangcorrelatiecoëfficiënt van 0.55. In Figuur 6 wordt deze correlatie uitgezet in een

spreidingsdiagram.

Deze resultaten suggereren dat er een samenhang is, voor zowel woorden als frasen, tussen de

globale beoordeling uit luik 1 enerzijds en de methode via ruismenging anderzijds. De

correlatie voor de zinnen is hoger dan voor woorden. Dit blijkt eveneens uit het

spreidingsdiagram.

Figuur 6: Spreidingsdiagram voor zinnen en woorden.

rS zin = 0.79

rS woord = 0.55


Discussie

Interpretatie van de gevonden correlaties

Met dit onderzoek kon statistisch worden aangetoond dat er een correlatie bestaat tussen de

globale rangschikking van afwijkende spraak en de nieuw geïntroduceerde methode voor

beoordeling via ruismenging. Hiermee kan de hypothese die werd gesteld aanvaard worden.

De gevonden correlatie voor zinnen (0.79) is sterker dan die voor woorden (0.55). In dit

onderzoek werden 24 spraakstalen van woorden gebruikt en slechts 16 van zinnen. De invloed

van dit verschil in aantal kan niet worden uitgesloten. Toch dient er rekening gehouden te

worden met de mogelijkheid dat zinnen meer geschikt zijn voor de beoordeling van

spraakverstaanbaarheid dan woorden. Spraak op zinsniveau leunt immers dichter aan bij

spontane spraak dan geïsoleerde woorden. De mogelijkheid bestaat dat beoordelaars voor

zinnen een gelijkaardige perceptiestrategie gebruikt hebben in beide luiken. Dit is minder

mogelijk voor losse woorden. De betere correlatie voor zinnen kan zo worden verklaard.

In beide luiken is er een element aan te halen dat mogelijk een invloed heeft gehad op de

bekomen correlaties. Ze verhinderen mogelijk het optreden van hogere correlaties. In het

eerste luik kent de opzet van het beoordelingssysteem met matchen beperkingen. Voordat de

spraakstalen aan de beoordelaars werden voorgelegd, werden ze onderworpen aan een eerste

selectie en ordening, gebaseerd op de perceptuele beoordeling van beide auteurs. Deze

consensusbeoordeling was bepalend voor het verder verloop van het onderzoek. Immers, het

ontwerp van het toernooisysteem is zo, dat onze rangschikking kan worden bekomen. Een

aantal andere ordeningen worden hiermee automatisch uitgesloten. Een meer uitgebreide

voorronde, bij meer dan twee personen, om uiteindelijk het toernooisysteem op te baseren had

misschien hogere correlaties met zich meegebracht.

Ook de manier van beoordelen van woorden en zinnen in het tweede luik, via ruismenging,

kan als beperking worden gezien. De groep beoordelaars werd gevraagd aan te geven welk

woord of welke zin ze te horen kregen. Hun antwoorden werden gescoord in alles of niets

fenomenen. Een woord werd immers pas als correct beschouwd wanneer alle fonemen correct

waren. Zinnen kregen een correcte score indien alle woorden correct werden aangegeven. De

introductie van scores volgens een percentage correcte fonemen bij woorden of een

procentuele score van correcte woorden bij zinnen geeft mogelijks een gedifferentieerder

beeld en betere correlaties.


Interpretatie van de resultaten op zinsniveau

Een aantal zinnen dient speciale aandacht te krijgen, hun plaats in rangschikking tussen beide

luiken kent immers een verschil van minstens 25%. Er wordt dan ook dieper ingegaan op die

individuele zinnen.

Voor zinnen b, d en e worden opmerkelijke verschillen in rang vastgesteld tussen beide luiken

van het onderzoek. Hierbij wordt de beste score gevonden in het eerste luik, dit is de

beoordeling op verstaanbaarheid. Dit kan wellicht verklaard worden op basis van onderzoek

naar de prosodie, meer bepaald de intonatie. Elk van deze zinnen heeft immers een incorrecte

intonatie. Als beoordelaar in het eerste luik is men geneigd de verstaanbaarheid te toetsen

door louter de aan- of afwezigheid van prosodie te observeren. In elk van deze zinnen is

prosodie wel degelijk aanwezig, waardoor de luisteraar geneigd is deze spraak als relatief

goed verstaanbaar aan te duiden. Toch blijkt de analyse van wat de spreker precies verwoordt,

zoals onderzocht in het tweede luik, complex aangezien de aanwezige intonatie niet de juiste

is. De proefpersoon wordt in het eerste luik met andere woorden misleid door de

aanwezigheid van incorrecte prosodie. Een andere mogelijke verklaring voor dit fenomeen is

de volgende. De beoordelaars in het eerste luik zijn zich mogelijks niet bewust van de impact

die een foutieve intonatie kan hebben op de verstaanbaarheid. Ze brengen dit aspect niet of

niet voldoende in rekening bij hun beoordeling. Het is denkbaar dat een ander resultaat wordt

bekomen indien gewerkt wordt met professionelen in dit vak, en niet met leken zoals hier het

geval was.

Er is alsnog een zin, item n, waarbij intonatie duidelijk aanwezig is, maar foutief. Hoe komt

het dat bij deze zin er geen opmerkelijk verschil te vinden is tussen de resultaten van de

verschillende onderzoeksluiken? Dit kan verklaard worden door het feit dat bij deze zin niet

enkel het prosodische aspect meespeelt, maar dat ook de articulatie in deze frase ondermaats

is. Hierdoor krijgt deze zin bij de beoordeling in het eerste luik reeds een slechte score voor

verstaanbaarheid toegekend.

Tot slot is er nog een aspect dat aandacht verdient bij het analyseren van deze zinnen.

Opvallend is dat twee van deze zinnen afkomstig zijn van gehoorgestoorden. Prosodie is

immers bij gehoorgestoorden vaak problematisch. Bij zin b, ingesproken door een persoon

met een stemstoornis, gaat het wellicht om een toevallige prosodische abnormaliteit.


Zinnen f en k scoren opmerkelijk slechter bij het eerste luik, de perceptuele beoordeling van

de spraakverstaanbaarheid. De verklaring moet mogelijks gezocht worden bij de startsituatie

van het opgestelde beoordelingstoernooi. Zinnen f en k moesten het immers reeds in de eerste

ronde opnemen tegen respectievelijk zinnen e en l, dewelke uiteindelijk de twee best

verstaanbare zinnen bleken te zijn. Hierdoor kwamen zinnen f en k na de eerste ronde alvast

terecht bij de acht slechtst verstaanbare zinnen.

Interpretatie van de resultaten op woordniveau

Er wordt gekeken naar de individuele woorden waarbij verschillen groter dan 25% in rang

gezien worden tussen beide onderzoeksluiken.

De woorden d, k, m en x krijgen opmerkelijk betere scores bij het eerste onderzoeksluik, de

perceptuele beoordeling van verstaanbaarheid. Een potentiële verklaring hiervoor wordt

opnieuw gezocht bij de prosodie. Het is namelijk zo dat de klemtoon bij elk van deze woorden

verkeerd ligt. Niet toevallig gaat het hier ook om spraakstalen van gehoorgestoorden.

Prosodische abnormaliteiten komen immers frequent voor bij gehoorgestoorden. Opnieuw

verwijzen we hier, parallel met de verklaring bij de prosodisch gestoorde zinnen, naar de reële

kans dat beoordelaars in het eerste luik geen of onvoldoende aandacht besteden aan de

afwijkende klemtoon van deze woorden. De fonemen op zich worden goed verstaan en

bijgevolg worden deze woorden goed beoordeeld. De mogelijke impact van een foutieve

klemtoon op de verstaanbaarheid wordt onderschat. In het tweede luik blijkt dan dat foutieve

klemtoon de identificatie van het doelwoord wel degelijk bemoeilijkt en aldus als

beïnvloedende factor kan worden beschouwd. Waarom zet deze trend zich niet verder bij de

andere woorden geproduceerd door gehoorgestoorden? Hier ligt de verklaring wellicht bij het

aantal lettergrepen dat de woorden bevatten. De kans om een klemtoon verkeerd te leggen bij

een drie- of vierlettergrepig woord is groter dan bij een tweelettergrepig woord. Dit zien we

dan ook gebeuren bij de woorden k, m en x. Hoewel de kans om een foutieve klemtoon te

leggen bij een tweelettergrepig woord kleiner is, is ze zeker niet onbestaande. Dit zien we

gebeuren bij het tweelettergrepig woord d.

De woorden a, h en n scoren beduidend beter op het tweede onderzoeksluik, waarbij de

woorden herkend moeten worden. Elk van deze woorden is afkomstig van een persoon met

een articulatiestoornis. Mogelijks ligt de oorzaak bij het verschillend uitgangspunt van


waaruit de proefpersonen vertrekken voor wat betreft de twee aparte onderzoeksluiken. Bij

luik twee schenkt de proefpersoon aandacht aan de fonemen die hij in grote lijnen door de ruis

heen meent te horen. Vervolgens zoekt deze persoon in zijn vocabularium naar een woord dat

er min of meer op gelijkt. De proefpersoon is met andere woorden niet erg streng bij het

oproepen van potentiële termen aangezien er ruis mee gemengd is, en aangezien gokken

toegestaan is. Vanaf het moment dat de fonemenreeks die door de proefpersoon verstaan is

grosso modo overeenkomt met een woord opgeroepen in het vocabularium, is dit genoeg om

een gok te wagen. Bij luik één daarentegen, de beoordeling van de verstaanbaarheid, focust de

proefpersoon zich op het gehele woord waarbij elk foneem in acht wordt genomen. Woorden

met zelfs maar één foneemsubstitutie kunnen hierop afgestraft worden door zo een lagere

score voor verstaanbaarheid toegekend te krijgen.

Vergelijking bestaande methodes voor het bepalen van spraakverstaanbaarheid

In wat volgt vergelijken wede nieuwe methode voor spraakverstaanbaarheidsbeoordeling via

ruismenging met de bestaande beoordelingsschalen (Frenchay Dysarthria Assessment

(Enderby, 1983) en het logopedisch dysartrieprotocol (Druyts et al, 1998)) enerzijds en met

het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek (Middag et al., 2009b; Van Nuffelen,

et al., 2008; Van Nuffelen, et al., 2009) anderzijds.

Een belangrijk voordeel van deze methode ten opzichte van de ernstschalen is de

bruikbaarheid ervan bij verschillende spraakproblematieken. Dit systeem werd immers, naast

dysartrie, ook toegepast bij articulatie-, stem-, gehoor- en laryngectomieproblematiek. Een

ander voordeel ten opzichte van de ernstschalen werd ons aangegeven door de beoordelaars

zelf. Bij het eerste luik was er veel twijfel bij het vergelijken van de spraakstalen.

Beoordelaars vroegen frequent om herhaling en ze waren niet steeds zeker van hun antwoord.

Bij de methode met ruismenging was dit niet het geval, de beoordelaars hadden het woord wel

of niet verstaan of konden via het overlopen van hun inwendig vocabularium een woord

selecteren. Dit wijst erop dat de methode via ruismenging eenvoudiger is in gebruik, terwijl

een globale perceptuele beoordeling steeds twijfel en dus een vorm van onzekerheid en

onbetrouwbaarheid met zich meebrengt. Een voordeel ten opzichte van het NSVO is de

incorporatie van prosodie als spraakkenmerk. Dit blijkt een invloed te hebben op de

spraakverstaanbaarheid en is vaak problematisch bij gehoorgestoorden. Zowel klemtoon als

intonatie kan de spraakverstaanbaarheid op een negatieve manier beïnvloeden.


Een nadeel van deze methode ten opzichte van de beoordelingsschalen is de afwezigheid van

een beoordeling van spontane spraak of eenheden groter dan zinnen. De ernstschalen geven

een snelle indruk van de spraakverstaanbaarheid, terwijl deze methode complexer is en meer

tijd in beslag neemt. Ten opzichte van het NSVO is een nadeel van de methode via

ruismenging dat semantische en pragmatische informatie niet kan worden uitgesloten. Deze

elementen maken immers, volgens de definitie, geen deel uit van spraakverstaanbaarheid. Ze

maken wel deel uit van de begrijpelijkheid van spraak. Los van de bestaande Nederlandstalige

beoordelingssystemen is er een andere beperking van deze methode. De therapeut of de

persoon die deze methode toepast moet beschikken over een luisteraarspanel aangezien de

onderzoeker niet als beoordelaar aangesteld mag worden indien hij zelf de opname maakt. De

spraak mag immers in geen geval op voorhand worden gehoord zonder toegevoegde ruis. Dit

vormt een belangrijke praktische implicatie van deze methode.

Suggesties verder onderzoek

Suggesties voor verder onderzoek zijn het opnieuw berekenen van correlaties op eenzelfde

manier maar hierbij een meer uitgebreide voorronde voorzien. De spraakstalen dienen op

voorhand door meerdere personen worden beoordeeld. In dit onderzoek werden twee zinnen

immers belemmerd in een hogere positie door dit gegeven. Ook kan deze methode worden

toegepast bij eenheden groter dan zinnen of spontane spraak.


Conclusie

De resultaten van dit onderzoek geven een significante correlatie aan voor woorden en zinnen

tussen de globale perceptuele beoordeling enerzijds en beoordeling via ruismenging

anderzijds. Vermits een globale perceptuele manier om pathologische spraak te beoordelen

algemeen aanvaard wordt, is de ruisbestendigheid van spraak een te hanteren hulpmiddel voor

therapeutische doeleinden.

De therapeut of persoon die deze methode wenst toe te passen, mag in geen geval zelf als

beoordelaar aangesteld worden. Voor deze methode heeft de onderzoeker dus een

luisteraarspanel nodig. Dit vormt een praktische implicatie van cruciaal belang.

Verder moet binnen deze methode ook rekening gehouden worden met een mogelijk verschil

in spraakverstaanbaarheid ten opzichte van globale perceptuele beoordeling bij articulatie -en

gehoorproblematieken. Op woordniveau zorgt de mogelijkheid tot gokken ervoor dat

articulatiestoornissen beter kunnen worden bevonden via ruismenging. Zowel op woord- als

op zinsniveau kan prosodie, respectievelijk onder de vorm van klemtoon en intonatie, bij

gehoorgestoorden een negatieve invloed hebben op de verstaanbaarheid. Vooral bij

meerlettergrepige woorden is er kans op een slechter resultaat door meer mogelijkheden tot

het leggen van een foutieve klemtoon.

Met dank aan

Het tot stand komen van dit werk was slechts mogelijk dankzij de medewerking van

verscheidene personen. Bijzondere dank gaat uit naar onze promotor, Prof. Dr. Corthals, voor

het aanreiken van het onderwerp, het opvolgen van het onderzoeken en het becommentariëren

van de tekst. Ook willen we hem bedanken voor het aanreiken van spraakstalen en het script

voor ruismenging in Praat. Daarnaast verdient Prof. Dr. De Bodt een gemeend woord van

dank voor het beschikbaar stellen van spraakstalen uit het Dutch Corpus of Pathological and

Normal Speech. Tot slot is een dankwoord verschuldigd aan alle proefpersonen die

meewerkten aan dit onderzoek. Dankzij hun bijdrage kon dit onderzoek volbracht worden.


Referenties

Ansel, B.M.,& Kent R.D. (1992). Acoustic-phonetic contrasts and intelligibility in the

dysarthria associated with mixed cerebral palsy. Journal of Speech and Hearing

Research,35, 296-308.

Baudonck, N., Dhooge, I., D’haeseleer, E.,& Van Lierde, K. (2010). A comparison of the

consonant production between Dutch children using cochlear implants and children using

hearing aids. International Journal of Pediatric Otorhinolaryngology, 74,416 – 421.

Baudonck, N., Dhooge, I., & Van Lierde, K. (2010). Intelligibility as hearing impaired

children as judged by their parents: A comparison between children using cochlear

implants and children using hearing aids. International Journal of Pediatric

Otorhinolaryngology, 74, 1310-1315.

Boersma, P., & Weenink, D. (2010). PRAAT: Doing phonetics by computer. (Version 5.2)

[Computer program]. Retrieved September 28, 2010, from: http://www.praat.org/.

De Bodt, M.S., Hernández-Díaz Huici, M.E., & Van De Heyning, P.H. (2002). Intelligibility

as a linear combination of dimensions in dysarthric speech. Journal of Communication

Disorders, 35, 283-292.

Druyts, N., Kalmeijer, J., & De Bodt, M. (1998). Een logopedisch protocol voor het

beoordelen van dysartrie. Logopedie, 11, 44-50.

Enderby, P. (1980). Frenchay dysarthria assessment. International Journal of Language and

Communication Disorders, 15, 165-173.

Kent, R.D., Weismer, G., Kent, J.F., & Rosenbek, J.C. (1989).Toward phonetic intelligibility

testing in dysarthria. Journal of Speech and Hearing Disorders, 54, 482-499.

Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). Automated intelligibility

of pathological speech using phonological features. EURASIP Journal on Advances in

Signal Processing, vol. 2009.

Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). DIA: a tool for objective

intelligibility assessment of pathological speech. 6th International workshop on Models

and Analysis of Vocal Emissions for Biomedical Application,165-167, Firenze, Italy.


Middag, C., Van Nuffelen, G., Martens J.P., & De Bodt, M. (2008). Objective intelligibility

assessment of pathological speakers. Interspeech 2008: 9th Annual conference of the

International Speech Communication Association, 1745-1748, Brisbane, Australia.

Van Nuffelen, G., De Bodt, M.,Guns, C., Wuyts, F., & Van de Heyning, P. (2008). Reliability

and clinical relevance of segmental analysis based on intelligibility assessment. Folia

Phoniatrica et Logopaedica, 60,264–268.

Van Nuffelen, G., De Bodt, M., Middag, C., & Martens, J.P. (2009). ‘Why an objective

intelligibility assessment?’ Closing symposium of the SPACE project, February 5-6,

Leuven. Retrieved from: .

http://www.esat.kuleuven.be/psi/spraak/projects/SPACE/events/closing/index.php.

Van Nuffelen, G., & De Bodt, M. (2011). COPAS: Dutch corpus of normal and pathological

speech. (Version 1.0).

Versonnen, A., De Bodt, M., Van Borsel, J., & Wuyts, F.L. (2004). Een

onderzoeksinstrument voor het bepalen van spraakverstaanbaarheid. Toepassing bij

volwassen dysartriepatiënten. Logopedie, 17, 33-38.

World Health Organisation Collaborating Centre for the Family of International

Classifications (2002). Nederlandse vertaling van de ‘International classification of

functioning, disability and health’ - compilatie. Retrieved from: http://www.rivm.nl/who-

fic/icf.htm.

Yorkston, K.M., Strand, E.A., & Kennedy, M.R.T. (1996). Comprehensibility of dysarthric

speech: Implications for assessment and treatment planning. American Journal of Speech-

Language Pathology, 5, 55-66.


Bijlage

Zinnen

a) Ze laat haar geldbeugel liggen.

b) Nu wil ik eerst afwachten.

c) Eerst hebben ze een kaart gekocht.

d) Wat doe ik aan mijn voeten.

e) Eten voor het slapengaan maakt dik.

f) Kijk toch eens uit waar je loopt.

g) Onze wegen liggen er slecht bij door de kou.

h) Plots toont ze de sleutel.

i) Wil je liever de thee of de borrel?

j) Dan stapt ze nog een beetje verder.

k) Ze betaalt de ober en gaat weer terug weg.

l) Zondag ben ik naar oma geweest.

m) Ze letten dan minder goed op.

n) We slapen te weinig.

o) Dat het enorm boeiend is met kinderen te werken.

p) Mijn been doet zo’n pijn.

Woorden

a) Appel

b) Roepen

c) Slang

d) Winkel

e) Eekhoorn

f) Knoopje

g) Zaterdag

h) Ballon

i) Juffrouw

j) Bloempot

k) Handtekening


l) Mensen

m) Evenwicht

n) Sleutel

o) Logopedist

p) Huilen

q) April

r) Puzzel

s) Drinken

t) Tafel

u) Horloge

v) Banaan

w) Banken

x) Vulkanen

Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...

Documents

Transcript of Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...