Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...
Transcript of Ontwerp praktische test voor verstaanbaarheid van …...functioneren van vier subsystemen van...
-
Faculteit Geneeskunde en Gezondheidswetenschappen
Academiejaar 2010-2011
Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak
Ine Van den Berghe
Dorien Van der Kerken
Promotor: Prof. Dr. Corthals
Scriptie voorgedragen tot het behalen van de graad van master in de logopedische en
audiologische wetenschappen
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 2
Ontwerp praktische test voor verstaanbaarheid van afwijkende spraak
Ine Van den Berghe
Dorien Van der Kerken
Promotor: Prof. Dr. Corthals
Abstract
Spraakverstaanbaarheid wordt internationaal erkend als een zeer belangrijke maat voor de
ernst van de pathologische conditie van een persoon met een spraakstoornis. Ze geeft
informatie over de beperking en handicap die de persoon in kwestie ondervindt in de
maatschappij. Om de spraakverstaanbaarheid van personen met een spraakstoornis te
onderzoeken zijn in het Nederlandse taalgebied een aantal methoden ter beschikking.
Enerzijds zijn er beoordelingsschalen voor dysartrie en anderzijds is er het instrumenteel
Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of kortweg NSVO. Deze studie reikt een
nieuwe methode aan waarbij “ruisbestendigheid” wordt gebruikt als indicator voor
spraakverstaanbaarheid van afwijkende spraak en dit voor verscheidene
spraakproblematieken. In dit onderzoek kregen twintig proefpersonen de opdracht een aantal
spraakstalen perceptueel te ordenen van best tot slechtst verstaanbaar, waarbij zowel woorden
als zinnen aan bod kwamen. Aan twintig andere proefpersonen werden dezelfde fragmenten
aangeboden gemengd met verschillende graden van ruis, beginnend bij de meest verstoorde
versie. Hierbij werd onderzocht vanaf welke signaal-ruisverhouding de spraak werd verstaan.
Uit de resultaten blijkt een sterke correlatie tussen beide luiken, waarbij het sterkste verband
gevonden wordt op zinsniveau. Dit betekent dat het meten van verstaanbaarheid op basis van
de ruisbestendigheid van spraak vergelijkbare resultaten oplevert met een globale perceptuele
beoordeling van verstaanbaarheid. De methode gebaseerd op ruisbestendigheid kan aldus
gehanteerd worden in de klinische praktijk om verstaanbaarheid van afwijkende spraak te
meten.
Keywords: Spraakverstaanbaarheid beoordeling, pathologische spraak, ruismenging
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 3
Abstract
Speech intelligibility is internationally recognized as a very important measure for the
severity of the pathological condition of a person with a speech disorder. It gives information
about the disabilities and handicap the person is experiencing in the society. In the Dutch
language, speech intelligibility of people with a speech disorder can be investigated with a
number of methods. On one hand, there are assessment scales for dysarthria and, on the other
hand, there is the instrumental Dutch Intelligibility Assessment or simply DIA. This study
introduces a new method where “noise resistance” is used as an indicator for intelligibility of
deviant speech and namely for several speech problems. In this study twenty subjects were
asked to rank perceptually a number of speech samples from most to least intelligible. Both
words and phrases were present in the speech samples. Twenty other subjects were offered the
same speech fragments mixed with various degrees of noise, starting with the most disturbed
version. This data was examined from which signal-to-noise ratio speech is understood. The
results show a strong correlation between the two parts, where the strongest correlation is
found at sentence level. This means that measuring speech intelligibility based on the noise
resistance of speech gives similar results to a perceptual assessment of intelligibility. The
method based on noise resistance can thus be used in clinical practice to measure
intelligibility of deviant speech.
Keywords: Speech intelligibility assessment, pathological speech, noise resistance
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 4
Introductie
Spraakverstaanbaarheid kan in verschillende mate aangetast zijn bij aandoeningen zoals
gehoorstoornissen, afwijkingen van de spraakorganen, dysartrie en laryngectomie. Het
verbeteren van de spraakverstaanbaarheid is het hoofddoel van logopedische therapie bij
personen met een congenitale of verworven spraakstoornis (Versonnen, De Bodt, Van
Borsel,& Wuyts, 2004). Spraakverstaanbaarheid wordt internationaal erkend als een zeer
belangrijke maat voor de ernst van de pathologische conditie.
Het begrip ‘spraakverstaanbaarheid’
Verstaanbaarheid wordt door Yorkston, Strand en Kennedy (1996) en Kent, Weismer, Kent
en Rosenbek (1989) gedefinieerd als wat door de luisteraars begrepen wordt van de fonetische
realisatie van spraak. Spraakverstaanbaarheid zegt dus enkel en alleen iets over de spraak van
de persoon. Begrijpelijkheid is een ruimer begrip en houdt ook rekening met de pragmatische
en semantische aspecten van taal (Yorkston et al., 1996). Daarnaast moet het verschil tussen
de begrippen spraakverstaanbaarheid en spraakverstaan duidelijk zijn. Dit onderscheid wordt
door Versonnen et al. (2004) verduidelijkt. Met spraakverstaanbaarheid wordt bedoeld de
mate waarin een persoon zich door middel van spraak verstaanbaar kan maken.
Verstaanbaarheid heeft dus betrekking op de spreker zelf. Dit mag niet verward worden met
het begrip spraakverstaan, wat iets zegt over de mate waarin een persoon spraak kan
begrijpen. Spraakverstaan heeft betrekking op de luisteraar in kwestie.
Klinische relevantie van spraakverstaanbaarheidsonderzoek
Het model van de International Classification of Function, Disability and Health (World
Health Organisation Collaborating Centre for the Family of International Classifications
[WHO-FIC], 2002) geeft informatie over het menselijk functioneren van een persoon met een
aandoening of ziekte. Dit model, toegepast op personen met een spraakstoornis,wordt
voorgesteld in figuur 1. Zoals uit het schema blijkt, heeft een spraakstoornis een impact op de
activiteiten en participatie van het individu, met andere woorden: ze geeft informatie over de
beperking en handicap die de persoon in kwestie ondervindt in de maatschappij. Met
‘beperking’ wordt in dit opzicht de spraakverstaanbaarheid van het individu bedoeld. Verder
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 5
volgt uit het model dat verstaanbaarheid van afwijkende spraakbepaald wordt door functies
van een individu en zijn anatomische eigenschappen. ‘Functies’ verwijzen naar de mate van
functioneren van vier subsystemen van spraak: fonatie, articulatie, resonantie en prosodie. De
impact van een bepaald subsysteem varieert naargelang de spraakstoornis (De Bodt,
Hernández-Díaz Huici, & Van De Heyning, 2002). ‘Anatomische eigenschappen’ refereren
naar de aan- of afwezigheid van afwijkingen van het lichaam, bijvoorbeeld van de
spraakorganen. In het schema zijn ook externe en persoonlijke factoren opgenomen om te
tonen dat ook zij van invloed kunnen zijn op iemands gezondheidstoestand. De mate van
verstaanbaarheid van een persoon wordt dus gebruikt om de impact van een stoornis op het
communicatief functioneren van de spreker te bepalen.
Figuur 1: International Classification of Function, Disability and Health (WHO-FIC Collaborating Centre,
2002),toegepast op personen met een spraakstoornis.
Daarnaast kan een kwalitatieve analyse van het probleem met behulp van een
verstaanbaarheidsonderzoek van nut zijn voor diagnose en therapie. Scores
voorspraakverstaanbaarheid kunnen een middel zijn om de evolutie in de spraakproductie op
te volgen. Dit kan enerzijds toegepast worden om progressieve of recupererende
ziektebeelden in kaart te brengen, anderzijds geeft het informatie over het effect van therapie
(Ansel & Kent, 1992).
Verder bewijst spraakverstaanbaarheidsonderzoek zijn nut als een test voor de effectiviteit
van hulpmiddelen voor gehoorgestoorden: gehoorgestoorde kinderen met een cochleair
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 6
implant zijn verondersteld verstaanbaarder te spreken. Zo is op basis van
spraakverstaanbaarheidsonderzoek de effectiviteit van een cochleair implant aangetoond in
vergelijking met hoorapparaten (Baudonck, Dhooge, D’haeseleer, & Van Lierde, 2010;
Baudonck, Dhooge,& Van Lierde, 2010).
Bestaande methoden voor het meten van spraakverstaanbaarheid
In de klinische praktijk is perceptueel onderzoek de gouden standaard voor wat betreft het
meten van spraakverstaanbaarheid van afwijkende spraak. Enerzijds zijn er
beoordelingsschalen, waarbij een ruwe algemene index voor verstaanbaarheid wordt
bekomen. Voor het Nederlands is er de vertaalde versie van het Frenchay Dysarthria
Assessment (Enderby, 1980) en het logopedisch dysartrieprotocol van Druyts, Kalmeijer en
De Bodt (1998). Anderzijds is er het onderzoek gebaseerd op het gebruik van
meetinstrumenten. Men spreekt van een meetinstrument als een score bekomen wordt op basis
van een zuivere meting en niet op basis van een schatting.Bij meetinstrumentenwordt gebruik
gemaakt van lijsten van woorden en zinnen. Het enige meetinstrument dat geconstrueerd is
specifiek voor het Nederlands is het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek of
kortweg NSVO (Middag, Martens, Van Nuffelen, & De Bodt, 2009b; Van Nuffelen, De Bodt,
Guns, Wuyts, & Van de Heyning, 2008; Van Nuffelen, De Bodt, Middag, & Martens, 2009)..
Met dit perceptueel onderzoek wordt het percentage correct geïdentificeerde fonemen
bekomen. Er bestaat ook een versie op zinsniveau. Later is er een geautomatiseerde versie van
NSVO ontwikkeld, waarbij een computer in de plaats wordt gesteld van de menselijke
luisteraar (Middag, Martens, Van Nuffelen, & De Bodt, 2009a; Middag, Van Nuffelen,
Martens, & De Bodt, 2008).Deze methode is objectiever dan de originele versie.
Deze studie: een nieuwe methode
In deze studie wordt getracht een methode te ontwikkelen om spraakverstaanbaarheid op een
nieuwe manier te beoordelen. Hiervoor wordt “ruisbestendigheid” gebruikt als een indicator
voor spraakverstaanbaarheid. We definiëren “ruisbestendigheid” als de signaal-
ruisverhouding waarvoor spraak nog verstaanbaar is.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 7
Een groep proefpersonen krijgt de opdracht een aantal spraakstalen perceptueel te ordenen
van best verstaanbaar tot slechtst verstaanbaar. Het betreft spraakstalen van zowel kinderen
als volwassenen met een spraakstoornis gaande van licht tot ernstig afwijkend. Zowel
woorden als korte frasen komen aan bod. Aan een andere groep proefpersonen worden
dezelfde spraakfragmenten aangeboden gemengd met verschillende graden van ruis,
beginnend bij het meest verstoorde spraakstaal. Hierbij wordt onderzocht vanaf welke
signaal-ruisverhouding de spraak wordt verstaan.
De hypothese die vooropgesteld wordt is dat er een verband bestaat tussen enerzijds de
globale perceptuele beoordeling van verstaanbaarheid en anderzijds de “ruisbestendigheid”
van spraak.
Werkwijze
Deze studie beschrijft een nieuwe methode om de verstaanbaarheid van afwijkende spraak te
bepalen. Daartoe werd ruisbestendigheid gebruikt als een indicator voor
spraakverstaanbaarheid. Het onderzoek bestaat uit twee verschillende luiken.
Methode
In een eerste luik wordt aan twintig normaalhorende, niet-ervaren beoordelaars gevraagd om
de woorden en frasen te beoordelen op spraakverstaanbaarheid. Dit gebeurt via een
toernooisysteem, wat uiteindelijk leidt tot een volledige rangschikking van de spraakstalen
van best tot slechtst verstaanbaar. Het toernooisysteem voor de woorden a tot p, 24
spraakstalen, bestaat uit 60 verschillende paren die moeten worden beoordeeld. Een te
beoordelen paar van spraakstalen noemen we een “match”. Het spraakstaal dat als best wordt
beoordeeld gaat door naar een volgende ronde en komt dan uit tegen het best beoordeelde
spraakstaal uit een andere match. Het toernooisysteem voor de zinnen a tot x wordt grafisch
voorgesteld in figuur 2. Voor de korte zinnen, of frasen, wordt eenzelfde toernooisysteem
gehanteerd. Hier worden 16spraakstalen gebruikt, die in 32 verschillende paren worden
beoordeeld. Figuur 3 geeft een grafische voorstelling van het toernooisysteem voor zinnen.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 8
Voor het tweede luik van het onderzoek werden de spraakstalen met ruis gemengd. Op die
manier werden dertien verschillende versies van elk spraakstaal gecreëerd met elk een
verschillend niveau van signaal-ruisverhouding. Twintig normaalhorende, niet-ervaren
proefpersonen, verschillend van de beoordelaars uit het eerste luik, beoordelen in dit tweede
luik de met ruis gemengde spraakstalen. De opdracht die ze hierbij krijgen is aangeven wat er
in het spraakstaal wordt gezegd. Ze krijgen de spraakstalen aangeboden startend met de meest
verstoorde versie van het spraakstaal. Daarna wordt steeds een andere versie van het
spraakstaal aangeboden met een opklimmende, dus gunstiger wordende, graad van signaal-
ruisverhouding. Van zodra de beoordelaars mondelingkunnen aangeven wat in het spraakstaal
wordt gezegd of wanneer het hoogste niveau van signaal-ruisverhouding wordt bereikt, wordt
overgegaan op een volgend spraakstaal. Het mondeling gegeven antwoord wordt per
verschillend niveau van signaal-ruisverhouding door de testleider genoteerd. De woorden
worden als correct beschouwd wanneer alle fonemen worden herkend. De zinnen worden als
correct beschouwd wanneer alle woorden worden verstaan. De proefpersonen hoeven hierbij
niet zeker te zijn van hun antwoord, een correcte gok wordt meegerekend. In laatste instantie
werden de scores van beide luiken met elkaar gecorreleerd.
Figuur 2: Overzicht beoordelingstoernooi voor woorden. Dit beoordelingstoernooi bestaat uit vier rondes, de
winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking bekomen van de
twaalf best beoordeelde spraakstalen, links bevinden zich de twaalf slechtst beoordeelde spraakstalen.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 9
Figuur 3: Overzicht beoordelingstoernooi voor zinnen. Dit beoordelingssysteem bestaat uit vier rondes, de
winnaars worden telkens in het vet aangeduid. Aan de rechterkant wordt een rangschikking van de acht best
beoordeelde spraakstalen bekomen, links bevinden zich de acht slechtst beoordeelde spraakstalen.
Materiaal
Om de spraakverstaanbaarheid door middel van ruismenging na te gaan werd gebruik
gemaakt van diverse spraakstalen. Alle spraakstalen zijn afwijkend: zowel articulatie-, stem-,
en gehoorstoornissen als laryngectomie- en dysartriepatiënten komen aan bod. Die
verscheidenheid werd gebruikt met het doel van deze studie voor ogen. We willen immers een
nieuw systeem ontwerpen om spraakverstaanbaarheid bij verscheidene stoornissen te
beoordelen.
Spraakstalen werden bekomen via onze promotor Prof. Dr. Corthals. Andere spraakstalen
werden geselecteerd uit het Dutch Corpus of Pathological and Normal Speech (Van Nuffelen
& De Bodt, 2011).
Daaruit werden 24 woorden en 16 frasen geselecteerd, waarin diverse graden van
spraakverstaanbaarheid vertegenwoordigd zijn. Dit is gebaseerd op de eigen perceptuele
beoordeling van de auteurs. De meerderheid, zeventien, van de woorden bestaan uit twee
syllaben. Verder zijn er vier woorden bestaande uit drie syllaben, twee woorden van vier
syllaben en één monosyllabisch woord. De frasen bestaan gemiddeld uit 6,4 woorden, met een
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 10
minimum van 4 en een maximum van 9 woorden. Een overzicht van de doelwoorden en -
zinnen is terug te vinden in bijlage. Het intensiteitsniveau van de verschillende spraakstalen
werd in Praat (Boersma & Weenink, 1996) gelijkgesteld tot een niveau van 80dB.
Voor het tweede luik van het onderzoek, werden de spraakstalen met ruis gemengd. Dit
gebeurde via een script in Praat (Corthals, P.). Zo werden per woord en frase dertien versies
bekomen met elk een verschillende signaal-ruisverhouding, dit gaande van een signaal-
ruisverhouding van -15dB tot +18dB, in stapjes van 3dB. De dertiende versie die werd
gebruikt, is de versie zonder ruis.
Beoordelaars
Voor het eerste luik van het onderzoek, het bekomen van een volledige rangschikking via het
toernooisysteem, gebeurde de beoordeling door twintig niet-ervaren normaalhorende
proefpersonen. Allen hebben een niet-sprekersberoep of zijn studenten uit een niet-talige
richting. De gemiddelde leeftijd van deze groep beoordelaars is 26,5jaar. De minimumleeftijd
bedraagt 18 en de maximumleeftijd 53jaar. Aan de beoordelaars werd in vrij veld telkens een
paar van twee verschillende spraakstalen aangeboden. De beoordelaars kregen de
mogelijkheid om elk spraakstaal per “match” maximaal twee maal te beluisteren. Daarna
moesten ze aangeven welke van de twee volgens hen het best verstaanbaar is, zonder hier
dieper op in te gaan.
Voor het tweede luik van het onderzoek, de beoordeling van wat er gezegd wordt in de
spraakstalen met ruismenging, werd eveneens beroep gedaan op twintig niet-ervaren
beoordelaars. Van de werkende proefpersonen heeft geen enkele persoon een sprekersberoep,
hiernaast zijn ook studenten uit een niet-talige richting vertegenwoordigd. De gemiddelde
leeftijd van deze groep beoordelaars is 30jaar. De minimum- en maximumleeftijd bedraagt
respectievelijk 19 en 53 jaar. De spraakstalen werden in vrij veld aangeboden en elk niveau
van ruismenging mocht slechts éénmaal worden beluisterd. Startend met de meest verstoorde
versie van het spraakstaal werd hen individueel gevraagd aan te geven wat er in het
spraakstaal gezegd werd. De spraakstalen worden aangeboden met een steeds groter
wordende signaal-ruisverhouding totdat de beoordelaar correct aangeeft wat er gezegd wordt.
Hiertoe geeft de proefpersoon mondeling aan wat hij meent te hebben verstaan. Dit antwoord
wordt, per graad van signaal-ruisverhouding, genoteerd door de testleider.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 11
Resultaten
Voor het eerste luik, de perceptuele beoordeling via het toernooisysteem, werd per
proefpersoon een volledige rangschikking van woorden en frasen apart bekomen. Vervolgens
werd van elk item de gemiddelde plaats in de rangschikking, over de twintig beoordelaars,
berekend.
De beoordeling via ruismenging in het tweede luik resulteerde in een niveau van
ruisbestendigheid per spraakstaal en per proefpersoon. Zoals eerder vermeld, werden er
maximaal dertien verschillende versies aangeboden. Zodoende kon hier een score gaande van
1, coderend voor een signaal-ruisverhouding van -15 dB waarop het spraakstaal werd
verstaan, tot een score van 14 worden bekomen. Een score van 12 codeert voor een signaal-
ruisverhouding van +18 dB. Wanneer het spraakstaal enkel zonder toegevoegde ruis werd
verstaan, werd een score van 13 gegeven. Bijkomend werd een score van 14 toegekend
wanneer het spraakstaal zelfs bij het hoogste niveau van signaal-ruisverhouding nog niet werd
verstaan. De gemiddelde plaats in de rangschikking en de gemiddelde score overeenkomstig
de ruisbestendigheid wordt per spraakstaal weergegeven in tabel 1.
Tabel 1:
Gemiddelde plaats in rangschikking en gemiddelde score voor ruisbestendigheid per item
Itema Gemiddelde plaats
in rangschikking
Gemiddelde score
voor ruisbestendigheid
Itema Gemiddelde plaats
in rangschikking
Gemiddelde score
voor ruisbestendigheid
Za 11,65 13,2 We 9,7 6
Zb 3,45 11,35 Wf 4,65 5,4
Zc 15,2 14 Wg 9 8,55
Zd 6,1 11,8 Wh 19,3 4,75
Ze 3,35 10,5 Wi 12,05 8,1
Zf 11,45 11,15 Wj 10,75 7,1
Zg 7,15 12,65 Wk 4,6 7,4
Zh 11,1 12,75 Wl 20,7 13,95
Zi 14,65 14 Wm 4,2 6,75
Zj 7,05 7,25 Wn 16,4 5,8
Zk 9,75 9,05 Wo 23,4 13,8
Zl 1,95 3,2 Wp 7,6 7,75
Zm 5,45 4,85 Wq 3,85 5,6
Zn 12,65 14 Wr 17,4 14
Zo 8,65 12,75 Ws 15,7 13,55
Zp 6,4 6,4 Wt 15,1 9,45
Wa 14,45 4,5 Wu 16,7 13,3
Wb 7,55 3,35 Wv 9,1 9,15
Wc 22,4 14 Ww 19 13,4
Wd 9,5 12,55 Wx 6,9 12,75 a Z: zin, W: woord
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 12
Met deze nieuwe waarden, de gemiddelden, kan voor de woorden en frasen afzonderlijk een
nieuwe rangschikking worden bekomen. Zo wordt een rangschikking bekomen voor de
woorden, waarbij elk woord een plaats krijgt binnen een top 24voor enerzijds de globale
rangschikking en anderzijds de beoordeling via ruismenging. Voor de frasen wordt, ook voor
zowel de globale beoordeling als voor de beoordeling via ruismenging een top 16bekomen.
Het is met deze rangschikking dat de statistische berekeningen worden gedaan.
Per item werd het verschil in rang berekend tussen de perceptuele beoordeling via het tornooi
en deze via ruismenging. Een positief verschil wijst op een betere beoordeling via
ruismenging dan via de globale rangschikking. Daarentegen duidt een negatief verschil op een
minder goede beoordeling via ruismenging. De grootte van het verschil geeft aan hoeveel
plaatsen een item opschuift in de rangschikking.
Figuur 4 stelt die veranderingen voor de frasen voor. De veranderingen vanaf 25% of 4
plaatsen worden als opvallend beschouwd. De 5 plaatsen achteruitgang van zin b in de
beoordeling via ruismenging en 4 plaatsen voor zinnen d en e zijn frappant. Zinnen f en k
daarentegen worden merkelijk beter beoordeeld via de ruismenging, ze stijgen 5 plaatsen in
de rangschikking.
Figuur 4: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per zin.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 13
De veranderingen voor woorden worden gevisualiseerd in figuur 5. Opnieuw worden
veranderingen vanaf 25% als opvallend beschouwd. Die verandering van 25% komt bij de
woorden overeen met een opschuiving in rang van 6 plaatsen. Met deze drempelwaarde blijkt
de achteruitgang van woord x met 12 plaatsen, woord k met 7 plaatsen en woorden d en m
met 6 plaatsen in beoordeling via ruismenging opvallend. Grote vooruitgang in beoordeling
via ruismenging ten opzichte van de globale rangschikking uit luik 1 zien we bij woorden h, a
en n. Respectievelijk schuiven ze 18, 12 en 11 plaatsen op.
Figuur 5: Verschil in rang, tussen perceptuele beoordeling en beoordeling via ruismenging, per woord.
Zoals hierboven vermeld, werden de berekende gemiddelden gebruikt om een nieuwe
rangschikking voor beide luiken, dit voor woorden en frasen afzonderlijk, te bekomen. Deze
gegevens dienen nu als basis voor de correlatieberekening. De correlaties die hier worden
bekomen geven dus de overeenkomst aan tussen resultaten van de globale perceptuele
beoordeling en beoordeling via ruismenging.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 14
De Spearman rangcorrelatiecoëfficiënt die aldus werd bekomen bedraagt voor de zinnen 0.79.
De significantie van dit resultaat is zeer sterk (p < 0.001). Op woordniveau kon een sterk
significante relatie (p < 0.01) worden aangetoond, en dit met een Spearman
rangcorrelatiecoëfficiënt van 0.55. In Figuur 6 wordt deze correlatie uitgezet in een
spreidingsdiagram.
Deze resultaten suggereren dat er een samenhang is, voor zowel woorden als frasen, tussen de
globale beoordeling uit luik 1 enerzijds en de methode via ruismenging anderzijds. De
correlatie voor de zinnen is hoger dan voor woorden. Dit blijkt eveneens uit het
spreidingsdiagram.
Figuur 6: Spreidingsdiagram voor zinnen en woorden.
rS zin = 0.79
rS woord = 0.55
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 15
Discussie
Interpretatie van de gevonden correlaties
Met dit onderzoek kon statistisch worden aangetoond dat er een correlatie bestaat tussen de
globale rangschikking van afwijkende spraak en de nieuw geïntroduceerde methode voor
beoordeling via ruismenging. Hiermee kan de hypothese die werd gesteld aanvaard worden.
De gevonden correlatie voor zinnen (0.79) is sterker dan die voor woorden (0.55). In dit
onderzoek werden 24 spraakstalen van woorden gebruikt en slechts 16 van zinnen. De invloed
van dit verschil in aantal kan niet worden uitgesloten. Toch dient er rekening gehouden te
worden met de mogelijkheid dat zinnen meer geschikt zijn voor de beoordeling van
spraakverstaanbaarheid dan woorden. Spraak op zinsniveau leunt immers dichter aan bij
spontane spraak dan geïsoleerde woorden. De mogelijkheid bestaat dat beoordelaars voor
zinnen een gelijkaardige perceptiestrategie gebruikt hebben in beide luiken. Dit is minder
mogelijk voor losse woorden. De betere correlatie voor zinnen kan zo worden verklaard.
In beide luiken is er een element aan te halen dat mogelijk een invloed heeft gehad op de
bekomen correlaties. Ze verhinderen mogelijk het optreden van hogere correlaties. In het
eerste luik kent de opzet van het beoordelingssysteem met matchen beperkingen. Voordat de
spraakstalen aan de beoordelaars werden voorgelegd, werden ze onderworpen aan een eerste
selectie en ordening, gebaseerd op de perceptuele beoordeling van beide auteurs. Deze
consensusbeoordeling was bepalend voor het verder verloop van het onderzoek. Immers, het
ontwerp van het toernooisysteem is zo, dat onze rangschikking kan worden bekomen. Een
aantal andere ordeningen worden hiermee automatisch uitgesloten. Een meer uitgebreide
voorronde, bij meer dan twee personen, om uiteindelijk het toernooisysteem op te baseren had
misschien hogere correlaties met zich meegebracht.
Ook de manier van beoordelen van woorden en zinnen in het tweede luik, via ruismenging,
kan als beperking worden gezien. De groep beoordelaars werd gevraagd aan te geven welk
woord of welke zin ze te horen kregen. Hun antwoorden werden gescoord in alles of niets
fenomenen. Een woord werd immers pas als correct beschouwd wanneer alle fonemen correct
waren. Zinnen kregen een correcte score indien alle woorden correct werden aangegeven. De
introductie van scores volgens een percentage correcte fonemen bij woorden of een
procentuele score van correcte woorden bij zinnen geeft mogelijks een gedifferentieerder
beeld en betere correlaties.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 16
Interpretatie van de resultaten op zinsniveau
Een aantal zinnen dient speciale aandacht te krijgen, hun plaats in rangschikking tussen beide
luiken kent immers een verschil van minstens 25%. Er wordt dan ook dieper ingegaan op die
individuele zinnen.
Voor zinnen b, d en e worden opmerkelijke verschillen in rang vastgesteld tussen beide luiken
van het onderzoek. Hierbij wordt de beste score gevonden in het eerste luik, dit is de
beoordeling op verstaanbaarheid. Dit kan wellicht verklaard worden op basis van onderzoek
naar de prosodie, meer bepaald de intonatie. Elk van deze zinnen heeft immers een incorrecte
intonatie. Als beoordelaar in het eerste luik is men geneigd de verstaanbaarheid te toetsen
door louter de aan- of afwezigheid van prosodie te observeren. In elk van deze zinnen is
prosodie wel degelijk aanwezig, waardoor de luisteraar geneigd is deze spraak als relatief
goed verstaanbaar aan te duiden. Toch blijkt de analyse van wat de spreker precies verwoordt,
zoals onderzocht in het tweede luik, complex aangezien de aanwezige intonatie niet de juiste
is. De proefpersoon wordt in het eerste luik met andere woorden misleid door de
aanwezigheid van incorrecte prosodie. Een andere mogelijke verklaring voor dit fenomeen is
de volgende. De beoordelaars in het eerste luik zijn zich mogelijks niet bewust van de impact
die een foutieve intonatie kan hebben op de verstaanbaarheid. Ze brengen dit aspect niet of
niet voldoende in rekening bij hun beoordeling. Het is denkbaar dat een ander resultaat wordt
bekomen indien gewerkt wordt met professionelen in dit vak, en niet met leken zoals hier het
geval was.
Er is alsnog een zin, item n, waarbij intonatie duidelijk aanwezig is, maar foutief. Hoe komt
het dat bij deze zin er geen opmerkelijk verschil te vinden is tussen de resultaten van de
verschillende onderzoeksluiken? Dit kan verklaard worden door het feit dat bij deze zin niet
enkel het prosodische aspect meespeelt, maar dat ook de articulatie in deze frase ondermaats
is. Hierdoor krijgt deze zin bij de beoordeling in het eerste luik reeds een slechte score voor
verstaanbaarheid toegekend.
Tot slot is er nog een aspect dat aandacht verdient bij het analyseren van deze zinnen.
Opvallend is dat twee van deze zinnen afkomstig zijn van gehoorgestoorden. Prosodie is
immers bij gehoorgestoorden vaak problematisch. Bij zin b, ingesproken door een persoon
met een stemstoornis, gaat het wellicht om een toevallige prosodische abnormaliteit.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 17
Zinnen f en k scoren opmerkelijk slechter bij het eerste luik, de perceptuele beoordeling van
de spraakverstaanbaarheid. De verklaring moet mogelijks gezocht worden bij de startsituatie
van het opgestelde beoordelingstoernooi. Zinnen f en k moesten het immers reeds in de eerste
ronde opnemen tegen respectievelijk zinnen e en l, dewelke uiteindelijk de twee best
verstaanbare zinnen bleken te zijn. Hierdoor kwamen zinnen f en k na de eerste ronde alvast
terecht bij de acht slechtst verstaanbare zinnen.
Interpretatie van de resultaten op woordniveau
Er wordt gekeken naar de individuele woorden waarbij verschillen groter dan 25% in rang
gezien worden tussen beide onderzoeksluiken.
De woorden d, k, m en x krijgen opmerkelijk betere scores bij het eerste onderzoeksluik, de
perceptuele beoordeling van verstaanbaarheid. Een potentiële verklaring hiervoor wordt
opnieuw gezocht bij de prosodie. Het is namelijk zo dat de klemtoon bij elk van deze woorden
verkeerd ligt. Niet toevallig gaat het hier ook om spraakstalen van gehoorgestoorden.
Prosodische abnormaliteiten komen immers frequent voor bij gehoorgestoorden. Opnieuw
verwijzen we hier, parallel met de verklaring bij de prosodisch gestoorde zinnen, naar de reële
kans dat beoordelaars in het eerste luik geen of onvoldoende aandacht besteden aan de
afwijkende klemtoon van deze woorden. De fonemen op zich worden goed verstaan en
bijgevolg worden deze woorden goed beoordeeld. De mogelijke impact van een foutieve
klemtoon op de verstaanbaarheid wordt onderschat. In het tweede luik blijkt dan dat foutieve
klemtoon de identificatie van het doelwoord wel degelijk bemoeilijkt en aldus als
beïnvloedende factor kan worden beschouwd. Waarom zet deze trend zich niet verder bij de
andere woorden geproduceerd door gehoorgestoorden? Hier ligt de verklaring wellicht bij het
aantal lettergrepen dat de woorden bevatten. De kans om een klemtoon verkeerd te leggen bij
een drie- of vierlettergrepig woord is groter dan bij een tweelettergrepig woord. Dit zien we
dan ook gebeuren bij de woorden k, m en x. Hoewel de kans om een foutieve klemtoon te
leggen bij een tweelettergrepig woord kleiner is, is ze zeker niet onbestaande. Dit zien we
gebeuren bij het tweelettergrepig woord d.
De woorden a, h en n scoren beduidend beter op het tweede onderzoeksluik, waarbij de
woorden herkend moeten worden. Elk van deze woorden is afkomstig van een persoon met
een articulatiestoornis. Mogelijks ligt de oorzaak bij het verschillend uitgangspunt van
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 18
waaruit de proefpersonen vertrekken voor wat betreft de twee aparte onderzoeksluiken. Bij
luik twee schenkt de proefpersoon aandacht aan de fonemen die hij in grote lijnen door de ruis
heen meent te horen. Vervolgens zoekt deze persoon in zijn vocabularium naar een woord dat
er min of meer op gelijkt. De proefpersoon is met andere woorden niet erg streng bij het
oproepen van potentiële termen aangezien er ruis mee gemengd is, en aangezien gokken
toegestaan is. Vanaf het moment dat de fonemenreeks die door de proefpersoon verstaan is
grosso modo overeenkomt met een woord opgeroepen in het vocabularium, is dit genoeg om
een gok te wagen. Bij luik één daarentegen, de beoordeling van de verstaanbaarheid, focust de
proefpersoon zich op het gehele woord waarbij elk foneem in acht wordt genomen. Woorden
met zelfs maar één foneemsubstitutie kunnen hierop afgestraft worden door zo een lagere
score voor verstaanbaarheid toegekend te krijgen.
Vergelijking bestaande methodes voor het bepalen van spraakverstaanbaarheid
In wat volgt vergelijken wede nieuwe methode voor spraakverstaanbaarheidsbeoordeling via
ruismenging met de bestaande beoordelingsschalen (Frenchay Dysarthria Assessment
(Enderby, 1983) en het logopedisch dysartrieprotocol (Druyts et al, 1998)) enerzijds en met
het Nederlandstalig SpraakVerstaanbaarheidsOnderzoek (Middag et al., 2009b; Van Nuffelen,
et al., 2008; Van Nuffelen, et al., 2009) anderzijds.
Een belangrijk voordeel van deze methode ten opzichte van de ernstschalen is de
bruikbaarheid ervan bij verschillende spraakproblematieken. Dit systeem werd immers, naast
dysartrie, ook toegepast bij articulatie-, stem-, gehoor- en laryngectomieproblematiek. Een
ander voordeel ten opzichte van de ernstschalen werd ons aangegeven door de beoordelaars
zelf. Bij het eerste luik was er veel twijfel bij het vergelijken van de spraakstalen.
Beoordelaars vroegen frequent om herhaling en ze waren niet steeds zeker van hun antwoord.
Bij de methode met ruismenging was dit niet het geval, de beoordelaars hadden het woord wel
of niet verstaan of konden via het overlopen van hun inwendig vocabularium een woord
selecteren. Dit wijst erop dat de methode via ruismenging eenvoudiger is in gebruik, terwijl
een globale perceptuele beoordeling steeds twijfel en dus een vorm van onzekerheid en
onbetrouwbaarheid met zich meebrengt. Een voordeel ten opzichte van het NSVO is de
incorporatie van prosodie als spraakkenmerk. Dit blijkt een invloed te hebben op de
spraakverstaanbaarheid en is vaak problematisch bij gehoorgestoorden. Zowel klemtoon als
intonatie kan de spraakverstaanbaarheid op een negatieve manier beïnvloeden.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 19
Een nadeel van deze methode ten opzichte van de beoordelingsschalen is de afwezigheid van
een beoordeling van spontane spraak of eenheden groter dan zinnen. De ernstschalen geven
een snelle indruk van de spraakverstaanbaarheid, terwijl deze methode complexer is en meer
tijd in beslag neemt. Ten opzichte van het NSVO is een nadeel van de methode via
ruismenging dat semantische en pragmatische informatie niet kan worden uitgesloten. Deze
elementen maken immers, volgens de definitie, geen deel uit van spraakverstaanbaarheid. Ze
maken wel deel uit van de begrijpelijkheid van spraak. Los van de bestaande Nederlandstalige
beoordelingssystemen is er een andere beperking van deze methode. De therapeut of de
persoon die deze methode toepast moet beschikken over een luisteraarspanel aangezien de
onderzoeker niet als beoordelaar aangesteld mag worden indien hij zelf de opname maakt. De
spraak mag immers in geen geval op voorhand worden gehoord zonder toegevoegde ruis. Dit
vormt een belangrijke praktische implicatie van deze methode.
Suggesties verder onderzoek
Suggesties voor verder onderzoek zijn het opnieuw berekenen van correlaties op eenzelfde
manier maar hierbij een meer uitgebreide voorronde voorzien. De spraakstalen dienen op
voorhand door meerdere personen worden beoordeeld. In dit onderzoek werden twee zinnen
immers belemmerd in een hogere positie door dit gegeven. Ook kan deze methode worden
toegepast bij eenheden groter dan zinnen of spontane spraak.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 20
Conclusie
De resultaten van dit onderzoek geven een significante correlatie aan voor woorden en zinnen
tussen de globale perceptuele beoordeling enerzijds en beoordeling via ruismenging
anderzijds. Vermits een globale perceptuele manier om pathologische spraak te beoordelen
algemeen aanvaard wordt, is de ruisbestendigheid van spraak een te hanteren hulpmiddel voor
therapeutische doeleinden.
De therapeut of persoon die deze methode wenst toe te passen, mag in geen geval zelf als
beoordelaar aangesteld worden. Voor deze methode heeft de onderzoeker dus een
luisteraarspanel nodig. Dit vormt een praktische implicatie van cruciaal belang.
Verder moet binnen deze methode ook rekening gehouden worden met een mogelijk verschil
in spraakverstaanbaarheid ten opzichte van globale perceptuele beoordeling bij articulatie -en
gehoorproblematieken. Op woordniveau zorgt de mogelijkheid tot gokken ervoor dat
articulatiestoornissen beter kunnen worden bevonden via ruismenging. Zowel op woord- als
op zinsniveau kan prosodie, respectievelijk onder de vorm van klemtoon en intonatie, bij
gehoorgestoorden een negatieve invloed hebben op de verstaanbaarheid. Vooral bij
meerlettergrepige woorden is er kans op een slechter resultaat door meer mogelijkheden tot
het leggen van een foutieve klemtoon.
Met dank aan
Het tot stand komen van dit werk was slechts mogelijk dankzij de medewerking van
verscheidene personen. Bijzondere dank gaat uit naar onze promotor, Prof. Dr. Corthals, voor
het aanreiken van het onderwerp, het opvolgen van het onderzoeken en het becommentariëren
van de tekst. Ook willen we hem bedanken voor het aanreiken van spraakstalen en het script
voor ruismenging in Praat. Daarnaast verdient Prof. Dr. De Bodt een gemeend woord van
dank voor het beschikbaar stellen van spraakstalen uit het Dutch Corpus of Pathological and
Normal Speech. Tot slot is een dankwoord verschuldigd aan alle proefpersonen die
meewerkten aan dit onderzoek. Dankzij hun bijdrage kon dit onderzoek volbracht worden.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 21
Referenties
Ansel, B.M.,& Kent R.D. (1992). Acoustic-phonetic contrasts and intelligibility in the
dysarthria associated with mixed cerebral palsy. Journal of Speech and Hearing
Research,35, 296-308.
Baudonck, N., Dhooge, I., D’haeseleer, E.,& Van Lierde, K. (2010). A comparison of the
consonant production between Dutch children using cochlear implants and children using
hearing aids. International Journal of Pediatric Otorhinolaryngology, 74,416 – 421.
Baudonck, N., Dhooge, I., & Van Lierde, K. (2010). Intelligibility as hearing impaired
children as judged by their parents: A comparison between children using cochlear
implants and children using hearing aids. International Journal of Pediatric
Otorhinolaryngology, 74, 1310-1315.
Boersma, P., & Weenink, D. (2010). PRAAT: Doing phonetics by computer. (Version 5.2)
[Computer program]. Retrieved September 28, 2010, from: http://www.praat.org/.
De Bodt, M.S., Hernández-Díaz Huici, M.E., & Van De Heyning, P.H. (2002). Intelligibility
as a linear combination of dimensions in dysarthric speech. Journal of Communication
Disorders, 35, 283-292.
Druyts, N., Kalmeijer, J., & De Bodt, M. (1998). Een logopedisch protocol voor het
beoordelen van dysartrie. Logopedie, 11, 44-50.
Enderby, P. (1980). Frenchay dysarthria assessment. International Journal of Language and
Communication Disorders, 15, 165-173.
Kent, R.D., Weismer, G., Kent, J.F., & Rosenbek, J.C. (1989).Toward phonetic intelligibility
testing in dysarthria. Journal of Speech and Hearing Disorders, 54, 482-499.
Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). Automated intelligibility
of pathological speech using phonological features. EURASIP Journal on Advances in
Signal Processing, vol. 2009.
Middag, C., Martens, J.P., Van Nuffelen, G., & De Bodt, M. (2009). DIA: a tool for objective
intelligibility assessment of pathological speech. 6th International workshop on Models
and Analysis of Vocal Emissions for Biomedical Application,165-167, Firenze, Italy.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 22
Middag, C., Van Nuffelen, G., Martens J.P., & De Bodt, M. (2008). Objective intelligibility
assessment of pathological speakers. Interspeech 2008: 9th Annual conference of the
International Speech Communication Association, 1745-1748, Brisbane, Australia.
Van Nuffelen, G., De Bodt, M.,Guns, C., Wuyts, F., & Van de Heyning, P. (2008). Reliability
and clinical relevance of segmental analysis based on intelligibility assessment. Folia
Phoniatrica et Logopaedica, 60,264–268.
Van Nuffelen, G., De Bodt, M., Middag, C., & Martens, J.P. (2009). ‘Why an objective
intelligibility assessment?’ Closing symposium of the SPACE project, February 5-6,
Leuven. Retrieved from: .
http://www.esat.kuleuven.be/psi/spraak/projects/SPACE/events/closing/index.php.
Van Nuffelen, G., & De Bodt, M. (2011). COPAS: Dutch corpus of normal and pathological
speech. (Version 1.0).
Versonnen, A., De Bodt, M., Van Borsel, J., & Wuyts, F.L. (2004). Een
onderzoeksinstrument voor het bepalen van spraakverstaanbaarheid. Toepassing bij
volwassen dysartriepatiënten. Logopedie, 17, 33-38.
World Health Organisation Collaborating Centre for the Family of International
Classifications (2002). Nederlandse vertaling van de ‘International classification of
functioning, disability and health’ - compilatie. Retrieved from: http://www.rivm.nl/who-
fic/icf.htm.
Yorkston, K.M., Strand, E.A., & Kennedy, M.R.T. (1996). Comprehensibility of dysarthric
speech: Implications for assessment and treatment planning. American Journal of Speech-
Language Pathology, 5, 55-66.
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 23
Bijlage
Zinnen
a) Ze laat haar geldbeugel liggen.
b) Nu wil ik eerst afwachten.
c) Eerst hebben ze een kaart gekocht.
d) Wat doe ik aan mijn voeten.
e) Eten voor het slapengaan maakt dik.
f) Kijk toch eens uit waar je loopt.
g) Onze wegen liggen er slecht bij door de kou.
h) Plots toont ze de sleutel.
i) Wil je liever de thee of de borrel?
j) Dan stapt ze nog een beetje verder.
k) Ze betaalt de ober en gaat weer terug weg.
l) Zondag ben ik naar oma geweest.
m) Ze letten dan minder goed op.
n) We slapen te weinig.
o) Dat het enorm boeiend is met kinderen te werken.
p) Mijn been doet zo’n pijn.
Woorden
a) Appel
b) Roepen
c) Slang
d) Winkel
e) Eekhoorn
f) Knoopje
g) Zaterdag
h) Ballon
i) Juffrouw
j) Bloempot
k) Handtekening
-
ONTWERP PRAKTISCHE TEST VOOR VERSTAANBAARHEID VAN AFWIJKENDE SPRAAK 24
l) Mensen
m) Evenwicht
n) Sleutel
o) Logopedist
p) Huilen
q) April
r) Puzzel
s) Drinken
t) Tafel
u) Horloge
v) Banaan
w) Banken
x) Vulkanen