New Beoordeling van stotterernst voorspellen door het tellen en … · 2014. 12. 18. ·...
Transcript of New Beoordeling van stotterernst voorspellen door het tellen en … · 2014. 12. 18. ·...
-
Faculteit Geneeskunde en Gezondheidswetenschappen
Academiejaar 2013-2014
Beoordeling van stotterernst voorspellen door het tellen en
timen van stottermomenten aan de hand van Praat-software
Dominique Geernaert
Promotor: Prof. Dr. P. Corthals
Masterproef voorgedragen tot het behalen van de graad van Master in de
Logopedische en Audiologische wetenschappen
-
-
-
-
Faculteit Geneeskunde en Gezondheidswetenschappen
Academiejaar 2013-2014
Beoordeling van stotterernst voorspellen door het tellen en
timen van stottermomenten aan de hand van Praat-software
Dominique Geernaert
Promotor: Prof. Dr. P. Corthals
Masterproef voorgedragen tot het behalen van de graad van Master in de
Logopedische en Audiologische wetenschappen
-
-
Dankwoord
Aangezien het tot stand komen van deze scriptie mede het resultaat is van de
ondersteuning, samenwerking en inzet van verschillende personen, wil ik graag tot
hen mijn woord van dank richten.
Allereerst wil ik mijn promotor Prof. Dr. P. Corthals bedanken voor de begeleiding,
feedback en statistische ondersteuning.
Ten tweede dank ik alle mensen van het luisteraarspanel voor hun tijd,
enthousiasme en medewerking. Jullie waren een onmisbare schakel in dit
onderzoek.
De personen die bereid waren om mijn eindwerk na te lezen en mij hierin verder te
helpen, verdienen uiteraard ook mijn welgemeende dank.
Mijn medestudenten Sarah, Silke, Ester, Rachel en Annelies wil ik graag
bedanken voor de mentale steun, hulp en vriendschap doorheen dit laatste jaar.
Bedankt voor jullie tips, geruststellingen en deugddoende babbels.
Ten slotte wil ik heel graag mijn ouders, vriend, familie en vrienden bedanken voor
de lieve ondersteuning, aanmoediging en hulp die ze me gaven tijdens het
schrijven van deze thesis.
I
-
II
Inhoud
Dankwoord .............................................................................................................. I
Inhoud .................................................................................................................... II
Abstract .................................................................................................................. 1
Inleiding .................................................................................................................. 3
Methode ................................................................................................................. 8
Spraakstalen ....................................................................................................... 8
Analyseprotocol................................................................................................... 8
a) Annoteren .................................................................................................... 8
b) Script ........................................................................................................... 9
c) Resultaten .................................................................................................. 10
Luisteraarspanel ................................................................................................ 10
Statistische analyse .......................................................................................... 11
Resultaten ............................................................................................................ 14
Discussie .............................................................................................................. 17
Conclusie.............................................................................................................. 21
Referenties ........................................................................................................... 22
Appendices ........................................................................................................... 24
Appendix I: Specifieke menustappen ................................................................ 24
Appendix II: Instructies en invulformulier luisteraarspanel ................................ 25
-
Abstract
Doelstelling In dit onderzoek wordt er na gegaan of, en zo ja welke, objectieve,
meetbare stotterparameters de stotterernst in zulke mate kunnen bepalen dat het
de mening van de luisteraar weerspiegelt. Bovendien wordt onderzocht of in deze
context de stottermomenten beter geteld dan wel getimed worden.
Methodologie 51 spraakstalen van Engelstalige personen die stotteren, afkomstig
van de website van 'UCLASS', werden via het softwareprogramma 'Praat'
geannoteerd volgens de taxonomie van Packman & Onslow. Vervolgens werden
via één softwarescript verschillende getimede en getelde indices berekend: van
elke stotterparameter werd de frequentie van voorkomen en zijn (relatieve) duur
bepaald. Nadien werd de stotterernst van alle spraakstalen door een panel van
148 luisteraars beoordeeld aan de hand van een 5-puntenschaal.
Resultaten Na statistische analyse werden er 6 parameters gevonden met een
significante correlatie met de door de luisteraars beoordeelde stotterernst.
Multipele regressie bracht volgende top 5 van beste voorspellers aan het licht:
percentage vloeiende spraak, gemiddelde duur van vloeiende spraak, percentage
herhalingen, percentage blokkeringen en verlengingen en ten slotte telling van het
overbodig gedrag. Hun relatief belang op een schaal van 0 tot 1 is respectievelijk
0,37; 0,28; 0,25; 0,08 en 0,02.
Bevindingen De ernstperceptie van de luisteraars wordt met andere woorden voor
zo'n 98% voorspeld door getimede parameters. Dit duidt, voor logopedisten, het
belang aan van de nood aan toestellen die op een nauwkeurige manier
stottermomenten kunnen timen. De top 5 stotterparameters en hun relatief belang,
beiden verkregen dankzij deze studie, vormen een aangrijpingspunt voor
stottertherapie.
1
-
Purpose This study investigates whether there are objective, measurable
parameters that can determine the severity of someone's stuttering in such a way
that it corresponds to a listeners' opinion. It was also explored whether it's more
interesting to either time or to count the disfluencies.
Methodology 51 speech samples of English persons who stutter, derived from the
website of 'UCLASS', were annotated by the software program 'Praat', using the
taxonomy of Packman & Onslow. Next, several parameters based on timing and
counting were calculated by one software script . The frequency of occurrence and
the (relative) duration of each parameter were determined. The stuttering severity
of all speech samples was also judged by a panel of 148 listeners on the basis of
a 5 point severity scale.
Results Statistical analysis shows that 6 parameters have a significant correlation
with the judged stuttering severity. The top 5 predictors, found by multiple
regression, were percentage of fluent speech, average duration of fluent speech,
percentage of repetitions, percentage of blocks and prolongations and finally
counts of superfluous behavior. Their relative contribution on a scale from 0 to 1 is
respectively: 0,37; 0,28; 0,25; 0,08 and 0,02.
Findings It turns out that 98% of the prediction of the severity perception by the
listeners is determined by timed parameters. This indicates the importance of tools
that can time disfluencies in an accurate way. The top 5 parameters and their
relative importance in predicting the severity perception, both found in this study,
are a starting point for stuttering therapy.
2
-
Inleiding
Stotteren is een vloeiendheidsstoornis die welgekend is bij het publiek. Ondanks
deze bekendheid blijkt een eenduidige omschrijving niet zo eenvoudig. Stotteren is
een complex fenomeen waarover reeds talrijke theorieën zijn gevormd door de
jaren heen. De definities in de vakliteratuur lopen hierdoor vaak uiteen: sommige
baseren zich op de etiologie van stotteren ('Stammering is a symptom in a
psychopathological condition classified as a pregenital coversion neurosis'
Glauber, 1958, p.78), andere zijn eerder beschrijvend (Van Borsel, 2011). De
definitie van Wingate (1964) omschrijft stotteren als een verzameling van enerzijds
onvrijwillige, al dan niet hoorbare spraakkenmerken (herhalingen, verlengingen,...)
en anderzijds bijkomende secundaire stotterkenmerken (lichaamsbewegingen,
stereotiepe uitdrukkingen,...), alsook emoties en cognities (angst, schaamte,
gespannenheid,...). In de ICF-definitie (International Classification of Functioning,
Disability and Health) worden de ideeën van Yaruss (1998) gereflecteerd. Ook hier
kijkt men verder dan enkel de observeerbare kenmerken (herhalingen,
verlengingen, aarzelingen,...). Ze hebben aandacht voor de algemene impact van
de stoornis (negatieve spreekattitude, schaamte, beperkte sociale participatie,...)
en beschrijven zowel factoren die de stotteraar hinderen (negatieve reacties), als
faciliterende factoren (hulpgroepen, stottertherapie,...).
In deze studie wordt de taxonomie van Packman & Onslow (figuur 1) gebruikt, die
ook wel de 'Lidcombe behavorial data language of stuttering' genoemd wordt
(Teesson, Packman & Onslow, 2003). Deze taxonomie bestaat uit 3 categorieën
van observeerbare stotterverschijnselen: de herhaalde spreekbewegingen
('repeated movements'), de gefixeerde spreekposities ('fixed postures') en de
overbodige gedragingen ('superfluous behaviors'). De eerste categorie omvat
herhalingen van ofwel lettergrepen ('zij-zij-zij-zij-zij zwemt'/'ik eet een ba-ba-ba-
banaan') ofwel onvolledige lettergrepen ('hij k-k-k-k-kruipt onder het hek') ofwel
lettergrepenreeksen ('in de tele-tele-teletijdsmachine'/ 'ik zie ik zie ik zie het niet').
Onder de 'fixed postures' verstaan we enerzijds de hoorbare verlengingen en
anderzijds de geluidloze blokkeringen. De derde categorie bestaat uit alle
overbodige gedragingen die we opsplitsen in een verbaal deel (tussenwerpsels en
revisies van zinnen) en een non-verbaal deel (kuchen, smakken, blazen,...).
3
-
LIDCOMBEbehavioral data
language ofSTUTTERING
Repeated movements
-syllable repetition'Rs'
-incomplete syllable repetition'Ri'
-multisyllable repetition'Rm'
Fixed postures
-with audible airflow'Fp'
-without audible airflow'Fb'
Superfluous behaviors
-verbal (interjection, revision)'Si, Sr'
-nonverbal (visible/audible)'Sn'
FIGUUR 1: TAXONOMIE VAN PACKMAN & ONSLOW (CORTHALS, 2012)
Niet alleen uit diagnostisch belang, maar ook om de ontwikkeling van het stotteren
te kunnen opvolgen en de effectiviteit van therapieën te evalueren, is het
belangrijk om op een correcte manier stotteren te 'meten'. Om iemands
stotterernst te bepalen, bestaan er verschillende methoden. Het spreekt voor zich
dat men voor zo'n ernstbepaling de spraak van de stotteraar moet te horen krijgen.
In praktisch alle ernstmetingen wordt dan ook gebruik gemaakt van een
spraakstaal. Uiteraard streeft men bij de opname van zo'n spraakstaal naar een zo
goed mogelijke kwaliteit en probeert men alle storende achtergrondgeluiden te
vermijden (Van Borsel, 2011). Wat de duur van het spraakstaal betreft, bestaan er
verschillende visies. Conture (2001) wees erop dat clinici niet altijd controle
hebben over de grootte van het spraakstaal. Een studie van Sawyer en Yairi bij -6
jarigen (2006) hield aan dat korte spraakstalen (bv. 300 woorden) voor zekere
basisgegevens zorgen, maar hoe langer zo'n spraakstaal is, hoe correcter zijn
representatie zal zijn. Onvloeiendheden komen immers niet met een bepaalde
regelmaat voor en zijn niet gelijk verdeeld over iemands spraak. Korte
spraakstalen lopen het risico om enerzijds bepaalde onvloeiendheden te
onderrepresenteren, maar anderzijds te overrepresenteren wanneer bijvoorbeeld
4
-
een meer zeldzame onvloeiendheid toevallig voorkomt in het spraakstaal. Meer
onderzoek is nodig om te bepalen hoe lang het spraakstaal minimum moet zijn.
Wetende dat stotteren zowel visuele (vooral blokkades en non-verbaal overbodig
gedrag zoals bv. oogknipperingen) als auditieve gedragingen bevat, klinkt het
logisch dat stottermetingen die enkel gebaseerd zijn op geluidsopnames mogelijks
de stotterernst onderschatten (Rousseau, Onslow, Packman & Jones, 2008). De
studie van Rousseau, Onslow, Packman en Jones (2008) toont aan dat dit het
geval is voor de stotterfrequentie (%SS: percentage of syllables stuttered), maar
niet voor de stotterernst bij kinderen jonger dan 6 jaar (bij volwassenen worden
deze verschillen veel minder gevonden). Wanneer men gebruik maakt van
geluidsopnames wordt de %SS voor zo'n 20% onderschat vergeleken met de
video- en geluidsopnames. Een mogelijke verklaring voor deze bevindingen is dat
beelden de aandacht van de observeerder (het gaat hier om ervaren spraak- en
taalpathologen) doen stijgen en beter toelaten om bij onduidelijke, dubbelzinnige
stottermomenten uit te maken of het nu om een stottermoment ging of niet. Er
moet echter wel opgelet worden dat de stotterernst bij video- en geluidsopnames
niet overschat wordt. Het feit dat er geen verschillen worden gevonden bij de
algemene stotterernst (9-puntenschaal) kan verklaard worden doordat de
onderzoeker hierbij geen beslissingen moet maken of een individueel
stottermoment nu gestotterd was of niet, hij moet een algemene stotterernst
bepalen.
Eens men beschikt over een degelijk spraakstaal, bestaan er zoals reeds eerder
vermeld verschillende methoden om de stotterernst te bepalen. Bij de
'ernstschalen' kiest de beoordelaar op het einde van het spraakstaal een
getalwaarde die aangeeft hoe ernstig hij het stotteren percipieerde. Zo gebruikt het
Australische 'Lidcombe-programma' een tienpuntenschaal, waarbij 0 staat voor
'geen stotteren', 1 voor 'zeer licht stotteren' en 10 voor 'zeer ernstig stotteren' (Van
Borsel, 2011). Op dezelfde manier bestaan er ook zelf-evalutieschalen. Hierbij
gaat de stotteraar zelf zijn spraak beoordelen, zich baserend op stotterfrequentie,
stotterernst en subjectieve, met stotteren geassocieerde gevoelens (Huinck &
Rietveld, 2007). In een studie van O'Brian, Packman en Onslow (2004) vond men
een sterke correlatie (r = 0,91) tussen de gemiddelde scores op een 9-
puntenernstschaal en het percentage gestotterde lettergrepen (%SS). Huinck en
5
-
Rietveld (2007) vonden ook grote correlaties tussen zelfevaluatie en metingen
zoals SPM (spoken syllables per minute) en %SS. Deze laatst genoemde meting
is wereldwijd verspreid en wordt erg veel gebruikt in zowel de onderzoekswereld
als in de klinische praktijk (Van Borsel, 2011). %SS geeft aan hoeveel procent van
de lettergrepen in een spraakstaal werden gestotterd. Deze meting wordt meestal
in 'real time' uitgevoerd met een drukknopsysteem, maar kan ook via transcriptie
gebeuren (O'Brian, Packman & Onslow, 2004). De studie van Yarrus et al. (1998)
vergelijkt deze twee meettechnieken om stottermomenten te tellen. Bij de
'transcript-based' techniek maakt de clinicus een gedetailleerde orthografische
transcriptie van het spraakstaal en gaat hierin alle onvloeiendheden aanduiden en
coderen. Deze meettechniek is gedetailleerder, maar meer tijdsconsumerend dan
de 'real-time' techniek. Deze laatste houdt een snelle telling in van het aantal en
type onvloeiendheden. De clinicus beluistert en bekijkt het spraakstaal en noteert
tegelijkertijd bij elk woord of elke lettergeep of deze al dan niet vloeiend werd
uitgesproken. De uitkomsten van deze twee meettechnieken hebben een sterke,
significante, positieve correlatie. Men raadt aan om de 'transcript-based' techniek
te gebruiken bij het diagnosticeren en de 'real-time' techniek bij tussentijdse
evaluaties tijdens de behandeling. Men moet er wel attent op zijn dat bij de
'transcript-based' techniek de kans bestaat dat men gaat 'overanalyseren' en men
bij de 'real-time' techniek subtiele, lichte stottermomenten kan missen. De
Stuttering Severity Instrument (SSI) (Riley, 1972) maakt naast het percentage
gestotterde lettergrepen ook gebruik van de gemiddelde duur van de drie langste
stottermomenten en het voorkomen van 'meebewegingen' om de stotterernst te
meten. Een andere mogelijkheid om de stotterernst te bepalen is de 'Illinois
Clinician Stuttering Severtity Scale (Yairi en Ambrose, 2005). Er wordt gewerkt
met een spraakstaal van minstens 600 lettergrepen en men baseert zich op vier
parameters: het aantal onvloeiendheden per honderd lettergrepen, de gemiddelde
duur van de vijf langste herhalingen, de spanning bij de onvloeiendheden en
secundair stottergedrag. Een Nederlandstalige test voor +8-jarigen is de 'Test voor
stotterernst Lezers' (TvS-L) (Boey, 2007). Op basis van een spraakstaal bij
conversatie en bij lezen beoordeelt men de stotterernst door te kijken naar de
stotterfrequentie tijdens lezen en vertellen, de duur, de vermijdings- en
uitstelgedragingen, de start- en duwgedragingen en bijbewegingen.
6
-
Deze lijst met stotterernstmetingen is niet volledig, maar niet onbelangrijk is om
even stil te staan bij de persoon die deze metingen uitvoert. Hoe 'getraind' moet
men zijn om op een betrouwbare, representatieve manier de ernst van iemands
stotteren te bepalen? Een studie van Einarsdottir en Ingham (2008) bevestigt
vroegere onderzoeksbevindingen die aantoonden dat training ervoor zorgt dat
men stottermomenten beter kan identificeren. Een opmerkelijke bevinding in hun
onderzoek was dat zelfs zonder training de leerkrachten uit hun studie reeds een
zeer degelijke beoordeling uitvoerden: gemiddeld 86,7% correct. Na training
echter, was de accuraatheid nog verbeterd: gemiddeld 91,8% correct.
Hoeveel systemen er ook bestaan om de stotterernst te bepalen, de waarde van
een menselijk oordeel kan moeilijk overtroffen worden. De stotteraars zijn immers
vooral geïnteresseerd in de mening van de luisteraars. Werken met een
luisteraarspanel is dan ook de meettechniek bij uitstek. Jammer genoeg is deze
manier van werken erg tijdsconsumerend en bovendien niet realistisch. Daarom is
het waardevol om na te gaan welke objectieve parameters, die door slechts één
iemand kunnen berekend worden aan de hand van een softwareprogramma, de
mening van de luisteraar het best weergeven.
In deze studie wordt het softwareprogramma 'Praat' gebruikt om de verschillende
stotterparameters uit de taxonomie van Packman en Onslow (zie figuur 1) aan te
duiden in spraakstalen. Via scripting worden de stotterparameters niet enkel
geteld, maar ook de relatieve duur van de onvloeiendheden wordt nauwkeurig
bepaald.
Het doel van deze studie is na te gaan:
1. of er parameters bestaan om de stotterernst te bepalen,
2. welke (combinatie van) parameters het best overeenkomt met een
luisteraaroordeel,
3. of onvloeiendheden timen dan wel tellen beter is om de stotterernst te
bepalen.
7
-
Methode
Spraakstalen De eerste stap van deze studie bestond eruit spraakstalen te verzamelen. Er
wordt gebruik gemaakt van bestaande spraakstalen die ter beschikking gesteld
zijn door 'University College London' voor wetenschappelijk gebruik. De
spraakstalen kunnen vrij gedownload worden op de website van 'UCLASS'
(University College Londen's Archive of Stuttered Speech):
http://www.uclass.psychol.ucl.ac.uk/Audio/mp3. UCLASS wordt gefinancierd door 'The
Wellcome Trust'. Het gaat om 15 Engelstalige spraakstalen van zowel vrouwelijke
(4) als mannelijke (11) deelnemers tussen 9 en 40 jaar oud. Qua tijdsduur zijn -bij
benadering- telkens de eerste 60 seconden van de spraakstalen geselecteerd
voor dit onderzoek. Voor de statistische gegevensverwerking werd de dataset van
een gelijklopend onderzoek door studenten uit Virginia (36 UCLASS-spraakstalen)
samengevoegd met de uit deze studie verkregen data.
Analyseprotocol De audio-opnames worden in het softwareprogramma 'Praat' als wave-file
ingelezen en geannoteerd (a). Vervolgens wordt er een script gebruikt (een op
maat gemaakt analyseprotocol) om de annotaties te verwerken (b) en ten slotte
verschijnen automatisch de eindresultaten (c). De specifiek te volgen
menustappen zijn terug te vinden in appendix 1.
a) Annoteren Deze stap houdt in dat de audio-opname wordt beluisterd, gesegmenteerd
en gelabeld door de clinicus. In het 'view & edit' scherm (zie figuur 2) kan
men het spraakstaal beluisteren en elk stottermoment segmenteren en
labelen met vooraf afgesproken afkortingen (zie figuur 1). Zo wordt
bijvoorbeeld een verlenging aangeduid met ‘Fp’ en een lettergreepherhaling
met ‘Rs’. Een stottermoment zoals /k-k-k-k-k-kruis/ wordt als een herhaling
gelabeld en niet als een verlenging aangezien /k/ een stopklank is en deze
niet aanhoudend kan gefoneerd worden zoals in een verlenging. Het label
'herhaling' (R), wordt gebruikt wanneer exact dezelfde woorden worden
8
-
herhaald ('De jongen, de jongen, de jongen speelt in de tuin'). Bij een
'revisie' (Sr) gaat de stotteraar zijn zin herbeginnen -en mogelijks hierdoor
een woord herhalen- omwille van een andere zinsopbouw of om, eventueel
in het kader van vermijdingsgedrag, een ander woord te gebruiken ('Hij
speelt gr... hij speelt liever piano'). De vloeiende, stottervrije stukken worden
aangeduid met het label ‘1’. Momenten zonder spraak, waarbij de persoon
in kwestie bijvoorbeeld aan het nadenken is of in-/uitademt, worden niet
meegeteld en als ‘0’ gelabeld. Deze afkortingen of ‘labels’ worden in het
script (zie stap 2) gebruikt met het oog op de verwerking.
FIGUUR 2: 'VIEW & EDIT' VENSTER
DE LABELS VAN ALLE SEGMENTEN VERSCHIJNEN OP EEN BALK ONDER DE AUDIO-OPNAME. BIJ HET SEGMENTEREN IS DE EINDGRENS VAN HET ENE SEGMENT DE BEGINGRENS VAN HET VOLGENDE SEGMENT.
b) Script In een volgende stap worden de geannoteerde spraakstalen verwerkt door
een op maat gemaakt analyseprotocol: het script. Dit is een broncode-
document dat de handmatig aangebrachte gegevens (labels en
segmentgrenzen) automatisch verwerkt en uitrekent.
9
-
c) Resultaten
labels telling timing
FIGUUR 3: 'PRAAT PICTURE' VENSTER
IN HET 'PRAAT PICTURE' VENSTER VERSCHIJNEN DE RESULTATEN IN TABELVORM. DE EERSTE KOLOM BEVAT ALLE GEBRUIKTE LABELS. HOE VAAK DEZE LABELS VOORKWAMEN IN HET SPRAAKSTAAL, WORDT OPGESOMD IN DE TWEEDE KOLOM. IN DE LAATSTE DRIE KOLOMMEN KAN DE GEMIDDELDE DUUR, HET TOTAAL AANTAL SECONDEN EN HET PERCENTAGE VAN VOORKOMEN TERUGGEVONDEN WORDEN.
Luisteraarspanel De volgende stap bestond eruit om de spraakstalen door een panel van luisteraars
te laten beoordelen. Via het social medium 'facebook' werden 28 personen
gerecruteerd. Het gaat om 23 vrouwen en 5 mannen tussen 17 en 70 jaar oud. De
beoordelaars werden in twee subgroepen verdeeld (naargelang de datum dat ze
beschikbaar waren), respectievelijk 16 personen en 12 personen. De tweede
groep (12 personen) kreeg de spraakstalen in omgekeerde volgorde aangeboden
om zo het vermoeidheidseffect weg te werken. Elk spraakstaal van één minuut
dienden ze qua ernst te beoordelen aan de hand van een 5-puntenschaal waarop
de schaalpunten 1 als 'niet ernstig', 3 als 'gemiddeld' en 5 als 'zeer ernstig'
benoemd waren. Vooraleer de beoordeling van de 15 spraakstalen startte, kregen
de beoordelaars ter illustratie een spraakstaal te horen met een score 3 (deze
werd bepaald aan de hand van een consensus-rating door 12 Engelstalig
luisteraars). Figuur 4 geeft aan dat er variatie was in de ernstgradatie van de
spraakstalen. Alle scores werden door het panel gebruikt tijdens de
beoordelingen. De instructies die aan het luisteraarspanel werden gegeven, zijn
terug te vinden in appendix 2. Bij de studie uit Virginia ging het om 120
beoordelaars die verdeeld werden in 3 subgroepen van 40 personen. Hun leeftijd
10
-
varieerde van 14 tot 62 jaar. Ze werden geselecteerd via 'convenience sampling'.
De 36 spraakstalen werden verdeeld in 3 deelverzamelingen van elk 12 stalen.
Iedere groep beoordelaars kreeg dezelfde spraakstalen te horen in een
verschillende volgorde. Ook in deze studie moesten ze de gepercipieerde
stotterernst via een 5-puntenschaal aangeven en kregen ze als referentiepunt
eerst een spraakstaal met een score 3 te horen.
FIGUUR 4: DOOR DE LUISTERAARS BEPAALDE ERNSTSCORES VAN ALLE SPRAAKSTALEN
Statistische analyse Allereerst werd een Kolmogorov-Smirnovtest gedaan om te achterhalen of de
gegevens normaal verdeeld waren. Dit was het geval voor de ernstscore, maar
niet voor alle geannoteerde tellingen en chronometreringen (zie tabel 1). Vandaar
het gebruik van non-parametrische correlaties. De multipele regressie kon wel
doorgaan aangezien de afhankelijke variabele (ernstscore) normaal verdeeld was.
Per stotterkenmerk ('R', 'F' en 'S') werd er gekeken naar de correlatie met de
ernstscore en werd het 'gewicht' als predictor voor de ernstscore nagegaan. Zo
werd er een top 5 bekomen van beste voorspellers voor de ernstscore (zie figuur
5). Bij de berekeningen van de correlaties, werden de verschillende subtypes van
de onvloeiendheden samengenomen (dus Ri + Rs + Rm, Fp + Fb, Si + Sr + Sn)
aangezien niet elk subtype voorkwam in alle spraakstalen.
11
-
TABEL 1: KOLMOGOROV-SMIRNOVTEST
12
-
FIGUUR 5: RELATIEF BELANG VAN DE PARAMETERS OP EEN SCHAAL VAN 0 TOT 1
13
-
Resultaten
Zoals te zien in tabel 2, blijken er in totaal 6 parameters te zijn die een significante
correlatie vertonen met de gemiddelde gepercipieerde stotterernst van het
luisteraarspanel. Het betreft 3 getimede parameters (% vloeiende spraak, %
blokkeringen en verlengingen en % herhalingen) en 3 getelde parameters (aantal
blokkeringen en verlengingen, aantal herhalingen en aantal overbodige
gedragingen).
Timing van de vloeiende spraak is de parameter met de grootste -uiteraard
negatieve- correlatie (r = -0,697, p = 0,01). Het klinkt inderdaad logisch dat, hoe
meer seconden van het spraakstaal uit vloeiende stukken spraak bestaat, hoe
minder ernstig het stotteren wordt bevonden. Opvallend echter is het feit dat
wanneer de vloeiende stukken spraak worden geteld in plaats van getimed, er
geen significante correlatie optreedt. Telling van deze parameter is met andere
woorden geen betrouwbare voorspeller om de mening van de luisteraar te
achterhalen. Een spraakstaal van 1 minuut waarin er 10 keer gemiddeld 2
seconden vloeiende spraak wordt geteld, zal naar schatting meer ernstig worden
gescoord dan een staal dat slechts 2 stukken stottervrije spraak bevat, maar wel
van telkens 20 seconden lang. Hieruit wordt duidelijk dat telling van de vloeiende
spraak een vertekend beeld kan geven van de stotterernst en dat timing voor meer
representatieve resultaten zorgt.
Bij de parameter 'herhalingen' levert zowel telling als timing een significante
(positieve) correlatie op; respectievelijk r = 0,425 en r = 0,480 (met p telkens =
0,01). Hetzelfde geldt voor de 'blokkeringen en verlengingen'; respectievelijk r =
0,530 en r = 0,534 (p = 0,01). De correlaties liggen telkens opmerkelijk iets hoger
bij timing.
Met 'overbodige gedragingen' trachten stotteraars hun onvloeiendheden te
voorkomen, te verbergen of uit te stellen. Interessant genoeg, lijken deze
'ontwijkingsmanoeuvres' te lukken; hoe meer overbodige gedragingen er in het
spraakstaal worden geteld, hoe minder ernstig het stotteren wordt gepercipieerd.
Dat blijkt uit de negatieve, significante correlatie van telling van de overbodige
14
-
gedragingen (r = -0,286, p = 0,05). Tevens is dit de enige parameter waarbij timing
geen significante correlatie oplevert.
Algemeen kan er gesteld worden dat de duur van de stotterparameters (timing)
vaker en beter correleert met de ernstperceptie van de luisteraars.
Via multipele regressie werden alle stotterparameters (zowel timing als telling
ervan) met elkaar gecombineerd en gecorreleerd aan de algemene stotterernst
om zo tot de 'formule' te komen die de beste voorspeller is van de mening van de
luisteraar wat de stotterernst betreft. In de formule wordt de relatieve bijdrage van
elke parameter berekend. De top 5 van de beste voorspellers is weergegeven in
figuur 5. Op de horizontale as wordt het 'gewicht' van elke parameter in de
voorspelling duidelijk; hoe langer de balk, hoe meer aandeel de parameter heeft.
Zo wordt 65% van de voorspelling bepaald door timing van de vloeiende spraak
(% en gemiddelde duur), ongeveer 25% door het percentage herhalingen, zo'n 8%
door het percentage blokkeringen en verlengingen en ten slotte ongeveer 2% door
telling van het overbodig gedrag. De ernstperceptie van de luisteraars wordt met
andere woorden voor zo'n 98% voorspeld door getimede parameters.
15
-
TABEL 2: CORRELATIES VAN DE STOTTERPARAMETERS MET DE ALGEMENE STOTTERERNST
** Correlation is significant at the 0.01 level (2-tailed); * Correlation is significant at the 0.05 level (2-tailed)
MEANRATING_total
Spearman's rho
MEANRATING_total
CorrelationCoefficient 1,000
Sig. (2-tailed) .
N 52
fluent_count
CorrelationCoefficient ,045
Sig. (2-tailed) ,752
N 52
fluent_percent
CorrelationCoefficient -,697**
Sig. (2-tailed) ,000
N 52
Fb+p_count
CorrelationCoefficient ,530**
Sig. (2-tailed) ,000
N 52
Fb+p_percent
CorrelationCoefficient ,534**
Sig. (2-tailed) ,000
N 52
Rs+i+m_count
CorrelationCoefficient ,425**
Sig. (2-tailed) ,002
N 52
Rs+i+m_percent
CorrelationCoefficient ,480**
Sig. (2-tailed) ,000
N 52
Si+r+n_count
CorrelationCoefficient -,286*
Sig. (2-tailed) ,040
N 52
Si+r+n_percent
CorrelationCoefficient -,175
Sig. (2-tailed) ,215
N 52
16
-
Discussie
Wie of wat bepaalt hoe ernstig de vloeiendheidsproblemen zijn van een persoon
die stottert? Wat telt voor deze laatst genoemde, is de mening van de luisteraars.
Het menselijk oor (en oog) is met andere woorden nog steeds dé meettechniek bij
uitstek. Telkens een luisteraarspanel verzamelen om iemands stotterernst te
bepalen zou echter zeer tijdsrovend en vooral onrealistisch zijn. Een handigere en
bovendien veel snellere manier van werken is aan de slag gaan met een systeem
dat met objectieve, meetbare parameters werkt die een weerspiegeling zijn van de
mening van de luisteraars en bovendien door slechts één persoon kunnen
berekend worden. Dit is mogelijk met 'Praat'. Met dit softwareprogramma kunnen
verschillende stotterindexen via annotatie en scripting uit een spraakstaal
geëxtraheerd worden. Er rest nog enkel de vraag welke (combinatie) van die
indexen nu het best overeenstemt met de mening van de luisteraars.
Werken met 'Praat' brengt verschillende voordelen met zich mee. Ten eerste
kunnen de stottermomenten in het spraakstaal niet alleen geteld worden, maar
kan ook telkens de duur ervan nauwkeurig bepaald worden. Ten tweede kan de
audio-opname steeds herbeluisterd worden en kunnen de labels van de
onvloeiendheden desgevallend aangepast worden. Een derde voordeel van 'Praat'
is het feit dat na de annotatie met slechts één script, en dus één bewerking via
één muisklik, een hele reeks aan indexen wordt bekomen. Na de annotatie wordt
aldus op zeer korte tijd een grote hoeveelheid aan nauwkeurige resultaten
verkregen.
Een nadeel echter aan 'Praat' is het feit dat non-verbale overbodige gedragingen
die niet hoorbaar zijn (denk aan oogknipperingen) onmogelijk kunnen
gedetecteerd worden. Er wordt immers enkel met audiobestanden gewerkt en niet
met audiovisueel materiaal. Zoals reeds eerder in de inleiding vermeld, toonden
Rousseau et al. (2008) aan dat stottermetingen die enkel gebaseerd zijn op
geluidsopnames de stotterfrequentie (%SS: percentage gestotterde syllaben) voor
zo'n 20% onderschatten bij -6 jarigen. Deze ernstonderschatting wordt niet
gevonden bij de score voor de algemene stotterernst (9-puntenschaal) aangezien
de beoordelaar hierbij geen beslissingen moet nemen of een individueel
17
-
stottermoment nu gestotterd was of niet, maar een globale beoordeling moet
geven. De bevindingen van Rousseau et al. gelden voor metingen in het begin van
klinische onderzoeken. Voor metingen die plaatsvinden na de behandeling is het
risico op onderschatten veel minder aangezien het %SS dan veel lager is. In de
toekomst zou het gebruik van videomateriaal de eventuele ernstonderschatting
kunnen opvangen.
De verwerkingsduur voor de annotatie is een tweede nadeel van de werkmethode
met 'Praat'. Deze ligt hand in hand met de lengte van het spraakstaal wat op zijn
beurt dan weer te maken heeft met de betrouwbaarheid van de meettechniek.
Hoeveel seconden/onvloeiendheden moet het spraakstaal lang zijn om een
representatief beeld te krijgen van de stotterernst? Verder onderzoek is nodig om
uit te maken wat de minimumlengte van een spraakstaal hoort te zijn (Corthals,
2012). Een andere zijde van betrouwbaarheid is de 'interbeoordelaars-
betrouwbaarheid'; de mate waarin er unanimiteit heerst tussen de resultaten van
verschillende beoordelaars. Via een voorafgaande training waarin typische,
audiovisuele voorbeelden worden gegeven van annotaties kan de
interbeoordelaarsbetrouwbaarheid in positieve zin toenemen (Corthals, 2009).
Naast betrouwbaarheid moet een test ook validiteit bezitten. Aldus wordt er
teruggekomen op de vraag welke indexen nu het best correleren met de mening
van de luisteraars. Het is duidelijk dat er een ander beeld naar voren komt
wanneer iemands stottermomenten worden getimed of geteld. Zo kunnen twee
personen een zelfde aantal verlengingen en blokkades hebben in hun spraakstaal,
maar kan de ene bijvoorbeeld opmerkelijk langere verlengingen vertonen. Op
basis van telling zouden deze twee personen een gelijkaardige score krijgen, maar
na timing wordt duidelijk dat de ene persoon een veel hogere stotterernst 'verdient'
dan de andere, wat ook zou terugkeren in de mening van de luisteraars. Het is
uiteraard zo dat de ene stotterparameter nu eenmaal een betere kandidaat is om
te timen in plaats van te tellen (zoals in het voorbeeld; de verlengingen) en
omgekeerd. Algemeen kan er echter gesteld worden dat de getimede parameters
vaker en beter overeenstemmen met de mening van de luisteraars. De resultaten
van een studie van Curran en Hood (1997) gaven aan dat onvloeiendheden die
18
-
gefragmenteerd (herhalingen en verlengingen) en hoorbaar zijn, als meer ernstig
worden gepercipieerd. Ook bleek duidelijk dat naarmate een herhaling uit meer
delen bestond, de ernstperceptie steeg (Curran & Hood, 1997). Deze laatste
bevinding klinkt zeer logisch en zal zich enkel kunnen uiten in de duur -en niet in
de telling- van de stotterparameter.
Wanneer de resultaten van twee beoordelaars naast elkaar worden gelegd, wordt
duidelijk dat timen een veiligere manier van 'meten' is dan tellen. Het is immers
realistisch dat de ene beoordelaar een zeer kort/subtiel stottermoment al eens zal
missen. Wanneer dit een aantal keer voorkomt, zullen de tellingresultaten al snel
een groot verschil vertonen. De timingresultaten lijden hier beduidend veel minder
onder (Corthals, 2009).
Via het hier gebruikte Praat-script wordt er een profiel van de persoon die stottert
bekomen. Al snel wordt duidelijk welke types van onvloeiendheden het frequentst
voorkomen en welke de meeste tijd in beslag nemen. Dit profiel vormt dan ook
een bron waaruit aanknopingspunten voor de stottertherapie kunnen voortvloeien.
Naast het streven naar zoveel mogelijk vloeiende spraak, zou werken aan de duur
van de herhalingen, blokkeringen en verlengingen en werken aan het aantal
overbodige gedragingen volgens de resultaten van deze studie een positieve
invloed moeten hebben op hoe ernstig hun onvloeiendheden door de luisteraars
worden gepercipieerd.
Door de onvloeiendheden te timen kunnen verborgen therapie-effecten aan het
licht gebracht worden. Een persoon die stottert kan immers na x-aantal
weken/maanden stottertherapie nog steeds evenveel herhalingen, blokkeringen
en/of verlengingen vertonen, maar mogelijks is hij/zij er wel in geslaagd om de
duur van zijn/haar onvloeiendheden te verminderen zonder dat de therapeute, en
misschien zelfs de patiënt, zich hiervan bewust was (Corthals, 2009).
Het 'overbodig gedrag' lijkt volgens de significante, negatieve correlatie te slagen
in zijn rol als 'ontwijkingsmanoeuvre'. Aangezien deze correlatie echter alle types
van overbodig gedrag bevat, kan de vraag gesteld worden of de verschillende
types afzonderlijk ook dit resultaat zouden opleveren. Uit de resultaten van het
gelijklopende onderzoek door studenten uit Virginia bleek enkel de telling van de
revisies een significante, negatieve correlatie te hebben met de algemene
19
-
stotterernst (niet gepubliceerde dissertatie). Het waren met andere woorden enkel
de revisies die de stotteraars als trucje konden gebruiken om vloeiender over te
komen bij de luisteraars. Het lijkt inderdaad aanneembaar dat de andere
overbodige gedragingen zoals het kuchen en smakken een eerder negatief effect
hebben bij de luisteraars. Dit zijn non-verbale gedragingen die als storend,
onwennig en/of onvloeiend kunnen aangevoeld worden door de luisteraar. De
interjecties hebben mogelijk minder de capaciteit om een vloeiende indruk te
maken. Verder onderzoek zou kunnen uitmaken of deze bevindingen ook gelden
wanneer er gewerkt wordt met audiovisueel materiaal. Wellicht zorgt de
aanwezigheid van het beeldmateriaal voor een ander effect en resultaat.
Er kan geconcludeerd worden dat het percentage vloeiende spraak, een getimede
parameter, de gemakkelijkste en bovendien belangrijkste parameter is bij het
voorspellen van de stotterernst zoals een panel van luisteraars die zou
percipiëren. De andere parameters uit de top 5 mogen echter niet in waarde
onderschat worden aangezien zij zoals reeds eerder vermeld een belangrijk
aangrijpingspunt vormen naar behandeling toe.
De bevindingen van deze studie duiden voor logopedisten het belang aan van de
nood aan een instrument (zoals bijvoorbeeld 'Praat') dat naast telling, vooral
nauwkeurige timing van de onvloeiendheden toelaat.
20
-
Conclusie
1. Bestaan er parameters om de stotterernst te bepalen?
Er werden 6 parameters gevonden die een significante correlatie vertonen
met de gemiddelde, door de luisteraars beoordeelde stotterernst:
% (timing) Aantal (telling)
Vloeiende spraak Overbodige gedragingen
Blokkeringen & verlengingen Blokkeringen & verlengingen
Herhalingen Herhalingen
2. Welke combinatie van parameters komt het best overeen met een
luisteraaroordeel?
De mening van de luisteraar wordt het best voorspeld door volgende top 5:
− percentage vloeiende spraak (37%)
− gemiddelde duur van vloeiende spraak (28%)
− percentage herhalingen (25%)
− percentage blokkeringen en verlengingen (8%)
− telling van het overbodig gedrag (2%)
3. Is onvloeiendheden timen dan wel tellen beter om de stotterernst te
bepalen?
Algemeen kan er gesteld worden dat de duur van de stotterparameters
(timing) vaker en beter correleert met de ernstperceptie van de luisteraars.
21
-
Referenties
Boey, R. (2007). Test voor Stotterernst Lezers (TvS-L). Herentals: Vlaamse
Vereniging voor Logopedisten.
Conture, E. (2001). Stuttering: Its nature, diagnosis, and treatment. Needham
Heights: MA: Allyn & Bacon.
Corthals, P. (2012). Onvloeiendheden timen en tellen in "Praat": een tutorial.
LOGOPEDIE, 68-75.
Corthals, P. (5-8 Aug. 2009). Timing and Tallying Dysfluencies using Praat
computer software. 5th World Congress on Fluency Disorders. Rio de Janeiro,
Brazil.
Curran, M. F., & Hood, S. B. (1977). Listener ratings of severity for specific
disfluency types in children. Journal of Fluency Disorders, 2, 87-97.
Einarsdóttir, J., & Ingham, J. R. (2008). The effect of stuttering measurement
training on judging stuttering occurrence in preschool children who stutter. Journal
of Fluency Disorders, 33, 167-179.
Huinck, W., & Rietveld, T. (2007). The validity of a simple outcome measure to
assess stuttering therapy. Folia Phoniatrica et Logopaedica, 59, 91-99.
O'Brian, S., Packman, A., Onslow, M., & O'Brian, N. (2004). Measurement of
stuttering in adults: comparison of stuttering-rate and severity-scaling methods.
Journal of Speech, Language, and Hearing Research, 47, 1081-1087.
Riley, G. (1972). A stuttering severity instrument for children and adults. Journal of
Speech and Hearing Disorders, 37, 314-322.
Rousseau, I., Onslow, M., Packmann, A., & Jones, M. (2008). Comparisons of
audio and audiovisual measures of stuttering frequency and severity on preschool-
age children. American Journal of Speech-Language Pathology, 17, 173-178.
Sawyer, J., & Yairi, E. (2006). The effect of sample size on the assessment of
stuttering severity. American Journal of Speech-Language Pathology, 15, 36-44.
22
-
Teessin, K., Packman, A., & Onslow, M. (2003). The Lidcombe behavioral data
language of stuttering. Journal of Speech, Language and Hearing Research, 44,
1009-1015.
Throneburg, R. N., & Yairi, E. (2001). Durational, Proportionate, and absolute
frequency characteristics of disfluencies: a longitudinal study regarding
persistence and recovery. Journal of Speech, Language, and Hearing Research,
44, 38-51.
Van Borsel, J. (2011). Basisbegrippen logopedie Deel 2:
communicatiestoornissen, Stotteren en broddelen. Leuven (België): Acco.
Wingate, M. E. (1964). A standard definition of stuttering. Journal of Speech and
Hearing Disorders, 29, 484-489.
Yairi, E., & Ambrose, N. (2005). Early childhood stuttering. Austin: TX: Pro-Ed.
Yaruss, J. S., Max, M., Newman, R., & Campbell, J. H. (1998). Comparing real-
time and transcript-based techniques for measuring stuttering. Journal of Fluency
Disorders, 23, 137-151.
23
-
Appendices
Appendix I: Specifieke menustappen
• Annoteren
− open het softwareprogramma 'Praat'
− kies in het 'Praat Objects' venster voor 'open' en 'read from file'
− kies het gewenste bestand dat geannoteerd moet worden
− klik op het gekozen spraakstaal zodanig dat dit grijs wordt
− kies voor 'annotate' en 'to textgrid'
− in het 'view & edit' venster kunnen grenzen gemaakt worden door op
'enter' te klikken en verwijderd worden via 'alt' + 'backspace'
− let op: geen extra spaties voor of achter de labels
− opslaan via 'file' en 'save Textgrid as text file' (Ctrl S)
• Scripting
− voeg het gewenste TextGrid-bestand in het 'Praat Objects' venster in
− selecteer dit bestand
− kies voor 'Praat' en 'open praat script'
− let er op dat de cursor in de eerste alinea staat en dus voor de
textgrid
− klik op 'run' in het broncode-venster (zie figuur 6)
FIGUUR 6: BRONCODE-VENSTER
24
-
Appendix II: Instructies en invulformulier luisteraarspanel
Welkom allemaal. Eerst en vooral wil ik jullie bedanken voor jullie deelname. Mijn
thesis gaat -samenvattend gezegd- over het bepalen van stotterernst. In het kader
hiervan gaan jullie zo dadelijk -één voor één- vijftien mannelijke en vrouwelijke,
Engelstalige mensen te horen krijgen die stotteren. Je hoort hen elk één minuut
praten. Hun leeftijd varieert van zeven tot veertig jaar. Het feit dat ze Engels
spreken doet eigenlijk niet ter zake omdat jullie hen niet moeten verstaan, jullie
moeten enkel op de onvloeiendheden letten. Jullie moeten telkens aan de hand
van een vijfpuntenschaal bepalen hoe erg je dit geval van stotteren vindt, waarbij
een score 'één' aanduidt dat je het niet zo ernstig vindt en een score 'vijf' dat je het
juist heel ernstig vindt. Als voorbeeld laat ik nu iemand horen die een 'gemiddelde
ernst' zou scoren, een score 'drie' met andere woorden. Zo kunnen jullie ten
opzichte van deze ernst de andere beoordelingen afwegen. Na ieder
geluidsfragment krijgen jullie eventjes de tijd om na te denken over jullie score.
Jullie mogen gedurende het hele half uur de cijfers nog veranderen, mochten jullie
bijvoorbeeld het vorige toch ernstiger vinden na het horen van een volgend
fragment. Ten slotte wil ik jullie vragen om je niet te laten leiden door hetgeen je
buren schrijven, er is geen juist of fout antwoord, ik ben benieuwd naar jullie
persoonlijke mening! Zijn er nog vragen?
25
-
26
Naam:..............................................................................................................................
Leeftijd:............................................................................................................................
Beroep/ Studierichting: ...................................................................................................
Datum:.............................................................................................................................
1= NIET ERNSTIG, 5= HEEL ERNSTIG
1 2 3 4 5
1) jongen, 14 jaar
2) jongen, 14 jaar
3) jongen, 14 jaar
4) meisje, 11 jaar
5) meisje, 11 jaar
6) jongen, 14 jaar
7) jongen, 11 jaar
8) jongen, 7 jaar
9) man, 20 jaar
10) man, 40 jaar
11) jongen, 9 jaar
12) meisje, 15 jaar
13) meisje, 11 jaar
14) jongen, 12 jaar
15) jongen, 11 jaar
-
DankwoordInhoudAbstractInleidingMethode SpraakstalenAnalyseprotocola) Annoteren b) Scriptc) Resultaten
LuisteraarspanelStatistische analyse
ResultatenDiscussieConclusieReferentiesAppendices Appendix I: Specifieke menustappen Appendix II: Instructies en invulformulier luisteraarspanel