Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

33
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie 1 Hoe gelexicaliseerder hoe vertrouwder? Een experimentele studie naar de leessnelheid en vertrouwdheidsoordelen van ‘hoe X-er hoe Y-er-constructies Anouk Vermulst ANR: 421974 UNR: 1271840 Masterscriptie Opleiding: Communicatie- en Informatiewetenschappen Faculteit: Tilburg School of Humanities Universiteit van Tilburg, Tilburg Aantal woorden: 8233 Begeleider: Dr. Rein Cozijn Tweede lezer: Dr. Maria Mos Juni 2019

Transcript of Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Page 1: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

1

Hoe gelexicaliseerder hoe vertrouwder?

Een experimentele studie naar de leessnelheid en vertrouwdheidsoordelen van ‘hoe X-er

hoe Y-er’-constructies

Anouk Vermulst

ANR: 421974

UNR: 1271840

Masterscriptie

Opleiding: Communicatie- en Informatiewetenschappen

Faculteit: Tilburg School of Humanities

Universiteit van Tilburg, Tilburg

Aantal woorden: 8233

Begeleider: Dr. Rein Cozijn

Tweede lezer: Dr. Maria Mos

Juni 2019

Page 2: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

2

Abstract

Er is onduidelijkheid over de manier waarop het mentale lexicon, de verzameling van alle

woorden die een spreker kent, is gestructureerd. Worden expressies woord voor woord

‘ontleed’ en zijn deze woorden apart opgeslagen in het lexicale geheugen, of worden

expressies in zijn geheel opgeslagen?

Middels een corpusstudie zijn tien ‘hoe X-er hoe Y-er’-, tien ‘hoe X-er hoe beter’- en

tien ‘hoe langer hoe Y-er’-constructies verzameld. Deze vormden, samen met 30 equivalente

‘als-dan’-constructies, het materiaal voor een leesexperiment. 65 participanten hebben

deelgenomen aan het experiment. Van hen zijn leestijden en de mate waarin zij expressies

‘vertrouwd’ vonden gemeten.

Expressies in een ‘hoe X-er hoe beter’-constructie werden sneller gelezen en als

vertrouwder beoordeeld dan ‘hoe-hoe’-constructies in een minder gefixeerd schema. Tevens

werden laagfrequente ‘hoe-hoe’-expressies als vertrouwder beoordeeld dan equivalente ‘als-

dan’-expressies, wat het aannemelijk maakt dat gedeeltelijke schema’s als geheel worden

opgeslagen in ons talig geheugen.

Page 3: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

3

Inhoudsopgave

Abstract 2

Inhoudsopgave 3

Introductie 4

1. Theoretisch kader 5

1.1 Taalverwerking 5

1.2 Productiviteit 8

1.2.1 Frequentie 9

1.3 Lexicalisatie 10

1.4 Hoe X-er hoe Y-er 13

1.5 Psycholinguïstisch onderzoek naar de 14

verwerking van gefixeerde uitdrukkingen

1.6 Vraagstelling 16

2. Methode 17

2.1 Participanten 17

2.2 Materiaal 18

2.3 Design 21

2.4 Instrumentatie 21

2.5 Procedure 22

3. Resultaten 23

4. Conclusie 27

5. Discussie 28

Referenties 31

Appendix A 33

Page 4: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

4

Introductie

Binnen taalverwerkingstheorieën bestaat er consensus over dat ieder mens een ‘mentaal

woordenboek’ heeft. Dit woordenboek, ook wel het mentale lexicon genoemd, bevat

waarschijnlijk niet alleen woorden, maar ook groepen van woorden die regelmatig samen

voorkomen (Jackendoff, 2002). Langacker (1988) beschrijft in zijn theorie Usage based

Model of Mental Grammar dat vaak voorkomende groepen woorden, gefixeerde

uitdrukkingen, kunnen ontstaan doordat bepaalde syntactische uitdrukkingen herhaaldelijk

worden berekend. Door het herhaaldelijk berekenen van deze expressies raken ze meer en

meer gefixeerd. Het gevolg hiervan is dat ze als eenheid op te halen zijn uit het mentale

lexicon.

Een expressie kan ook deels gefixeerd zijn. Een deels gefixeerde uitdrukking wordt

een schema genoemd. Een voorbeeld van een schema in de Nederlandse taal is het ‘hoe X-er

hoe Y-er’-schema, bijvoorbeeld ‘hoe eerder hoe beter’, ‘hoe moeilijker hoe fijner’ en ‘hoe

langer hoe leuker’. Het ‘hoe X-er hoe Y-er’-schema komt veel voor in het Nederlandstalige

corpus SoNaR. Daaruit kan worden geconcludeerd dat deze constructie met regelmaat

voorkomt in het dagelijks taalgebruik. Het is niet duidelijk hoe zo’n expressie wordt

opgeslagen in het talig geheugen. Volgens Langacker (1988) zou een frequent gebruikt

schema als eenheid opgeslagen moeten zijn in het mentale lexicon. Dit heeft implicaties voor

de verwerking van deels gefixeerde expressies. Hoe meer een expressie gefixeerd is, hoe lager

de druk op verwerkingscapaciteit is. Dit zorgt voor een snellere verwerking van gefixeerde en

(deels) schematische expressies (Smits, 2004). Als dit zo is, dan zouden de ‘hoe X-er hoe Y-

er’-constructies dus sneller gelezen moeten worden dan niet-schematische uitdrukkingen zoals

‘als X-er dan Y-er’. Op het moment dat expressies in het geheel zijn opgeslagen en ze in die

vorm frequent worden gebruikt, betekent dit wellicht ook dat ze vertrouwder worden

gevonden dan niet-schematische uitdrukkingen. Ook zouden schema’s die in mindere mate

gefixeerd zijn langzamer gelezen moeten worden en minder vertrouwd gevonden moeten

worden dan schema’s die gefixeerder zijn. In deze scriptie wordt middels een experiment

onderzocht of deze veronderstellingen kloppen.

Allereerst is er een kleinschalig corpusonderzoek uitgevoerd om materiaal te

selecteren. Er zijn drie schema’s gevonden die frequent voorkomen: ‘hoe X-er hoe Y-er’, ‘hoe

langer hoe Y-er’ en ‘hoe X-er hoe beter’. Van elk van deze schema’s zijn 5 hoogfrequente en

5 laagfrequente instanties geselecteerd als materiaal voor het leesexperiment. Deze 30

instanties van de ‘hoe-hoe’-constructie zijn in het leesexperiment ook aangeboden in een ‘als-

Page 5: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

5

dan’-constructie, welke in SoNaR niet of nauwelijks voorkomen. Zo is onderzocht of het

aanbieden van targetzinnen in een deels gefixeerde ‘hoe-hoe’-constructie zorgt voor een

kortere leestijd en hogere vertrouwdheidsoordelen dan zinnen in een niet-schematische ‘als-

dan’-constructie. De leestijden van de zinnen zijn gemeten. Na elke zin gaven participanten

aan hoe ‘vertrouwd’ ze zich voelden bij de zin. Zo is onderzocht of deels schematische

expressies leiden tot lagere leestijden en hogere vertrouwdheidsoordelen.

1. Theoretisch kader

In dit theoretisch kader wordt allereerst dieper ingegaan op de relevante aspecten van

taalverwerking zoals productiviteit, frequentie en lexicalisatie. Hierbij zal worden uitgelegd

wat onder schema’s wordt verstaan. Ook zal worden uitgelegd hoe de ‘hoe X-er hoe Y-er’-

constructie wordt gebruikt en wat de kenmerken van deze constructie zijn. Vervolgens zal

psycholinguïstisch onderzoek dat reeds is verricht naar de verwerking van gefixeerde

uitdrukkingen worden uitgelicht. Het theoretisch kader zal eindigen met de centrale

vraagstelling van deze scriptie.

1.1 Taalverwerking

Het ‘mentale woordenboek’ in het menselijk brein is een belangrijk begrip binnen de

taalwetenschap. Dit mentale woordenboek wordt ook wel het mentale lexicon genoemd en

omvat de verzameling van alle woorden die een spreker kent. Hieruit is het stereotype beeld

ontstaan dat het mentale lexicon alleen woorden bevat. Jackendoff (2002) stelde dat er een

belangrijk onderscheid is tussen ‘woorden’ en ‘lexicale items’. Lexicale items zijn volgens

Jackendoff alle eenheden die opgeslagen worden in het lexicale langetermijngeheugen. Deze

eenheden kunnen bestaan uit groepen van grammaticale woorden. ‘Woorden’ definieert

Jackendoff als grammaticale eenheden die opzichzelfstaand een betekenis hebben in het

lexicale geheugen. Dit onderscheid wordt geïllustreerd aan de hand van de uitdrukking ‘de

pijp uitgaan’. Wanneer deze drie grammaticale eenheden los van elkaar bekeken worden, zal

worden vastgesteld dat ‘de’ een lidwoord is, ‘pijp’ verwijst naar een langwerpige ronde koker

en ‘uitgaan’ een werkwoord is dat onder andere beschrijft hoe iets of iemand van punt A naar

punt B beweegt. Echter, deze drie grammaticale eenheden krijgen een andere betekenis

wanneer ze in deze specifieke volgorde gepresenteerd worden. Ze krijgen dan de betekenis

‘doodgaan’. De uitdrukking bestaat dus uit drie grammaticale eenheden, maar wordt als

Page 6: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

6

geheel opgeslagen in het lexicaal geheugen omdat de specifieke combinatie van deze drie

grammaticale eenheden een andere betekenis heeft dan wanneer deze drie woorden apart van

elkaar in een context worden gepresenteerd. Door Jackendoff zou deze uitdrukking dus

gedefinieerd worden als een lexicaal item.

Er zijn verschillende theorieën die voorspellingen doen over wat er zoal wordt

opgeslagen in het lexicale geheugen. Jackendoff (2002) onderbouwt in zijn boek het verschil

tussen het ‘online construeren’ van uitingen en het in zijn geheel opslaan van uitingen in het

langetermijngeheugen. Met ‘online construeren’ bedoelt Jackendoff het bouwen van

uitdrukkingen door woorden aan elkaar te plakken of gedeeltelijke schema’s in te vullen. Het

woord ‘hond’, zo legt hij uit, kan niet worden ontleed in deelwoorden en kan niet ‘online’

worden geconstrueerd omdat het een opzichzelfstaand grammaticaal woord is. Dit woord

wordt dus in zijn geheel opgeslagen in het lexicale langetermijngeheugen.

De zin ‘jouw hond heeft op mijn tapijt geplast’ kan vervolgens online worden

geconstrueerd door verschillende grammaticale woorden uit het lexicale

langetermijngeheugen aan elkaar te plakken. Echter, het is volgens Jackendoff (2002) ook

mogelijk dat de zin ‘jouw hond heeft op mijn tapijt geplast’ zodanig vaak geproduceerd wordt

dat deze uiting in zijn geheel als lexicaal item in het lexicale langetermijngeheugen wordt

opgeslagen. Voorbeelden van uitingen die in zijn geheel in het lexicale langetermijngeheugen

kunnen worden opgeslagen zijn uitdrukkingen zoals ‘fijne verjaardag’, ‘vergeven en

vergeten’, ‘veni, vidi, vici’ maar bijvoorbeeld ook titels van films, televisieprogramma’s en

songteksten.

Verschillende theorieën doen voorspellingen over de structuur van het mentaal

lexicon. In taalonderzoek is er onderscheid te maken tussen taalproductie en

taalcomprehensie. In deze scriptie staat taalcomprehensie centraal. Er zijn echter theorieën

met betrekking tot taalproductie die ook voor taalcomprehensie relevant zijn, bijvoorbeeld de

taalproductietheorie van Willem Levelt (1999). Levelt (1999) schetst in één van zijn

onderzoeken een zogenaamde ‘blueprint of the speaker’ waarin het gehele

taalproductieproces van een spreker is ontleed. In Figuur 1 is de ‘blauwdruk van de spreker’

te zien. De rechterkant van de blauwdruk is voor deze scriptie niet relevant. De linkerhelft

bevat echter wel een relevant component: grammaticaal encoderen van taaluitingen.

Page 7: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

7

Figuur 1: Levelt’s blauwdruk van de spreker (Levelt, 1999, p. 87).

Het grammaticaal encoderen van expressies is volgens Levelt (1999) één van de belangrijkste

stappen van het taalproductieproces. Het grammaticaal encoderen neemt zogeheten

‘preverbale’ uitdrukkingen als input uit het mentale lexicon. Als output produceert

grammaticaal encoderen ‘surface structures’, oppervlaktestructuren bestaande uit een

ordening van de lemma’s die worden geactiveerd bij het genereren van de preverbale

uitdrukking. Een lemma is in essentie hetzelfde als wat Jackendoff (2002) een lexicaal item

noemt. Volgens Levelt kan een lemma één of meerdere woorden bevatten. Het idioom ‘de

pijp uitgaan’ is een voorbeeld van een lemma met meerdere woorden. Lemma-selectie is een

belangrijke stap in het proces van grammaticaal encoderen.

Lemma’s bevatten verschillende soorten informatie. Twee soorten informatie zijn

belangrijk bij het grammaticaal encoderen van een taaluiting, namelijk betekenisinformatie en

informatie over syntactische eigenschappen. Ten eerste is de betekenis relevant, omdat een

spreker moet weten wat er bedoeld wordt met de woorden die worden geuit. Dit is dus in feite

‘wat’ er gezegd wordt. Ten tweede zijn de syntactische eigenschappen van een woord, zoals

woordsoort, belangrijk om een woord correct grammaticaal te kunnen encoderen. Dit is dus

‘hoe’ taal geuit wordt. Een lexicaal concept in een uiting activeert het corresponderende

lemma. Als dit lemma dan vervolgens geselecteerd wordt, worden de syntactische

eigenschappen van het lemma toegankelijk uit het mentale lexicon.

Bybee (1995) stelt dat woorden in het mentale lexicon worden opgeslagen met een

bepaalde ‘lexical strength’. Hoe sterker de lexicale kracht, des te meer verbonden lemma’s in

het mentale lexicon zijn. Dit zorgt voor lexicale connecties tussen woorden. Zo kan het zijn

Page 8: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

8

dat bij het oproepen van het werkwoord ‘selecteren’ uit het mentale lexicon óók het

werkwoord ‘kiezen’ wordt opgeroepen. Dit komt doordat deze twee woorden min of meer

synoniemen van elkaar zijn, dus zullen ze vaak in eenzelfde context gebruikt worden. Het

oproepen van één van deze lexicale items kan ervoor zorgen dat lexicale items die middels

een lexicale connectie aan elkaar verbonden zijn, ook opgeroepen worden. Het is echter niet

duidelijk of een expressie van meerdere grammaticale woorden in zijn geheel als lexicaal item

wordt opgeslagen in het talig geheugen, of dat een expressie keer op keer wordt ‘gebouwd’

door de losse stukjes aan elkaar te plakken. De volgende paragraaf gaat hier dieper op in.

1.2 Productiviteit

Gebruikers van taal zijn continu bezig met het vormen en begrijpen van expressies. Het is

mogelijk om expressies te vormen die nog nooit eerder gebruikt zijn. Sprekers hebben twee

opties als het gaat om het produceren van een expressie: het aan elkaar plakken van woorden

uit het lexicale geheugen om zo nieuwe expressies te ‘bouwen’ of het ophalen van een groep

regelmatig voorkomende woorden uit het lexicale geheugen. Het produceren van expressies

door verschillende woorden uit het lexicale geheugen aan elkaar te plakken wordt ook wel het

productief vormen van een expressie genoemd. Dit kan worden gedaan door woorden in te

vullen in een gedeeltelijk schema (Bybee, 1995).

Schema’s kunnen volgens Langacker (1988) in meer of mindere mate gefixeerd zijn.

Schema’s die in meer of mindere mate gefixeerd kunnen zijn worden door Langacker ‘lagere

schema’s’ genoemd. Er bestaat volgens hem ook een tweede soort schema’s, namelijk

‘hogere’ ongespecificeerde schema’s, die syntactische en morfologische regels bevatten.

Hieronder vallen bijvoorbeeld de syntactische regels die beschrijven hoe meervoudsvormen

gevormd dienen te worden. Om van het woord ‘strijkijzer’ meervoud te maken, moet er een -s

aan toegevoegd worden. De meervoudstoevoeging ‘-s’ is een typisch voorbeeld van een hoger

schema. Volgens Langacker worden deze ‘hogere’ schema’s maar zelden gebruikt en zijn

taalgebruikers over het algemeen afhankelijk van de ‘lagere’, minder abstracte schema’s. Het

is volgens Langacker dan ook waarschijnlijk dat we voor frequent voorkomende

meervoudsvormen, zoals de uitgang ‘-s’, een lager schema hebben opgebouwd.

In deze context heeft Jackendoff (2002) het over productieve morfologie. Productieve

morfologie is het toepassen van regelmatige syntactische regels om woorden te vormen. Zo

kunnen bijvoeglijke naamwoorden in het Engels bijvoorbeeld gevormd worden door de

uitgang -ly toe te voegen aan een woord. Een voorbeeld van een Nederlandse productieve

Page 9: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

9

morfologische regel is het toevoegen van -baar aan een woord. Wanneer dit morfeem achter

de stam van een werkwoord is gevoegd, dan geeft dat aan dat de actie die door het werkwoord

beschreven wordt ‘te doen’ is (Backus & Mos, 2011). Zelfs als een niet-bestaand woord zoals

‘glarf’ wordt opgevolgd door het morfeem ‘-baar’, dan is het duidelijk dat iets ‘te glarfen’ is.

Deze syntactische regels zijn te classificeren als een gedeeltelijk schema. De uitgang -baar is

immers het schematische deel, waarbij de stam van het werkwoord in dit geval een open

positie is.

De waarschijnlijkheid waarmee een (gedeeltelijk) schema gebruikt gaat worden voor

nieuwe items is afhankelijk van twee factoren. Ten eerste is het afhankelijk van de

definiërende eigenschappen van het schema. Wanneer de definiërende eigenschappen van het

schema erg specifiek zijn, zijn er minder items in te vullen in de open posities waardoor het

schema minder wordt in productiviteit. De tweede factor is hoe sterk het schema is. Dit is

afhankelijk van hoe vaak een schema voorkomt en in welke vormen dit schema voorkomt.

Zowel expressies die niet als geheel in het talig geheugen zijn opgeslagen als

expressies die dat wel zijn, worden door sprekers continu gebruikt. Het is echter niet duidelijk

welke expressies zijn opgeslagen in het talig geheugen en welke er keer op keer opnieuw

worden ‘berekend’. Een belangrijke rol hierbij speelt frequentie, het aantal keer dat een

bepaalde expressie wordt gebruikt (Backus & Mos, 2011; Bybee, 1995).

1.2.1 Frequentie

Bybee (1995) deed onderzoek naar productiviteit in taalverwerking door de rol van een hoge

type-frequentie in productiviteit te onderzoeken. Een hoge type-frequentie wil zeggen het

aantal ‘unieke’ instanties waarin een schema voorkomt. Bijvoorbeeld, de type-frequentie van

de meervoudsvorm ‘-en’ in het Nederlands is alle verschillende instanties waarin deze

meervoudsvorm voorkomt. ‘Stokken’, ‘flessen’ en ‘hoezen’ zijn dus allemaal types van dit

schema. Token-frequentie is dan het aantal keren dat het schema in totaal voorkomt. De

token-frequentie van de meervoudsvorm ‘-en’ is dus het totaal aantal keren dat deze

meervoudsvorm voorkomt. Bybee (1995) concludeert dat een hoge type-frequentie cruciaal is

voor productiviteit; unieke instanties waarin een schema voorkomt kunnen ‘gebouwd’ worden

door woorden uit het mentale lexicon aan elkaar te plakken.

De belangrijke rol van frequentie in productiviteit is aangetoond door Bybee (1995)

middels een studie waarin de taalverwerving van jonge kinderen werd onderzocht. In veel

Romaanse talen zoals het Spaans en het Frans is een aantal werkwoord-uitgangen dominant

Page 10: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

10

(bijvoorbeeld -er in het Frans). Niet-dominante uitgangen, zoals -re, hebben een lage type-

frequentie, maar een hoge token-frequentie. Het aantal door de kinderen geproduceerde

werkwoord-uitgangen werd geteld. Daaruit bleek dat niet de uitgangen met de hoogste type-

frequentie, maar juist de woorden met de hoogste token-frequentie het meest door de kinderen

werden gebruikt. Deze vormen komen het vaakst voor, zijn dus het meest toegankelijk en

worden daarom door kinderen die ‘de regel’ met betrekking tot werkwoord-uitgangen nog

niet accuraat toe kunnen passen het meest gebruikt.

Vormen met een hoge individuele token-frequentie worden vaker als geheel

aangeleerd in plaats van dat men deze moet ‘ontleden’. Deze vormen zijn niet bevorderlijk

voor de productiviteit van een uiting. Zo is het mogelijk dat twee klassen van onregelmatige

werkwoorden in het Engels met een vergelijkbare type-frequentie significant verschillen in

productiviteit, omdat de token-frequentie van de twee klassen van elkaar verschillen. Zo is de

werkwoordsvorm ‘strung’, met 13 types en 199 tokens, veel productiever dan de

werkwoordsvorm ‘swept’, die 14 types en 656 tokens heeft (Bybee, 1995). Baayen en Lieber

(1991) stellen tevens dat type-frequentie bevorderlijk is voor de productiviteit van een

bepaalde taalvorm, en dat token-frequentie schadelijk is voor de productiviteit.

Dabrowska (2004) stelt dat er drie factoren zijn die de waarschijnlijkheid voorspellen

waarmee een woord productief zal worden gevormd: type-frequentie, of het woord regelmatig

is of niet en fonologische heterogeniteit, de mate waarin het woord ‘klinkt als’ een ander

woord. Wanneer de type-frequentie van een constructie hoog is, dan is de kans groter dat er

een nieuwe instantie van dit type productief wordt gevormd. Hoe hoger de type-frequentie

van een constructie, hoe regelmatiger het woord is en hoe gelijkender het woord fonologisch

is met andere woorden, des te hoger de productiviteit van een constructie.

Het is duidelijk dat er een belangrijke relatie bestaat tussen productiviteit en

frequentie. Hoe meer een bepaald schema in unieke gevallen voorkomt, des te hoger de type-

frequentie en productiviteit van dat schema. De tegenhanger van productiviteit is lexicalisatie,

het in zijn geheel opslaan van gehele woordgroepen en volledig ingevulde schema’s in

lexicaal geheugen.

1.2 Lexicalisatie

Doordat bepaalde syntactische uitdrukkingen herhaaldelijk worden berekend kan een

uitdrukking gefixeerd worden. Gefixeerde uitdrukkingen zijn als lexicaal item op te halen uit

het mentale lexicon, waardoor uitdrukkingen vervolgens niet meer door de spreker of

Page 11: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

11

toehoorder te hoeven worden ‘ontleed’. Zo’n eenheid, in de literatuur ook een

geprefabriceerde uitdrukking of afgekort ‘prefab’ genoemd, wordt door Wray en Perkins

(2000) gedefinieerd als een sequentie woorden of andere betekeniselementen die als geheel

opgeslagen in en opgehaald uit het mentale lexicon kunnen worden, zonder dat deze

geproduceerd of geanalyseerd hoeven te woorden door taalgrammatica.

Geprefabriceerde uitdrukkingen zijn dus gelexicaliseerde uitdrukkingen. Erman en

Warren (2000) geven twee redenen waarom het definiëren van gelexicaliseerde uitdrukkingen

problematisch kan zijn. Ten eerste omdat niet voor iedereen een bepaalde expressie

opgeslagen zal zijn als gelexicaliseerde uitdrukking. Dit is voor elke spreker heel persoonlijk.

Ten tweede is het moeilijk om erachter te komen of een dergelijke sequentie woorden als

gelexicaliseerde uitdrukking tellen, omdat ze op het eerste gezicht compositioneel kunnen

lijken.

Naar het bestaan en het gebruik van gelexicaliseerde uitdrukkingen is reeds veel

onderzoek verricht. Erman en Warren (2000) deden onderzoek naar het zogenaamde ‘open

choice’ principe versus het ‘idiom choice’ principe. Het open choice principe omvat het

combineren van aparte lexicale items middels het gebruik van een aantal syntactische regels.

Dit is dus te vergelijken met het fenomeen productiviteit. Het idiom choice principe houdt in

het gebruik van gelexicaliseerde multi-woord eenheden. Deze eenheden zouden als eenheid

opgeslagen zijn in het lexicale geheugen, en is daarom te vergelijken met het fenomeen

lexicalisatie. Erman en Warren (2000) stellen dat een spreker bij het produceren van taal

afwisselt tussen het toepassen van het open choice principe en het idiom choice principe. Het

uiteindelijke doel van hun studie was het geven van een realistische representatie van de

structuur van het mentale lexicon. Erman en Warren (2000) concludeerden dat ongeveer 55

procent van de tekst die zij analyseerden bestond uit gelexicaliseerd taalgebruik. Zij hebben

dit gemeten door de ‘restricted exchangeabilitytest’ uit te voeren. Ten minste één item uit de

gelexicaliseerde uitdrukking mag niet vervangbaar zijn door een synoniem item zonder dat de

betekenis van het geprefabriceerde item verloren gaat. Erman en Warren (2000) geven hier

een voorbeeld van. ‘I’m afraid’ is een uitdrukking die in het Engels vaak wordt gebruikt om

een deel slecht nieuws te verzachten voor de toehoorder. ‘Afraid’ kan niet worden vervangen

door een synoniem item zoals ‘scared’ zonder dat er betekenisverlies optreedt, dus is ‘I’m

afraid’ een typisch geval van een Engelse gelexicaliseerde uitdrukking.

Erman en Warren (2000) concluderen dus dat meer dan de helft van de tekst die zij

hebben geanalyseerd bestaat uit (woorden uit) gelexicaliseerde uitdrukkingen. In hun definitie

Page 12: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

12

van een gelexicaliseerde uitdrukking zijn Erman en Warren echter niet streng geweest. Zij

verstaan onder een ‘geprefabriceerde uitdrukking’ elke combinatie van meer dan één woord.

Zo zou ‘theekopje’ bijvoorbeeld geen uitdrukking zijn, maar als het als ‘thee kopje’ gespeld

zou zijn, dan wel. Desalniettemin concluderen Erman en Warren (2000) dat gelexicaliseerde

uitdrukkingen veel voorkomen in teksten. Ook vinden Erman en Warren bevestiging voor hun

hypothese over het combineren van gelexicaliseerde uitdrukkingen met niet-gelexicaliseerde

uitdrukkingen. Zij concluderen dat er bij het schrijven van een tekst veel wordt geswitcht

tussen het gebruik van gelexicaliseerde uitdrukkingen en uitdrukkingen die niet

gelexicaliseerd zijn.

Het gebruiken van gelexicaliseerde uitdrukkingen heeft verschillende voordelen.

Gelexicaliseerde uitdrukkingen zijn makkelijker te memoriseren dan expressies die nog online

geconstrueerd moeten worden (Smits, 2004). Of dat ook betekent dat gelexicaliseerde

eenheden sneller uit het mentale lexicon worden opgehaald dan niet-gelexicaliseerde

uitdrukkingen is nog onduidelijk. Tevens kan de grammaticale encodering die Levelt (1999)

als belangrijk onderdeel van het taalproductieproces beschouwde worden overgeslagen

wanneer er gebruik wordt gemaakt van een gelexicaliseerde uitdrukking. Ten slotte wordt de

betekenis van de gelexicaliseerde uitdrukking bepaald door het corresponderende schema en

is de betekenis daardoor makkelijk te bepalen (Smits, 2004).

Een nadeel van het gebruiken van een gelexicaliseerde uitdrukking is het feit dat een

in zijn geheel opgeslagen expressie een beperkter aantal gebruiksmogelijkheden heeft (Smits,

2004). De gelexicaliseerde eenheid ‘happy birthday to you’ is hoogfrequent, maar is niet in

veel verschillende contexten toe te passen. Deze gelexicaliseerde eenheid is namelijk alleen te

gebruiken wanneer men iemand een fijne verjaardag wil wensen. Het grammaticale woord

‘happy’ kan echter in veel meer contexten gebruikt worden. Het aantal

gebruiksmogelijkheden neemt af naarmate de gelexicaliseerde eenheid langer en specifieker

wordt.

De vraag of het lexicale geheugen voornamelijk uit losse woorden die door middel van

het invullen van schema’s keer op keer ‘gebouwd’ moeten worden of uit gelexicaliseerde,

geprefabriceerde uitdrukkingen bestaat is nog niet beantwoord. Door middel van dit

onderzoek wordt getracht een bijdrage te leveren aan deze discussie. Het is nu duidelijk dat er

gefixeerde uitdrukkingen bestaan die als geheel opgeslagen worden in het mentale lexicon. Er

zijn echter ook uitdrukkingen die gedeeltelijk gefixeerd zijn. Deze deels-gefixeerde

uitdrukkingen worden schema’s genoemd. Een voorbeeld van een schema in de Nederlandse

Page 13: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

13

taal is de ‘hoe X-er hoe Y-er’-constructie. De kenmerken en vorm van deze constructie zullen

nu worden uiteengezet.

1.4 Hoe X-er hoe Y-er

De specifieke constructie waar in deze scriptie naar gekeken zal worden is de ‘hoe X-er hoe

Y-er’-constructie. Er is een corpusonderzoek uitgevoerd waarin honderden verschillende

instanties van deze constructie zijn bekeken. In paragraaf 2.2 zijn de uitkomsten van dit

corpusonderzoek uitgelicht. Na het bekijken van deze verschillende instanties is te

concluderen dat het schema er als volgt uitziet:

‘HOE’ [adj.] ‘HOE’ [adj.].

Hoffmann, Horsch en Brunner (2019) deden onderzoek naar de Engelse equivalent van deze

constructie, de the X the Y-constructie. Zij noemen deze constructie een minder frequente

vorm van de filler-gap constructies. Met ‘gaps’ bedoelen zij de open posities in een

constructie. De ‘hoe X-er hoe Y-er’-constructie heeft twee posities, de ‘gaps’, die open zijn.

Hier kunnen dan bijvoeglijke naamwoorden worden ingevuld, bijvoorbeeld ‘langer’ en

‘groter’. Hiermee kan dan een instantie van het schema ‘hoe X-er hoe Y-er’ gevormd worden.

‘Langer’ en ‘groter’ zijn dus ‘fillers’ in de twee open posities die het schema heeft. De ‘hoe

X-er hoe Y-er’-constructie kan in meer of mindere mate gefixeerd zijn. Het is mogelijk dat de

X- en/of Y-positie gefixeerd is. Een meer gefixeerde variant van het ‘hoe X-er hoe Y-er’-

schema is bijvoorbeeld ‘hoe X-er hoe beter’. De Y-positie van de constructie is in dit geval

ook ingevuld, waardoor dit schema meer gefixeerd is dan de ‘hoe X-er hoe Y-er’-variant. Het

‘hoe X-er hoe Y-er’-schema zou volgens Langacker (1988) gespecificeerd worden als een

‘lager schema’ omdat het schema in meer of mindere mate gefixeerd kan zijn.

Cappelle (2011) beschrijft de twee volgens hem belangrijke semantische aspecten van

de ‘hoe X-er hoe Y-er’ -constructie. Dit zijn dynamicity en directionality. Dynamicity

gebruikt hij om aan te geven dat met behulp van de constructie aangeduid kan worden dat

zaken op verschillende schalen met elkaar vergeleken worden. De ‘hoe X-er hoe Y-er’

constructie duidt een ‘beweging’ op de ene schaal ten opzichte van de ‘beweging’ op de

andere schaal aan. De constructie ‘hoe langer hoe moeilijker’ laat beweging zien op de schaal

van lengte (of tijd) ten opzichte van beweging op de schaal van moeilijkheid. Met andere

woorden, de ‘hoe X-er hoe Y-er’-constructie geeft een dynamische relatie weer, geen

statische.

Page 14: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

14

Het tweede semantische aspect is directionality, wat inhoudt dat de X-positie van de

constructie de onafhankelijke variabele bevat en de Y-positie van de constructie de

afhankelijke variabele. In de constructie ‘hoe leuker hij het vindt, hoe harder hij lacht’ is de

invulling van de X-positie, namelijk het grammaticale woord ‘leuker’, de onafhankelijke

variabele omdat het een toename in het lachgeluid teweegbrengt. Het grammaticale woord in

de Y-positie, ‘harder’, is dus een gevolg van een verandering van de onafhankelijke variabele.

De onafhankelijke variabele in positie X beïnvloedt de afhankelijke variabele in positie Y. Er

zit dus een bepaalde richting in de constructie waarin geredeneerd wordt, van positie X naar

positie Y.

De ‘hoe X-er hoe Y-er’-constructie is een comparatieve constructie waarin de toestand

van de onafhankelijke variabele in positie X wordt vergeleken met de toestand van de

afhankelijke variabele in positie Y. Naar de verwerking van gefixeerde uitdrukkingen en

schema’s is reeds onderzoek verricht. Dit specifieke schema is echter nog niet onderzocht. In

de volgende paragraaf zullen enkele studies worden uitgelicht die psycholinguïstisch

onderzoek verrichtten naar de verwerking van gefixeerde uitdrukkingen.

1.5 Psycholinguïstisch onderzoek naar de verwerking van gefixeerde uitdrukkingen

De studies die reeds zijn verricht naar de verwerking van gefixeerde uitdrukkingen

onderzochten niet dezelfde uitdrukkingen, maar kunnen toch relevant zijn in het achterhalen

welke cognitieve processen belangrijk zijn bij de verwerking van gefixeerde expressies. Bij de

verwerking van vaste uitdrukkingen zoals ‘het voordeel van de twijfel’ kunnen we ervan

uitgaan dat vergelijkbare cognitieve processen worden gebruikt als bij de verwerking van ‘hoe

X-er hoe Y-er’-constructies

Schilperoord en Cozijn (2010) deden oogbewegingsregistratieonderzoek naar

gefixeerde expressies door vaste uitdrukkingen zoals ‘het is mij een groot genoegen’ en ‘hij

werkt op mijn zenuwen’ in gefixeerde- en in gemodificeerde vorm aan te bieden, bijvoorbeeld

‘hij werkt op mijn gevoelige zenuwen’. Zo trachtten zij aan te tonen dat entiteiten uit

gefixeerde uitdrukkingen minder toegankelijk zijn als antecedent bij het oplossen van

anaforische relaties. De resultaten van het onderzoek wezen uit dat de anaforische relaties in

de tekstjes met daarin gefixeerde uitdrukkingen inderdaad minder snel werden opgelost dan

de relaties uit tekstjes met gemodificeerde uitdrukkingen. Leestijden van het gedeelte na de

anaforische expressies waren langer bij een gefixeerde uitdrukking dan bij een niet-gefixeerde

uitdrukking. Participanten sprongen bij het lezen van de zinnen vaker terug naar expressies

Page 15: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

15

die gefixeerd waren dan naar expressies die niet-gefixeerd waren. Schilperoord en Cozijn

(2010) concludeerden dat entiteiten uit een gefixeerde expressie minder toegankelijk zijn

omdat de gefixeerde expressie als eenheid ‘in de weg’ zit. De verwijzing naar een entiteit is

dus moeilijker bij een gefixeerde expressie omdat de delen van de expressie niet zo

toegankelijk zijn als delen van een niet-gefixeerde expressie.

Sprenger (2003) heeft experimenteel onderzoek verricht naar de verwerking van

idiomen. Een idioom is een gefixeerde uitdrukking met een figuurlijke betekenis. Er is vaak

geen relatie tussen wat de uitdrukking in zijn geheel betekent en wat de losse woorden apart

betekenen, bijvoorbeeld het in paragraaf 1.1 genoemde idioom ‘de pijp uitgaan’. Sprenger

(2003) tracht in kaart te brengen hoe idiomen mentaal in het lexicaal geheugen zijn

gerepresenteerd. Dit werd gedaan door paren te maken tussen idiomatische expressies zoals

‘door de mand vallen’ en normale expressies bestaande uit dezelfde grammaticale onderdelen,

zoals ‘in de mand zitten’. Participanten werd gevraagd om zowel de idiomatische als de

normale expressies uit hun hoofd te leren. Zodra ze dit hadden gedaan, zagen participanten

ezelsbruggetjes bestaande uit één woord. Voor ‘door de mand vallen’ was het ezelsbruggetje

bijvoorbeeld ‘bekennen’ en voor ‘in de mand zitten’ was deze ‘resideren’. Ook hoorden de

participanten een ‘prime’, dit woord kwam letterlijk voor in de te produceren zin. In het geval

van de zinnen ‘door de mand vallen’ en ‘in de mand leggen’ was de prime bijvoorbeeld het

woord ‘mand’. Er werd gemeten hoe veel tijd het de participanten kostten om te beginnen met

uiten van de zinnen die ze moesten produceren. De resultaten wezen uit dat de invloed van de

prime sterker was bij de gefixeerde uitdrukkingen dan bij niet gefixeerde uitdrukkingen.

Vermoedelijk is dit het geval omdat de gefixeerde uitdrukkingen in het lexicaal geheugen zijn

opgeslagen als eenheid waardoor de prime een directe relatie heeft met alle woorden waaruit

het idioom bestaat. Daarentegen hebben de grammaticale woorden ‘mand’ en ‘resideren’

waarschijnlijk geen directe lexicale connectie. Om deze reden kost het participanten

vermoedelijk minder tijd om woorden uit een gefixeerde uitdrukking te produceren wanneer

deze uitdrukkingen geprimed zijn.

Er is nu meer duidelijk over wat de productiviteit versus lexicalisatie-discussie

inhoudt. Begrippen zoals taalverwerking, frequentie en schema’s zijn een belangrijk

onderdeel van deze discussie. In de volgende paragraaf zullen de centrale vraagstelling en de

hypotheses van deze scriptie uiteen worden gezet.

Page 16: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

16

1.6 Vraagstelling

Er is veel onderzoek verricht naar de manier waarop het mentaal lexicon is gestructureerd.

Een belangrijke discussie rondom dit onderwerp gaat over productiviteit versus lexicalisatie.

‘Bouwen’ we constructies keer op keer, of slaan we naar verloop van tijd gehele constructies

als lexicaal item op in het mentaal lexicon? Deze scriptie tracht een bijdrage te leveren aan die

discussie. Dat wordt gedaan door antwoord te geven op de volgende vragen:

Bevordert het gebruik van (deels) schematische constructies de leessnelheid en verhoogt het

gebruik van (deels) schematische constructies het gemiddelde vertrouwdheidsoordeel dat aan

een constructie wordt toegekend door participanten?

Deze onderzoeksvragen zullen worden beantwoord middels een experiment. In het

experiment zullen zinnen in een ‘hoe X-er hoe Y-er’-constructie worden vergeleken met

zinnen in een ‘als X-er dan Y-er’-constructie, om af te tasten of constructievorm effect heeft

op leestijden en vertrouwdheidsoordelen.

Er is gekeken naar de type-frequentie waarmee schema’s voorkomen in SoNaR.

Frequentie is voor dit onderzoek als controlemaat meegenomen, omdat frequentie-effecten al

reeds aangetoonde en robuuste effecten zijn. Bybee (1995) concludeert dat hoogfrequente

constructies sneller worden gelezen dan laagfrequente omdat hoogfrequente constructies reeds

als eenheid in talig geheugen zijn opgeslagen. Laagfrequente constructies zouden keer op keer

opnieuw ‘aan elkaar geplakt’ moeten worden, waardoor de leestijd voor deze constructies

langer is. Om te controleren of frequentie in dit experiment dit verwachte effect heeft, zijn

voor deze controlemaat twee hypotheses opgesteld.

Corpusonderzoek wijst uit dat de schema’s ‘hoe langer hoe Y-er’ en ‘hoe X-er hoe

beter’ frequent voorkomen in dagelijks taalgebruik. Smits (2004) stelt dat schematische

uitdrukkingen makkelijker te memoriseren zijn dan expressies die niet of in mindere mate

gelexicaliseerd zijn. Door deels ingevulde schema’s te vergelijken met het abstractere schema

‘hoe X-er hoe Y-er’, waarin zowel de X- als de Y-posities nog niet ingevuld zijn, wordt

getracht aan te tonen dat hoe schematischer een constructie is, hoe lager de leestijden en hoe

hoger de vertrouwdheidsoordelen zijn.

Tevens worden laagfrequente ‘hoe-hoe’-constructies vergeleken met hun ‘als-dan’-

equivalent om te onderzoeken of het aanbieden van expressies in een schematische

Page 17: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

17

constructie leestijden verlaagt en vertrouwdheidsoordelen verhoogt.

Om de onderzoeksvragen te beantwoorden zijn hypotheses opgesteld:

Ter controle, H1a: Hoogfrequente constructies zullen sneller worden gelezen dan

laagfrequente constructies.

Ter controle, H1b: Hoogfrequente constructies zullen als vertrouwder worden beoordeeld dan

laagfrequente constructies.

H2a: Zinnen in een ‘hoe-hoe’-constructie zullen sneller worden gelezen dan vergelijkbare

zinnen in een ‘als-dan’-constructie.

H2b: Zinnen in een ‘hoe-hoe'-constructie zullen als vertrouwder worden beoordeeld dan

vergelijkbare zinnen in een ‘als-dan’-constructie.

H3a: Zinnen in een ‘hoe X-er hoe beter’- constructie en in een ‘hoe langer hoe Y-er’-

constructie zullen sneller worden gelezen dan zinnen in een ‘hoe X-er hoe Y-er’-constructie.

H3b: Zinnen in een ‘hoe X-er hoe beter’-constructie en in een ‘hoe langer hoe Y-er’-

constructie zullen als vertrouwder worden beoordeeld dan zinnen in een ‘hoe X-er hoe Y-er’-

constructie.

H4a: Laagfrequente ‘hoe-hoe’-constructies in een bepaald schema zullen sneller worden

gelezen dan de equivalente ‘als-dan’-constructies.

H4b: Laagfrequente ‘hoe-hoe’-constructies in een bepaald schema zullen vertrouwder worden

beoordeeld dan de equivalente ‘als-dan’-constructies.

2. Methode

Om de onderzoeksvragen te kunnen beantwoorden is er een experiment uitgevoerd. In dit

experiment zijn de leestijden en vertrouwdheidsoordelen die participanten gaven aan zinnen

die zowel in een ‘hoe-hoe’-constructie als een ‘als-dan’-constructie werden aangeboden

gemeten.

2.1 Participanten

In totaal hebben 65 participanten deelgenomen aan het experiment. De participanten waren

studenten aan de Faculteit Geesteswetenschappen van de Universiteit van Tilburg. 41

participanten waren bachelor studenten, 20 premasterstudenten en 4 masterstudenten. De

participanten zijn benaderd via een proefpersonenpool en kregen 0.5 punt om deel te nemen

aan het experiment. De leeftijden van de participanten lagen tussen de 18 en de 27 jaar, met

Page 18: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

18

een gemiddelde van 21.5 jaar.

2.2 Materiaal

Voor het selecteren van het materiaal is een kleinschalig corpusonderzoek uitgevoerd. Daar is

SoNaR voor gebruikt, een Nederlandstalig corpus van hedendaagse en geschreven taal

bestaande uit circa 500 miljoen woorden. SoNaR is bedoeld om linguïstisch onderzoek mee te

verrichten.

In de zoekopdracht zijn de woorden ‘hoe ADJECTIEF hoe ADJECTIEF’ ingevuld.

Opmerkelijk is dat de instanties van de constructie die het woord ‘meer’ bevatten, zoals ‘hoe

meer hoe beter’, niet in de zoekresultaten waren opgenomen. Vermoedelijk komt dit door de

aparte vorm van het adjectief ‘meer’, een afwijkende vergrotende trap vergeleken met andere

vormen van de vergrotende trap. Er is om die reden een additionele corpus zoekopdracht

gedaan naar het woord ‘meer’ in de eerste positie en een zoekopdracht met ‘meer’ in de

tweede positie.

In de zoekresultaten was een aantal fouten te vinden, bijvoorbeeld ‘hoe oud hoe oud’

en ‘hoe groot hoe klein’. Deze zoekresultaten zijn niet meegenomen in het onderzoek. Ook

kwam eenzelfde hit in het corpus met en zonder hoofdletter als twee aparte zoekresultaten

voor. Deze werden samengevoegd. Ten slotte is ‘hoe vetiiger hoe prettiger’ geïnterpreteerd

als een spelfout van de constructie ‘hoe vettiger hoe prettiger’. Na deze handmatige check van

de zoekresultaten bleven er 1790 tokens over, verdeeld over 383 types. 1

De constructie ‘hoe langer hoe meer’ is in het corpus verreweg het meest frequent.

Deze constructie heeft 943 hits en vormt, samen met de constructies ‘hoe meer hoe beter’,

‘hoe langer hoe moeilijker’, ‘hoe eerder hoe beter’, en ‘hoe langer hoe beter’ de top vijf van

meest frequent voorkomende ‘hoe X-er hoe Y-er’-constructies.

Uit de corpusstudie is gebleken dat het woord ‘beter’ in verhouding erg vaak in de Y-

positie wordt ingevuld. Van de 383 verschillende types die in totaal zijn gevonden waren 107

expressies daarvan instanties van het schema ‘hoe X-er hoe beter’. Niet alleen de Y-positie

kan gefixeerd zijn, het kan ook zo zijn dat de X-positie gefixeerd is. Zo waren er in totaal 136

unieke instanties van het schema ‘hoe langer hoe Y-er’. Hieruit is te concluderen dat het

schema ‘hoe X-er hoe Y-er’ in meer of mindere mate gefixeerd kan zijn en dat de X en/of Y-

posities in deze expressie ook gefixeerd kunnen zijn.

Wanneer ‘meer’ ingevuld wordt in de Y-positie van de ‘hoe X-er hoe Y-er’-

1 De volledige resultaten van het corpusonderzoek zijn bij de auteur te verkrijgen.

Page 19: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

19

constructie, wordt duidelijk dat de constructie ‘hoe langer hoe meer’ 943 keer voorkomt. Deze

constructie is het meest frequent van alle ‘hoe X-er hoe Y-er’-constructies. Hiermee kan

wellicht verondersteld worden dat de constructie ‘hoe langer hoe meer’ een gefixeerde

expressie is.

De voor dit onderzoek geselecteerde stimuli zijn per schema weergegeven in Tabellen

1 tot en met 3. De frequentie waarmee de ‘hoe-hoe’-constructies voorkomen in SoNaR is ook

in de Tabellen weergegeven. Alle geselecteerde ‘hoe-hoe’-constructies hadden een ‘als-dan’-

equivalent, bijvoorbeeld ‘als langer dan meer’. De ‘als-dan’-constructies zijn voor dit

experiment verzonnen, waardoor ze geen frequentie hebben. Er zijn in totaal 60 stimuli

gekozen voor het experiment.

Tabel 1

De 5 hoogfrequente en 5 laagfrequente constructies in het ‘langer, Y-er’ schema met de

bijbehorende frequentie in SoNaR.

Hoe-hoe constructie Frequentie Als-dan constructie

Hoe langer hoe meer 943 Als langer dan meer

Hoe langer hoe moeilijker 46 Als langer dan moeilijker

Hoe langer hoe duidelijker 15 Als langer dan duidelijker

Hoe langer hoe gekker 7 Als langer dan gekker

Hoe langer hoe harder 6 Als langer dan harder

Hoe langer hoe leuker 1 Als langer dan leuker

Hoe langer hoe korter 1 Als langer dan korter

Hoe langer hoe minder 1 Als langer dan minder

Hoe langer hoe eenvoudiger 1 Als langer dan eenvoudiger

Hoe langer hoe gezonder 1 Als langer dan gezonder

Tabel 2

De 5 hoogfrequente en 5 laagfrequente constructies in het ‘X-er, beter’-schema met de

bijbehorende frequentie in SoNaR.

Hoe-hoe constructie Frequentie Als-dan constructie

Hoe meer hoe beter 70 Als meer dan beter

Hoe eerder hoe beter 29 Als eerder dan beter

Hoe ouder hoe beter 13 Als ouder dan beter

Page 20: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

20

Hoe sneller hoe beter 9 Als sneller dan beter

Hoe vroeger hoe beter 8 Als vroeger dan beter

Hoe enger hoe beter 1 Als enger dan beter

Hoe strenger hoe beter 1 Als strenger dan beter

Hoe zwaarder hoe beter 1 Als zwaarder dan beter

Hoe vetter hoe beter 1 Als vetter dan beter

Hoe duurder hoe beter 1 Als duurder dan beter

Tabel 3

De 5 hoogfrequente en 5 laagfrequente constructies in het ‘X-er, Y-er’-schema met de

bijbehorende frequentie in SoNaR.

Hoe-hoe constructie Frequentie Als-dan constructie

Hoe vettiger hoe prettiger 16 Als vettiger dan prettiger

Hoe ouder hoe zotter 5 Als ouder dan zotter

Hoe later hoe zotter 4 Als later dan zotter

Hoe hoger hoe groter 4 Als hoger dan groter

Hoe groter hoe slapper 3 Als groter dan slapper

Hoe later hoe schoner 1 Als later dan schoner

Hoe harder hoe mooier 1 Als harder dan mooier

Hoe later hoe langzamer 1 Als later dan langzamer

Hoe wilder hoe leuker 1 Als wilder dan leuker

Hoe zwaarder hoe duurder 1 Als zwaarder dan duurder

Om ervoor te zorgen dat eventuele effecten niet toegeschreven kunnen worden aan

individuele woordlengte van de woorden die ingevuld worden in de X- en Y-posities is de

woordlengte gecontroleerd. De gemiddelde woordlengtes van de woorden in de X- en Y-

posities zijn met elkaar vergeleken. In Tabel 4 zijn de gemiddelde woordlengtes per

constructie weergegeven.

Gemiddelde frequentie van de 5 geselecteerde items per conditie is ook meegenomen.

Voor de laagfrequente groep zijn alleen constructies gekozen die als tokenfrequentie ‘1’

hadden. Voor de hoogfrequente condities zijn constructies gekozen die 3 keer of vaker

voorkwamen in het corpus.

Page 21: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

21

Tabel 4

Gemiddeld aantal letters per woord en gemiddelde frequentie per schema in SoNaR.

Schema Frequentie Gemiddeld

aantal

letters X-

positie

Gemiddeld

aantal

letters Y-

positie

Gemiddelde

frequentie

Langer, Y-er Hoog 6 7.2 203.4

Langer, Y-er Laag 6 7.2 1

X-er, beter Hoog 5.8 5 25.8

X-er, beter Laag 6.8 5 1

X-er, Y-er Hoog 5.8 6.8 6.4

X-er, Y-er Laag 6 7 1

2.3 Design

Er was in dit experiment sprake van twee soorten onafhankelijke

binnenproefpersoonsvariabelen: constructietype en schematype. Frequentie is als

controlemaat meegenomen. Er zijn twee constructietypen onderzocht, namelijk ‘hoe-hoe’ en

‘als-dan’ en drie schematypen, namelijk ‘X-er, Y-er’, ‘X-er, beter’ en ‘langer, Y-er’. Van elk

van deze schematypes zijn tien constructies verzameld. Vijf van deze constructies waren

hoogfrequent en vijf waren laagfrequent. ‘Als-dan’-constructies zijn voor dit onderzoek

verzonnen, waardoor deze niet in te delen waren in een frequentieklasse. Elk proefpersoon

kreeg alle condities te zien, dus het experiment had een binnenproefpersoonsontwerp. De

volgorde waarin de stimuli werden aangeboden is gerandomiseerd.

2.4 Instrumentatie

Er waren twee afhankelijke variabelen, namelijk leestijden en vertrouwdheidsoordelen. De

leestijden werden gemeten door zinnen op een verder leeg beeld aan te bieden. De

participanten werden geïnstrueerd om de zinnen zo snel mogelijk te lezen en vervolgens op de

spatiebalk te drukken. De tijd tussen het verschijnen van de zin en het drukken op de

spatiebalk is geregistreerd als de leestijd van de zin. Met ‘vertrouwdheid’ werd bedoeld de

mate waarin participanten een constructie zelf zouden gebruiken of ooit zijn tegengekomen.

Participanten werd gevraagd de mate van vertrouwdheid aan te geven op een 7-punts Likert

Page 22: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

22

schaal.

2.5 Procedure

Participanten lazen allereerst een informatiebrief waarin stond dat ze deel gingen nemen aan

een leesexperiment. Daarna tekenden participanten een toestemmingsformulier waarmee ze

toestemming gaven voor hun deelname en het analyseren en verwerken van de

onderzoeksresultaten. Van de participanten werd tevens een aantal demografische

eigenschappen genoteerd zoals leeftijd, geslacht en opleidingsniveau. Vervolgens namen de

participanten plaats in een geluiddichte cabine met daarin een computerscherm. De

participanten werd eerst gevraagd de instructie te lezen. In de instructie lazen participanten

dat ze zinnen zo snel mogelijk moesten lezen en daarna op de spatiebalk moesten drukken.

Vervolgens lazen ze dat ze over die zin een vertrouwdheidsoordeel op een schaal van 1 tot 7

moesten geven. De volledige instructie is te vinden in Appendix A. De proefleider lichtte de

instructies mondeling toe en de participanten kregen de kans om vragen te stellen voordat het

experiment startte. Wanneer de participanten aangaven de instructies te hebben begrepen,

startte een oefenblok met vijf oefentrials. De proefleider bleef tijdens het oefenblok in de

cabine aanwezig om ervoor te zorgen dat de participanten begrepen wat er van ze verwacht

werd.

De oefentrials en de experimentele trials waren precies hetzelfde: allereerst verscheen

er op het beeldscherm een ‘+’-teken, dat na één seconde automatisch weer verdween. Daarna

verscheen de constructie bestaande uit vier woorden gecentreerd op het scherm. De tekst was

zwart met een grijze achtergrond. Zodra participanten de constructie gelezen en begrepen

hadden, drukten zij zo snel mogelijk op de spatiebalk. Daarna zagen participanten bovenaan

het scherm de vraag ‘Hoe vertrouwd vind je de constructie die je zojuist gelezen hebt op een

schaal van 1-7?’. Links onderin het scherm stonden de woorden ‘minst vertrouwd’, daarnaast

de cijfers 1 tot en met 7 en rechts van de schaal stonden de woorden ‘meest vertrouwd’.

Participanten gaven middels de toetsen 1 tot en met 7 op het toetsenbord hun oordeel. Aan het

geven van een vertrouwdheidsoordeel zat geen tijdslimiet verbonden. Na het geven van een

oordeel verscheen er weer een ‘+’- teken en begon de volgende trial.

Na het beoordelen van de 60 experimentele trials verscheen er een tekst die meedeelde

dat het experiment afgelopen was en dat de participanten de cabine mochten verlaten.

Vervolgens werden de participanten gedebrieft. Hen werd verteld dat het doel van de studie

was om meer duidelijkheid te krijgen over de structuur van het mentale lexicon. Ten slotte

Page 23: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

23

werden de participanten bedankt voor hun deelname. De gemiddelde duur van het experiment

was 15 minuten.

3. Resultaten

Er is getoetst of frequentieklasse, constructietype en schematype van invloed zijn op

leestijden en vertrouwdheidsoordelen. De data van vier participanten zijn geëxcludeerd omdat

zij geen gebruik hebben gemaakt van de gehele schaal om vertrouwdheidsoordelen toe te

kennen aan de stimuli. Deze participanten kenden bijvoorbeeld alleen de cijfers 1 tot en met 3

toe aan de stimuli. De data van nog twee participanten zijn geëxcludeerd omdat zij hetzelfde

vertrouwdheidsoordeel toekenden aan alle stimuli in de ‘als-dan’-constructie. Van deze

participanten was het gemiddelde voor deze constructie 1.00 (SD = .00). In totaal zijn de data

van 59 participanten gebruikt voor analyse. De data zijn in een binnenproefpersoonsanalyse

geanalyseerd (Repeated Measures ANOVA).

Tabel 5

Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe

constructies als functie van frequentie (hoog/laag).

Leestijd Vertrouwdheidsoordeel

Hoe-hoe hoogfrequent 1818 (SD = 87.27) 4.84 (SD = .11)

Hoe-hoe laagfrequent 1816 (SD = 78.84) 4.01 (SD = .13)

Ten eerste is onderzocht of de controlemaat frequentie de verwachte invloed had op de

leestijden en vertrouwdheidsoordelen binnen ‘hoe-hoe’-constructies. De gemiddelde

leestijden en vertrouwdheidsoordelen staan weergegeven in Tabel 5. ‘Als-dan’-constructies

zijn voor deze analyse buiten beschouwing gelaten omdat deze verzonnen zijn en ze geen

frequentie in het dagelijks taalgebruik hebben. Er was geen effect van frequentie op

leestijden: (F(1, 58) =.002, p =.966). Daarmee is Hypothese 1a niet bevestigd. Er was echter

wel een effect van frequentie op vertrouwdheidsoordelen: (F(1, 58) =137.806, p <.001, ɳ²

=.704). Hoogfrequente constructies werden niet significant sneller gelezen, maar wel als

vertrouwder beoordeeld dan laagfrequente constructies. Hiermee is Hypothese 1b bevestigd.

Page 24: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

24

Tabel 6

Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe

constructies als functie van constructie (hoe-hoe/als-dan).

Leestijd Vertrouwdheidsoordeel

Hoe-hoe 1817 (SD = 80.40) 4.42 (SD = .12)

Als-dan 1825 (SD = 85.81) 2.73 (SD = .10)

De tweede hypothese voorspelde een effect van constructietype. De gemiddelde leestijden en

vertrouwdheidsoordelen zijn weergegeven in Tabel 6. Enerzijds werd er een hoofdeffect van

constructietype op leestijd voorspeld (Hypothese 2a). Dit effect werd niet gevonden: (F(1, 58)

=.041, p =.840). Anderzijds werd er een effect van constructietype op

vertrouwdheidsoordelen voorspeld (Hypothese 2b). Hier toonde de Repeated Measures

ANOVA wel een significant effect (F(1,58) =139.046, p <.001, ɳ² =.706). ‘Hoe-hoe’-

constructies werden niet significant sneller gelezen dan de ‘als-dan’-constructies, maar wel

significant als vertrouwder beoordeeld.

Tabel 7

Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe

constructies als functie van schema (hoe X-er hoe Y-er / hoe X-er hoe beter / hoe langer hoe

Y-er).

Leestijd Vertrouwdheidsoordeel

Hoe X-er hoe Y-er 1911 (SD = 92.03) 3.34 (SD = .10)

Hoe X-er hoe beter 1729 (SD = 75.01) 4.19 (SD = .08)

Hoe langer hoe Y-er 1822 (SD = 81.33) 3.21 (SD = .11)

Ook is onderzocht of schematype effect had op de leestijden en de vertrouwdheidsoordelen

van participanten. De gemiddelde leestijden en vertrouwdheidsoordelen staan weergegeven in

Tabel 7. Er was een effect van schematype op leestijden: (F(1,58)= 8.059, p = .006, ɳ² =.122).

De participanten lazen expressies in een ‘hoe X-er hoe beter’-schema significant sneller dan

expressies in een ‘hoe X-er hoe Y-er’ of een ‘hoe langer hoe Y-er’-schema. Dit effect is

Page 25: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

25

gevisualiseerd in Figuur 2. Er was geen effect van schematype op vertrouwdheidsoordelen:

(F(1,58)= 2.386, p = .128). Constructies in een ‘hoe X-er hoe beter’-schema leken echter wel

door participanten met hogere vertrouwdheidsoordelen beoordeeld te worden dan constructies

in een ‘hoe langer hoe Y-er’ of ‘hoe X-er hoe Y-er’-schema. Dit is gevisualiseerd in Figuur 3.

Om deze reden zijn de gemiddelde vertrouwdheidsoordelen van de schema’s afzonderlijk

getoetst. Er was een effect tussen ‘hoe X-er hoe beter’ en ‘hoe X-er hoe Y-er’: (F(1,58)=

100.554, p < .001, ɳ² =.634). Er was ook een effect wanneer ‘hoe X-er hoe beter’ en ‘hoe

langer hoe Y-er’ werden vergeleken: (F(1,58)= 146.156, p < .001, ɳ² =.716). Er was echter

geen effect wanneer ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ met elkaar werden

vergeleken (F(1,58)= 2.386, p = .128). Zinnen in een ‘hoe X-er hoe beter’-schema werden

significant hoger beoordeeld dan zinnen in een ‘hoe X-er hoe Y-er’- of een ‘hoe langer hoe Y-

er’-schema. Tussen de schema’s ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ was er geen

significant verschil tussen vertrouwdheidsoordelen.

Figuur 2: Gemiddelde leestijden (ms) Figuur 3: Gemiddelde vertrouwdheidsoor-

per constructie als functie van schema. delen op een schaal van 1-7 (1=laag,

7=hoog) per constructie als functie van

schema.

Tabel 8

Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van

laagfrequente hoe-hoe constructies als functie van schema (X-er, Y-er / X-er, beter / langer,

Y-er).

Constructie Schema Leestijd Vertrouwdheidsoordeel

Hoe-hoe X, Y 1904 (SD = 115.13) 4.02 (SD = .15)

Page 26: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

26

X, beter 1930 (SD = 120.33) 2.68 (SD = .14)

Langer, Y 1737 (SD = 88.71) 4.54 (SD = .16)

Als-dan X, Y 1930 (SD = 120.33) 2.68 (SD = .14)

X, beter 1806 (SD = 87.70) 3.46 (SD = .16)

Langer, Y 1822 (SD = 94.95) 2.39 (SD = .11)

Ten slotte is er onderzocht of er een verschil is in leestijden en vertrouwdheidsoordelen tussen

laagfrequente ‘hoe-hoe’-constructies en ‘als-dan’-constructies per schema. ‘Hoe-hoe’- en ‘als-

dan’-equivalenten zijn per schema met elkaar vergeleken. Voor deze analyse zijn ‘als-dan’-

equivalenten van laagfrequente ‘hoe-hoe’-constructies tevens laagfrequent genoemd. De

gemiddelde leestijden en vertrouwdheidsoordelen staan weergegeven in Tabel 8. Er was geen

effect van constructie op leestijden in een ‘X, Y’-schema (F(2,116)= .064, p = .801) maar wel

van constructie op vertrouwdheidsoordelen (F(1,58)= 61.636, p < .001, ɳ² =.515). Voor het

schema ‘X-er, beter’ was er zowel een effect van constructie op leestijden (F(1,58)= 4.791, p

= .033, ɳ² =.076) als een effect op vertrouwdheidsoordelen (F(1,58)= 71.195, p < .001, ɳ²

=.551). Voor het schema ‘langer, Y-er’ was er geen effect op leestijden (F(1,58)= .048, p =

.827) maar wel op vertrouwdheidsoordelen (F(1,58)= 55.225, p < .001, ɳ² =.488).

Laagfrequente ‘hoe X-er hoe beter’-constructies werden sneller gelezen dan hun ‘als-dan’-

equivalenten, maar ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ werden niet significant

sneller gelezen dan equivalente ‘als X-er dan Y-er’ en ‘als langer dan Y-er’-constructies.

Laagfrequente ‘hoe-hoe’-constructies in alle schema’s werden wel significant als vertrouwder

beoordeeld dan hun ‘als-dan’-equivalenten.

De interactie tussen schema en constructie in laagfrequente expressies was op het

gebied van leestijden niet significant (F(1,58)= .007, p = .934). Het interactie-effect op

vertrouwdheidsoordelen was tevens niet significant, maar er is wel een trend te zien (F(1,58)=

3.237, p = .077). Dit is gevisualiseerd in Figuur 4. Laagfrequente expressies werden in een

‘hoe-hoe’-constructie niet significant sneller gelezen dan de ‘als-dan’-constructies in dit

schema, waardoor Hypothese 4a niet is bevestigd. De laagfrequente expressies in een ‘hoe-

hoe’-constructie leken wel hoger beoordeeld te worden dan equivalente expressies in een ‘als-

dan’-constructie, waardoor Hypothese 4b deels is bevestigd.

Page 27: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

27

Figuur 4: Gemiddelde vertrouwdheidsoordelen op een schaal van 1-7 (1=laag, 7=hoog) voor

laagfrequente constructies als functie van schema en constructietype.

4. Conclusie

In dit onderzoek is het effect van frequentieklasse, constructietype en schematype op

leestijden en vertrouwdheidsoordelen onderzocht om zo een bijdrage te kunnen leveren aan de

productiviteit versus lexicalisatie-discussie. De onderzoeksvraag was als volgt:

Bevordert het gebruik van (deels) schematische constructies de leessnelheid en verhoogt het

gebruik van (deels) schematische constructies het gemiddelde vertrouwdheidsoordeel dat aan

een constructie wordt toegekend door participanten?

Frequentie werd als controlemaat meegenomen in het onderzoek. Hypothese 1

voorspelde een effect van frequentie op leestijd en vertrouwdheidsoordelen. Expressies met

een hoge frequentie werden niet significant sneller gelezen, maar wel als vertrouwder

beoordeeld. Zoals gesteld in paragraaf 1.2.1 worden vormen met een hoge individuele token-

frequentie vaker als geheel aangeleerd in plaats van dat men deze moet ‘ontleden’. Het is

aannemelijk dat dit ook geldt voor het opslaan van expressies in lexicaal geheugen. Gezien

het feit dat constructies met een hoge frequentie in deze studie als vertrouwder werden

beoordeeld dan constructies in eenzelfde schema met een lage frequentie, is het aannemelijk

dat frequentie een predictor is van of een constructie in zijn geheel wordt opgeslagen in

lexicaal geheugen of niet. In de Discussie zal dieper worden ingegaan op de afwezigheid van

een effect van frequentie op leestijden en worden er mogelijke verklaringen besproken.

De twee constructietypes ‘hoe-hoe’ en ‘als-dan’ zijn in dit onderzoek met elkaar

vergeleken. Constructietype bleek geen effect te hebben op leestijd maar wel op

vertrouwdheidsoordelen. Participanten beoordeelden expressies in een ‘hoe-hoe’ constructie

Page 28: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

28

significant als vertrouwder dan vergelijkbare expressies in een ‘als-dan’-constructie.

Constructies die frequent in Nederlands taalgebruik voorkomen en daardoor als schematisch

kunnen worden gezien ontvingen van participanten hogere vertrouwdheidsoordelen dan

vergelijkbare expressies in een niet-schematische constructie.

Hypothese 3 veronderstelde een effect van schematype op leestijden en

vertrouwdheidsoordelen. Volgens Langacker (1988) kunnen schema’s in meer of mindere

mate gefixeerd zijn. Dit blijkt uit het corpusonderzoek ook te gelden voor de ‘hoe X-er hoe Y-

er’-constructie. Naast het schema ‘hoe X-er hoe Y-er’, die twee open posities heeft, is

gebleken dat de schema’s ‘hoe langer hoe Y-er’ en ‘hoe X-er hoe beter’ ook frequent

voorkomen in dagelijks taalgebruik. Deze twee schema’s hebben beide slechts één open

positie en zijn daardoor meer gefixeerd dan het algemene patroon met twee open posities. Op

basis van de data-analyse kan geconcludeerd worden dat leestijden lager zijn bij het ‘hoe X-er

hoe beter’-schema dan bij het ‘hoe X-er hoe Y-er’- en ‘hoe langer hoe Y-er’-schema.

Expressies worden significant hoger als vertrouwd beoordeeld wanneer ze in een ‘hoe X-er

hoe beter’-schema worden aangeboden dan in een ‘hoe X-er hoe Y-er’- of ‘hoe langer hoe Y-

er’-schema. Dit zou erop kunnen wijzen dat het ‘hoe X-er hoe beter’-schema het meest

gelexicaliseerd is. Hierop wordt in de Discussie verder ingegaan.

Laagfrequente ‘hoe-hoe’-constructies werden vergeleken met hun ‘als-dan’-

equivalenten. Er werd geen effect op leestijden gevonden, maar wel een effect op

vertrouwdheidsoordelen. Deels schematische constructies worden als vertrouwder beoordeeld

dan niet schematische constructies. Dit effect tussen laagfrequente ‘hoe-hoe’- en ‘als-dan’-

constructies zou kunnen betekenen dat gedeeltelijke schema’s als zodanig in het lexicale

geheugen zijn opgeslagen.

Kortom: het gebruik van een (deels) schematische uitdrukking kan leestijd verlagen,

afhankelijk van welk deels gefixeerd schema er wordt gebruikt. Het ‘hoe X-er hoe beter’-

schema lijkt als geheel te zijn opgeslagen in lexicaal geheugen. Op basis van de resultaten van

deze studie is het aannemelijk dat gedeeltelijke schema’s als geheel worden opgeslagen in

lexicaal geheugen. Over deze conclusie wordt in de Discussie verder gediscussieerd.

5. Discussie

De controlemaat frequentie heeft in dit onderzoek niet het verwachte effect gehad op

leestijden. Hoogfrequente constructies werden even snel gelezen als laagfrequente

constructies. Dit kan verschillende oorzaken hebben. Het is mogelijk dat de aard van de taak

Page 29: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

29

een eventueel effect van frequentie op leestijden heeft gemaskeerd, bijvoorbeeld doordat

participanten tijdens het lezen van de expressies hun vertrouwdheidsoordelen al hebben

bepaald waardoor in de leestijden ook de tijd die men nodig had om tot een

vertrouwdheidsoordeel te komen is meegenomen. In een eventuele vervolgstudie zou dit

voorkomen kunnen worden door eerst alle expressies één voor één aan te bieden en

vervolgens middels een aparte taak de vertrouwdheidsoordelen te meten, zodat het zeker is

dat alleen de tijd die participanten nodig hebben om de zin te lezen wordt gemeten.

Dit zou echter niet verklaren waarom er voor het schema ‘hoe X-er hoe beter’ wel een

effect op leestijd is gevonden. Hoe meer een expressie gefixeerd is, hoe lager de druk op

verwerkingscapaciteit. Dit zorgt voor een snellere verwerking van gefixeerde en schematische

expressies (Smits, 2004). Deze verklaring zou aannemelijk zijn als voor beide gefixeerde

schema’s, ‘hoe X-er hoe beter’ en ‘hoe langer hoe Y-er’, een effect op leestijd gevonden zou

zijn. Dat is echter niet het geval. Er is geen effect van leestijd op het schema ‘hoe langer hoe

Y-er’ gevonden. Dit zou kunnen komen doordat de token-frequentie van de hoogfrequente

constructies in een ‘hoe langer hoe Y-er’-schema die voor deze scriptie zijn gebruikt 1017 is,

tegenover een token-frequentie van 129 in het ‘hoe X-er hoe beter’-schema. Baayen en Lieber

(1991) stellen dat type-frequentie bevorderlijk is voor de productiviteit van een bepaalde

taalvorm, en dat token-frequentie schadelijk is voor de productiviteit. Dit kan komen doordat

het aantal gebruiksmogelijkheden afneemt naarmate een gelexicaliseerde eenheid specifieker

wordt. Dit zou kunnen verklaren waarom gelexicaliseerde expressies minder lexicale

connecties hebben en zij om deze reden ook geen snellere leestijden teweegbrengen. Het

schema ‘hoe X-er hoe beter’, dat een hoge type-frequentie heeft, is productiever, wat een

verklaring zou kunnen zijn voor de lagere leestijden.

Er kan uit dit onderzoek wel geconcludeerd worden dat deels schematische

uitdrukkingen als vertrouwder worden beoordeeld dan niet-schematische uitdrukkingen.

‘Hoe-hoe’-constructies worden als vertrouwder beoordeeld dan ‘als-dan’-constructies. Een

verklaring voor deze bevinding is dat schematische uitdrukkingen vanwege hun hogere type-

en/of token-frequentie vaak worden gebruikt, waardoor ze vertrouwd aanvoelen.

Voor dit onderzoek zijn ‘hoe-hoe’-expressies die middels corpusonderzoek zijn

verzameld vergeleken met zelfverzonnen ‘als-dan’-expressies. Wellicht dat het gebruik van

deze niet-bestaande expressies de resultaten van het onderzoek heeft beïnvloed. ‘Als-dan’-

constructies zijn ongebruikelijk in natuurlijk taalgebruik. Er zijn alternatieven denkbaar

waarmee de ‘hoe-hoe’-constructie vergeleken kan worden, bijvoorbeeld constructies met

Page 30: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

30

visuele eigenschappen zoals ‘groter = leuker’ of ‘groter → leuker’. De leestijden van de

woorden die worden ingevuld op de X- en Y-posities, in dit geval groter en leuker, zouden

kunnen worden gemeten middels oogbewegingsregistratieonderzoek. Op deze manier kan

opnieuw worden onderzocht of het gebruik van deels schematische expressies vergeleken met

niet-schematische expressies leestijden verlaagt. Uiteraard kan ook worden onderzocht of

deels schematische expressies wederom hogere vertrouwdheidsoordelen veroorzaken.

Door het uitgevoerde experiment kan worden geconcludeerd dat het gebruik van een

deels schematische constructie leessnelheid kan bevorderen wanneer de type-frequentie van

een schema hoog is en de token-frequentie laag. Het gebruik van deels schematische

expressies verhoogt de mate waarin participanten constructies vertrouwd vinden. Gefixeerde

expressies zijn dus als eenheden opgeslagen in het lexicaal geheugen, wat vertrouwdheid

verhoogt en leessnelheid kan verlagen. Constructies die niet schematisch zijn en dus als het

ware ‘ontleed’ moeten worden zijn niet zo vertrouwd en kosten meer tijd om te lezen dan

schematische uitdrukkingen. Wat als duidelijkste resultaat uit deze studie naar voren komt is:

hoe gelexicaliseerder hoe vertrouwder!

Page 31: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

31

Referenties

Baayen, H., & Lieber, R. (1991). Productivity and English derivation: A corpus-based

study. Linguistics, 29(5), 801-844.

Backus, A., & Mos, M. (2011). Islands of (im)productivity in corpus data and acceptability

judgments. Converging evidence: Methodological and theoretical issues for linguistic

research, 165-195.

Bybee, J. (1995). Regular morphology and the lexicon. Language and Cognitive

Processes, 10(5), 425-455.

Cappelle, B. (2011). The the… the… construction: Meaning and Readings. Journal of

Pragmatics, 43(1), 99-117.

Dabrowska, E. 2004. Rules or schemas? Evidence from Polish. Language and Cognitive

Processes, 19, 225-271.

Erman, B., & Warren, B. (2000). The idiom principle and the open choice principle. Text-

Interdisciplinary Journal for the Study of Discourse, 20(1), 29-62.

Hoffmann, T., Horsch, J., & Brunner, T. (2019). The more data, the better: A usage-based

account of the English comparative correlative construction. Cognitive

Linguistics, 30(1), 1-36.

Jackendoff, R., & Jackendoff, R. S. (2002). Foundations of language: Brain, meaning,

grammar, evolution. Oxford University Press, USA.

Langacker, R. (1988). A Usage-Based Model. In: B. Rudzka-Ostyn (Eds.). Topics in

Cognitive Linguistics, 127-161. Amsterdam: John Benjamins.

Levelt, W.J.M. (1999). Producing spoken language: A blueprint of the speaker. In C.M.

Brown, & P. Hagoort (Eds.), The Neurocognition of Language (83-121). Oxford:

Oxford University Press.

Schilperoord, J., & Cozijn, R. (2010). The representation and processing of fixed and

compositional expressions. In M. Everaert, T. Lentz, H. de Mulder, Ø. Nilsen, & A.

Zondervan (Eds.), The linguistics enterprise: From knowledge of language to

knowledge in linguistics, 291-314. Amsterdam: John Benjamins.

Smits, M. (2004). De verwerking van geprefabriceerde uitdrukkingen in tekst: Een

oogbewegingsexperiment. Scriptie, Universiteit van Tilburg. Ontleend aan

http://arno. uvt. nl/show. cgi.

Sprenger, S. A. (2003). Fixed expressions and the production of idioms. Doctorale dissertatie,

Radboud University Nijmegen.

Page 32: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

32

Wray, A. & Perkins, M. (2000). The functions of formulaic language: An integrated model.

Language & Communication, 20, 1-28.

Page 33: Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...

Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie

33

Appendix A

Letterlijke instructies die participanten kregen alvorens het experiment.

Beste participant,

Je gaat deelnemen aan een leesexperiment. Het is hiervoor belangrijk dat je de instructies

GOED doorleest! Wanneer je iets niet begrijpt, vraag het dan aan de proefleider.

Er wordt van je gevraagd om 60 korte uitdrukkingen te lezen. Het is voor dit experiment van

belang dat je de zinnen zo goed mogelijk probeert te begrijpen. Wanneer je een uitdrukking

gelezen hebt, druk dan zo snel mogelijk op de spatiebalk.

Nadat je op de spatiebalk hebt gedrukt, zal je worden gevraagd om op een schaal van 1 tot 7

aan te geven hoe vertrouwd de uitdrukking aanvoelt. Met vertrouwdheid wordt bedoeld de

mate waarin de zin in het dagelijks taalgebruik gebruikt zou kunnen worden of voor zou

kunnen komen.

Je kan je oordeel geven door de toetsen 1 tot en met 7 op je toetsenbord te gebruiken: 1

betekent helemaal niet vertrouwd en 7 betekent heel erg vertrouwd met de uitdrukking. Denk

niet te lang over dit oordeel na, maar geef je eerste indruk.

DRUK NU OP SPATIEBALK VOOR VERDERE INSTRUCTIES

Elke uitdrukking wordt voorafgegaan door een scherm met een ‘+’-teken. Dit teken verdwijnt

automatisch na enkele seconden. Daarna verschijnt er een uitdrukking. Lees te uitdrukking

snel en goed en als je hem begrepen hebt, druk je op de spatiebalk. Dan verdwijnt de

uitdrukking en verschijnt het scherm waarop je op een schaal van 1 tot 7 kunt aangeven hoe

vertrouwd je met de uitdrukking bent. Als je een oordeel hebt gegeven, verschijnt weer het

scherm met een ‘+’-teken.

Is dit duidelijk? Heb je hierover vragen?

Er volgt nu eerst een oefenblok. Dan kun je de procedure oefenen.

Ik blijf erbij staan.

WACHT OP EEN TEKEN VAN DE PROEFLEIDER