Binnen of buiten de tang? Binnen of buiten de tang? Lengte als bepalende factor voor de plaatsing...
-
Upload
dina-gerritsen -
Category
Documents
-
view
219 -
download
4
Transcript of Binnen of buiten de tang? Binnen of buiten de tang? Lengte als bepalende factor voor de plaatsing...
Binnen of buiten de tang? Lengte als bepalende factor voor de plaatsing
van voorzetselconstituenten in Nederlandse bijzinnen
Annelore WillemsPromotoren: Gert De Sutter & Johan De Caluwe
Onderzoeksforum 13 februari 2012
Nagaan wat de invloed is van de factor lengte op de positie van VzC’s in de Nederlandse bijzin
Taalgebruikers hebben vaak de keuze om voorzetselconstituenten voor [1] of achter [2] de werkwoordelijke eindgroep te plaatsen:
1. dat de bescherming van de privacy van de werknemers bij het beoordelen van geschillen tussen werkgevers en werknemers een kapitale rol || kan spelen ||.
2. dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen|| bij het beoordelen van geschillen tussen werkgevers en werknemers.
Doel
o.a. Behaghel (1909) & Hawkins (1994, 2000): lengte is een belangrijke factor om woordvolgordevariatie te verklaren
Vroeger onderzoek naar de positie van VzC’s heeft beperkingen:Enkel gesproken taalgebruikMethodologische problemen:
Jansen (1978, 1979): enkel lengte middenveld Braecke (1990): lengte ondergeschikt aan focus
Want
Van Haeringen en schrijfadviseurs (o.a. Renkema): tangconstructies vermijdenextra geheugenbelasting
Gibson (1998, 2000): de begrijpelijkheid van een zin is afhankelijk van de afstand tussen twee zinsdelen die op elkaar betrokken moeten worden (hier subject en het werkwoord)
Hypothese 1: voorkeur om het subject en het werkwoord zo dicht mogelijk bij elkaar te plaatsenVzC’s verschijnen in extrapositie
Over lengte MV
Kooij 1978: Extrapositie betekent juist voor een lange VzC verlichting van de spanning
In Jansen & Wijnands 2004: Hoe langer de constituent en hoe ingewikkelder zijn interne structuur, des te meer zal het achterin de zin te vinden zijn (Behaghel 1909)
Hypothese 2: de lengte van de VzC beïnvloedt de variatieLengte VzC is positief gecorreleerd met extrapositie
Over lengte VzC
Dutch Parallel Corpus (DPC)
10 miljoen woorden Parallel en vergelijkbaar corpus: NL als brontaal (> FR, EN) en doeltaal
(< FR, EN) Ingedeeld in teksttypes: ADMIN, JOURNAL, INSTR, NON-FIC, FIC
Data
Selectiecriteria:
Enkel Nederlandstalige data Enkel journalistieke teksten Enkel bijzinnen ingeleid door het grammaticaal onderschikkend
voegwoord ‘dat’ Enkel VzC’s die zowel in het middenveld als in extrapositie kunnen staan
Data
Resultaat: 1919 manueel gecontroleerde zinnen Voor deze presentatie 501 zinnen
Data
VzC in MV VzC in AV
501 zinnen 45% 227 55% 2741919 zinnen 44% 845 56% 1074
Lengte operationaliseren middenveld
Aantal lettergrepen tussen kern subject en werkwoordelijke eindgroep dat de bescherming van de pri · va · cy van de werk · ne · mers een ka · pi · ta · le rol
||kan spelen|| bij het beoordelen van geschillen tussen werkgevers en werknemers.
Aantal woorden tussen kern subject en werkwoordelijke eindgroep dat de bescherming van / de / privacy / van / de / werknemers / een / kapitale / rol
Aantal constituenten tussen subject en werkwoordelijke eindgroep dat de bescherming van de privacy | van de werknemers | een kapitale rol
Methode, analyse
Lengte operationaliseren VzC
Aantal lettergrepen dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen||
bij het be · oor · de · len van ge · schil · len tus · sen werk · ge · vers en werk · ne · mers.
Aantal woorden dat de bescherming van de privacy van de werknemers een kapitale rol ||kan spelen||
bij / het / beoordelen / van / geschillen / tussen / werkgevers / en / werknemers /.
Methode, analyse
Gepartitioneerde chi-kwadraatanalyse:
Methode, analyse
Interval 1 Interval 2 Interval 3 Interval 4
MV lettergrepen
0 en 1 ≥ 2
MV woorden 0 en 1 2 ≥ 3MV constituenten
0 1 tot 4
VzC lettergrepen
2 3 tot 7 8 tot 12 ≥ 13
VzC woorden 2 of 3 4 tot 6 7 tot 11 ≥ 12
Logistische regressieanalyse:
Analyse van de individuele impact van de verschillende lengtes op de keuze tussen middenveld en extrapositie
Analyse van verschillende operationaliseringen van de factor lengte Analyse van de globale impact van de lengte van het middenveld en de
lengte van de VzC op de keuze tussen middenveld en extrapositie
Methode, analyse
Logistische regressieanalyse met 1 predictor:
Resultaten
Factor O.R. P-value
MV lettergrepen 1.34727 0.0376 *
MV woorden 0.5068587 0.000608 ***
MV constituenten 1.400599 0.0427 *
VzC lettergrepen 13.39927 4.64e-09 ***
VzC woorden 14.13141 0.000143 ***
Logistische regressieanalyse:
Resultaten MV
Factor O.R. P-value
MV lettergrepen 1.34727 0.0376 *
MV woorden 0.5068587 0.000608 ***
MV constituenten 1.400599 0.0427 *
VzC lettergrepen 13.39927 4.64e-09 ***
VzC woorden 14.13141 0.000143 ***
Logistische regressieanalyse:
Resultaten MV
%AV
Interval 1 Interval 2 Interval 3
Lettergrepen 47% 57%
Woorden 51% 70% 51%
constituenten 45% 57%
Logistische regressieanalyse:
De verschillende lengtes hebben een statistisch significante impact op de variatie Effect lettergrepen en constituenten vergelijkbaar
Hypothese 1: voorkeur om het subject en het werkwoord zo dicht mogelijk bij elkaar te plaatsen kan niet worden bevestigdInterval 1 lettergrepen/constituenten: ± 50% VzC’s in het middenveldInterval 2 lettergrepen/constituenten: meer VzC’s in extrapositie maar nog altijd
± 40% middenveld
Besluit MV
Logistische regressieanalyse:
Resultaten VzC
Factor O.R. P-value
MV lettergrepen 1.34727 0.0376 *
MV woorden 0.5068587 0.000608 ***
MV zinsdelen 1.400599 0.0427 *
VzC lettergrepen 13.39927 4.64e-09 ***
VzC woorden 14.13141 0.000143 ***
Logistische regressieanalyse:
Resultaten VzC
%AV
Interval 1 Interval 2 Interval 3 Interval 4
Lettergrepen 18% 44% 63% 89%
Woorden 43% 54% 87% 96%
Logistische regressieanalyse:
De verschillende lengtes hebben een statistisch significante impact op de variatie
Effect lettergrepen en woorden vergelijkbaar
Hypothese 2: de lengte van de VzC beïnvloedt de variatie kan worden bevestigdLengte VzC is positief gecorreleerd met extrapositie
Besluit VzC
Logistische regressieanalyse:
Analyse van de globale impact van de lengte van het middenveld en de lengte van de VzC op de keuze tussen middenveld en extrapositie
Geen interactie-effect Geen multicollineariteit C = 0.706
Resultaten MV en VzC
Factor O.R. P-value
MV lettergrepen 1.419919 0.0259 *
VzC lettergrepen 13.07367 7.4e-09 ***
Lange VzC’s meer in extrapositie om middenveld te verlichten om zin makkelijker te verwerken
Maar toch veel VzC’s in middenveld?
Verklaring
Andere verklaringen: Chomsky (1975): “it is interesting to note that it is apparently not the
length in words of the object that determines the naturalness of the transformation, but, rather, in some sense, its complexity.”
Levy (2008) verrassingstheorie Hawkins (1994): “constituents occur in the orders they do so that
syntactic groupings and their immediate constituents can be recognized and produced as rapidly and efficiently as possible in language performance”
Verklaring
Complexiteit operationaliseren
Het middenveld is complex als één van de volgende elementen aanwezig is:
nabepaling: vb. dat de helft van de Belgen klaagt over stress samentrekking: vb. dat verkopers en marketeers deel uitmaakten van
dezelfde afdeling bijzin: vb. dat zelfs jongeren die niet in het buitenland willen werken,
aangetrokken worden door bedrijven die internationaal actief zijn tussenvoeging: vb. dat een verstrenging van de maatregelen, met
eventuele veroordelingen, kan leiden tot een overbevolking van de gevangenissen
Vooruitblik
Invloed vertaald/ niet-vertaald?
Logistische regressieanlayse voor 501 zinnen: geen significant effect
Vooruitblik
Factor O.R. P-value
Vertaald/niet-vertaald 1.021048 0.8696
Suggesties? Vragen?