DE conferentie 2012 - Karina van Dalen-Oskam

Post on 18-Jun-2015

205 views 0 download

Transcript of DE conferentie 2012 - Karina van Dalen-Oskam

Namescape: Onderzoek naar eigennamen in romans

Karina van Dalen-Oskam

Hoogleraar Computationele literatuurwetenschap,Universiteit van Amsterdam

Onderzoeksleider Textual Scholarship & Literary studies,Huygens ING – KNAW

Letterkundig stilistisch onderzoek

Wat is de rol van eigennamen in romans?

Hoe vaak komen ze voor en wat zijn hun functies?

Stand van zaken named entity recognition

Nieuwe ontwikkelingen op basis van nieuwe vragen

3

Naamtypen

Persoonsnamen

Geografische namen

Overige namen (gebouwen, gebeurtenissen, instituten, boektitels, etc.)

Plot intern versus plot extern

Plot intern: namen die verwijzen naar personages, plaatsen of zaken die uitsluitend 'bestaan' binnen de fictie van de roman.

Plot externe namen verwijzen naar personen, plaatsen of zaken die in de werkelijke wereld bestaan.

Kan nog niet in huidige NER-tools

Subtypen van persoonsnamen

Voornamen

Familienamen

Bijnamen

Kan nog niet in huidige NER-tools

Aantal personen met een naam

Onafhankelijk van naamvorm of naamtype (voornaam, familienaam en bijnaam zijn verschillende naamtypen)

Kan nog niet in huidige NER-tools

Namescape werkzaamheden

- aanpassing Stanford NER door Instituut voor Nederlandse Lexicologie om de uitgebreidere ‘literaire’ tagset te gebruiken (team van Katrien Depuydt)

-aanpassing techniek voor Named Entity Resolution (mapping naar 'real entities') gebruikmakend van Wikipedia door Universiteit van Amsterdam (team van Maarten Marx)

-corpusproblematiek

karina.van.dalen@huygens.knaw.nl