DE conferentie 2012 - Karina van Dalen-Oskam

16
Namescape: Onderzoek naar eigennamen in romans Karina van Dalen-Oskam Hoogleraar Computationele literatuurwetenschap, Universiteit van Amsterdam Onderzoeksleider Textual Scholarship & Literary studies, Huygens ING – KNAW

Transcript of DE conferentie 2012 - Karina van Dalen-Oskam

Page 1: DE conferentie 2012 - Karina van Dalen-Oskam

Namescape: Onderzoek naar eigennamen in romans

Karina van Dalen-Oskam

Hoogleraar Computationele literatuurwetenschap,Universiteit van Amsterdam

Onderzoeksleider Textual Scholarship & Literary studies,Huygens ING – KNAW

Page 2: DE conferentie 2012 - Karina van Dalen-Oskam

Letterkundig stilistisch onderzoek

Wat is de rol van eigennamen in romans?

Hoe vaak komen ze voor en wat zijn hun functies?

Stand van zaken named entity recognition

Nieuwe ontwikkelingen op basis van nieuwe vragen

Page 3: DE conferentie 2012 - Karina van Dalen-Oskam

3

Page 4: DE conferentie 2012 - Karina van Dalen-Oskam
Page 5: DE conferentie 2012 - Karina van Dalen-Oskam

Naamtypen

Persoonsnamen

Geografische namen

Overige namen (gebouwen, gebeurtenissen, instituten, boektitels, etc.)

Page 6: DE conferentie 2012 - Karina van Dalen-Oskam
Page 7: DE conferentie 2012 - Karina van Dalen-Oskam

Plot intern versus plot extern

Plot intern: namen die verwijzen naar personages, plaatsen of zaken die uitsluitend 'bestaan' binnen de fictie van de roman.

Plot externe namen verwijzen naar personen, plaatsen of zaken die in de werkelijke wereld bestaan.

Kan nog niet in huidige NER-tools

Page 8: DE conferentie 2012 - Karina van Dalen-Oskam
Page 9: DE conferentie 2012 - Karina van Dalen-Oskam

Subtypen van persoonsnamen

Voornamen

Familienamen

Bijnamen

Kan nog niet in huidige NER-tools

Page 10: DE conferentie 2012 - Karina van Dalen-Oskam
Page 11: DE conferentie 2012 - Karina van Dalen-Oskam

Aantal personen met een naam

Onafhankelijk van naamvorm of naamtype (voornaam, familienaam en bijnaam zijn verschillende naamtypen)

Kan nog niet in huidige NER-tools

Page 12: DE conferentie 2012 - Karina van Dalen-Oskam
Page 13: DE conferentie 2012 - Karina van Dalen-Oskam
Page 14: DE conferentie 2012 - Karina van Dalen-Oskam

Namescape werkzaamheden

- aanpassing Stanford NER door Instituut voor Nederlandse Lexicologie om de uitgebreidere ‘literaire’ tagset te gebruiken (team van Katrien Depuydt)

-aanpassing techniek voor Named Entity Resolution (mapping naar 'real entities') gebruikmakend van Wikipedia door Universiteit van Amsterdam (team van Maarten Marx)

-corpusproblematiek

Page 15: DE conferentie 2012 - Karina van Dalen-Oskam