4 Joop Van Gent Irion
-
Upload
platform-meta-informatie -
Category
Documents
-
view
2.350 -
download
1
description
Transcript of 4 Joop Van Gent Irion
Wat is er mis met de Onderwerptaxonomie?
Inhoud
1. Wat is een taxonomie?
2. De rol van controlled vocabularies
3. Project Antwoord en de rol van de Onderwerpsthesaurus
4. Problemen bij de Onderwerpsthesaurus
Wat is een taxonomie?
Taxonomieën
Traditionele definitie:– Een hierarchisch termensysteem, oorspronkelijk gebaseerd op inzichten in de
biologie, bedoeld om het dierenrijk in te delen– De originele relatietypes: kingdom, phylum, class, order, family, genus, and
species– Iedere term komt slechts één keer voor– De klassen hebben geen overlap
Thesaurus– Termen kunnen meer keer voorkomen– Klassen hebben overlap– Veel meer relatietypen
Op een dag in het pizza restaurant
Het menu
Pizza gerechten €
Pizza Margherita MET TOMATEN EN KAAS 5,70
Pizza Pugliese MET TOMATEN, UI EN KAAS 5,80
Pizza Passoa MET TOMATEN, KAAS EN BANAAN 6,30
Pizza Capricciosa MET TOMATEN, KAAS EN CHAMPIGNONS 6,35
Pizza Margherita Ananas
MET TOMATEN, KAAS EN ANANAS 6,60
Pizza Napoletana MET TOMATEN, KAAS EN ANSJOVIS 7,05
Pizza Etrusca MET TOMATEN, KAAS, BANAAN EN ANANAS 7,20
Pizza Bolognese MET TOMATEN, KAAS EN BOLOGNESESAUS 7,20
Pizza Cipolla MET TOMATEN, KAAS, HAM EN UI 7,45
Pizza Borromea MET TOMATEN, KAAS EN HAM 7,65
Pizza al Salame MET TOMATEN, KAAS EN SALAMI 7,65
Pizza Siciliana MET TOMATEN, KAAS, ANSJOVIS, KAPPERTJES EN OLIJVEN 7,90
Pizza Pepperoni MET TOMATEN, KAAS, PAPRIKA, SPAANSE PEPER EN UI 7,90
Pizza Roma MET TOMATENSAUS, KAAS VERSE TOMATEN, UI EN BASILICUM
8,25
Pizza Hawaï MET TOMATEN, KAAS, HAM EN ANANAS 8,25
Pizza Carne MET TOMATEN, KAAS, HAM EN SALAMI 8,35
Pizza Quattro Stagioni
MET TOMATEN, KAAS, SALAMI, HAM, PAPRIKA EN CHAMPIGNONS
8,40
Pizza Pesto MET TOMATEN, KAAS, PESTO, MOZZARELLA, OLIJVEN, UI EN KNOFLOOK
8,65
Pizza Mozzarella MET TOMATEN, KAAS EN MOZZARELLA 8,95
Pizza al Gorgonzola
MET TOMATEN, KAAS EN GORGONZOLA 8,95
Pizza Delizia MET TOMATEN, KAAS, ANANAS, PERZIK, CHAMPIGNONS EN PAPRIKA
9,05
Pizza al Salmone MET TOMATEN, KAAS EN GEROOKTE ZALM 9,10
Pizza Picante MET TOMATEN, KAAS, PIKANTE WORST, CHAMPIGNONS, UI EN SPAANSE PEPERS
9,35
Pizza al Tonno MET TOMATEN, KAAS, TONIJN, UI EN CHAMPIGNONS 9,35
Pizza Calzone GEVULDE PIZZA MET KAAS, HAM, DIVERSE SOORTEN VLEES, GROENTEN EN CHAMPIGNONS
9,35
Pizza Vegetariana MET TOMATEN, KAAS, ARTISJOKKEN, PAPRIKA, CHAMPIGNONS EN UI
9,40
Pizza al Casa MET TOMATEN, KAAS, GEKRUID GEHAKT, IJSBERGSLA EN KNOFLOOKSAUS
9,60
Pizza ai Quattro Formaggi
MET TOMATEN EN 4 SOORTEN KAAS (O.A. GORGONZOLA, MOZZARELLA, FETA)
9,75
Pizza Shoarma MET TOMATEN, KAAS, PAPRIKA, UI, SHOARMAVLEES EN KNOFLOOKSAUS
10,30
Pizza Marinara MET TOMATEN, KAAS, MOSSELEN, GARNALEN EN TONIJN 10,40
Pizza Bomba MET TOMATEN, KAAS, HAM, SALAMI, SPEK, GORGONZOLA, UI, PAPRIKA EN CHAMPIGNONS
10,95
Pizza Pollo MET TOMATEN, KAAS, KIPFILET, PAPRIKA, CHAMPIGNONS EN UI
10,95
Visie 1: de taxonomie
pizza’s
vlees geen vlees
venezia calzone vegetarisch vis
margheritaquattro formaggi
al tonno frutti di mare
Visie 2: de tabel
margherita 4 formaggi calzone Pugliese al tonno 4 stagionitomaten X X X X Xkaas X X X X Xchampignons X X Xui X Xtonijn Xham X Xgehakt Xsalami Xpaprika X Xmozzarella X X
Visie 3: Objecten als feature bundles
tomaten
ham
mozzarella
tonijn
ui
champignons
kaas
gehakt
salami
paprika
Pizza1
Visie 3: Objecten als feature bundles
tomaten
Pizza 2ham
mozzarella
tonijn
ui
champignons
kaas
gehakt
salami
paprika
Visie 3: Objecten als feature bundles
tomaten
Pizza 3
ham
mozzarella
tonijn
ui
champignons
kaas
gehakt
salami
paprika
Conclusies uit de pizzeria
Werken met feature bundles is prachtig, want met slechts weinig features is een object, een verzameling objecten, een eigenschap of een relatie snel te duiden.
Maar communicatie in taal – in tegenstelling tot beeld - is lineair, en vereist daarom dat feature bundles voortdurend worden samengevat om snelle communicatie mogelijk te maken:
– Balkenende voelt zich gepiepeld door de retoriek van Bush.– Ik ben over naar groene energie.
Dit is niet alleen het principe van natuurlijke taal, maar tevens het grondbeginsel van de dialoog tussen overheid en burger.
De taxonomie is dus een prima idee!! Maar samenvatten van featurebundels enerzijds en het definiëren van features
anderzijds lijken erg op elkaar. Daarom is het maken van taxonomieën vaak zo verwarrend.......
De ideeën van Plato en Leibniz
1. Plato:• indentiteit• verschil• beweging• stilstand• zijn
2. Leibniz• 0• 1
3. www.20q.net
Deel van het antwoord: de taxonomie!
De basisstructuur achter de dialoog is de controlled vocabulary, meestal in de vorm van een hierarchie (taxonomie of thesaurus).
Taxonomieën zijn beslist onvoldoende om de rijkheid van taal of de nuances in de werkelijke wereld te beschrijven, maar desondanks een uitstekende basis voor de dialoog:
– Structuur– allebei weten waar je over praat
In de praktijk betekent dit altijd kiezen tussen twee uitersten:– De wereld zo mooi mogelijk proberen te maken (maar de wereld is geen boom)– Zorgen voor begrijpelijkheid (maar hoe dan?)
De rol van controlled vocabularies
Oftewel concreet: wat hebben gemeentes en andere overheden eigenlijk aan een taxonomie?
De wereld zonder taxonomie
A
A’ indexing
engine
A
ape
….
….
….
….
….
….
zilch
A’’
document query
De wereld zonder taxonomie
paardensport
paard indexing
engine
schaken
aap
….
….
….
….
paard
….
zijwind
paard
document query
Taxonomie als communicatiemiddel
A
A’
A
A’’
document query
a
Project Antwoord! en de rol van de Onderwerpsthesaurus
Uitdagingen en oplossingen
Het project Antwoord!
Consortium Gemeenteweb – CTP – Irion Overall product voor alle informatiemanagement in een gemeente:
– Opvraag van alle informatie, producten en diensten– Automatische E-mailafhandeling– Webassistent en Webassistent+– FAQ’s– Automatische postsortering– Alle koppelingen met backoffice en andere overheidsinstellingen– Managementinformatie
Joop van Gent: [email protected]
Warning!
Commercial
Sheet
Antwoord! en de Onderwerptaxonomie
De uitdagingen
Uitdaging 1: verbeter transparantie
Gemeente
Onderwerp
Burger
Het is heel simpel:
hfjsdl;dsl hdf hehrgh ;h;w;tgruihj %$
$#$% hhk jdjwdwkdkhhfio jfj;
Huh?
Uitdaging 2: verbeter communicatie
De gemeente
Telefoon InternetInzage Balie
kantoortijden 24 x 7
Antwoord!
Uitdaging 2: verbeter communicatie
De gemeente
Telefoon InternetInzage Balie
kantoortijden 24 x 7
Antwoord!
Het project Antwoord!
Demonstratieshttp://www.enkhuizen.nl/?path=1126
http://demo2.gemeenteweb.nl/?path=1
http://wikihier.irion.nl/WikiHier/index.php/Main_Page
Problemen bij de onderwerpsthesaurus
1. De taxonomie als interlingua Burgers spreken een andere taal dan ambtenaren, en de taxonomie zou een brug moeten zijn.
Maar het woordgebruik is zodanig, dat burgers het niet snappen, hetzij vanwege de woordkeuze:
– ruimtelijke ordening en infrastructuur– economische aangelegenheden– registers administratie en documenten
hetzij vanwege de wijze van formuleren:– opleiding werklozen, vergoeding– volmachtbewijs, omzetten oproepingskaart verkiezingen– bedrijfsverzamelgebouw, toewijzing en beheer
De klassenbenamingen zijn verwarrend. Bijvoorbeeld:– de moeder Geneesmiddelen en medische hulpmiddelen omvat de volgende dochters:
a. Bedrijfsgezondheidszorg b. Epidemiologie c. Jeugdgezondheidszorg d. Verzorgingstehuis etc.
– De indruk is dat de klasse gebruikt wordt voor alle zaken rond de zorg en dus hij zal beter gewoon Zorg kunnen heten.
Taxonomie: klassiek of modern?cl
ass
ifica
tion
retr
ieva
l
2. Dekking
Burgers komen met allerlei onderwerpen bij een gemeente die niet door de taxonomie gedekt zijn; de taxonomie moet worden uitgebreid. Voorbeelden:
– WMO (Wet Maatschappelijke Ondersteuning)– bouw- en grondverklaring– bevolkingsonderzoek– subsidie minderheden– waardebepaling WOZ (Wet Waardering Onroerende zaken)
Maar ook hele domeinen ontbreken, bijvoorbeeld: – dingen m.b.t. religie (zaken rond religie horen in de rijkstaxonomie bij moeders emacipatie
en integratie)– financiele sector
Soms zijn de rijksklassen te specifiek, bijvoorbeeld de moeders:– Arbeidsomstandigheden– Arbeidstijden verlof– Arbeidsongeschikt
maar er is geen algemenere klasse voor andere zaken rond werk beschikbaar.
3. Technische problemen
De paspoort-paradox– burgers gebruiken vaak eenvoudige bewoordingen, die ambigu zijn: als iemand als
trefwoord "paspoort" intypt, wil hij/zij waarschijnlijk een paspoort aanvragen, maar er zijn veel meer keuzes die allemaal hetzelfde trefwoord bevatten, zoals: vreemdelingenpaspoort, tweede paspoort, vluchtelingenpaspoort. Voor een burger is het dan hinderlijk dat niet de meest evidente direct kan worden gekozen.
Codering– In de handleiding wordt gezegd, dat om verschillende html-coderingen te vermijden
“alleen tekst" is toegestaan. Dit is echter niet voldoende, want diacritische tekens, zoals trema's, zijn op verschillende computers ook verschillend gecodeerd.
Deeplinking– (dat een burger die "huurtoeslag" invoert bijvoorbeeld naar de Belastingdienst wordt
doorgelinkt, in plaats van een link bij de gemeente) is momenteel niet geregeld in implementatie Advies Overheid.nl
4. Stiefdochters-probleem
Er worden veel dochters bij meerdere moeders aangesloten bijv.zie in de tabel - in de rechter kolom de dochter gehandicapten voorzieningen (WVG) en links alle moeders waar de dochter aan bijgesloten is.
Gemiddeld heeft iedere dochter 4 moeders.
Oma Moeder Dochter
Familie en gezin senioren gehandicapten voorzieningen (WVG)
Gezondheid en zorg ziektekosten gehandicapten voorzieningen (WVG)
Gezondheid en zorg handicap of lichamelijke beperkingen gehandicapten voorzieningen (WVG)
Werk en inkomen arbeidsongeschikt arbeidsgehandicapt gehandicapten voorzieningen (WVG)
Werk en inkomen werkloos gehandicapten voorzieningen (WVG)
Werk en inkomen pensioen gehandicapten voorzieningen (WVG)
Wonen (ver)bouwen en slopen gehandicapten voorzieningen (WVG)
Wonen koophuizen gehandicapten voorzieningen (WVG)
Wonen huren of verhuren gehandicapten voorzieningen (WVG)
5. Termen lijken op elkaar
Soms lijken moederklassen (uit verschillende oma's) heel erg op elkaar bijvoorbeeld:
– oma Gezondheid en zorg, moeder: Calamiteiten en incidenten– oma: Openbare orde en recht: moeder: Branden calamiteiten en rampen
Maar ook de lagere klassen hebben dit probleem:– Wat is het verschil tussen “Nederlands paspoort" en "paspoort aanvragen",
wellicht voor een gemeente evident, maar voor de burger niet Bovendien ontbreekt een beschrijving (scope node) van wat bij de
Rijksthesaurusklassen hoort. Wat is bijvoorbeeld het verschil tussen de twee bovengenoemde moeders?
6. Overige problemen
Onderscheid informatie- en transactieproducten niet duidelijk Deeplinking (bv voor huurtoeslag naar Belastingdienst) niet geregeld in
implementatie Advies Overheid.nl De knopen in de taxonomie zijn nu termen (rigide), maar het zou veel
handiger zijn om ze nummer te geven, en de gemeentes zelf te laten kiezen welke precieze naam ze willen gebruiken
Conclusies en aanbevelingen
De Onderwerptaxonomie dient herzien te worden met het oog op gebruik in retrievalsystemen
Daarbij moeten de klassieke bibliotheekconcepten gedeeltelijk worden verlaten: – de wereld niet aan de achterkant mooi maken– maar aan de voorkant begrijpelijk
Aanbevelingen:– De gebruiker moet niet vermoeid worden met de structuur– Coderingen in plaats van termen, zodat de gemeentes vrij zijn in de keuze van termen– In plaats van stiefdochters werken met feature bundels, waardoor het hele systeem veel
eenvoudiger wordt en veel gemakkelijker aan te passen aan nieuwe inzichten– Verplichten of verleiden? Faciliteren!– Tip: burgerpanels betrekken bij de ontwikkeling
Taal
Taal
TEI XML
Einde