Pres c7 hoofdstuk2
-
Upload
cvodenobel -
Category
Documents
-
view
157 -
download
0
Transcript of Pres c7 hoofdstuk2
Hoofdstuk 2 : IR-Hoofdstuk 2 : IR-technieken en technieken en
zoekstrategieënzoekstrategieën
Battle of the technics
1. File structuren (1)1. File structuren (1)
Databank verschillende tabellen
Tabel = File met gegevens gemeenschappelijke soort gegevens
Databank = tabellen met links
1. File structuren (2)1. File structuren (2)
Soorten files
1.Lineaire files : “chronologische ordening”
Gemakkelijk om gegevens toe te voegen Moeilijk om te doorzoeken
1. File structuren (3)1. File structuren (3)
Soorten files
2.Sequentiële files : geordend volgens een criterium (alfanumeriek)
Moeilijker om gegevens toe te voegen 1 positie opschuiven
Gemakkelijker om te doorzoeken
1. File structuren (3)1. File structuren (3)
Soorten files
3.Geïndexeerde files :
Nieuwe aparte file Link tussen index en deelfile (pointer) Gemakkelijker om te doorzoeken Moeilijk om te onderhouden
1. File structuren (4)1. File structuren (4)
1. File structuren (5)1. File structuren (5)
Soorten files
4.Geïnverteerde indexfiles :
Geen directe files Recordfile is lineair Index is technisch heel ingewikkeld Paradox van snelheid
1. File structuren (6)1. File structuren (6)
1. File structuren (7)1. File structuren (7)
2. Formele modellen (1)2. Formele modellen (1)
= Twaalf modellen waarmee een DB kan ondervraagd worden
Illustraties :
Bordschema met voorbeeldenVoorbeelden uit databanken
2. Formele modellen (2)2. Formele modellen (2)
1.Single descriptor request
2.Set of descriptors request = Complete boolean request
3.Set descriptors request met "cut off value"
2. Formele modellen (3)2. Formele modellen (3)
4.Set descriptors request met "cut off value" en ranking
5.Gewogen request
6.Gewogen indexering
7.Gewogen request en indexering
2. Formele modellen (4)2. Formele modellen (4)
8.Cosinus regel
9.Boolean request
10.Full-text retrieval
11.Fuzzy-modellen
12.Clustering
3. Methodologische 3. Methodologische aspecten (1)aspecten (1)
Enkel technische aspecten = niet voldoende
Algemeen Methodologisch Specifieke methodologie Specifieke strategieën
meestal gebaseerd op geïnverteerde files
3. Methodologische 3. Methodologische aspecten (2)aspecten (2)
Analystische methode :
Search interview Self-interview Gedetailleerde stappen
Verschillende aspecten
3. Methodologische 3. Methodologische aspecten (3)aspecten (3)
Onderwerp :
Formulering in natuurlijke taal Omzetting naar trefwoorden Specialisatie aanpassen Omzetting naar synoniemen Omzetting naar andere talen
3. Methodologische 3. Methodologische aspecten (4)aspecten (4)
Beginsituatie
Vertrekken van bekende referenties? Welke periode? Welke budget? Interesse in meer of minder publicaties?
3. Methodologische 3. Methodologische aspecten (5)aspecten (5)
Databanken en bronnen
Welke bronnen? Specifieke informatie en eigenschappen Trefwoorden omzetten naar DB (thesaurus) Werkwijze DB aanpassen aan methode Outputformats
3. Methodologische 3. Methodologische aspecten (6)aspecten (6)
Zoekmethoden :
1.Bouwsteenmethode
Vooraf bepaalde zoektermen Combineren (booleaanse) Tussenuitkomsten bereiken Tussenuitkomsten combineren
3. Methodologische 3. Methodologische aspecten (7)aspecten (7)
Zoekmethoden :
2.Citation pearl growing
Vertrekpunt = zeer relevant document Citaties onderzoeken (recenter en ouder) Varianten
Subject pearl growing Internet pearl growing
3. Methodologische 3. Methodologische aspecten (8)aspecten (8)
Zoekmethoden :
3.Ideal search Vertrek = zeer enge zoekterm Vergelijkbaar met bouwsteenmethode
4.Opeenvolgende beperkingen Zeer ruime verzameling Beperkingen uitvoeren
3. Methodologische 3. Methodologische aspecten (9)aspecten (9)
Nog even enkele andere tips :
Verschillen in indexen Vb. Alle velden
Keuze van veldenTaalvariantenAfkortingenTypfauten
3. Methodologische 3. Methodologische aspecten (10)aspecten (10)
Methoden van feedback
Verschilt van databank tot databank
Enkele aspecten Korte beschrijving Lange beschrijving
Eventueel gebruik van een KWIC-index
3. Methodologische 3. Methodologische aspecten (11)aspecten (11)
3. Methodologische 3. Methodologische aspecten (12)aspecten (12)
Hoe presenteren?
Afdrukformaat?Citation software?Nabewerking?Email?
3. Methodologische 3. Methodologische aspecten (13)aspecten (13)
Relevance feed-back op basis van :
Frequentie van zoektermenFrequentie in indexPlaats van voorkomenRelatie tussen zoektermenAantal consultatiesAantal citaties of hyperlinks
4. Specifieke strategiën (1)4. Specifieke strategiën (1)
Booleaans zoeken (1)
Opeenvolgende zoekacties Een grote zoekactie
OR-relatie Unie van verzamelingen Verschil met taal Verschil met truncatie
4. Specifieke strategiën (2)4. Specifieke strategiën (2)
Booleaans zoeken (2)
AND-relatie Doorsnede van verzamelingen Verschil met taal
NOT-relatie Verschil van twee verzamelingen
4. Specifieke strategiën (3)4. Specifieke strategiën (3)
Booleaans zoeken (3)
Volgorde van bewerkingen
NOT AND OR Gebruik van haakjes
4. Specifieke strategiën (4)4. Specifieke strategiën (4)
Booleaans zoeken (4) : recapitulatie
4. Specifieke strategiën (5)4. Specifieke strategiën (5)
Eigenschappen van boolse operatoren
Commutatieve eigenschapAssociatieve eigenschapDistributiviteit
Zie bordschema
4. Specifieke strategiën (6)4. Specifieke strategiën (6)
Andere strategieën (1)
Suffixen en prefixen Nabijheidsoperatoren Woordafstand Thesaurus-zoeken Truncatie
4. Specifieke strategiën (6)4. Specifieke strategiën (6)
Andere strategieën (2)
Probalistische modellen Vectoren Vb. Model = extended boolean search
Algebraïsche modellen Basis = taal Vb. Model = n-grams
5. Aanverwante activiteiten5. Aanverwante activiteiten
Lezen en interpreteren Summarization Analyse
Vinden van trends Vergelijkingen maken Aggregatie van informatie Identificatie
Vertalingen Evaluatie