Pres c7 hoofdstuk2

Post on 27-Jul-2015

157 views 0 download

Transcript of Pres c7 hoofdstuk2

Hoofdstuk 2 : IR-Hoofdstuk 2 : IR-technieken en technieken en

zoekstrategieënzoekstrategieën

Battle of the technics

1. File structuren (1)1. File structuren (1)

Databank verschillende tabellen

Tabel = File met gegevens gemeenschappelijke soort gegevens

Databank = tabellen met links

1. File structuren (2)1. File structuren (2)

Soorten files

1.Lineaire files : “chronologische ordening”

Gemakkelijk om gegevens toe te voegen Moeilijk om te doorzoeken

1. File structuren (3)1. File structuren (3)

Soorten files

2.Sequentiële files : geordend volgens een criterium (alfanumeriek)

Moeilijker om gegevens toe te voegen 1 positie opschuiven

Gemakkelijker om te doorzoeken

1. File structuren (3)1. File structuren (3)

Soorten files

3.Geïndexeerde files :

Nieuwe aparte file Link tussen index en deelfile (pointer) Gemakkelijker om te doorzoeken Moeilijk om te onderhouden

1. File structuren (4)1. File structuren (4)

1. File structuren (5)1. File structuren (5)

Soorten files

4.Geïnverteerde indexfiles :

Geen directe files Recordfile is lineair Index is technisch heel ingewikkeld Paradox van snelheid

1. File structuren (6)1. File structuren (6)

1. File structuren (7)1. File structuren (7)

2. Formele modellen (1)2. Formele modellen (1)

= Twaalf modellen waarmee een DB kan ondervraagd worden

Illustraties :

Bordschema met voorbeeldenVoorbeelden uit databanken

2. Formele modellen (2)2. Formele modellen (2)

1.Single descriptor request

2.Set of descriptors request = Complete boolean request

3.Set descriptors request met "cut off value"

2. Formele modellen (3)2. Formele modellen (3)

4.Set descriptors request met "cut off value" en ranking

5.Gewogen request

6.Gewogen indexering

7.Gewogen request en indexering

2. Formele modellen (4)2. Formele modellen (4)

8.Cosinus regel

9.Boolean request

10.Full-text retrieval

11.Fuzzy-modellen

12.Clustering

3. Methodologische 3. Methodologische aspecten (1)aspecten (1)

Enkel technische aspecten = niet voldoende

Algemeen Methodologisch Specifieke methodologie Specifieke strategieën

meestal gebaseerd op geïnverteerde files

3. Methodologische 3. Methodologische aspecten (2)aspecten (2)

Analystische methode :

Search interview Self-interview Gedetailleerde stappen

Verschillende aspecten

3. Methodologische 3. Methodologische aspecten (3)aspecten (3)

Onderwerp :

Formulering in natuurlijke taal Omzetting naar trefwoorden Specialisatie aanpassen Omzetting naar synoniemen Omzetting naar andere talen

3. Methodologische 3. Methodologische aspecten (4)aspecten (4)

Beginsituatie

Vertrekken van bekende referenties? Welke periode? Welke budget? Interesse in meer of minder publicaties?

3. Methodologische 3. Methodologische aspecten (5)aspecten (5)

Databanken en bronnen

Welke bronnen? Specifieke informatie en eigenschappen Trefwoorden omzetten naar DB (thesaurus) Werkwijze DB aanpassen aan methode Outputformats

3. Methodologische 3. Methodologische aspecten (6)aspecten (6)

Zoekmethoden :

1.Bouwsteenmethode

Vooraf bepaalde zoektermen Combineren (booleaanse) Tussenuitkomsten bereiken Tussenuitkomsten combineren

3. Methodologische 3. Methodologische aspecten (7)aspecten (7)

Zoekmethoden :

2.Citation pearl growing

Vertrekpunt = zeer relevant document Citaties onderzoeken (recenter en ouder) Varianten

Subject pearl growing Internet pearl growing

3. Methodologische 3. Methodologische aspecten (8)aspecten (8)

Zoekmethoden :

3.Ideal search Vertrek = zeer enge zoekterm Vergelijkbaar met bouwsteenmethode

4.Opeenvolgende beperkingen Zeer ruime verzameling Beperkingen uitvoeren

3. Methodologische 3. Methodologische aspecten (9)aspecten (9)

Nog even enkele andere tips :

Verschillen in indexen Vb. Alle velden

Keuze van veldenTaalvariantenAfkortingenTypfauten

3. Methodologische 3. Methodologische aspecten (10)aspecten (10)

Methoden van feedback

Verschilt van databank tot databank

Enkele aspecten Korte beschrijving Lange beschrijving

Eventueel gebruik van een KWIC-index

3. Methodologische 3. Methodologische aspecten (11)aspecten (11)

3. Methodologische 3. Methodologische aspecten (12)aspecten (12)

Hoe presenteren?

Afdrukformaat?Citation software?Nabewerking?Email?

3. Methodologische 3. Methodologische aspecten (13)aspecten (13)

Relevance feed-back op basis van :

Frequentie van zoektermenFrequentie in indexPlaats van voorkomenRelatie tussen zoektermenAantal consultatiesAantal citaties of hyperlinks

4. Specifieke strategiën (1)4. Specifieke strategiën (1)

Booleaans zoeken (1)

Opeenvolgende zoekacties Een grote zoekactie

OR-relatie Unie van verzamelingen Verschil met taal Verschil met truncatie

4. Specifieke strategiën (2)4. Specifieke strategiën (2)

Booleaans zoeken (2)

AND-relatie Doorsnede van verzamelingen Verschil met taal

NOT-relatie Verschil van twee verzamelingen

4. Specifieke strategiën (3)4. Specifieke strategiën (3)

Booleaans zoeken (3)

Volgorde van bewerkingen

NOT AND OR Gebruik van haakjes

4. Specifieke strategiën (4)4. Specifieke strategiën (4)

Booleaans zoeken (4) : recapitulatie

4. Specifieke strategiën (5)4. Specifieke strategiën (5)

Eigenschappen van boolse operatoren

Commutatieve eigenschapAssociatieve eigenschapDistributiviteit

Zie bordschema

4. Specifieke strategiën (6)4. Specifieke strategiën (6)

Andere strategieën (1)

Suffixen en prefixen Nabijheidsoperatoren Woordafstand Thesaurus-zoeken Truncatie

4. Specifieke strategiën (6)4. Specifieke strategiën (6)

Andere strategieën (2)

Probalistische modellen Vectoren Vb. Model = extended boolean search

Algebraïsche modellen Basis = taal Vb. Model = n-grams

5. Aanverwante activiteiten5. Aanverwante activiteiten

Lezen en interpreteren Summarization Analyse

Vinden van trends Vergelijkingen maken Aggregatie van informatie Identificatie

Vertalingen Evaluatie