Pres c7 hoofdstuk2

34
Hoofdstuk 2 : IR- Hoofdstuk 2 : IR- technieken en technieken en zoekstrategieën zoekstrategieën Battle of the technics

Transcript of Pres c7 hoofdstuk2

Page 1: Pres c7 hoofdstuk2

Hoofdstuk 2 : IR-Hoofdstuk 2 : IR-technieken en technieken en

zoekstrategieënzoekstrategieën

Battle of the technics

Page 2: Pres c7 hoofdstuk2

1. File structuren (1)1. File structuren (1)

Databank verschillende tabellen

Tabel = File met gegevens gemeenschappelijke soort gegevens

Databank = tabellen met links

Page 3: Pres c7 hoofdstuk2

1. File structuren (2)1. File structuren (2)

Soorten files

1.Lineaire files : “chronologische ordening”

Gemakkelijk om gegevens toe te voegen Moeilijk om te doorzoeken

Page 4: Pres c7 hoofdstuk2

1. File structuren (3)1. File structuren (3)

Soorten files

2.Sequentiële files : geordend volgens een criterium (alfanumeriek)

Moeilijker om gegevens toe te voegen 1 positie opschuiven

Gemakkelijker om te doorzoeken

Page 5: Pres c7 hoofdstuk2

1. File structuren (3)1. File structuren (3)

Soorten files

3.Geïndexeerde files :

Nieuwe aparte file Link tussen index en deelfile (pointer) Gemakkelijker om te doorzoeken Moeilijk om te onderhouden

Page 6: Pres c7 hoofdstuk2

1. File structuren (4)1. File structuren (4)

Page 7: Pres c7 hoofdstuk2

1. File structuren (5)1. File structuren (5)

Soorten files

4.Geïnverteerde indexfiles :

Geen directe files Recordfile is lineair Index is technisch heel ingewikkeld Paradox van snelheid

Page 8: Pres c7 hoofdstuk2

1. File structuren (6)1. File structuren (6)

Page 9: Pres c7 hoofdstuk2

1. File structuren (7)1. File structuren (7)

Page 10: Pres c7 hoofdstuk2

2. Formele modellen (1)2. Formele modellen (1)

= Twaalf modellen waarmee een DB kan ondervraagd worden

Illustraties :

Bordschema met voorbeeldenVoorbeelden uit databanken

Page 11: Pres c7 hoofdstuk2

2. Formele modellen (2)2. Formele modellen (2)

1.Single descriptor request

2.Set of descriptors request = Complete boolean request

3.Set descriptors request met "cut off value"

Page 12: Pres c7 hoofdstuk2

2. Formele modellen (3)2. Formele modellen (3)

4.Set descriptors request met "cut off value" en ranking

5.Gewogen request

6.Gewogen indexering

7.Gewogen request en indexering

Page 13: Pres c7 hoofdstuk2

2. Formele modellen (4)2. Formele modellen (4)

8.Cosinus regel

9.Boolean request

10.Full-text retrieval

11.Fuzzy-modellen

12.Clustering

Page 14: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (1)aspecten (1)

Enkel technische aspecten = niet voldoende

Algemeen Methodologisch Specifieke methodologie Specifieke strategieën

meestal gebaseerd op geïnverteerde files

Page 15: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (2)aspecten (2)

Analystische methode :

Search interview Self-interview Gedetailleerde stappen

Verschillende aspecten

Page 16: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (3)aspecten (3)

Onderwerp :

Formulering in natuurlijke taal Omzetting naar trefwoorden Specialisatie aanpassen Omzetting naar synoniemen Omzetting naar andere talen

Page 17: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (4)aspecten (4)

Beginsituatie

Vertrekken van bekende referenties? Welke periode? Welke budget? Interesse in meer of minder publicaties?

Page 18: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (5)aspecten (5)

Databanken en bronnen

Welke bronnen? Specifieke informatie en eigenschappen Trefwoorden omzetten naar DB (thesaurus) Werkwijze DB aanpassen aan methode Outputformats

Page 19: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (6)aspecten (6)

Zoekmethoden :

1.Bouwsteenmethode

Vooraf bepaalde zoektermen Combineren (booleaanse) Tussenuitkomsten bereiken Tussenuitkomsten combineren

Page 20: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (7)aspecten (7)

Zoekmethoden :

2.Citation pearl growing

Vertrekpunt = zeer relevant document Citaties onderzoeken (recenter en ouder) Varianten

Subject pearl growing Internet pearl growing

Page 21: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (8)aspecten (8)

Zoekmethoden :

3.Ideal search Vertrek = zeer enge zoekterm Vergelijkbaar met bouwsteenmethode

4.Opeenvolgende beperkingen Zeer ruime verzameling Beperkingen uitvoeren

Page 22: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (9)aspecten (9)

Nog even enkele andere tips :

Verschillen in indexen Vb. Alle velden

Keuze van veldenTaalvariantenAfkortingenTypfauten

Page 23: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (10)aspecten (10)

Methoden van feedback

Verschilt van databank tot databank

Enkele aspecten Korte beschrijving Lange beschrijving

Eventueel gebruik van een KWIC-index

Page 24: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (11)aspecten (11)

Page 25: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (12)aspecten (12)

Hoe presenteren?

Afdrukformaat?Citation software?Nabewerking?Email?

Page 26: Pres c7 hoofdstuk2

3. Methodologische 3. Methodologische aspecten (13)aspecten (13)

Relevance feed-back op basis van :

Frequentie van zoektermenFrequentie in indexPlaats van voorkomenRelatie tussen zoektermenAantal consultatiesAantal citaties of hyperlinks

Page 27: Pres c7 hoofdstuk2

4. Specifieke strategiën (1)4. Specifieke strategiën (1)

Booleaans zoeken (1)

Opeenvolgende zoekacties Een grote zoekactie

OR-relatie Unie van verzamelingen Verschil met taal Verschil met truncatie

Page 28: Pres c7 hoofdstuk2

4. Specifieke strategiën (2)4. Specifieke strategiën (2)

Booleaans zoeken (2)

AND-relatie Doorsnede van verzamelingen Verschil met taal

NOT-relatie Verschil van twee verzamelingen

Page 29: Pres c7 hoofdstuk2

4. Specifieke strategiën (3)4. Specifieke strategiën (3)

Booleaans zoeken (3)

Volgorde van bewerkingen

NOT AND OR Gebruik van haakjes

Page 30: Pres c7 hoofdstuk2

4. Specifieke strategiën (4)4. Specifieke strategiën (4)

Booleaans zoeken (4) : recapitulatie

Page 31: Pres c7 hoofdstuk2

4. Specifieke strategiën (5)4. Specifieke strategiën (5)

Eigenschappen van boolse operatoren

Commutatieve eigenschapAssociatieve eigenschapDistributiviteit

Zie bordschema

Page 32: Pres c7 hoofdstuk2

4. Specifieke strategiën (6)4. Specifieke strategiën (6)

Andere strategieën (1)

Suffixen en prefixen Nabijheidsoperatoren Woordafstand Thesaurus-zoeken Truncatie

Page 33: Pres c7 hoofdstuk2

4. Specifieke strategiën (6)4. Specifieke strategiën (6)

Andere strategieën (2)

Probalistische modellen Vectoren Vb. Model = extended boolean search

Algebraïsche modellen Basis = taal Vb. Model = n-grams

Page 34: Pres c7 hoofdstuk2

5. Aanverwante activiteiten5. Aanverwante activiteiten

Lezen en interpreteren Summarization Analyse

Vinden van trends Vergelijkingen maken Aggregatie van informatie Identificatie

Vertalingen Evaluatie