Internetresearch - The Traveler · 2016-12-08 · Google Custom Search Engine 66 Google Scholar 66...

of 320 /320
Internetresearch

Embed Size (px)

Transcript of Internetresearch - The Traveler · 2016-12-08 · Google Custom Search Engine 66 Google Scholar 66...

  • Internetresearch

  • Internetresearch

    Arjan Dasselaar

    Culemborg

  • ISBN: 978-90-5940-480-9NUR: 988Trefw.: internet

    Omslag: Artifex Graphics, RoosendaalVormgeving (concept): Aad Metz, De MeernOpmaak: Van Duuren Media, Culemborg

    Dit boek is gezet met Corel VENTURA™ 10.

    Dit boek is gedrukt op een papiersoort die niet met chloorhoudende chemicaliën is gebleekt.Hierdoor is de productie van dit boek minder belastend voor het milieu.

    © Copyright 2010 Van Duuren Media B.V.Van Duuren Informatica is een imprint van Van Duuren Media B.V.

    Op dit werk is de Creative Commons-licentie CC BY-NC-SA 4.0 van toepassing. De volledigedetails en voorwaarden van deze licentie vindt u op https://creativecommons.org/licenses/by-nc-sa/4.0/.

    Ondanks alle aan de samenstelling van dit boek bestede zorg kan noch de redactie, noch deauteur, noch de uitgever aansprakelijkheid aanvaarden voor schade die het gevolg is van enigefout in deze uitgave.

  • Overige series bij Van Duuren Media...

    ...in je broekzak

    De serie ...in je broekzak kent diverse kleine referentiegidsjes boordevol basisvaardigheden, tips,trucs, nuttige websites en naslaginformatie over het beschreven onderwerp. De inhoud is bondig,relevant, helder en informatief, waarbij het onderwijzende aspect iets minder prominent aanwezig is.

    Leer jezelf SNEL...

    De serie Leer jezelf SNEL... kenmerkt zich door een opzet van bondige hoofdstukken in een boekjedat qua formaat uitnodigt tot lezen en zelfstudie. De serie ontleent haar naam aan het feit dat destof snel kan worden doorgewerkt en opgenomen.

    Leer jezelf MAKKELIJK...

    De serie Leer jezelf MAKKELIJK... is bedoeld voor de lezer die duizelt van onbegrijpelijk jargon,Engelse termen, complexe constructies en ondoorgrondelijke voorbeelden. Gelardeerd met afbeel-dingen, vele praktijkvoorbeelden en nuttige tips en wetenswaardigheden, is de serie Leer jezelfMAKKELIJK... voor nagenoeg elke computergebruiker – beginner of gevorderde – een verademing.

    Leer jezelf PROFESSIONEEL...

    De serie Leer jezelf PROFESSIONEEL... biedt wat de naam reeds doet vermoeden: professionele on-derwerpen, beschreven op een hoog doch begrijpelijk niveau. Zonder te verzanden in minutieuzedetails beschrijven de auteurs van deze serie ingewikkelde onderwerpen op een heldere en duide-lijke wijze, waarbij complexere voorbeelden niet worden geschuwd.

    Superboek

    De serie Superboek omvat titels die complexe onderwerpen op een geavanceerd niveau beschrij-ven, zonder onbegrijpelijk te worden. Ook hier blinkt het taalgebruik uit in doorzichtigheid en lees-baarheid, evenals de vele voorbeelden, tips en achtergronden. Boeken in de serie Superboek kun-nen als naslagwerk worden bestempeld, maar ook als referentiegids en geavanceerd cursusmateriaal.

    Megatips

    De serie Megatips bevat boeken boordevol tips over een bepaald onderwerp. Deze tips zijn opdiverse manieren gerubriceerd en ingedeeld, zodat opzoeken zeer eenvoudig wordt gemaakt.Enkele titels zijn voorzien van een cd-rom met aanvullende software en een zoekmachine. De serieis opgezet voor de hobbyist of de professional die over een waardevol naslagwerk wil beschikken.

    Computer Idee... Duidelijk voor iedereen

    De serie Computer Idee... Duidelijk voor iedereen is bedoeld voor de enthousiaste computergebrui-ker. De serie behandelt diverse aspecten van het praktisch omgaan met hardware en software. Deauteurs van deze serie zijn stuk voor stuk ervaren computergebruikers die hun sporen in de journa-listiek ruimschoots hebben verdiend.

    Ga voor het actuele titeloverzicht naar www.vanduurenmedia.nl

  • Registreer uw boek!

    Van Duuren Media biedt haar lezers een unieke service. Op de websitewww.vanduurenmedia.nl kunt u dit boek kosteloos registreren. Als klant vanVan Duuren Media hebt u via de website toegang tot speciale gebieden met:

    • Nieuwsberichten• Interessante links• Speciale e-zines en archieven

    Registratiecode van deze titel:

    HBK-4420-7

    Registreer u vandaag nog en krijg gratis toegang tot de discussiefora op dewebsite van Van Duuren Media. Bovendien maakt u dan regelmatig kans opgratis boeken en leuke prijzen, en ontvangt u tweemaandelijks eennieuwsbrief, met:

    • Tips en trucs• Extra informatie• Wetenswaardigheden• Nuttige links

    Om te registreren:

    • Ga naar www.vanduurenmedia.nl.• Klik op Registreer!

  • Over de auteur

    Arjan Dasselaar (1975, www.arjandasselaar.nl) werkt sinds 1997 als jour-nalist voor het weekblad Elsevier. Ook ontwikkelde hij de eerste sites van dittijdschrift, zette hij in 2000 de eerste vierkoppige internetredactie vanElsevier op, en was hij geruime tijd internetcolumnist voor dit blad. Met dielaatste activiteit verwierf hij een eervolle vermelding bij de verkiezing van hetGouden Pennetje. Dasselaar werkte tevens geruime tijd voor de redactie vanPlanet Internet als onder meer columnist en onderzoeksjournalist. Hij waseen van de founding bloggers van Quotenet.nl en daarmee een van deeerste betaalde bloggers in Nederland. Nog altijd schrijft hij voor het blogbizz.nl. Tevens is hij columnist van nieuwssite NU.nl. Voor het FinancieeleDagblad schrijft hij daarnaast over technologie. Dasselaar doceerde aanjournalistiekopleidingen van de Universiteit Leiden (2005-2007), de Rijks-universiteit Groningen (2007-2009) en de Erasmus Universiteit (2010). Sinds2001 gaf en geeft Dasselaar incompany trainingen en strategisch advies bijuiteenlopende instellingen als het Europees Parlement, Wegener, het toen-malige PCM, VNU, Reed Business en diverse regionale mediaorganisaties.Verder was hij contentmanager bij zakensite zibb.nl.

    Eerdere boeken van Dasselaar:

    • Handboek Digitale Criminaliteit (2005, 2e herziene druk in 2008)• Handboek voor de ZZP’er (2009, 2e herziene druk in 2010)• Handboek Crossmediale Journalistiek en Redactie (2010)

  • Trainingsmogelijkheden

    U wilt dat uw medewerkers snel leren de vaardigheden uit dit boek in depraktijk toe te passen? Auteur Arjan Dasselaar geeft met zijn bedrijf ISOPEDAsinds 2001 intensieve researchtrainingen bij kranten, tijdschriften, tv-zendersen andere bedrijven. Ook geeft hij trainingen in webredactie, SEO en web-schrijven binnen de journalistieke praktijk, en crossmediale redactievoering.Zo gaf Arjan onder meer trainingen bij de Weekbladpers, RTL Nieuws, hetEuropees Parlement, Reed Business, VNU, de Fontys Hogeschool Journa-listiek, de Christelijke Hogeschool Windesheim en de Persgroep toen datbedrijf nog PCM heette. De inhoud van het trainingsprogramma is maatwerk.Afhankelijk van uw voorkeuren en het voorkennisniveau van de cursistenkunt u kiezen voor een stoomcursus van een dag, maar ook voor een gede-tailleerd meerdaags programma. Het lesprogramma over meerdere dagdelenof data verdelen, behoort uiteraard ook tot de mogelijkheden, net als hetuitbreiden van de cursus met journalistieke en/of computergerelateerdeonderwerpen die buiten het bestek van dit boek vallen.

    Neemt u vrijblijvend contact op voor een offerte door een e-mail te sturennaar [email protected], of te bellen naar 020-7072189.

  • Inhoud

    1 Basis van zoekstrategie 1

    Goed gereedschap 2

    Nuttige computerprogramma’s 4

    Internet Explorer – www.microsoft.com/windows/ie/ 4Firefox – www.getfirefox.com 6Google Chrome – chrome.google.com 7Google Desktop – desktop.google.com 7Copernic Desktop Search – www.copernic.com 9

    Nuttige sites 10

    Google Language Tools – www.google.com/language_tools 10Babel Fish – babelfish.yahoo.com 11

    Uw computer beter bedienen tijdens het zoeken 12

    Algemene Windows-wenken 12Internet Explorer 13Firefox 14Chrome 16

    Algemene zoekstrategie 16

    Drie gouden zoekregels 17

    2 Zoekmachines en internetgidsen 19

    Wat zijn zoekmachines en internetgidsen 20

    De werking van een zoekmachine 23

    Spiders en crawlers 24Tekstanalyse en heuristiek 24Metadata 25Autoriteit 25Spamdexing 27

    Bediening van zoekmachines 27

    Booleaanse operatoren 27Bediening van internetgidsen 30

    Rubrieksindeling 30Zoekveld 31

    ix

  • Kenmerken van goede zoekmachines en internetgidsen 31

    Scheiding commercie en inhoud 31Hulp 32Transparantie 32

    3 Google 33

    De basismogelijkheden van Google 34

    Met alle woorden 37Met de exacte woordcombinatie 38Met een van deze woorden 39Zonder de woorden 43Op datum zoeken 45

    Speciale functies van Google 47

    Een site doorzoeken 47Verdwenen documenten terughalen 49Zoeken op documenttype 50Verborgen documenten vinden, ofwel: het combineren van devoorgaandedrie zoekopdrachten 54Geavanceerd gebruik van de cache 58Google als woordenboek 59Google als rekenmachine 59Google als synoniemenzoeker 60Soortgelijke pagina’s vinden 61

    Taalfuncties 62

    Google dijt uit 64

    Google Maps 64Google Persoonlijk 65Google Web History 66Google Custom Search Engine 66Google Scholar 66Google Books 66Google N(i)e(u)ws 67Google Finance 67Google Images 67Google Video 67Google Products 67

    Experimentele Google-functies 68

    Google Sets 68Google Experimental 70

    Google-software 70

    Google Toolbar 70Google Earth 70Google Desktop 71

    Overige functies van Google 71

    Inhoud

    x

  • 4 Overige zoekmachines 73

    Nederlandse zoekmachines 74

    Zoeken.nl – www.zoeken.nl 74Ilse – www.ilse.nl 74Kobala – www.kobala.nl 75

    Buitenlandse zoekmachines 75

    Yahoo! – www.yahoo.com 75Wolfram|Alpha – www.wolframalpha.com 76Bing – www.bing.com 77Ask.com – www.ask.com 78Alexa – www.alexa.com 78AltaVista – www.altavista.com 78Gigablast – www.gigablast.com 79WikiAnswers – http://answers.wikia.com/ 80

    Metazoekmachines 80

    Clusty – www.clusty.com 81Dogpile – www.dogpile.com 82Freebase – www.freebase.com 82

    Gespecialiseerde zoekmachines 83

    Google Directory – directory.google.com/Top/Computers/Internet/Searching/Search_Engines/Specialized 83Wikipedia’s lijst van zoekmachines – en.wikipedia.org/wiki/List_of_search_engines 84Beaucoup – www.beaucoup.com 84Pandia – www.pandia.com/powersearch 84

    Informatie en nieuws over zoekmachines 86

    SearchEngineWatch – www.searchenginewatch.com 86Voelspriet – www.voelspriet.nl 87InfoPeople-lijsten – www.infopeople.org/search 87Bruce Clay – www.bruceclay.com/searchenginerelationshipchart.htm 88

    5 Internetgidsen en het diepe web 89

    Goede versus slechte internetgidsen 90

    Startpagina – www.pagina.nl 90Yahoo! – dir.yahoo.com 91About.com – www.about.com 91DMOZ – www.dmoz.nl 92Google Directory – www.google.com/dirhp en www.google.nl/dirhp 92Best of the Web – botw.org 93ipl2 – www.ipl2.org 94Library of Congress – international.loc.gov en www.loc.gov 94Intute – www.intute.ac.uk 95

    xi

    Handboek – Internetresearch

  • Het diepe web 96

    Infomine – infomine.ucr.edu 99Google Scholar – scholar.google.com 100CompletePlanet – www.completeplanet.com 100

    6 Lui zoeken 101

    De lui-zoeken-via-Google-truc 102

    Inleiding tot expertdiensten 103

    Library of Congress – www.loc.gov/rr/askalib 103Ask an ipl2 Librarian – www.ipl2.org/div/askus/ 104People’s Network (Groot-Brittannië) – www.peoplesnetwork.gov.uk 105Ask a Librarian (Schotland) – www.nls.uk/info/readingrooms/askalibrarian.html 106AllExperts – www.allexperts.com 106Answers.com – wiki.answers.com 107LinkedIn Answers – www.linkedin.com/answers 108Hunch – www.hunch.com 108Aardvark – www.aardvark.com 109Uclue – www.uclue.com 110Answerbag – www.answerbag.com 111Profnet – profnet.prnewswire.com 111MAD – www.madsci.org/submit.html 112Yahoo! Answers – answers.yahoo.com 112KEN – www.steljevraag.nl 114

    Automatisch op de hoogte blijven via websites 115

    Google Alerts – www.google.nl/alerts en www.google.com/alerts 115Yahoo! Pipes – pipes.yahoo.com 117

    Automatisch op de hoogte blijven via software 118

    7 De structuur van internet 121

    In den beginne… 122

    Waarom internet niet bestand is tegen een kernaanval 125

    Waarom IP en DNS voor researchers toch onmisbaar zijn 127

    Url’s en de opbouw van webadressen 128

    Het ontleden van websites 131

    Voorbij het WWW 134

    8 Bronverificatie 137

    Fameuze blunders 138

    De Paaseierenregel™ 140

    Sites die niet zijn wat ze lijken 141

    WHOIS, of: de personen achter een website 143

    AllWhois – www.allwhois.com 146

    Inhoud

    xii

  • CentralOps – centralops.net/co/ 149SIDN-whois – https://www.sidn.nl/nc/over-nl/whois/ 149Alternatief voor SIDN – tools.webtic.nl/domein_nl.php 151

    Gerelateerde WHOIS-diensten 151

    Domain Tools Suggestions – domain-suggestions.domaintools.com 151Siteautoriteit: zoeken naar een second opinion 152

    Rechtstreeks via een zoekmachine 152Via Submit Express – tools.marketleap.com/publinkpop 154

    Werking en nut van traceroutes en reverse DNS-scans 155

    Traceroute 155Reverse DNS-scans 158

    9 Personen, deskundigen en bedrijven zoeken 163

    Sneeuwballen gooien 164

    Adresgegevens en telefoonnummers van personen achterhalen 164

    De Telefoongids – www.telefoongids.nl 165Infobel – www.infobel.com 166

    Adresgegevens en telefoonnummers van bedrijven achterhalen 167

    Gouden Gids – www.goudengids.nl 167Kamer van Koophandel – www.kvk.nl/handelsregister 167

    Reverse lookups 168

    Nummerboek – www.nummerboek.com 169Nummerzoeker – www.nummerzoeker.com 170Ik heb je – www.ikhebje.nl 170WhitePages – www.whitepages.com/reverse-lookup 171

    Personen vinden met internetregisters 172

    Wieowie.nl – www.wieowie.nl 172Pipl – www.pipl.com 173Hyves – www.hyves.nl 173Schoolbank – www.schoolbank.nl 174Schoolpagina – www.schoolpagina.nl 175Dienstmakkers – www.dienstmakkers.nl 175Kadaster – www.kadaster.nl 176Naymz – www.naymz.com 177Yahoo! People Search – people.yahoo.com 177Diverse personenzoekmethoden – zoeken.beginthier.nl 178

    Deskundigen vinden 179

    Nederlandse Onderzoek Databank – www.onderzoekinformatie.nl 179BIG-register (gezondheidszorg) – www.bigregister.nl 179Advocaten – www.advocatenorde.nl/nova/advocaten2b.nsf/zoek?openform 180Diplomaten (Oranje Boekje) – www.mfa.nl 181Zakenlui vinden – www.forbes.com/peopletracker 182

    E-mailadressen opspeuren 182

    Andere manieren om personen op te sporen 183

    xiii

    Handboek – Internetresearch

  • 10 Nieuws vergaren met RSS 185

    Wat is RSS? 186

    Hoe RSS helpt bij research 187Het voordeel van RSS boven nieuwsbrieven 188

    Welke sites bieden RSS? 190

    Weblogs 190Nieuwssites 193Bedrijven 195

    Verschillende standaarden 196

    RSS lezen 197

    FeedDemon – www.feeddemon.com 197FeedReader – www.feedreader.com 198Snarfer – www.snarfware.com 198Sharpreader – www.sharpreader.net 199RssReader – www.rssreader.com 199NetNewsWire – http://netnewswireapp.com/ (OS X) 200Mozilla Thunderbird – www.mozilla-europe.org/nl/products/thunderbird/(Windows, Linux, OS X) 200RSSOwl – www.rssowl.org (Windows, Linux, OS X) 200

    RSS-feeds bekijken via websites 202

    Google Reader – www.google.com/reader 202Bloglines – www.bloglines.com 202

    RSS-feeds vinden 203

    1 – Via RSS-zoekmachines 2032 – Via de site zelf 2043 – Via directory’s – www.newsisfree.com/sources/bycat 2064 – Via Google 2065 – Zelf een RSS-feed maken 208

    11 Usenet 211

    Wat is Usenet? 212

    Toepassingen van Usenet 212

    Het Usenet-idioom: wat betekent wat? 214

    Het nut van Usenet voor research 215

    Google Discussiegroepen (Google Groups) gebruiken voor Usenet-research 215

    Personen zoeken met Google Groups 216Personen zoeken met Google Groups – een praktisch voorbeeld 221Research naar onderwerpen met Google Groups 222Nieuwsgroepen over specifieke onderwerpen vinden via Google Groups 222

    Usenet-research automatiseren 227

    Software voor langdurige Usenet-research 227

    Inhoud

    xiv

  • 12 E-mail als informatiebron 231

    Wat zijn mailinglijsten 232

    Het nut van mailinglijsten 232

    Hoe u relevante mailinglijsten vindt 233

    Yahoo! Groups – groups.yahoo.com 234Google Groups – groups.google.nl of groups.google.com 234L-soft – www.lsoft.com/lists/listref.html 235Tile – www.tile.net/lists 235Topica – lists.topica.com 236The Mail Archive – www.mail-archive.com 237

    Wat zijn e-mailheaders? 237

    E-mailheaders vinden 237

    Microsoft Outlook 2000, Outlook XP, Outlook 2003, Outlook 2007 237Microsoft Outlook Express 238Mozilla Thunderbird 239Op de Mac: OS X Mail 240

    E-mailheaders begrijpen 240

    E-mailheaders analyseren 241

    13 Social networks, chatdiensten en andere sociale sites 247

    Social networks 248

    Twitter – www.twitter.com 248Facebook – www.facebook.com 250Foursquare – www.foursquare.com 250LinkedIn – www.linkedin.com 251Hyves – www.hyves.nl 252MySpace – nl.myspace.com 252Orkut – www.orkut.com 253Friendster – www.friendster.com 253

    Andere sociale sites 253

    Scribd – www.scribd.com 253Slideshare – www.slideshare.net 254Google Wave – wave.google.com 254YouTube – www.youtube.com 255

    Chatdiensten 255

    IRC (Internet Relay Chat) – www.mirc.com 256

    De kenmerken van IRC 256Het gebruik van IRC 257Zoeken naar IRC-channels 260IRC-opdrachten 260

    xv

    Handboek – Internetresearch

  • Overige chatdiensten 262

    Windows Live Messenger – messenger.live.com 262ICQ – www.icq.com/whitepages 262Trillian – www.ceruleanstudios.com 263

    A Nuttige researchwebsites 265

    B Overzicht van TLD’s 289

    Index 297

    Inhoud

    xvi

  • Basis vanzoekstrategie

    Zoals de Almelose cabaretier Herman Finkers ooit zong:wie een stier wil castreren, moet over een scherp mesbeschikken. En – wat Finkers niet meldde – over de juisteanatomische kennis. Evenzo heeft het weinig zin om onvoor-bereid te beginnen met zoeken. Van belang is daarbij zowel hetgereedschap als de kennis van de researcher. Daarom komen indit hoofdstuk zowel nuttige software en hardware aan de orde alsde basisvaardigheden waarover een succesvolle onderzoekermoet beschikken.

    U leert in dit hoofdstuk:

    Welke software en hardware een researcher in elk geval nodig heeft.

    Welke sites en computerprogramma’s het zoeken prettiger maken.

    Tips en trucs om uw computer tijdens het zoeken efficiënter te gebruiken.

    De drie basisstappen in een succesvolle zoektocht.

    1

  • Goed gereedschap

    Om te kunnen zoeken op internet hebt u een computer nodig en een inter-netverbinding. Dat klinkt eenvoudig, maar die uitspraak is ongeveer net zovolledig als te zeggen dat u om auto te rijden een stuk blik op vier wielennodig hebt plus een paar liter benzine. Zit u dagelijks vierhonderd kilometerop de weg, dan doet u dat bij voorkeur niet met een in degelijk Oost-Euro-pees plastic uitgevoerde Lada van voor die Wende, maar in een comfortabelewagen.

    Evenzo geldt voor internetresearch dat de lol – en daarmee de efficiëntie –er snel vanaf is wanneer u met slechte spullen werkt. Minimaal hebt u een pcnodig waarop Internet Explorer zonder problemen kan draaien, en waarvande vaste schijf niet fanatiek aan het ratelen slaat op het moment dat u meer-dere browservensters geopend hebt. De hoeveelheid intern geheugen isbelangrijker dan de snelheid: zeker op computers met Windows 7 is tenminste vier gigabyte aan intern geheugen aan te raden. Meer is altijd beter.Let op: zorg voor de 64-bitsversie van Windows 7! De 32-bitsversie werktniet goed samen met grote hoeveelheden geheugen. Werkt u nog metWindows XP of Vista, dan is dit een mooi moment om over te schakelen.

    Voor nieuwe Mac-modellen geldt dat minimaal vier gigabyte standaard is oponder meer iMacs. Wilt u uw bestaande computer zelf uitbreiden, of gelijkeen nieuw modelletje aanschaffen: goedkope computers en computer-onderdelen zijn te vinden via de website Tweakers, op www.tweakers.net/pricewatch.

    Hoofdstuk 1 – Basis van zoekstrategie

    2

    Afbeelding 1.1 Tweakers, voor uw onpartijdige computeraankoopadviezen.

  • 1h002 Wat betreft de internetverbinding geldt iets soortgelijks. Eén keer zes secon-den wachten totdat een pagina geladen is, gaat nog wel. Maar wanneer userieus werk maakt van internetresearch, zult u in een sessie misschienhonderd pagina’s bekijken.

    Zeshonderd seconden wachten staat gelijk aan tien minuten, die u ook hadkunnen gebruiken om sneller te vinden wat u zocht, in plaats van u te erge-ren. Investeer daarom in een fatsoenlijk DSL(2)-abonnement. Die zijn relatiefgoedkoop, zelfs bij kwaliteitsaanbieders als TweakDSL en XS4ALL (in geenvan welke bedrijven de auteur overigens aandelen heeft).

    Toch te duur? De Consumentenbond publiceert regelmatig tests van de besteinternetaanbieders. Daarnaast wil zoeken op de naam van de aanbieder viawww.webwereld.nl nog wel eens nuttige aanvullende informatie opleveren.Zo kunt u via deze nieuwssite bijvoorbeeld snel te weten komen of eeninternetaanbieder de laatste tijd veel ontevreden klanten heeft. Op de sitewww.internetten.nl vindt u een feitelijk overzicht van de diverse aanbiedersen abonnementsvormen.

    Veel aantrekkelijke aanbiedingen komen van providers zoals Tele2 en Alicedie telefonie- en internetdiensten gebundeld verkopen. Dat kan voordeligzijn, maar hou er wel rekening mee dat u zich met handen en voeten aanéén partij bindt.

    1h003

    3

    Handboek – Internetresearch

    Afbeelding 1.2 Op www.internetten.nl vindt u een overzicht van de diverseaanbieders en abonnementsvormen.

  • Nuttige computerprogramma’s

    Internet Explorer – www.microsoft.com/windows/ie/

    Dit programma zit standaard bij ieder exemplaar van Microsoft Windows enwordt gebruikt om pagina’s op het World Wide Web te bekijken. Aanvanke-lijk begon Internet Explorer (IE) als een poging om Microsoft-concurrent Net-scape de voet dwars te zetten. In die tijd was IE duidelijk minder goed dande Netscape-browsers, maar die situatie is veranderd. IE kan qua functionali-teit heel aardig meekomen. Bovendien is het gratis. Althans, de kosten ervanzijn verdisconteerd in de prijs die u voor Windows hebt betaald.

    1h004 Toch heeft Internet Explorer wel wat nadelen. Zo is IE qua beveiliging onge-veer net zo effectief als een golden retriever met een pond zolpidem achterde kiezen. Dat kan ervoor zorgen dat allerlei vervelende programma’s zichzonder uw toestemming op uw pc nestelen, met als doel het stelen van uwpersoonlijke gegevens voor marketingdoeleinden – of erger. Deze zogehetenspyware moet u met grote regelmaat verwijderen.

    Hoofdstuk 1 – Basis van zoekstrategie

    4

    Afbeelding 1.3 Internet Explorer dankte zijn aanvankelijke populariteitvooral aan fel zakendoen, maar is tegenwoordig een kwalitatief primaproduct.

  • Gratis programma’s om dat te doen vindt u op www.microsoft.com/security_essentials, www.malwarebytes.org (kent zowel een gratis als eenbetaalde versie) en op www.safer-networking.org (Spybot Search & Destroy,een Duits programma met dienovereenkomstige subtiliteit in de naam-geving). Echte fanatiekelingen installeren daarna nog Spyware Blaster, tevinden op www.javacoolsoftware.com.

    ir5-h1-1 Een ander nadeel van IE is dat het geheugen slurpt. Dat is niet zo’n probleemals u altijd in een en hetzelfde browservenster werkt, maar wel wanneer u ertien tegelijk open hebt staan. Verderop in dit boek zult u leren dat het somsheel handig kan zijn om veel vensters geopend te hebben. In dat geval is hetnogal vervelend als blijkt dat uw computer al die onderzoeksdrift niet aankan.

    5

    Handboek – Internetresearch

    Afbeelding 1.4 Malwarebytes Anti-Malware. In de smaken ‘Gratis’ en‘Duur’.

    Afbeelding 1.5 Spybot Search & Destroy kunt u downloaden via het icoonaan de rechterkant van het scherm, maar ook door (inderdaad) Download teselecteren in het linkermenu en vervolgens wat naar beneden te scrollen.Spybot staat boven in de lijst.

  • 1h006Firefox – www.getfirefox.com

    IE heeft, zoals u hiervoor kon lezen, nogal wat nadelen. Bent u het beginner-stadium ook maar enigszins ontstegen, schakel dan over op een alternatief.Een van deze alternatieven is Firefox. Deze IE-vervanger beleefde in dezomer van 2004 een flinke doorbraak. Volgens door Wikipedia-vrijwilligersberekende gemiddelden heeft Firefox anno juni 2010 een wereldwijd markt-aandeel van 28,75 procent.

    Dat zo veel gebruikers overschakelen op Firefox is logisch. Firefox is een stukveiliger en beter beschermd tegen spyware. Of dat komt doordat Firefoxbeter gebouwd is, of doordat het minder liefhebbers heeft zodat het eenminder aantrekkelijk doelwit is voor kwaadwillenden, laten we in het mid-den.

    Minstens zo belangrijk: Firefox gaat beter om met geheugen. Tien venstersgeopend in Firefox belasten uw pc minder zwaar dan dezelfde tien venstersin IE. Dat heeft voordelen, zeker als u een oudere computer hebt. MochtFirefox crashen, dan slaagt het programma er achteraf meestal in om u ver-der te laten gaan op de plek waar u was gebleven. Firefox onthoudt namelijkwelke sites u aan het bekijken was. Ook bevat Firefox diverse specialeopdrachten die het leven van de gevorderde internetresearcher een stukeenvoudiger maken. Zo bevat Firefox een mogelijkheid om met één toetsen-combinatie (Ctrl+E) een zoekopdracht voor Google in te voeren. Ten slotte

    Hoofdstuk 1 – Basis van zoekstrategie

    6

    Afbeelding 1.6 Firefox is een betere browser dan Internet Explorer.

  • zijn er voor Firefox allerlei gratis uitbreidingen beschikbaar, waardoor u bij-voorbeeld speciale muisopdrachten tot uw beschikking krijgt, of het weer-bericht automatisch kunt laten binnenhalen (https://addons.mozilla.org).

    Speciaal voor de lezers van dit boek is een lijstje met de nuttigste Firefox-uitbreidingen beschikbaar. U kunt dit vinden op www.arjandasselaar.nl/internetresearch.html.

    1h008Google Chrome – chrome.google.com

    Op dit moment (juni 2010) de beste browser. (Wel jammer dat – vooralsnog– er geen Mac- en Linux-versies beschikbaar zijn.) Zoals de naam al aangeeft,wordt Google Chrome gemaakt door – inderdaad – Google. Chrome is snel –sneller dan andere browsers. Voor Chrome zijn bovendien ook uitbreidings-programma’s verkrijgbaar, die u vindt op https://chrome.google.com/extensions/.

    ir5-h1-2Google Desktop – desktop.google.com

    Wie snel wil kunnen zoeken op internet, moet eerst zijn eigen (elek-tronische) huis op orde hebben. Soms staat de informatie die u nodig hebtimmers op uw vaste schijf. In andere gevallen zult u gegevens op uw compu-ter moeten terugvinden – de naam van een contactpersoon bijvoorbeeld –om uw internetzoektocht te kunnen beginnen. In beide gevallen hebt u veelaan programma’s die uw computer doorzoekbaar maken.

    7

    Handboek – Internetresearch

    Afbeelding 1.7 Het is wel degelijk Chrome wat daar blinkt. (U mag nu eenboze brief sturen aan Seth Gaaikema.)

  • De ingebouwde zoekfunctie van Windows XP voldoet voor dat doel niet,want deze is veel te traag. Ook op de ingebouwde zoekmachine van Vistavalt het nodige aan te merken. En de zoekmachine van Windows 7 – hoewelbeter dan alle voorgaande – breekt evenmin snelheidsrecords.

    1googledesktop Kortom: hebt u regelmatig last van het syndroom ‘in welk bestand of e-mail-tje heb ik dat nu weer voor het laatst gezien’, dan doet u er goed aan GoogleDesktop te downloaden. Dit programma maakt een index van alle bestandenop uw vaste schijf die teksten bevatten, van Word-documenten tot uwe-mails.

    Het installeren van Google Desktop doet u het best op een mooie zomer-ochtend, net voordat u naar het strand vertrekt. Wanneer u alle verkeers-infarcten van de afgelopen tien jaar bij elkaar optelt, hebt u een goede bena-dering van de tijd die Google Desktop nodig heeft om zich op uw pc tenestelen.

    Als Google Desktop eenmaal werkt, bespaart het programma u echter zoveel tijd, dat u met liefde over dit ongemak heen zult stappen. Bonus: hetprogramma is beschikbaar voor Windows, OS X en Linux.

    1x1 Google Desktop heeft beperkingen. Voor professionele computeraars metgrote hoeveelheden documenten en e-mails kan het uitstekende programmaX1 (www.x1.com) een prima alternatief zijn. X1 werkt veel sneller danGoogle Desktop, met name tijdens het zoeken, maar is echter niet gratis.

    Hoofdstuk 1 – Basis van zoekstrategie

    8

    Afbeelding 1.8 Informatie op uw bureaublad.

  • Copernic Desktop Search – www.copernic.com

    Een goed en eveneens gratis alternatief voor Google-haters die vrezen dathun volledige vaste schijf door Google Desktop rechtstreeks wordt geko-pieerd naar de computers van de CIA. De werking van Copernic DesktopSearch verschilt echter weinig van die van Google Desktop, al zit de interfacenet even iets anders in elkaar. Probeer ze beide uit en kijk welke voor u hetprettigst werkt.

    9

    Handboek – Internetresearch

    Afbeelding 1.9 X1, chaoten zweren erbij.

    Afbeelding 1.10 Het programma Copernic Desktop Search 2: net even anders.

  • Nuttige sites

    Verderop in dit boek zult u leren zoeken. Maar wat hebt u aan informatiedie u niet kunt begrijpen? Veel beginnende researchers laten sites links liggenomdat die in talen zijn geschreven die ze niet begrijpen. Niet nodig. Allerleidiensten kunnen u helpen de informatie op die sites toch te gebruiken.

    Google Language Tools – www.google.com/language_tools

    Via www.google.com is de vertaaldienst van de zoekmachine Google te vin-den. Die werkt heel eenvoudig. U voert een zoekopdracht in – bijvoorbeeld“Le Monde”, naar de gelijknamige Franse krant – en klikt vervolgens opTranslate this page.

    Die woorden treft u aan op de eerste, blauwe regel van het zoekresultaat.Hetzelfde trucje kunt u gebruiken in tal van andere talen. Experimenteermaar eens met El País, Corriere della Serra of Al Jazeera.

    Voorwaarde is wel dat u via de Engelstalige variant van Google zoekt. Datdoet u door op www.google.com voor de optie Google.com in English tekiezen. Weliswaar beschikt de Nederlandse Google-variant ook over eenaantal vertaaldiensten, maar die zijn minder uitgebreid. Wilt u de Google-taalhulpmiddelen rechtstreeks benaderen, ga dan naar www.google.com/language_tools.

    Hoofdstuk 1 – Basis van zoekstrategie

    10

    Afbeelding 1.11 Google Language Tools is evenmin een talenwonder, maarlijdt in tegenstelling tot SYSTRAN en Babel Fish niet onder kunstmatigebeperkingen.

  • Een groot voordeel van Google Language Tools is dat het hier mogelijk is ombehalve websites ook teksten uit documenten integraal te vertalen, doordeze te kopiëren en te plakken naar het Language Tools-scherm. Viatranslate.google.com kunt u zelfs documenten uploaden ter vertaling.Concurrerende diensten zoals SYSTRAN (www.systran.co.uk) en het daaropgebaseerde Yahoo! Babel Fish houden er bij dergelijke vertalingen na eenbeperkt aantal woorden mee op.

    1lemondeBabel Fish – babelfish.yahoo.com

    De naam van deze vertaaldienst is gebaseerd op het gelijknamige visje(jawel) uit het cultboek The Hitchhiker’s Guide to the Galaxy van DouglasAdams. Hoofdpersoon Arthur Dent moet dit visje in zijn oor stoppen om zoallerlei buitenaardse talen te kunnen verstaan.

    U hoeft geen haring tegen uw trommelvlies aan te drukken om van de ver-taaldienst Babel Fish gebruik te maken (al mag het natuurlijk wel, op eigenrisico). Deze op de software van vertaalpionier SYSTRAN gebaseerde site iseen bruikbaar alternatief voor de diensten van Google.

    11

    Handboek – Internetresearch

    Afbeelding 1.12 SYSTRAN maakt soms pijnlijk duidelijk dat een computerbij lange na niet in staat is om menselijke vertalers te evenaren.

  • Uw computer beter bedienen tijdens het zoeken

    Internet Explorer, Firefox en Chrome beschikt over toetsencombinaties diehet zoeken vergemakkelijken. Ook het Windows-besturingssysteem bevatenkele nuttige mogelijkheden.

    Het zal u wellicht opvallen dat deze toetsencombinaties functies activerendie vaak ook met de muis kunnen worden bediend. Toch kan het bijzonderpraktisch zijn om niet steeds van toetsenbord naar muis te hoeven wisselen.Daarnaast zijn toetsencombinaties vaak sneller dan muisopdrachten waar-voor u eerst door een aantal menu’s moet klikken.

    Algemene Windows-wenken

    Voor alle onderstaande toetsencombinaties geldt dat ze in veel verschillendeWindows-programma’s werken.

    • Ctrl+F Opent een venster waarmee u kunt zoeken naar een woord ofwoordcombinatie in een lopende tekst. Is bijvoorbeeld te gebruiken inWord, maar ook in lange webpagina’s als u niet precies weet waar dedoor u gezochte woordcombinatie zich bevindt.

    • Ctrl+C Kopiëren. Als u met de muis een stuk tekst selecteert en vervol-gens op Ctrl+C drukt, slaat Windows de geselecteerde tekst tijdelijk inhet geheugen op. U kunt diezelfde tekst weer dupliceren met behulp vanplakken.

    • Ctrl+V Plakt de met Ctrl+C gekopieerde tekst op de gewenste plek inbijvoorbeeld een document, de adresbalk van de browser of het invoer-veld van een zoekmachine als Google.

    • Ctrl+P Drukt het huidige document, de huidige e-mail of webpaginaaf.

    • Alt+Tab en Alt+Shift+Tab Door de Alt-toets ingedrukt te houden engelijktijdig een of meerdere malen de Tab-toets in te drukken, kunt utussen meerdere programma’s schakelen zonder dat u daarvoor met demuis naar de programmabalk van Windows hoeft af te dalen. Dat is han-dig als u meerdere browservensters geopend hebt. Met Alt+Shift+Tabdoet u hetzelfde, maar dan in omgekeerde richting. Waarschuwing: ditvergt enige oefening.

    • Alt+F4 Met deze toetsencombinatie sluit u het programma of hetbrowservenster waarin u aan het werk bent.

    Hoofdstuk 1 – Basis van zoekstrategie

    12

  • Altijd nieuw venster

    Open potentieel interessante zoekresultaten altijd in een nieuw ven-ster. Zo voorkomt u dat u al zoekende de draad kwijtraakt en nietmeer kunt terugvinden welke resultaten de zoekmachine nog meerheeft opgeleverd.

    Internet Explorer

    • Ctrl+B Hiermee maakt u een bookmark oftewel een bladwijzer. Daar-mee kunt u de site waarop u bent, later snel terugvinden in het menuFavorieten.

    • Ctrl+N Opent een nieuw venster. Tussen vensters schakelen doet umet de eerder besproken toetsen Alt+Tab en Alt+Shift+Tab.

    • Ctrl+T Vanaf Internet Explorer 7.0. Opent een nieuw tabblad. Tab-bladen lijken op vensters, maar maken het werken overzichtelijker als uveel websites tegelijkertijd open hebt staan.

    • Ctrl+Tab en Ctrl+Shift+Tab Vanaf Internet Explorer 7.0. Met dezetoetsen kunt u wisselen tussen de verschillende tabbladen, vergelijkbaarmet de manier waarop u Alt+Tab en Alt+Shift+Tab gebruikt voor hetschakelen tussen applicaties of vensters.

    • Ctrl+O Als u naar een nieuwe website wilt gaan, kunt u natuurlijk metde muis naar de adresbalk gaan. U kunt ook op Ctrl+O drukken en u diemoeite besparen. Na Ctrl+O opent zich namelijk een venster waarin uhet gewenste adres rechtstreeks kunt invoeren.

    • Ctrl+W Hiermee sluit u het huidige venster.• Shift+linkermuisknop Zoals elders in dit hoofdstuk aan de orde is

    geweest, verdient het aanbeveling tijdens het zoeken resultaten in eennieuw browservenster te openen. De ‘ouderwetse’ methode daarvoorbinnen Internet Explorer bestaat uit het met de muisaanwijzer op de kop-peling (hyperlink) te gaan staan die in een nieuw venster geopend moetworden, op de rechtermuisknop te drukken en vervolgens Openen innieuw venster te selecteren. Veel simpeler is: op de koppeling klikkendie in een nieuw venster geopend moet worden, maar nu tegelijkertijdde Shift-toets ingedrukt te houden.

    • Ctrl+linkermuisknop Vanaf Internet Explorer 7.0. Hiermee opent ueen hyperlink in een nieuw tabblad.

    • Ctrl+E Vanaf Internet Explorer 7.0. Met deze toetsencombinatie gaat urechtstreeks naar het zoekveld.

    1h012 • F5 Soms is er aanleiding om de website die u bekijkt opnieuw te laden,bijvoorbeeld omdat deze in eerste instantie onvolledig is binnengeko-men, of omdat de site in de tussentijd kan zijn gewijzigd. Dat laatste wilbij nieuwssites nogal eens het geval zijn.

    13

    Handboek – Internetresearch

  • • F11 Laat de huidige webpagina in de zogeheten modus full screen zien,waarbij het hele scherm wordt gebruikt om de site te tonen, zonderruimte. Dat kan handig zijn als u over een klein scherm beschikt of desite in kwestie nogal uit de kluiten is gewassen. Als u een tweede keer opF11 drukt, gaat u terug naar de normale situatie.

    • Backspace en Shift+Backspace Hiermee gaat u respectievelijk terugnaar de vorige pagina die u hebt bezocht, en een pagina vooruit.

    Twee terug

    Sommige sites sluiten u op in een virtuele gevangenis. Op hetmoment dat u op de knop Vorige van uw browser klikt, wordt uvooruit gebonjourd naar de site waar u juist weg wilde. Dit komtomdat de voorgaande pagina een code bevat die uw computeronmiddellijk terugstuurt. De truc is dus om niet de voorgaandepagina, maar de pagina daarvoor te pakken te krijgen. Oftewel: doetwee stappen terug in plaats van één. Druk daartoe op het kleine pijl-tje naar beneden dat u rechts van de knop Vorige aantreft. U krijgtdan een lijst met alle voorgaande pagina’s te zien. Selecteer vervol-gens de tweede pagina van boven.

    Firefox

    • F5 Zorgt ervoor dat de huidige pagina opnieuw wordt ingeladen.• F11 Toont de website over het volledige scherm.• Ctrl+B Maak een bookmark (bladwijzer) voor de huidige pagina.• Ctrl+N Opent een nieuw venster• Ctrl+W Venster of tabblad sluiten.• Ctrl+T Nieuw tabblad, een manier om een extra venster te openen

    zonder dat onder in de Windows-taakbalk een nieuw pictogram ver-schijnt.

    Hoofdstuk 1 – Basis van zoekstrategie

    14

    Afbeelding 1.13 Het kleine pijltje naast de knop Vorige of Back laat een lijstzien van alle sites die u eerder hebt bezocht in het desbetreffende venster.

  • • Ctrl+L Een toets waardoor u rechtstreeks in de adresbalk een nieuwesite kunt invoeren.

    • Ctrl+E Biedt snelle toegang tot een zoekmachine. Zo kunt u bijvoor-beeld in zoekmachine Google een zoekopdracht opgeven zonder eerstnaar www.google.nl te gaan.

    • Shift+linkermuisknop en Ctrl+linkermuisknop De combinatieShift+linkermuisknop zorgt ervoor dat de gewenste koppeling in eennieuw venster wordt geopend. De combinatie Ctrl+Shift+linkermuis-knop echter opent de koppeling in een nieuw tabblad, dus zonder nieuwpictogram onder in de Windows-taakbalk.

    • Ctrl+PageUp en Ctrl+PageDown Met deze toetsencombinaties sneltu makkelijk door de diverse tabbladen binnen Firefox.

    1h013 • Daarnaast kan Firefox worden uitgebreid met een speciaal programma-tje, een zogeheten plug-in, waardoor u ook met de muis opdrachtenkunt geven. Na het installeren van All-in-One Gestures(https://addons.mozilla.org/nl/firefox/addon/12) drukt u de rechter-muisknop in en maakt u vervolgens een beweging die correspondeertmet een bepaalde computerhandeling. De belangrijkste muisopdrachtenzijn:• Omhoog Hiermee opent u een nieuw tabblad.• Omlaag Hiermee opent u een nieuw venster.• Naar links Hiermee gaat u een pagina in uw browsergeschiedenis

    terug. Voor gevorderden: probeer ook eens (in hoog tempo) op derechtermuisknop te klikken, deze ingedrukt te houden en vervolgensop de linkermuisknop te klikken.

    • Naar rechts Hiermee gaat u een pagina in uw browsergeschiedenisvooruit. Voor gevorderden: probeer ook eens (in hoog tempo) op delinkermuisknop te klikken, deze ingedrukt te houden en vervolgensop de rechtermuisknop te klikken.

    • Omlaag, naar rechts Met deze opdracht (een ‘L-figuur’) sluit u hethuidige venster.

    15

    Handboek – Internetresearch

    Afbeelding 1.14 Bij Firefox geldt net als bij Internet Explorer dat u met hetkleine naar beneden gerichte pijltje een lijst opent van de sites die u eerderin het desbetreffende venster hebt bezocht.

  • Chrome

    • F5 Zorgt ervoor dat de huidige pagina opnieuw wordt ingeladen.• F11 Toont de website over het volledige scherm.• Ctrl+B Doet de balk met bookmarks (bladwijzers) verschijnen of ver-

    dwijnen.• Ctrl+D Bookmark de huidige pagina.• Ctrl+N Opent een nieuw venster• Ctrl+W Venster of tabblad sluiten.• Ctrl+T Nieuw tabblad, een manier om een extra venster te openen

    zonder dat onder in de Windows-taakbalk een nieuw pictogram ver-schijnt.

    • Ctrl+L Het adres in de vraagbalk wordt geselecteerd. Hierdoor kunt urechtstreeks in de adresbalk een nieuwe site invoeren.

    • Ctrl+E Maakt het mogelijk om gelijk een zoekopdracht in te voeren.Het verschil met Ctrl+L is dat bij het gebruik van Ctrl+E een vraagtekenin de adresbalk verschijnt.

    • Shift+linkermuisknop en Ctrl+linkermuisknop De combinatieShift+linkermuisknop zorgt ervoor dat de gewenste koppeling in eennieuw venster wordt geopend. De combinatie Ctrl+linkermuisknopechter opent de koppeling in een nieuw tabblad, dus zonder nieuwpictogram onder in de Windows-taakbalk.

    • Ctrl+PageUp en Ctrl+PageDown Met deze toetsencombinatiesschakelt u tussen de verschillende tabbladen.

    Algemene zoekstrategie

    U weet aan welke eisen uw computer en software moeten voldoen, en uhebt geleerd waar de knoppen zitten die research makkelijker maken. Inautotermen weet u thans waar de versnellingsbak en het gaspedaal zitten.Wat nog ontbreekt, is het autorijden zelf: hoe komt u van A naar B? Hoe umet uw computer bij de informatie komt die u zoekt, leert u in de overigehoofdstukken van dit boek. Voor nu is het belangrijk om de juiste ‘zit-houding’ aan te leren: vanuit welke uitgangspositie begint u iedere zoek-tocht?

    Vuistregel bij iedere zoektocht

    Bekijk na het invoeren van een zoekvraag slechts de eerste twintigzoekresultaten en ga alleen verder als bij deze eerste twintig resulta-ten nuttige sites lijken te staan. Staat er daarentegen niets interessantsbij de eerste twintig, dan deugt uw zoekvraag niet. Pas de vraag aanen begin opnieuw.

    Hoofdstuk 1 – Basis van zoekstrategie

    16

  • Drie gouden zoekregels

    1 Definieer De allerbelangrijkste regel voor succesvol zoeken op internetis simpel: denk na! Het heeft geen zin om te zoeken als u niet weet watu zoekt. U stapt ook niet in een auto zonder een bestemming in uwachterhoofd te hebben. Hoewel dit een open deur lijkt, wordt deze foutmaar al te vaak gemaakt. Bedenk daarom eerst wat u wilt vinden. Pasdan heeft het nut om na te denken over hoe het te vinden zou kunnenzijn.

    2 Specificeer Oftewel: zoek niet met omwegen uit angst iets te missen,maar ga recht op uw doel af. Niemand rijdt vanuit Den Helder naarGroningen via Maastricht. Het blijkt dat het gros van de zoekmachinesopdrachten van slechts één tot drie woorden te verwerken krijgt. Dat iszonde, want een zoekmachine kan u beter helpen wanneer u duidelijkbent over wat u wilt. Bent u op zoek naar gegevens over de gebeurtenis-sen in Den Haag tijdens de Februaristaking in de Tweede Wereldoorlog,zoek dan ook op de termen “Den Haag”, “Februaristaking” en “TweedeWereldoorlog”. Wie enkel zoekt op “Den Haag” en “Tweede Wereld-oorlog” zal zo veel informatie te zien krijgen dat hij erin verzuipt, en juistdaardoor veel informatie missen. Elders in dit boek zult u allerlei metho-den leren om zo specifiek mogelijk te zoeken; voor nu gaat het alleenom de intentie.

    3 Zoek in de omgeving Het nadeel van niet-specifiek zoeken is dat uvermoedelijk verdwaalt in de informatiebrij. Helaas kan ook specifiekzoeken soms voor problemen zorgen. Vergelijk het met een autorit naareen bioscoop in een stad die u niet kent. Als het vooraf opgezochte huis-nummer net niet juist blijkt te zijn, is het verstandig om de omgeving teverkennen. Hetzelfde geldt voor internet. Een te specifieke zoekvraagmoet in dat geval wat algemener worden opgesteld. Hou wel altijd devolgorde uit deze lijst aan: eerst specifiek zoeken, dan pas de zoekvraagalgemener maken. U gaat per slot van rekening ook niet eerst doelloosdoor de buurt crossen en daarna pas op de plattegrond kijken die naastu ligt.

    17

    Handboek – Internetresearch

  • Zoekmachines eninternetgidsen

    Zoekmachines en internetgidsen lijken op elkaar, maar vor-men wezenlijk verschillende manieren om de enorme hoe-veelheid informatie op internet te doorzoeken. Waar eenzoekmachine grotendeels door computers wordt bijgehouden,heeft een internetgids een menselijke redactie. Dat heeft nietalleen invloed op het soort informatie dat beide bevatten, maarook op de bediening en de toepassingsmogelijkheden. In dithoofdstuk komen algemene kenmerken van beide soorten sitesaan de orde. Ook wordt duidelijk wat goede zoekmachines eninternetgidsen van hun malafide soortgenoten onderscheidt.

    U leert in dit hoofdstuk:

    Wat het verschil is tussen zoekmachines en internetgidsen.

    Hoe zoekmachines en internetgidsen gebruikt moeten worden.

    Aan welke criteria goede zoekmachines en internetgidsen voldoen.

    2

  • Wat zijn zoekmachines en internetgidsen

    Google, Ilse, Alltheweb, Yahoo!, Bing: voor de gemiddelde researcher lijkenalle pagina’s waarmee hij of zij zoekt op elkaar. Een invoerveld biedt demogelijkheid zoektermen in te voeren en de website reageert door in eengrote kaartenbak met verschillende websites te kijken of er sites zijn die aande gewenste criteria voldoen. Vervolgens krijgt de researcher een rijtje meerof minder relevante websites te zien.

    Toch zijn er grote verschillen tussen deze zoekhulpmiddelen. Grofwegvolstaat de indeling in zoekmachines en internetgidsen. Daarbij zijn zoek-machines sites waarvan de kaartenbak is gevuld door een computer. Google(www.google.nl) is een goed voorbeeld van een zoekmachine. Internetgid-sen maken voor het formuleren van hun antwoorden gebruik van een dooreen menselijke redactie bijgehouden lijst met internetsites. Een voorbeeldvan zo’n internetgids is Yahoo! (directory.yahoo.com).

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    20

    Afbeelding 2.1 De Nederlandse website van zoekmachine Google…

    Afbeelding 2.2 …en de website van internetgids Yahoo!

  • 2h0012h002 Dit onderscheid is van groot belang bij de vraag van welk zoekhulpmiddel ubij een gegeven zoekvraag moet gebruikmaken. Een zoekmachine werktrigide, zoals u van een computer mag verwachten. Om te kunnen reagerenop zoektermen beschikt een zoekmachine vaak over een bijna letterlijketranscriptie van miljoenen of zelfs miljarden webpagina’s. Daardoor is zo’nsite bij uitstek geschikt voor het zoeken naar feiten. Wilt u weten wat er op 6maart 1972 in Detroit gebeurde, of welke voetballer in de recente nacompe-titie goed scoorde tegen de Vroomshoopse Boys, dan is een zoekmachine bijuitstek behulpzaam.

    2vrooms2h003 Voor meer generieke informatie is een internetgids nuttig. Omdat internet-gidsen door mensen zijn gevuld, bevatten ze geen miljoenen of miljardenwebsites. Wat ze wel bevatten, is een op onderwerp gesorteerde verzamelingwebsites. Vanwege de inmenging van een menselijke redactie bevat eengoede internetgids weinig slechte websites: die worden simpelweg verwor-pen tijdens het selectieproces.

    21

    Handboek – Internetresearch

    Afbeelding 2.3 Niet alleen de voetbalkwaliteiten van de VroomshoopseBoys doen zeer aan de ogen.

  • Wie even snel de belangrijkste drie websites over Nederlandse architectuurwil vinden, maar totaal niet thuis is in het onderwerp, kan zijn of haar zoek-tocht het best beginnen bij een internetgids.

    Om het verwarrend te maken, is het onderscheid tussen zoekmachines eninternetgidsen soms nogal diffuus. De zoekmachine Ilse (www.ilse.nl) maaktevoor het vullen van de kaartenbak lange tijd onder meer gebruik van deinformatie van de internetgids Startpagina (www.pagina.nl). (In 2009 kwamde leiding over Ilse opnieuw in handen bij de oprichters, die aankondigdeneen nieuwe richting met de site in te willen slaan.)

    Startpagina is een vrijwilligersproject bestaande uit ruim zesduizend mini-internetgidsen (peildatum: juni 2010) over verschillende onderwerpen,variërend van het houden van bijen tot het onderhouden van auto’s. In ruilvoor hun vrijwillige assistentie krijgen de medewerkers van Startpagina dehelft van de advertentieopbrengsten die met hun pagina’s wordt gegene-reerd. Hoewel Ilse dus een computer is, zou deze zonder de inbreng vantweebenige zoogdieren niet veel klaarspelen. (Met deze inbreng presteertIlse overigens nog steeds niet briljant, maar daarover meer in hoofdstuk 4.)

    2h004

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    22

    Afbeelding 2.4 De internetgids van Ilse.

  • Daar komt nog bij dat sommige zoeksites zowel een zoekmachine als eeninternetgids bevatten. Zowel Google als Yahoo! behoren tot deze categorie.In hoofdstuk 4 en 5 worden de verschillende zoekmachines en internetgid-sen afzonderlijk besproken, inclusief hun respectievelijke voor- en nadelen.In hoofdstuk 3 komt Google – als absolute, kwalitatieve marktleider – uit-gebreid aan bod. In dit hoofdstuk ligt de nadruk op de algemene werking enbediening van zoekmachines en internetgidsen.

    De werking van een zoekmachine

    Net zoals een automobilist een basaal begrip moet hebben van de principesachter gemotoriseerd vervoer, zo is het essentieel dat een goede researcherenig idee heeft van de werking van een zoekmachine. Wie niet weet watwielen zijn of wat een motor doet, zal het contactsleuteltje niet durvenomdraaien, en wie niet begrijpt waarom een zoekmachine juist die resul-taten teruggeeft en geen andere, zal de moed voor internetresearch al snelopgeven. Een kanttekening vooraf is op zijn plaats: zoekmachines houdenhun exacte werkwijze graag geheim. Wie precies snapt hoe een zoek-machine ertoe komt om bepaalde sites een hoge plaats in de zoekresultatente geven, kan die kennis immers benutten om zijn eigen site te promoten.Hoe hoger de plek in de zoekresultaten, hoe meer bezoek immers.

    23

    Handboek – Internetresearch

    Afbeelding 2.5 Startpagina, een site vol verwijzingen naar sites over diverseonderwerpen, fungeert als toeleverancier van informatie voor Ilse.

  • Spiders en crawlers

    Een zoekmachine baseert zijn antwoorden op zoekvragen op informatie uiteen enorme gedigitaliseerde kaartenbak met websites. Maar die kaartenbakmoet wel eerst zijn gemaakt en vervolgens worden bijgehouden. Dat is detaak van een zogeheten spider of crawler.

    Dit is een computerprogramma dat websites bezoekt en er digitale uittrekselsvan maakt, bestemd voor opslag in een kaartenbak. De locaties van de tebezoeken sites haalt de spider uit twee bronnen.

    Ten eerste biedt vrijwel iedere zoekmachine de mogelijkheid aan eigenarenvan websites om hun site aan te melden voor opname in de zoekmachine.Ten tweede bevatten sites die door de crawler worden bezocht zelf veelaladressen van andere websites, bijvoorbeeld in de vorm van koppelingen.

    Tekstanalyse en heuristiek

    Een spider baseert zich in eerste instantie op de letterlijke informatie op eensite. Daarom is het via zoekmachines mogelijk naar een specifiek citaat tezoeken: een beetje crawler onthoudt de volledige tekst van een internet-pagina. Vervolgens worden op deze tekst bewerkingen toegepast. Hoe vakereen bepaald woord wordt genoemd, hoe representatiever dat woord waar-schijnlijk is voor de inhoud. Voorbeeld: twintig keer ‘Willem van Hanegem’op een site geeft een sterkere indicatie dat de site de voormalige voetballerals onderwerp heeft, dan wanneer Van Hanegem maar eenmaal wordtgenoemd.

    Met deze basale analyse komt een zoekmachine er niet. Wie halverwegede jaren negentig via een zoekmachine zocht naar medische informatie overmenselijke voortplanting, kwam niet zelden terecht op een pornosite. Dereden: websites, met name van het ranzige soort, namen massaal woorden-lijsten op met populaire zoektermen, om zo meer bezoekers naar hun siteste lokken.

    Om dergelijke slimmeriken voor te zijn, maken zoekmachines tegenwoordiggebruik van zogeheten heuristische technieken: methoden om met behulpvan logische analyse een idee te krijgen van de inhoud van een website. Eenmethode daarvoor is het kijken naar woordverbanden. Als op een site gerela-teerde termen voorkomen als ‘voetbal’, ‘middenstip’ en ‘scheidsrechter’, zalde zoekmachine een seksueel getinte term of de naam van een automerknegeren. Verder zijn zoekmachines tegenwoordig in grote meerderheidronduit wantrouwend tegenover pagina’s waarop een en dezelfde term tien-tallen malen wordt herhaald.

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    24

  • Metadata

    De naam zegt het al: metadata vormen informatie over informatie, ongeveerzoals boeken in een bibliotheek zijn ingedeeld op trefwoord. Metadatageven korte, beknopte informatie in de vorm van steekwoorden over deinhoud van de onderliggende webpagina. Zoekmachines gebruikten dezeinformatie vooral vroeger om een zoekvraag beter te koppelen aan de letter-lijke tekst van een website. Voorbeeld: een site waarop wijlen prins Bernhardtien keer wordt genoemd én waarvan de metadata zeggen dat het hier inder-daad een site met biografische informatie over prins Bernhard gaat, zal daar-door hoger eindigen bij een zoekvraag naar prins Bernhard dan een site zon-der of met andere metadata. Dat laatste is immers ook mogelijk: op een siteover wijlen prinses Juliana wordt Bernhard ook regelmatig genoemd, zonderdat de site hem als onderwerp heeft. Omdat misbruik van metadata eenvou-dig is, gebruiken steeds minder zoekmachines echter de hierin vervatte infor-matie.

    Of en wat voor metadata een site bevatten, is eenvoudig te zien. Ga hiervoorin Internet Explorer naar de eerste pagina van een site. Klik op de rechter-muisknop en selecteer Bron weergeven of View source. In Firefox is de pro-cedure vrijwel hetzelfde, alleen moet hier via de rechtermuisknop View pagesource worden gekozen. Alternatief in Firefox is het gebruik van de toetsen-combinatie Ctrl+U.

    Google heeft sommige vormen van metadata volledig afgezworen (voor deliefhebbers: het gaat dan om Meta name=”keywords”), maar er is geëxpe-rimenteerd met zoekmachines die de mogelijkheid bieden enkel op meta-data te zoeken. Het rendement van deze zoekmachines is zeer beperkt. Gamaar na: de eigenaar van de site bepaalt wat er in de metadata komt testaan. Dat biedt alle ruimte voor manipulatie. Metadata als enige bron vooreen zoekmachine werkt dus louter als de machine zich beperkt tot een seriebetrouwbare sites, waarvan de metadata gegarandeerd correct zijn.

    Autoriteit

    Het klinkt zo logisch: een zoekmachine kijkt ook naar de autoriteit van eensite om te bepalen hoe hoog een pagina moet eindigen in de zoekresultaten.Maar hoe weet een zoekmachine nu of een site belangrijk is?

    Een van de slimste methoden om dit te doen – en daarom in gebruik bijzoekmachine Google – is om te kijken naar de mening van andere internet-gebruikers. Omdat een zoekmachine geautomatiseerd zijn werk doet en dusniet de internetgebruikers daadwerkelijk iets kan vragen, wordt een truc toe-

    25

    Handboek – Internetresearch

  • gepast. De zoekmachine kijkt naar het aantal keren dat andere websites eenkoppeling hebben opgenomen naar de onderhavige site.

    Stel dat de zoekmachine in zijn digitale kaartenbak ziet dat in totaal twee-honderd websites een koppeling hebben opgenomen naar de websitewww.elsevier.nl en slechts honderd websites een koppeling bevatten naarwww.wolters-kluwer.com, dan zal www.elsevier.nl hoger uit de bus komendan www.wolters-kluwer.com als een zoekmachine gevraagd wordt naar‘uitgever’ te zoeken.

    Een slimme zoekmachine als Google kijkt echter niet alleen naar het aantalinkomende links, maar ook naar de kwaliteit ervan. Zijn de tweehonderdsites die linken naar www.elsevier.nl allemaal volstrekt impopulaire ennauwelijks bijgehouden blogs, en de honderd sites die linken naarwww.wolters-kluwer.com juist actuele, hoog gewaardeerde sites van presti-gieuze universiteiten, dan is de kans groot dat de afweging van de zoek-machine alsnog in het voordeel van www.wolters-kluwer.com uitvalt. HoeGoogle bepaalt of een linkende site belangrijk is? Simpel: door te kijken naarde sites die dáár weer naar linken – enzovoort. Wilt u meer details, leest udan en.wikipedia.org/wiki/PageRank.

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    26

    Afbeelding 2.6 Het PageRank-algoritme: de wijze waarop Google hetbelang van een pagina vaststelt. Eitje toch?

  • ir5-h2-1 Een andere manier om de mening van internetgebruikers mee te nemen inde beoordeling, is te kijken naar hun klikgedrag. Stel dat een zoekmachineop de zoekvraag ‘uitgever’ www.wolters-kluwer.com op de eerste plaatstoont, en www.elsevier.nl op de tweede plek. Vervolgens blijkt echter datde overgrote meerderheid van alle zoekers voor de nummer twee kiest. Eenzoekmachine kan dan besluiten om www.elsevier.nl voortaan maar op deeerste plaats te zetten, omdat deze site blijkbaar beter voldoet aan de ver-wachtingen van zoekers.

    Spamdexing

    Het is hiervoor even aan de orde gekomen: het kan lonen om zoekmachineste foppen. Sommige bedrijven specialiseren zich hier zelfs in. Tegen betalingbeloven ze een site hoger te laten eindigen in de resultaten van bekendezoekmachines. Zo wist een slimme Nederlandse autohandelaar met behulpvan de kennis onder het kopje ‘Autoriteit’ zijn eigen bedrijf als hoogste telaten eindigen voor wie via Google zocht naar een bekend automerk inNederland. Hij had vele duizenden nepwebsites gecreëerd die allemaal eenkoppeling bevatten naar zijn eigen site. De straf van Google was niet mals:toen het bedrijf ontdekte dat het belazerd was, werd het desbetreffendebedrijf onmiddellijk onder in de zoekresultaten gezet. Bovendien pasteGoogle de eigen spidersoftware aan. De truc werkt tegenwoordig niet meer.Moraal van het verhaal: bedrog loont niet, en wie zijn site wil promoten,doet er beter aan om de inhoud en bijbehorende metadata te verbeteren.Terzijde: mocht u geïnteresseerd zijn in het verbeteren van de score van desite, ook wel Search Engine Optimization genoemd, dan biedtwww.seomoz.org/article/search-ranking-factors een aardig vertrekpunt.

    Bediening van zoekmachines

    Iedere zoekmachine heeft een eigen gebruiksaanwijzing en eigen specialeopdrachten. Verderop komen met name de bijzondere eigenschappen vanGoogle uitgebreid aan de orde. Maar er zijn ook overeenkomsten tussenzoekmachines. Deze worden hieronder toegelicht.

    Booleaanse operatoren

    Booleaanse operatoren ontlenen hun naam aan de Britse wiskundige en filo-soof George Boole (1815-1864), wiens werk ook nu nog wordt toegepast inmoderne zoekmachines. Booleaanse operatoren, soms in het spraakgebruikfoutief aangeduid als booleans, zijn logische opdrachten waarmee een zoek-machine kan worden verteld iets wel of juist niet te doen.

    27

    Handboek – Internetresearch

  • Ze worden in hun oorspronkelijke vorm altijd in hoofdletters geschreven, alhebben sommige zoekmachines tegenwoordig andere manieren om boole-aanse operatoren te gebruiken. In hoofdstuk 3 en 4 komen we daarop terug.De belangrijkste booleaanse operatoren zijn:

    2h005 • AND AND vertelt een zoekmachine dat deze de woorden aan weers-kanten van AND beide moet meenemen in een zoekvraag. De opdrachtfiets AND fietsenmaker leidt dus tot pagina’s waarop zowel het woordfiets als fietsenmaker voorkomt. Goede zoekmachines, zoals Google,zoeken standaard met de booleaanse operator AND.

    • OR OR is vergelijkbaar met AND; de opdracht werkt op de woordenlinks en rechts van OR. Wie zoekt op chocola OR chocolade krijgt duspagina’s waarop alleen chocola staat én pagina’s waarop alleen choco-lade staat, maar ook pagina’s waarop beide termen voorkomen. OR ishandig voor wie wil zoeken op verschillende spellingsvarianten van eenwoord of naam, en kan ook worden gebruikt om te zoeken naar de com-binatie van een persoon en meerdere onderwerpen. Einstein relati-vity OR peace zoekt naar de beroemde geleerde in documenten dieover vrede of relativiteit gaan. (Of over beide, maar het aantal pagina’swaarop Einstein in combinatie met beide onderwerpen wordt genoemd,is vermoedelijk nogal beperkt). Slechte zoekmachines zijn eraan te her-kennen dat ze standaard met OR zoeken. De reden hiervoor is simpel:dit levert meer zoekresultaten op, zodat het lijkt alsof de zoekmachinegroter is dan in werkelijkheid het geval is.

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    28

    Afbeelding 2.7 George Boole bewijst dat wiskundigen wel degelijk eenmannelijke kaaklijn kunnen hebben.

  • • NOT Een vaak onderschatte, maar uiterst nuttige booleaanse operator.NOT vertelt de zoekmachine dat het resultaat een bepaalde term abso-luut niet mag bevatten. Hoewel het op het eerste gezicht nogal onzinniglijkt om de zoekmachine te vertellen waarnaar deze niet moet zoeken, isNOT erg handig om zoekresultaten uit te dunnen. Wie zoekt naar degeleerde Krajicek, maar geen pagina’s over de voormalige Nederlandsetennisser wil krijgen, voegt aan zijn zoekvraag simpel NOT tennis toe.

    • NEAR Waar AND de zoekmachine vertelt dat twee termen beide opeen pagina moeten voorkomen, is NEAR nog wat specifieker: de termenmoeten dicht bij elkaar staan, meestal met maximaal twintig woordentussenruimte. Dit is handig, want de zoekopdracht Wim NEAR Kok levertniet alleen pagina’s op waarop Wim Kok staat, maar ook alle weten-schappelijke publicaties van ‘Kok, Wim’. Helaas wordt NEAR tegenwoor-dig nauwelijks nog ondersteund.

    • Wildcards Ondergeschikt aan het belang van booleaanse operatoren,maar niettemin nuttig bij zoekmachines die ze ondersteunen, zijn wild-cards, ook wel jokers geheten. Een wildcard is het symbool * en wordtgebruikt om een ontbrekend of variabel gedeelte van een zoekvraag opte vullen. Voorbeeld: “De * valt niet ver van de boom” zal resulta-ten opleveren met ieder willekeurig woord op de plek van de *. De wild-card is dus uitstekend geschikt om te gebruiken als u op zoek bent naareen exact citaat, maar niet meer precies weet hoe dit citaat ook alweerluidde. Sommige zoekmachines staan het ook toe om een wildcard ineen woord te gebruiken. Voorbeeld: “Jans*en” levert zowel pagina’s opmet de term ‘Jansen’ als ‘Janssen’. Waar het gebruik van dergelijke wild-cards in 2004, bij het verschijnen van de eerste editie van dit boek, nognut had, is Google anno 2010 zo slim geworden dat de machine in veelgevallen zelf zal zoeken op meerdere varianten van een woord. Dat heeftzo weer zijn eigen nadelen, want soms wilt u dat helemaal niet. Dwing indat geval Google om bij de les te blijven door een plusteken vast te plak-ken aan de voorkant van de zoekterm. Voorbeeld: +Jansen.

    29

    Handboek – Internetresearch

  • Bediening van internetgidsen

    Enkele bijzondere internetgidsen komen verderop in het boek uitgebreid aande orde. Meer algemeen gelden voor het bedienen van internetgidsen devolgende wenken.

    Rubrieksindeling

    Internetgidsen plaatsen hun lemma’s in een rubrieksindeling die is opge-bouwd volgens een soort boomstructuur. Dit maakt het voor de redacteurenvan de internetgids eenvoudiger om sites te classificeren. Een goed voorbeelddaarvan is te zien op www.dmoz.nl, een internetgids die door vrijwilligerswordt bijgehouden. Deze rubrieksindelingen vertonen onderling grote over-eenkomsten en dus is het raadzaam om er goede studie van te maken bijeen internetgids die u veel gebruikt. Die kennis komt ook bij andere zoek-machines weer van pas.

    In het algemeen loont het om voordat u een zoektocht via een internetgidsbegint, eerst te bedenken in welke rubriek een bepaalde gezochte site zichzou kunnen bevinden. Zoekt u naar de site van een ambassade van een bui-tenlandse mogendheid, dan kan het bijvoorbeeld zinvol zijn om te beginnenbij de rubriek Government (in het geval van http://dir.yahoo.com) of derubriek Regionaal (een anglicisme waaronder Nederlandse internetgidsenbuitenlandse sites plaatsen, zie bijvoorbeeld www.dmoz.nl).

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    30

    Afbeelding 2.8 De internetgids DMOZ bestaat bij de gratie van vrijwilligers.

  • 2h006Zoekveld

    Hetzelfde invoerveld dat zo karakteristiek is bij veel zoekmachines ontbreekttegenwoordig ook niet bij de meeste internetgidsen. Waarom is een raadseldat qua onbegrijpelijkheid vergelijkbaar is met de Nederlandse gewoonte omop Koninginnedag de jeugd vuilnis op straat te laten verkopen.

    Het invoerveld ondergraaft de inherent logische rubrieksindeling van eeninternetgids volledig. Niet zelden leidt het gebruik ervan tot volkomen onzin-nige resultaten. De site kan immers alleen een antwoord geven op basis vande beschrijvingen die de redacteuren aan de diverse opgenomen sites heb-ben gegeven. Deze beschrijvingen zijn bedoeld om door mensen begrepente worden, niet om doorzoekbaar te zijn, met alle gevolgen van dien.

    Een gunstige uitzondering is de internetgids van Google opdirectory.google.com of directory.google.nl. Deze kan redelijk goedoverweg met zoekvragen via het invoerveld. Desondanks is het jammer dateigenaren van internetgidsen met het invoerveld hun bezoekers denken eenplezier te doen, terwijl het resultaat van het gebruik ervan meestal louterafschrikt.

    Kenmerken van goede zoekmachines

    en internetgidsen

    Verderop in dit boek komen, zoals gezegd, specifieke zoekmachines eninternetgidsen aan de orde. Een volledige opsomming kan echter alleen alvanwege ruimtegebrek niet gegeven worden: er zijn immers honderden, zoniet duizenden zoekmachines en internetgidsen. Bovendien wordt hun aan-tal vrijwel dagelijks groter. Daarom treft u hieronder een lijst kenmerken aanwaarmee u zelf kunt beoordelen of een specifieke zoekmachine of internet-gids aan basiskwaliteitseisen voldoet.

    Scheiding commercie en inhoud

    Zonder enige twijfel de belangrijkste toetssteen voor alle zoekmachines eninternetgidsen. Wie via Google zoekt, zal regelmatig aan de rechterkant vanhet scherm een rij duidelijk als zodanig aangegeven advertenties zien. In zo’ngeval is er niets aan de hand: het is niet meer dan logisch dat een zoek-machine of internetgids gemaakte kosten wil terugverdienen. U leest per slotvan rekening ook nog steeds een krant ondanks de grote aantallen adverten-ties daarin. Het wordt gevaarlijk wanneer redactionele inhoud en commerciezich gaan vermengen. Dit vaststellen is overigens lang niet altijd even een-

    31

    Handboek – Internetresearch

  • voudig. Een belangrijke indicatie is ironisch genoeg het ontbreken van adver-tenties. In dat geval zijn ze er waarschijnlijk wel, maar worden ze simpelwegniet als zodanig aangegeven, met als gevolg dat u zonder het te weten eencommercieel en dus subjectief antwoord op een zoekvraag kunt krijgen.Oordeel overigens niet te snel: sommige licht anarchistische sites alswww.dmoz.nl bevatten geen advertenties uit ideële motieven. In dat soortgevallen is op de site echter vrijwel altijd een toelichting te vinden over hetredactionele beleid (zie ook de subparagraaf Transparantie).

    Hulp

    Zelfs bij een plantenspuit zit meestal een gebruiksaanwijzing, dus die magook bij een internetgids of zoekmachine niet ontbreken. Is dat wel het geval,dan nemen de makers hun eigen site niet serieus, wat bij voorbaat ernstigetwijfels oproept over de inhoud. Een Help-functie, veelal te herkennen aan(inderdaad) het woordje ‘Help’ ergens op de pagina, bevat (als het goed is)niet alleen tips voor beginners, maar is ook voor gevorderden vaak essen-tieel. Op de hulppagina’s behoren namelijk alle speciale functies van de des-betreffende site te worden beschreven en toegelicht. Een zoekmachine ofinternetgids zonder hulpfunctie is als een Formule 1-wagen op de handrem:het rijdt, maar met de hendel naar beneden gaat het net wat vlotter.

    Transparantie

    Geeft de site duidelijkheid over wat er gebeurt met gegevens die de eigena-ren via de zoekmachine of internetgids verzamelen, bijvoorbeeld in de vormvan een privacy statement? Is bekend hoe de site omgaat met adverteerders?Wordt duidelijk hoe de inhoud van de site tot stand komt en onder welkeregels een eventuele redactie werkt? Is er een manier om in contact tekomen met de makers? Bevat de site informatie over het bedrijf dat verant-woordelijk is voor de inhoud? Duidelijkheid over het hoe en waarom vaneen site is op internet geen pre, maar een voorwaarde. Waar rook is, is in ditgeval niet zozeer vuur maar een enorme vlammenzee. En wilt u voor uwinformatie afhankelijk zijn van een mogelijk dubieuze bron terwijl er keusgenoeg is?

    Hoofdstuk 2 – Zoekmachines en internetgidsen

    32

  • Google

    Hoewel het de meest gebruikte zoekmachine ter wereld is,benutten veel researchers de mogelijkheden van Googleonvoldoende. Feit is dat de kracht van Google die vanalle zoekmachines overtreft. Dat wekt op zijn beurt zo veelwrevel op dat er geen week voorbij gaat of het einde van dezezoekmachine wordt voorspeld. Allemaal kinnesinne: wie metGoogle zoekt, hoeft zich er zeker niet toe te beperken, maarzonder Google kan geen researcher.

    U leert in dit hoofdstuk:

    De basismogelijkheden van Google gebruiken.

    Hoe de geavanceerde opties van Google werken.

    Welke diensten Google aanbiedt naast het reguliere zoekgedeelte.

    3

  • De basismogelijkheden van Google

    Google ziet er in eerste instantie uit als iedere andere zoekmachine en wel-licht daarom wordt de kracht van Google vaak onderschat. Een andere redenis dat wie geen kennis heeft van de mogelijkheden van Google, die ook nietzal gebruiken.

    .com versus .nl

    Het verschil tussen www.google.nl en www.google.com zit verbor-gen in de taalinstellingen: bij een bezoek aan www.google.nl gaat dezoekmachine ervan uit dat u Nederlander bent en biedt deze bijvoor-beeld standaard de mogelijkheid om louter Nederlandse pagina’s alsresultaat weer te geven. Ook als u die optie niet selecteert, zult umerken dat de ‘Nederlandse’ variant van Google een sterke voorkeurvertoont voor binnenlandse zoekresultaten. De site www.google.combevat de standaardversie van Google. Google heeft zijn eigenaardig-heden: soms zult u bij een bezoek aan www.google.com auto-matisch worden doorgestuurd naar www.google.nl. Hebt u daar geenbehoefte aan, selecteer dan Google.com in English in het Google.nl-scherm. Het gebruik van de Engelstalige Google is in veel gevallenaan te raden, al is het maar omdat nieuwe foefjes over het algemeeneerst in de internationale Google-variant worden geïntroduceerd.

    De belangrijkste fout die Google-gebruikers maken, is dat ze geen rekeninghouden met de grootte van Google. Die is enorm en wordt geschat op enke-le tientallen miljarden pagina’s. Toch behandelen veel onervaren researchersGoogle nog altijd als een zoekmachine met een geheugen als een vergiet.Want hoe anders is het te verklaren dat veel gebruikers in het zoekvensterslechts één of twee woorden invullen, uit angst een resultaat te missen?

    Google versus andere zoekmachines

    Een belangrijk verschil tussen Google en andere zoekmachines is dehoeveelheid in de index opgenomen unieke pagina’s: die is groterdan waar ook. Hoewel andere zoekmachines hun waarde hebben alsaanvulling, moet Google altijd het startpunt zijn.

    Een belangrijke stelregel bij het gebruik van Google – en iedere zoekmachinedie deze naam waard is – luidt: maak het de zoekmachine zo lastig mogelijk.Het is zinvoller om zes zoekwoorden in te voeren en slechts 25 resultatenterug te krijgen, dan twee zoekwoorden in te vullen en er drie miljoen tezien.

    Hoofdstuk 3 – Google

    34

  • Van die drie miljoen bekijkt u er hoogstens enkele tientallen, waardoor u netzo goed resultaten over het hoofd ziet, namelijk bijna drie miljoen pagina’s.Vergeet de illusie van volledigheid, die bestaat niet op internet (noch elders inhet leven, maar dit is geen filosofieboek). Door Google precies te vertellen watu wilt, behoudt u tenminste zelf de controle over wat u niet te zien krijgt.

    32 woorden

    Google kan maximaal 32 zoekwoorden tegelijk verwerken. Maakgebruik van die ruimte! Aan te veel zoekresultaten hebt u niets, diekunt u toch niet allemaal bekijken.

    3maxquery Er zijn grofweg twee manieren om te zoeken in Google: via het standaard-venster of via het venster Geavanceerd zoeken. Het standaardvenster is tevinden op www.google.nl (voor Google Nederland) of www.google.com(de internationale versie van Google); Geavanceerd zoeken benadert u doorvanaf het hoofdvenster op Geavanceerd zoeken (Advanced Search) te klik-ken. Beide bieden dezelfde functionaliteit, maar het venster Geavanceerdzoeken is eenvoudiger te bedienen. Omdat bij ieder invoerveld in het ven-

    35

    Handboek – Internetresearch

    Afbeelding 3.1 Over het algemeen is een gebrek aan zoekresultaten nietecht een probleem.

    Afbeelding 3.2 Google kan maximaal 32 zoekwoorden tegelijk verwerken.

  • ster Geavanceerd zoeken een equivalent in het standaard Google-vensterhoort, komen beide tegelijkertijd aan de orde. Het verdient overigens devoorkeur om van het venster Geavanceerd zoeken een zogeheten bookmarkof bladwijzer te maken, zodat u deze pagina eenvoudig kunt terugvinden.Hoe dit moet, hebt u kunnen lezen in hoofdstuk 1.

    3h0023advsearch Boven in het venster Geavanceerd zoeken ziet u een blauw vak met daarinvier invoervelden. Dit bevat de basisfunctionaliteit van Google (oftewel demanier waarop Google gebruikmaakt van een aantal booleaanse operatoren;zie hoofdstuk 2). Deze regels worden in de volgende paragrafen besproken.

    Hoofdstuk 3 – Google

    36

    Afbeelding 3.3 U bereikt het venster Geavanceerd zoeken door naarwww.google.nl te gaan en in dit venster op Geavanceerd zoeken te klikken.

    Afbeelding 3.4 Bij de internationale versie van Google op www.google.comheet Geavanceerd zoeken Advanced Search.

  • 3h003Met alle woorden

    Dit veld doet precies hetzelfde als het standaardvenster van Google. Als uhier iets invult, krijgt u pagina’s terug waarop alle woorden voorkomen dieu hebt ingevuld. In booleaanse-termen: Google gebruikt hier standaardAND.

    Wilt u bijvoorbeeld zoeken naar pagina’s die zowel over chimpansees alsbonobo’s gaan, dan is dit het veld dat u moet hebben. Er is overigens eenuitzondering op de regel dat Google standaard op alle ingevulde woordenzoekt. Sommige veelvoorkomende termen (de, het, een, and, the) wordendoor Google genegeerd. Zoek maar eens op Bert en Ernie: u zult merken

    37

    Handboek – Internetresearch

    Afbeelding 3.5 Het venster Geavanceerd zoeken. In het bovenste veldbevinden zich de basisfuncties van Google.

    Afbeelding 3.6 Het zoeken naar Bert en Ernie zonder +…

  • dat er ook zoekresultaten bijstaan waarbij het woordje ‘en’ niet op de paginavoorkomt, zoals Engelstalige pagina’s. U zult het wellicht niet vaak gebruiken,maar in dergelijke gevallen kunt u Google dwingen toch te zoeken op hetdesbetreffende woord door er aan de voorkant een + aan vast te plakken(zonder spatie tussen de + en het door Google genegeerde woord). In hetgeval van Bert en Ernie moet u dan Bert +en Ernie invoeren. Vergelijk hetaantal treffers: in het laatste geval krijgt u er minder.

    3h0043h005Met de exacte woordcombinatie

    Het gebruik van met alle woorden heeft een groot nadeel. Wie zoekt naarWim Kok, krijgt behalve sites over de voormalige regeringsleider ook sitesterug waarop zowel Wim de Bruijn als uitgeverij Kok uit Kampen wordengenoemd. Met alle woorden garandeert dat de ingevulde woorden op depagina voorkomen, maar zegt niets over de plek van die woorden. Doorgebruik te maken van het invoerveld met de exacte woordcombinatie kuntu eventueel leed afwenden.

    Wie op deze plek Wim Kok typt, zal alleen pagina’s terugzien waarin dezetwee woorden in deze exacte volgorde voorkomen. Dit is niet alleen handigvoor persoonsnamen, maar ook bijvoorbeeld voor het achterhalen van decontext van citaten of zinnen uit boeken.

    Hoofdstuk 3 – Google

    38

    Afbeelding 3.7 …en met +.

  • U kunt ook in het standaardvenster van Google deze zoektechniek gebrui-ken. Zet daartoe de zoekterm tussen aanhalingstekens, dus: ”Wim Kok”.

    Punt!

    Door in plaats van spaties punten te typen, kunt u Google vertellendat de zoekmachine moet zoeken op de exacte woordcombinatie.Voorbeeld: Wim.Kok geeft hetzelfde resultaat als “Wim Kok”.

    Met een van deze woorden

    ‘Beroerde’ zoekmachines als Ilse zoeken standaard op deze manier, waarbijalle pagina’s worden getoond waarop een of meer van de woorden voor-komen die u invult. Het gevolg is dat wie op Vrij Nederland zoekt, allepagina’s krijgt waarop of het woordje Vrij, of het woordje Nederland of decombinatie voorkomt. Dat levert dus veel meer resultaten op dan zoeken viamet alle woorden of met de exacte woordcombinatie.

    39

    Handboek – Internetresearch

    Afbeelding 3.8 Dit levert hetzelfde resultaat op als…

    Afbeelding 3.9 …dit.

  • 3h0103h011 Toch heeft deze optie nut. Stel dat u moet zoeken naar informatie over deprimatoloog Frans de Waal. Meer specifiek: u wilt weten wat hij over deapensoorten chimpansees en bonobo’s heeft gezegd. In dat geval vult u bijmet de exacte woordcombinatie natuurlijk Frans de Waal in. Maar daarkunt u chimpansees en bonobo’s niet achter plaatsen: Google zou dan zoe-ken naar pagina’s waarop de tekst “Frans de Waal chimpansees bonobo’s”voorkomt. Deze twee termen zet u dus neer bij met een van deze woorden.Het voordeel daarvan is dat u pagina’s terugkrijgt waarop slechts één vanbeide apensoorten hoeft voor te komen. Had u chimpansees en bonobo’s inhet eerste invoerveld geplaatst, dan had u alleen pagina’s gezien waaropFrans de Waal in combinatie met beide diersoorten wordt genoemd. U zultzien dat Google het woordje OR plaatst tussen de woorden die u bij met eenvan deze woorden hebt ingevuld. OR is de gelijknamige booleaanse opera-tor uit hoofdstuk 2.

    Hoofdstuk 3 – Google

    40

    Afbeelding 3.10 Deze zoekopdracht…

    Afbeelding 3.11 …levert slechts weinig resultaten op.

  • 3h0083h009 Wilt u Google laten kiezen uit meerdere woordcombinaties, dan kan datook. Gebruik hiervoor aanhalingstekens om de verschillende woordgroepenvan elkaar te scheiden. Wilt u pagina’s waarop de Ford Sierra of de Volks-wagen Golf voorkomen, dan vult u dus “Ford Sierra” “Volkswagen Golf”in. Google zal automatisch het OR-commando toevoegen tussen beidewoordcombinaties. U kunt natuurlijk ook via de gewone Google-zoekpaginauw opdracht invoeren. Wel moet u dan handmatig de OR-opdracht toevoe-gen. De zoekopdracht wordt dan “Ford Sierra” OR “Volkswagen Golf”.

    41

    Handboek – Internetresearch

    Afbeelding 3.12 Terwijl het gebruikmaken van de optie met een van dezewoorden…

    Afbeelding 3.13 …de hoeveelheid nuttige pagina’s drastisch uitbreidt.

  • Hoofdstuk 3 – Google

    42

    Afbeelding 3.14 Bij de Engelstalige variant van Geavanceerd zoeken laatGoogle onmiddellijk zien waar de aanhalingstekens en de OR-opdrachtmoeten staan.

    Afbeelding 3.15 U kunt aanhalingstekens gebruiken om woordgroepen aante geven op de regel Met een van deze woorden…

    Afbeelding 3.16 …Google zal automatisch op de juiste plek het OR-commando toevoegen.

  • Spreid uw kansen

    Op zoek naar een persoon maar u weet de exacte spelling van zijn ofhaar naam niet? Zoek dan vanaf het standaard Google-venster vol-gens de notatie “Eerste mogelijke spelling van naam” OR“Tweede mogelijke spelling van naam”. Als u Henk Jansen moethebben, maar u twijfelt over het aantal s’en in zijn achternaam, wordtde zoekopdracht dus “Henk Jansen” OR “Henk Janssen”. Gebruiktu het scherm Geavanceerd zoeken, typ dan “Henk Jansen” “HenkJanssen” in het invoervak met een van deze woorden. De Engels-talige versie van Geavanceerd zoeken (Advanced Search) biedt bijone or more of these words wel drie aparte velden waarvan u er indit geval twee kunt gebruiken om de naam van Henk Jans(s)en in tevoeren.

    Zonder de woorden

    Dit lijkt een eigenaardig invoervak. Waarom zou u immers op iets niet willenzoeken? Toch is dit invulveld, het equivalent van de booleaanse operatorNOT uit hoofdstuk 2, erg nuttig. Het maakt het mogelijk om snel te schiftenin grote hoeveelheden informatie. Stel dat u op zoek bent naar informatieover de wiskundige Krajicek, dan loopt u een behoorlijke kans veel sites overde gelijknamige tennisser voor uw neus te krijgen. Door bij zonder de woor-den tennis en Richard te typen, reduceert u die kans behoorlijk. Perfectwerkt deze methode natuurlijk niet. Een site waarop Richard Krajicek enkelwordt genoemd als ‘Wimbledon-winnaar Krajicek’, wordt op deze manierniet weggefilterd.

    De functionaliteit zonder de woorden is ook via het standaardvenster vanGoogle te gebruiken. Daartoe koppelt u een minteken aan het woordwaarvan u niet wilt dat het in de zoekresultaten voorkomt. In het geval vanKrajicek wordt de opdracht dan Krajicek -tennis -Richard. De min moetzonder spatie aan het te negeren woord voorafgaan.

    43

    Handboek – Internetresearch

    Afbeelding 3.17 Uiteraard is het ook mogelijk om het zoekcommando ORhandmatig toe te voegen via het gewone Google-zoekscherm.

  • Het moge overigens duidelijk zijn dat zonder deze woorden nooit alleenmag worden gebruikt, maar altijd in combinatie met ten minste één anderinvoerveld. U moet Google immers altijd iets geven waarnaar hij wél kanzoeken. Anders valt er ook niets uit te filteren.

    Hoofdstuk 3 – Google

    44

    Afbeelding 3.18 U zoekt op Krajicek…

    Afbeelding 3.19 …en krijgt allemaal pagina’s over de bekende tennissersMichaëlla en Richard Krajicek.

    Afbeelding 3.20 Door het veld zonder de woorden in te schakelen…

    Afbeelding 3.21 …reduceert u het aantal pagina’s over tennis dramatisch.

  • Google Dance

    U krijgt op de ene computer andere zoekresultaten via Google daneen collega of kennis met dezelfde opdracht? Dan bent u slachtoffergeworden van de zogeheten Google Dance. Google bestaat uit meer-dere computers die verschillende zoekresultaten kunnen geven opdezelfde vraag. Vermoedelijk test Google op deze manier nieuwetoevoegingen aan haar dienst. Op www.seochat.com/googledance iste zien hoe de Google Dance in zijn werk gaat.

    3h020Op datum zoeken

    Last van te veel oude pagina’s bij het zoeken? Google kent de mogelijkheidom de zoekresultaten te beperken tot die van de laatste drie maanden, zesmaanden of het laatste jaar. In de praktijk werkt deze functie niet altijd evengoed, hoewel ze de laatste jaren steeds beter is gaan functioneren. Toch pro-beren veel sites nog steeds Google voor de gek te houden door net te doenalsof pagina’s veel nieuwer zijn dan ze zijn.

    Zo denken deze sites meer bezoek te genereren, omdat internetgebruikersen zoekmachines grosso modo een voorkeur hebben voor actuele pagina’s.Een alternatief is daarom om bij met een van deze woorden een aantalrecente jaartallen in te vullen, in de hoop dat dit jaartal in de tekst van depagina’s voorkomt die u zoekt. U kunt natuurlijk ook slechts één jaartalgebruiken, maar dan loopt u de kans wel erg weinig resultaten terug te krij-gen. Een honderd procent efficiënte methode om op datum te zoeken,bestaat helaas niet.

    45

    Handboek – Internetresearch

    Afbeelding 3.22 Google Dance zet de resultaten van de ‘verschillendepersoonlijkheden’ van Google naast elkaar.

  • Hoofdstuk 3 – Google

    46

    Afbeelding 3.23 Google biedt een mogelijkheid om te zoeken naar recentedocumenten. Deze levert echter sterk wisselende resultaten op.

    Afbeelding 3.24 Een alternatief is om te zoeken naar een aantal jaartallen,waarvan er ten minste eentje in de tekst van de gezochte documenten moetvoorkomen. Hiervoor gebruikt u de functie met een van deze woorden.

    Afbeelding 3.25 In de praktijk leidt het zoeken op jaartallen soms totbetere resultaten.

  • Speciale functies van Google

    Google bezit een aantal meer geavanceerde mogelijkheden. Sommige daarvanzijn uniek voor Google, andere niet, maar allemaal zijn ze bijzonder nuttig.

    Een site doorzoeken

    Niet alle sites hebben een eigen zoekfunctie en als ze er wel over beschik-ken, dan is de kwaliteit vaak matig. Google schiet gelukkig te hulp, en welmet een functie die het mogelijk maakt om alleen zoekresultaten te retour-neren die zich op een bepaalde website bevinden. Dat kan handig zijn als ubijvoorbeeld alle pagina’s wilt hebben op www.amsterdam.nl die het woord‘begroting’ bevatten.

    Er zijn twee manieren om deze functie te gebruiken. U kunt naar het vensterGeavanceerd zoeken gaan en daar in het veld Domein de website invullenwaartoe u wilt dat Google zich beperkt. Voer hier alleen de laatste tweegedeelten van het siteadres in. Dus niet: www.amsterdam.nl, maar amster-dam.nl.

    site:

    Wilt u alle pagina’s zien die Google van een bepaalde website in deaanbieding heeft? Zoek dan alleen op site:naamvansite.nl en klikop De zoekbewerking herhalen met de weggelaten resultaten alsdeze tekst onder in de Google-resultaten verschijnt.

    De tweede manier is om in het standaardscherm van Google de opdrachtsite: te gebruiken. Aan site: koppelt u vervolgens de naam van de websitewaarbinnen u wilt zoeken. Net als bij de eerste methode laat u het eerstegedeelte van het siteadres weg. Zoeken binnen www.amsterdam.nl doet udus met de opdracht site:amsterdam.nl.

    47

    Handboek – Internetresearch

    Afbeelding 3.26 Bij het invoerveld Domein typt u de naam van de website,zonder voorvoegsels als www. In dit geval typt u bij domein amsterdam.nlen bij zoek resultaten met alle woorden de term begroting, om te zoekennaar documenten binnen de site van de gemeente Amsterdam die deze termbevatten.

  • Landen doorzoeken

    U kunt de opdracht site: ook gebruiken om binnen een bepaald landte zoeken. Dat doet u door site: te combineren met de landcodes inappendix B, achter in dit boek. Voor Nederland is de internetland-code .nl. Zoeken binnen Nederlandse sites doet u dus door site:.nlin te voeren, of bij het invoerveld Domein in het venster Geavan-ceerd zoeken .nl te typen. Het is van belang dat er een punt staatvoor de landcode.

    Hoofdstuk 3 – Google

    48

    Afbeelding 3.27 Met de opdracht site: kunt u binnen een bepaald domeinzoeken zonder naar het venster Geavanceerd zoeken te hoeven gaan.

    Afbeelding 3.28 Door de opdracht site: te koppelen aan een van de land-codes uit appendix B, beperkt u de zoekresultaten tot websites die geregi-streerd staan in dat land.

  • 3h026 Een kanttekening: met deze functie doorzoekt u uiteraard alleen doorGoogle bekeken pagina’s. Dit zijn niet per se alle pagina’s die een site bevat:geen zoekmachine op internet is immers compleet.

    Verdwenen documenten terughalen

    Vroeger – we praten nu over lang geleden, zo rond 1998 – kwam het regel-matig voor: de zoekmachine liet een veelbelovend resultaat zien, u klikteerop en het resultaat was een melding in de trant van ‘Page not found’ of‘Error 404’.

    Ook met Google kan dat gebeuren, maar nodig is het niet. Google beschiktnamelijk over een bijzondere eigenschap. Op het moment dat deze zoek-machine een site bezoekt, maakt Google gelijk een kopie voor zichzelf. Hetgoede nieuws: die kopieën zijn op te vragen. Op het moment dat u viaGoogle op een pagina terechtkomt die niet meer bestaat, kunt u terugvallenop deze veiligheidskopie.

    De veiligheidskopie benadert u door in het venster met zoekresultaten op detekst In cache of Cached te klikken. Deze woorden vindt u op de ondersteregel van een zoekresultaat, na de groene tekst. Een waarschuwing: dezecacheversie of veiligheidskopie is niet altijd even actueel. Het is immers dekopie die Google maakte bij het laatste bezoek aan de desbetreffende site.Dat kan alweer even geleden zijn. Houd er dus rekening mee dat de infor-matie die u op deze manier verkrijgt, verouderd kan zijn.

    Laat Google arceren

    Een bijkomend voordeel van het g