Bestandkeuze en zoekstrategieën nieuws
description
Transcript of Bestandkeuze en zoekstrategieën nieuws
1
Bestandkeuze en zoekstrategieën
nieuws
Jeroen Bosman
VOGIN, 21 november 2013 Wageningen
2
Nieuwsvoorbeeld aard zoeken bijblijven
persbureaus
ANP, AFPReuters, Novum, Visnews
feitelijke berichten en foto’s
via andere nieuwsdiensten (bv. Nu.nl, NOS Nieuws, Teletekst)
RSS-feeds Nu.nl
kranten NRC / NYT /El Pais / Trouw
persbericht, redactioneel, achtergrond, opinie etc.
Google Nieuws/NewsLexisNexis / KrantenbankFactiva / Howard’s H.
RSS-feeds van kranten / alert in database / Google news alert
RTV NOS-JournaalBBC JournaalRTL JournaalActualiteitenprog.
gelijk aan krant, maar dan geluid/beeld
B&G Academia / uitzending gemist-RTLgemist-Ooitgemist / Blinkx / Youtube
Omroep.nlRSS-feeds
organisaties WNF, IMF, FIFA, ANWB etc.
persberichten, nieuws op eigen terrein, tweets
alg. zoekmach. / interne zoekmach./Google News /Howards home
RSS-feed op zoekactie
individuen Bv Phil Bradley blog, podcast, vodcast, tweets, update/post
Google blogs / Yahoo blogs / YouTube / Twitter search, facebook, / LinkedIn, Google+ / Topsy
feeds, tweets, filters in RSS readers
3
Zoeken actuele discussies:
• Twitter search: relatief goede advanced search• Nieuwsgroepen: zoeken via Google Groups• Discussielijsten: lastig doorzoekbaar tenzij er een
webarchief is– Overzicht bv bij JISCmail >
• Fora doorzoeken zoeken met Google Discussions, met Omgili of een site beperking
4
Interactief: nieuwsgroepen• heet: usenet, news, forums, groups• vroeger apart protocol en vereiste newsreader• nu lezen en archief bij Google Groups• voor specifieke problemen (foutmeldingen)• voor laagdrempelige, actuele discussies• voor sociaal-cultureel en taal(historisch) onderzoek• vluchtig, wilde westen, illegale zaken• Functies deels overgenomen door groepsblogs en
profielsites (FB/Google+), Twitter en blog comments
5
Interactief: discussielijsten
• werkt via Email (later ook vaak web-interface)• vaak eerst abonneren, verzenden alleen door abonnees• vrij sterke communities• soms zeer hoge kwaliteit• zoeken lijsten:
– Catalist (lijsten met Listserv software)– www.jiscmail.ac.uk/groups/ (Brits hoger onderwijs/wetenschap)– groups.yahoo (lijsten van Yahoo)
• bv Nedbib > of Web4Lib > of DIG_REF
6
VideosearchZoeken met:• Algemeen: Blinkx en Google Video• Youtube (ook advanced filters!)• Hoger onderwijs: B&G Academia
• Known item search en populaire video gaat goed
• Maar onderwerpzoeken lastig• Semantic gap tussen eigenlijke informatie en
doorzoekbare proxy daarvan >>
Beeldontsluiting – semantic gap• text based image en sound retrieval:
de computer zoekt in tekst die aan het beeld/geluid gerelateerd is– in expliciet aanwezige computerleesbare tekst
• in bijbehorende webpagina• in aanwezige metadata (extern of intern)
– in computerleesbaar gemaakte “embedded” tekst • OCR van in afbeelding aanwezige tekst• spraakherkenning in geluidsbestand
• content based image en sound retrieval >7