Bestandkeuze en zoekstrategieën nieuws
description
Transcript of Bestandkeuze en zoekstrategieën nieuws
1
Bestandkeuze en zoekstrategieën
nieuws
Jeroen Bosman
VOGIN, 27 november 2012 Wageningen
2
Nieuwsvoorbeeld aard zoeken bijblijven
persbureaus ANP, AFPReuters, Novum, Visnews
feitelijke berichten en foto’s
via andere nieuwsdiensten (bv. Nu.nl, NOS Nieuws, Teletekst)
RSS-feeds Nu.nl
kranten NRC / NYT /El Pais / Trouw
persbericht, redactioneel, achtergrond, opinie etc.
Google Nieuws/News
LexisNexis / KrantenbankFactiva / Howard’s H.
RSS-feeds van kranten / alert in database / Google news alert
RTV NOS-JournaalBBC JournaalRTL JournaalActualiteitenprog.
gelijk aan krant, maar dan geluid/beeld
B&G Aacademia / uitzending gemist-RTLgemist-Ooitgemist / Blinkx / Youtube
Omroep.nlRSS-feeds
organisaties WNF, IMF, FIFA, ANWB etc.
persberichten, nieuws op eigen terrein, tweets
alg. zoekmach. / interne zoekmach./Google News /Howards home
RSS-feed op zoekactie
individuen Bv Phil Bradley blog, podcast, vodcast, tweets, update/post
blogsearch,YouTube, Twitter search, facebook, linked in, Google+
feeds, tweets, filters in RSS readers
3
Zoeken actuele discussies:• Twitter search: relatief goede advanced search• Nieuwsgroepen: zoeken via Google groups• Discussielijsten: lastig doorzoekbaar tenzij er een
webarchief is– Overizcht bv bij JISCmail
• Fora doorzoeken zoeken met domain/site-beperking– bv forum van bibliotheek20.ning.com
4
Interactief: nieuwsgroepen• heet: usenet, news, forums, groups• apart protocol• vereist newsreader of:• lezen via archief bij Google• voor specifieke problemen (foutmeldingen)• voor laagdrempelige, actuele discussies• voor sociaal-cultureel en taal(historisch) onderzoek• vluchtig, wilde westen, illegale zaken• functies grotendeels overgenomen door groepsblogs en
profielsites (FB/Google+), Twitter en blog comments
5
Interactief: discussielijsten• werkt via Email (later ook vaak web-interface)• vaak eerst abonneren, verzenden alleen door abonnees• vrij sterke communities• soms zeer hoge kwaliteit• zoeken lijsten:
– Catalist (lijsten met Listserv software)– www.jiscmail.ac.uk/groups/ (Brits hoger onderwijs/wetenschap)– groups.yahoo (lijsten van Yahoo)
• bv Nedbib of Web4Lib of DigRef
6
VideosearchZoeken met:•Blinkx•Youtube (ook advanced search!)•B&G Academia
•Known item search en populaire video gaat goed•Maar onderwerpzoeken lastig•Semantic gap tussen eigenlijke informatie en doorzoekbare proxy daarvan >>
Beeldontsluiting• text based image en sound retrieval:
de computer zoekt in tekst die aan het beeld/geluid gerelateerd is– in expliciet aanwezige computerleesbare tekst
• in bijbehorende webpagina• in aanwezige metadata (extern of intern)
– in computerleesbaar gemaakte “embedded” tekst
• OCR van in afbeelding aanwezige tekst• spraakherkenning in geluidsbestand
• content based image en sound retrieval 7