La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining...

33
1 La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido 2 Yahoo! Research Agenda La Internet y la Web hoy Web 2.0 y la Media Social Búsqueda Social Yahoo! Research La sabiduria de la gente El futuro

Transcript of La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining...

Page 1: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

1

La Web 2.0:

Ricardo Baeza-YatesDirector, Web Mining Research

Yahoo! ResearchBarcelona, Spain & Santiago, Chile

La Persona como

Contenido

2

Yahoo! Research

Agenda

� La Internet y la Web hoy

� Web 2.0 y la Media Social

� Búsqueda Social

� Yahoo! Research

� La sabiduria de la gente

� El futuro

Page 2: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

2

Internet y la Web

5

Yahoo! Research

Internet y la Web

� Entre 1 y 2.5 mil millones de gente conectada– 5 mil millones estarán conectadas para el año 2015

� 1.8 mil millones de teléfonos celulares – Se estima que 500 millones de personas tendrá celulares con

banda ancha para el año 2010

� El tráfico de Internet se ha incrementado 20 veces en los últimos 5 años

� Hoy hay más de 120 millones de servidores en la Red

� La Web es en la práctica infinita– Las paginas dinámicas son ilimitadas

– ¿Las páginas estaticas son más de 12 mil millones?

Page 3: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

3

6

Yahoo! Research

Mundo Yahoo!

� Buscadores:– Yahoo! Image , – Yahoo! Video , – Yahoo! Local , – Yahoo! News , – Yahoo! Shopping Search ,

� Comunicación:– Yahoo! Mail ,– Yahoo! Messenger , – My Web, – Yahoo! Personals , – Yahoo! 360º , – Yahoo! Photos , – Flickr , Delicious ,– Yahoo! Answers

� Contenido:– Yahoo! Sports , – Yahoo! Finance , – Yahoo! Music , – Yahoo! Movies , – Yahoo! News , – Yahoo! Games . – My Yahoo!

� Celulares: – Yahoo! Mobile

� Comercio:– Yahoo! Shopping ,

– Yahoo! Autos ,

– Yahoo! Auctions ,

– Yahoo! Travel ,

� Pequeños Negocios– Yahoo! Small Business

– Yahoo! Domains ,

– Yahoo! Web Hosting ,

– Yahoo! Merchant Solutions ,

– Yahoo! Business Email ,

– HotJobs

� Publicidad: – Yahoo! Search Marketing

– Yahoo! Publisher Network .

7

Yahoo! Research

El Tamaño de Yahoo! (March ’07, May’07)

24 idiomas, 20 países

� > 4 mil millones de páginas vistas por día (en todo el mundo)� > 500 millones de personas al mes (la mitad de usuarios en Internet!)� > 250 millones de cuentas de correos (1 millón de cuentas al día)� 100 millones de personas en cerca de 8 millones de grupos� 7 millones de moderadores� 4 mil millones de videos musicales descargados en el 2005

� 20 Pb de datos almacenados (20M Gb) – Biblioteca del Congreso de EEUU cada día (28M libros, 20TB)

� 12 Tb de datos generados cada día� 7 mil millones de canciones evaluadas (ratings)� 2 mil millones de fotos almacenadas � 2 mil millones de correos y mensajes enviados por día

Page 4: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

4

Media Social

9

Yahoo! Research

Nuevas Tendencias

Page 5: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

5

10

Yahoo! Research

La Web: Un Juego en Tres Actos

“Nuestra Web”

“Mi” Web

“La” WebPublicoPublico

PersonalPersonal

SocialSocial

11

Yahoo! Research

Web 2.0: Ingredientes

Reviews

RSS

PhotosVideo

Blogs

Bookmarks

Playlists

Audio

Podcasts

IM

TagsVoIP

APIs

Groups

Page 6: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

6

12

Yahoo! Research

Algunas Redes Sociales

� Blogs– Discusiones colaborativas dirigidas en tópicos específicos

� Instant messenger– Lista de amigos

� Yahoo! Groups– Temas enfocados a comunidades

� Friendster, Orkut, 360º, MyWeb 2.0– Redes de amigos

� Del.icio.us– Favoritos (bookmarking) colaborativos

� Flickr, You Tube– Compartir y etiquetar fotos o videos

� Yahoo! Answers– Personas respondiendo a personas

13

Yahoo! Research

¿Por qué las personas se conectan a Internet?

� Para estar comunicadas

� Para estar informadas

� Para entretenerse

� Cada vez más… para ser parte de nuevas formas de participacion, perteneciendo y compartiendo

� Para ser parte de la Web 2.0 – También llamada redes sociales o “social media”

Page 7: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

7

14

Yahoo! Research

“One-way” ContentFilm Clips

CompetitionCritics

Picture Gallery

Community Content

User’s photos

User’s reviews

User knowledge

15

Yahoo! Research

Page 8: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

8

16

Yahoo! Research

UGC (Contenido Generado por el Usuario)

Types of ContentHa experimentado UGC?

Una o más alternativasNo

Tipos de Contenido

Si

ComoCreador

ComoConsumidor

Fotos,Imágenes

Texto

Videos

Música

Animaciones, Flash

Otros

Fuente: National Internet Development Agency Report en Junio, 2006 (Corea del Sur)

17

Yahoo! Research

Using a system of user-assigned ratings, LAUNCHcast builds up a profile of preferences for each individual..

The more ratings users make, the more intelligent the radio becomes. We have over 7 billion ratings

LAUNCHcast = music that listens to you

Users can then share their custom radio station with friends through Yahoo! Messengertaking all the hassle out of discovering new music

Actos simples crean valores y oportunidades

Page 9: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

9

18

Yahoo! Research

Dinámica de la Comunidad

1 creador

10 sintetizadores

100 consumidores

Los nuevos productos difuminan las distinciones entre creadores, sintetizadores y consumidores.

Ejemplo: LaunchcastTodo acto de consumo, es un acto implícito de producción

que no requiere un esfuerzo incremental….Escuchar música crea una estación de radio…

19

Yahoo! Research

Geografía: LJ bloggers en EEUU (2004)

< 1K< 5K< 10K< 25K< 50K~ 100K

Fuente: R. Kumar, D. Liben-Nowell, J. Novak, P. Raghavan, and A. Tomkins.Geographic routing in social networks.In Proceedings of the National Academy of Science 102(33):11623-11628 (2005).

Page 10: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

10

20

Yahoo! Research

LJ bloggers en el mundo (2004)

< 1K< 2K< 5K~ 25K~ 50K~ 75K

21

Yahoo! Research

¿Quiénes son ellos?Edad % Intereses representativos

Page 11: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

11

22

Yahoo! Research

¿Qué hace Flickr especial?

1. Contenidos generados por los usuariosContenidos no licenciados de proveedores tales como Corbis o Getty, al contrario son contribuidos por usuarios.

2. Contenido organizado por los usuariosContenidos son etiquetados, describidos, organizados, descubiertos, etc. no por “editores” si no por los mismos usuarios.

3. Contenido Distribuido por los usuariosFlickr hace la distribución por internet, no a tráves de acuerdos comerciales.

4. Funcionalidad Desarrollada por usuarios

Los APIs disponibles de Flickr (PHP, Perl, etc.) permiten que la comunidad de desarrolladores construyan sobre la plataforma de Flickr.

Un ecosistema entero creado con menos de 10 persona s…auxiliado por millones en la comunidad de Flickr

23

Yahoo! Research

Disgresión: Visión por Computador es Difícil

Page 12: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

12

24

Yahoo! Research

Page 13: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

13

Page 14: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

14

28

Yahoo! Research

29

Yahoo! Research

Progreso Social

� Millones de usuarios de Flickr comparten y comentan en las fotografías de unos y otros (¿por que?)

� Blogs (Fernando Flores) – Mirar hacia el futuro

– Advertencia

– Conmoción

– Institución

� Individual o colaborativamente– Periódico de la Comunidad: www.elmorrocotudo.cl

� Ley de Zipf está en todas partes– Pocos tienen mucho y muchos tienen poco

Page 15: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

15

Búsqueda Social

31

Yahoo! Research

El Desafío del Conocimiento

Desafío � Habilitar a los usuarios para compartir sabiduría con su comunidad para

crear una mejor experiencia de búsqueda.

Número de Resultados

Vacaciones Chile 1.080.000

“Todo lo que Valeria sabe sobre Chile” 0

Ejemplo:Pregunta: Vacaciones Chile

Pregunta: “Todo lo que Valeria sabe sobre Chile”

Page 16: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

16

32

Yahoo! Research

Preguntas Subjetivas

Los tipos de preguntas que dependen de la experiencia…

� “¿Ud. conoce un buen gasfiter en Santiago?”� “¿Dónde encuentro un buen pub en Temuco?”� “¿Qué blogs políticos cree que yo disfrutaría leyendo?”� “¿Dónde puedo comprar un par de zapatos bonitos?”

Este tipo de preguntas son mal contestadas por los buscadores de hoy, pero irónicamente son las más valiosas (i.e. generan transacciones comerciales)

¿Cómo podemos capturar la experiencia de la gente?

33

Yahoo! Research

Un Ejercicio sobre Conocimiento…

�10 páginas por tema o evento (fotos/textos/blogs/ranking/podcasts)

�5.000 temas por persona durante su vida

�50.000 páginas por persona

�2.000.000.000 de internautas en el planeta

�100 billones de páginas

�20 mil millones de páginas indexadas/100 billones de paginas = 0.02% del conocimiento del mundo.

Page 17: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

17

34

Yahoo! Research

La Oportunidad del Cambio…

Enlaces

Webmasters

Texto

Ingenierosy Científicos

Los primeros navegadoresTecnologías Habilitantes

Incentivos CorrectosMasa Crítica

Miles de Grupos de Noticias

Millones de Sitios Web

Billonesde artefactos del

conocimiento

Usenet / Newsgroups

Google / Inktomi

Y! Answers /Flickr

Y! Directorio / Altavista

Cientos de Milliones de Páginas Web

Algoritmos de EnlacesEscala de Infraestructura

Fuente

Tecnología

Magnitud

Producto

UGC

Comunidad

35

Yahoo! Research

Busqueda Social Enriquecida: Yahoo! Answers

� Democratizar el proceso de “votar”(tanto explícito como implícito)

� Salir de la mira de webmasters y devolver el control de los usuarios

� Permitir asignamiento dinámico a autoridades varias de confianza, nuevo grado de libertad

“Una Mejor Búsqueda a Traves de la Gente”

Page 18: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

18

36

Yahoo! Research

37

Yahoo! Research

Visualizando Nubes de Tags en Flickr

Page 19: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

19

38

Yahoo! Research

Desafíos en Búsqueda Social

�¿Cómo usamos UGC para una mejor búsqueda?�¿Cuáles son los “ratings” y el sistema de reputacion?�¿Cómo hacemos frente al spam de Web?�¿Cuáles son los mecanismos de incentivos?

�El Gran Desafio: ¿Dónde más se puede aprovechar el poder de la gente?

Yahoo! Investigación

Page 20: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

20

40

Yahoo! Research

Agenda

� European search vision

� Knowledge - the next challenge

� People power

� Making knowledge pay

Leader board

Poorly formed questions

41

Yahoo! Research

No definitiveanswer

Unverifiableanswer

Community consensus

Page 21: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

21

42

Yahoo! Research

¿Cuáles son los Problemas?

�¿Qué preguntas son legítimas?

�¿Cuál es el sistema incentivo?

�¿Como validamos las respuestas?

�¿Cuál es el rol de la comunidad?

�¿Cuál es el sistema de reputacion?

43

Yahoo! Research

Incentives

Legitimate?

Page 22: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

22

44

Yahoo! Research

Community validation

Validation

45

Yahoo! Research

¿Cuáles son los Desafíos?

� Comunidad de Usuarios

– Sistema Social

� Incentivos y Reputación

– Sistema Económico

� Expresión pobre, preguntas “gramaticamente” limitada s

– Analisis del Lenguaje

� Mejorando la experiencia del usuario en base a dato s recopilados

– Extracción de Información, minería de datos

Page 23: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

23

46

Yahoo! Research

¿Cuales son Las Ciencias?

�Recuperación de Información & Procesamiento de Lenguaje Natural

�Microeconomía en Internet

�Minería de Datos y Extracción de Información

�Sociología e Interacción Humano-Computador

�Sistemas de Comunidades Digitales

47

Yahoo! Research

Misión de Yahoo! Investigación

Visión:Ser el lugar que invente el futuro de Internet

Vista de la comunidad del laboratorio de

Barcelona

Page 24: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

24

La Sabiduría de la Gente

49

Yahoo! Research

� La Sabiduría de la Gente- James Surowiecki - 2004

– “Dadas las circunstancias correctas, los grupos son notablemente inteligentes”

• Importancia de la diversidad, independencia y descentralización

– “Grandes grupos de gente son más listos que unos pocos expertos, sin importar que tan brillantes son — ellos son mejores resolviendo problemas, fomentando innovación, llegando a buenas soluciones, e incluso prediciendo el futuro”.

• ¿Como desplegar esto en el proxima generación de búsqueda social y servicios de la Web?

La Minería de Datos de la Web

Page 25: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

25

50

Yahoo! Research

Texto Ancla (“anchor text”)

� La sabiduría de la gente puede ser usada para buscar

� El principio no es nuevo – el texto ancla es usado en

una búsqueda estándar: un enlace a un documento D,

incluye un texto anchor que se asocia a D

www.ibm.com

Armonk, NY-based computer

giant IBM announced today

Joe’s computer hardware links

Compaq HP IBM

Big Bluetoday announced

record profits for the quarter

51

Yahoo! Research

The Wisdom of Crowds

� Crucial para el “ranking” de búsqueda

� Contenido de Texto: Escritores de la Web

– ¡No sólo para la Web!

� Enlaces: Editores de la Web (webmasters)

� Anotaciones: Usuarios de Web 2.0

– Etiquetas (tags), favoritos, comentarios, ratings, etc.

� Preguntas: ¡Todos los que usan la Web!

– Consultas y las acciones (“clicks”) en las respuestas

Page 26: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

26

52

Yahoo! Research

La Intención de las Preguntas (Broder, 2000)

•~40% Navegacional

•~35% Transaccional

~25% Informacional

53

Yahoo! Research

Page 27: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

27

54

Yahoo! Research

55

Yahoo! Research

Page 28: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

28

56

Yahoo! Research

Home page

Hub page

Page with resources

Levinson and Rose, 2004

Yahoo! Research

Ejemplo de Minería de Consultas

Page 29: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

29

Yahoo! Research

Folksonomía Implícita

Yahoo! Research

Conocimiento Implícito

Page 30: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

30

61

Yahoo! Research

Minería de Consultas para ...

� Mejorar la búsqueda en la Web

� Ranking

� Recomendaciones de Preguntas

� Diseño dirigido por los usuarios

– Esencia de la Información

– El sitio Web que los usuarios quieren

– El sitio Web que tu deberías tener

– Mejorar el contenido y la estructura

� Generación de recursos pseudo-semánticos

Epílogo

Page 31: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

31

63

Yahoo! Research

El Futuro

�La Web es científicamente joven.

�Es intelectualmente diversa

– El Elemento Humano

– El Elemento Social

�La tecnología refleja la economía y la

sociedad en general

64

Yahoo! Research

Reflejo de la Sociedad

Page 32: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

32

65

Yahoo! Research

Exportaciones/Importaciones vs. Enlaces a Países

Baeza-Yates & Castillo, WWW2006

66

Yahoo! ResearchDe buscar información a proveer información a “Mi Mundo”… .

Page 33: La Persona La Web 2.0: como Contenido · La Web 2.0: Ricardo Baeza-Yates Director, Web Mining Research Yahoo! Research Barcelona, Spain & Santiago, Chile La Persona como Contenido

33

67

Yahoo! Research¿Futuro? Cuarta Generación:

De recuperación de información a provisión de información

Demanda explícita por información generada por la pregunta del usuario

Incrementar el uso del contexto

Provisión de información generada por la actividad y contexto del usuario

68

Yahoo! Research

¿Web 3.0?

� Ahora estamos en la Web 2.0 beta

� La gente quiere realizar tareas/trabajos completos

– ¿Dónde voy de vacaciones con 200.000$?

� Tomar en cuenta el contexto de la tarea

Quiero reservar vacaciones en Toscana.Inicio Meta