Buscadores web

24
BUSCADORES WEB

Transcript of Buscadores web

Page 1: Buscadores web

BUSCADORES WEB

Page 2: Buscadores web

ÍNDICE (I) Qué es un Buscador Web. Cómo funciona. Parámetros de calidad. Spam en buscadores. Lingüística y buscadores. Retos y futuro. Números de un buscador web. Modelos de negocio.

Page 3: Buscadores web

ÍNDICE (YII) SEO y buscadores web. La web y los buscadores. Buscadores y el español. Para el debate...

Page 4: Buscadores web

QUÉ ES UN BUSCADOR WEB Es un sistema informático concebido para la localización inmediata de información en la web.

Page 5: Buscadores web

CÓMO FUNCIONA UN BUSCADOR WEB Todo gira alrededor del índice: una estructura de datos que almacena referencias sobre la presencia de la información en la web.

Los principales procesos que lleva a cabo un buscador web son: Rastreo. Indexación. Búsqueda.

Los rastreos e indexaciones actualizan el índice y las búsquedas lo consultan para responder a los usuarios.

Page 6: Buscadores web

CALIDAD EN BUSCADORES WEB Como sistema de recuperación de información la calidad en los resultados de puede medir en términos de precisión y cobertura.

Limitaciones: La relevancia es personal. La web no se ha medido.

Aparte de la recuperación, la calidad también depende del índice: Volumen, frescura y relevancia.

Prácticas no éticas: Spam.

Page 7: Buscadores web

SPAM EN BUSCADORES WEB Por el volumen de tráfico que manejan, existe un claro interés por ocupar las primeras posiciones en las páginas de resultados en los buscadores.

Para que un algoritmo de cálculo de relevancia sea aplicable, debe ser no spammeable.

El spam se traduce en un encarecimiento del coste unitario de la búsqueda.

Tipos de spam: De contenido Link spam

Page 8: Buscadores web

LINGÜÍSTICA Y BUSCADORES (I)

Una de las principales limitaciones de la tecnología de búsqueda actual es que es literal. Las ambigüedades lingüísticas no se resuelven.

Del matching literal al matching semántico: Conocimiento superior. Reduce el gap en la interfaz hombre-máquina. Enriquecimiento de la presentación. De ayuda al spam.

¿Por qué no se usan?

Page 9: Buscadores web

LINGÜÍSTICA Y BUSCADORES (YII) Problemas para su aplicación: Volumen de información. Heterogeneidad de la información. Proyección sobre la interfaz. El coste computacional de las técnicas.

Infocious es una implementación.

Page 10: Buscadores web

FUTURO DE LOS BUSCADORES WEB Se trata de una tecnología con poco más de 10 años. Gran futuro por delante.

Futuro: Personalización. Búsqueda semántica. Web 2.0 y redes sociales. Integración con el escritorio. Multimedia.

Page 11: Buscadores web

NÚMEROS DE UN BUSCADOR WEB (I) 25.000 millones de páginas estáticas en la web. 10KB/pag (comprimido) [cache + índice]. 250 máquinas rastreadoras, a 100 páginas por segundo... 1.000.000 seg (11,6 días).

Nº Págs 25.000 mill

Volumen 500TB

Rastreo 25.000 pág/s

Búsquedas 3.000 bús/s

Page 12: Buscadores web

NÚMEROS DE UN BUSCADOR WEB (YII)

Cluster de pequeñas computadoras sin redundancia. Sistema operativo basado en Linux. Módulos de balanceo y tolerancia a fallos. Impresionante potencia computacional de bajo coste.

Cluster 100.000 PC’s

Coste hw. 50M€

Coste eléc. 80M€

Coste Adm. -

Coste sw. -

• 500€/PC, 300W/PC, Coste hw a 3 años• Coste eléc. a 3 años y 0,1€ KWh

Page 13: Buscadores web

MODELO DE NEGOCIO (I)

Un buscador web hace frente a importantes costes. Sin embargo ofrecen el servicio de modo gratuito.

Pago por posicionamiento: Las primeras posiciones en las SERP’s obtienen mucho más tráfico

(62% hace clic en la primera posición). El pago no necesariamente se corresponde con una alta relevancia. Fue el primer modelo, creado por GoTo.com (Overture).

Page 14: Buscadores web

MODELO DE NEGOCIO (YII) Publicidad contextual: Las SERP’s son un escaparate muy concurrido. La publicidad depende de la búsqueda: es relevante y útil al

usuario. La publicidad está diferenciada de los resultados: no compromete

la relevancia.

Problema: click fraud Troyanos de generación automática de clics. Empresas en países de mano de obra barata.

Page 15: Buscadores web

SEO Y BUSCADORES WEB Los sites en la web viven de su tráfico. Y éste llega a ellos fundamentalmente desde los buscadores.

A menudo los sites están construidos con barreras que dificultan e imposibilitan el trabajo de los buscadores.

Search Engine Optimization (SEO). Crear servicios y contenidos para humanos teniendo en cuenta a los buscadores.

Search Engine Friendly.

Page 16: Buscadores web

LA WEB Y LOS BUSCADORES (I) Internet es el segundo medio por tiempo de consumo en los países desarrollados (por detrás de la TV).

Refleja lo que sucede en la sociedad.

Page 17: Buscadores web

LA WEB Y LOS BUSCADORES (II) Los buscadores son los puntos de partida en la web [Informacional (40%), Navigacional (25%), Transaccional (35%)].

Los buscadores son los responsables de poner en contacto contenidos y servicios con su audiencia.

De la efectividad de tal proceso depende el desarrollo mismo de la web. El desarrollo y crecimiento de la web ha ido de la mano del desarrollo de los buscadores.

Page 18: Buscadores web

LA WEB Y LOS BUSCADORES (YIII) Los buscadores son una sonda de extraordinario valor para saber: Qué demanda el internauta. Cómo lo demanda. Cuándo lo demanda. Desde dónde.

Los buscadores... Canalizan el tráfico de la web. Conocen las necesidades de dicho tráfico.

Page 19: Buscadores web

BUSCADORES WEB Y EL ESPAÑOL (I) La web, como medio de masas refleja lo que sucede en la sociedad.

Page 20: Buscadores web

BUSCADORES WEB Y EL ESPAÑOL (II) ¿Cuál es la presencia de contenidos en español en los buscadores?

Experimentos. Inglés vs Español en Google: La palabra más frecuente. La palabra a. Las 5 más frecuentes. La búsqueda * *. La búsqueda –afalsdejenfinu.

Page 21: Buscadores web

BUSCADORES WEB Y EL ESPAÑOL (YIII)

Validez orientativa: órdenes de magnitud.

Basado en las estimaciones de números de resultados.

Los datos se refieren únicamente al índice de Google.

Page 22: Buscadores web

PARA EL DEBATE... (I) ¿Por qué hay tal diferencia en la densidad de resultados español / inglés ? ¿Web en inglés más desarrollada y antigua? ¿Mayor madurez tecnológica? ¿Inglés idioma universal? ¿Tratamiento diferenciado por idiomas por diferente mercado

publicitario?

Si la web ha crecido de la mano de los buscadores ¿habría que crear buscadores para desarrollar la web en español?

Page 23: Buscadores web

PARA EL DEBATE... (YII) ¿Qué efectos tiene la concentración de las búsquedas web en 3 o 4 proveedores tan sólo?

Con los intereses económicos patentes, ¿hasta qué punto se puede creer en la objetividad de la información proporcionada por los buscadores web?

¿Cuál es el poder real que tienen los buscadores web y cuáles son las “manos” que los gobiernan?

¿Deberían existir iniciativas estatales de desarrollo de buscadores web como parte de los planes de desarrollo de la sociedad de la información?

Page 24: Buscadores web

¡MUCHAS GRACIAS!