Máquinas de busca

Post on 18-Jun-2015

73 views 1 download

Transcript of Máquinas de busca

Nome: Camila Morgado Fernanda Zanon

Rodrigo Pereira

Introdução Histórico Tipos de buscador Funcionamento

Coleta e Armazenamento Indexação Processamento de consulta

Otimização para mecanismos de busca Bibliografia

O que é uma máquina de busca?

Feito para auxiliar a procura de informaçõesRede mundial

Rede corporativa

Computador pessoal

Recuperação de Informação (RI)

Recupera informação que possa ser útil ou relevante

Palavras-chave

Grau de relevância

Criadas logo após o surgimento da internet.

Necessidade de buscar informações.

Apresentar resultados de maneira rápida e eficiente.

Os primeiros motores de busca

Archie: buscava dados em sites ftp.

Gopher: buscava arquivos de texto.

Veronica e Jughead utilizavam os arquivos armazenados nos servidores Gopher.

Os primeiros web crowler

Wandex Aliweb

Buscadores TípicosAltavista: primeiro a

oferecer pesquisa de imagem, vídeo e áudio.

Yahoo: utilizava indexação por categorização.

Google: utiliza tecnologias diversas.

Buscadores GlobaisPesquisam todos os documentos da rede

Buscadores VerticaisRealizam buscas especializadas em uma base

de dados própria.

Guias LocaisBuscadores locais ou regionais, referentes a

endereços de empresas ou serviços.

Guias de Busca LocalBuscadores de abrangência nacional, listam

empresas e prestadores de serviços próximos.

Diretórios de WebsitesÍndices de sites, localizam sites por categoria.

Coleta e Armazenamento de documentosVarre e guarda informações

IndexaçãoArmazena informações num índice invertido

Processamento de consultaVarre o índice invertido de termos

Aplicativos para descobrir novas páginas:Crawlers

Bots

Robots

Spiders

Robots.txtFormato do arquivo: nome e arquivos bloqueados

O arquivo abaixo permite acesso total a todos os bots:User-agent: *Disallow:

O arquivo abaixo nega acesso de todos os bots a todos os arquivos:User-agent: *Disallow: /

O arquivo abaixo nega acesso do googlebot ao sub-diretório /brasil:User-agent: *Disallow: /brasil/

O processo de coleta é dividido em:

Coletor Extrai links

Servidor de Armazenamento Extrai textos

Servidor de Nomes Controla requisições

Escalonador Coordena ação dos coletores

Escalonamento: função crítica

Técnicas para tentar pegar as melhores páginas:Em profundidadeEm largura com sufixo de URLBaseada em Ranking de URLBaseada em conectividade

Varre coleção de documentos

“Indexa“ palavras e suas ocorrências

Armazena as informações em índice invertidoExemplo: Palavras: Lista de ocorrências da palavra: casa-> (B, 3)(C, 12) carro-> (A, 10)(B, 6)(C, 12) blog-> (A, 3)

Granularidade

Stopwords

Stemming de palavras

Relação entre palavras

Calcula relevância de cada palavra consultada

Medidas TF – IDF

O que é?Proposta de melhora do ranking da página nos

principais motores de busca(Google, Yahoo, Bing, etc).

Essencial participação e conhecimento do cliente sobre o seu produto.

O retorno de um projeto de SEO deve ser esperado para o médio/longo-prazo.

Como se faz?Técnica de preparação de sites e páginas web

para alcançar bons posicionamentos nas SERPsHierarquia de necessidadesAnálise competitivaCombinação de chaves

Análise InicialAnálise completa do tráfego e código do site atual

Observação da posição do site no SERP(resultado nas páginas de busca)

Análise do serviços de SEO’s anteriores

Desenvolvimento da “lista negra do fracasso” do site nos mecanismos de busca

Pesquisa e análise de chavesLista de palavras-chaves determinantes para o

negócio.

Ferramentas de medição de audiência das palavras-chave.

Elaboração da exposição e abordagem da página de busca no site

Análise CompetitivaQuem são os concorrentes?

Quais os seus pontos fortes e fracos?

Análise dos websites e campanhas online dos concorrentes.

Mapeamento do siteAnálise dos pontos fracos da empresa em:

Usabilidade

Acesso

Design

Resoluções

Multibrowser

Cuidados no modelo otimizado do siteRepetição das palavras-chaves(palavras-chaves

negativas)Excesso de palavras-chaves distintasNão utilizar as meta-tags

ResultadosDistribuição das palavras-chaves através do

título, meta-descrição , meta-tags

Submissão das url’s para os principais motores de busca

Análise dos resultados da submissão

Benefícios:40% dos usuários se baseiam em mecanismo

de busca no processo de decisão da compra93% dos usuários sequer passa da primeira

página de busca retornada.72% dos usuários só consideram relevantes

informações de empresas onde podem encontrar o que precisam facilmente.

Benefícios:68% dos usuários somente consideram os

resultados orgânicos como relevantes.

http://www.bruceclay.com/web_rank.htm http://pt.wikipedia.org/wiki/Motor_de_busca http://www.blogdohummel.com/2007/10/como-funciona-uma-mquina

-de-busca.html http://googlediscovery.com/2007/11/16/o-futuro-das-maquinas-de-

busca/ http://www.sites-de-busca.com/basico/ http://www.mediaboon.com/pt/o-que-fazemos/outros/otimizacao-

para-maquinas-de-busca.html http://www.brandup.com.br/otimizacao-de-sites-seo http://www.pensedynamo.com/tipos-servicos-seo.htm http://www.artigonal.com/seo-e-sem-artigos/como-funciona-o-

trabalho-inicial-de-seo-2054231.html http://www.dzoe.com.br/servicos/otimizacao-de-sites-para-

buscadores-seo/ http://www.mestreseo.com.br/