Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com.

Post on 17-Apr-2015

102 views 0 download

Transcript of Arquitetura de Máquinas de Busca Prof. Marcus Silva drakhos@gmail.com.

Arquitetura de Máquinas de Busca

Prof. Marcus Silvadrakhos@gmail.com

O que é Máquina de Busca?

Máquina de Busca

“Um motor de busca, motor de pesquisa ou máquina de busca é um sistema de software projetado para encontrar informações armazenadas em um sistema computacional a partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para encontrar informações”.

http://pt.wikipedia.org/wiki/Motor_de_busca

Como funciona uma Máquina de Busca?

Arquitetura da Máquina de Busca

Histórico,

ou como eu gosto de pensar: “a vida antes do Google!”

Histórico

A primeira ferramenta utilizada para busca na Internet foi o Archie (da palavra em Inglês, "archive" sem a letra "v"). Foi criado em 1990 por Alan Emtage, um estudante da McGill University em Montreal. O programa baixava as listas de diretório de todos arquivos localizados em sites públicos de FTP (File Transfer Protocol) anônimos, criando uma base de dados que permitia busca por nome de arquivos.

Histórico

Enquanto o Archie indexava arquivos de computador, o Gopher indexava documentos de texto. Ele foi criado em 1991, por Mark McCahill da University of Minnesota.

Histórico Desde então, as buscas evoluíram e em 1993, Matthew Gray, criou Wandex, o primeiro sistema de busca que indexava e também buscava no índice da web pages. Coletava e armazenava em um banco de dados, bem como utilizava uma interface de pesquisa.

Histórico

Em 1993, Martijn Koster criava Aliweb (Archie-Like Indexing Web). Aliweb permitiu que os usuários enviassem suas próprias páginas a serem indexadas.

Excite foi introduzido em 1993 por seis estudantes da Universidade de Stanford. Usou-se análise estatística de relações de palavra para auxiliar no processo de busca.

Histórico

EINet Galaxy (Galáxia) foi criada em 1994 como parte do Consórcio de Pesquisa MCC na Universidade do Texas, em Austin.

Yahoo foi fundado por David Filo e Jerry Yang, formandos da Universidade de Stanford em janeiro de 1994 e incorporado no dia 2 de março de 1995.

Histórico

Brian Pinkerton, da Universidade de Washington lançou WebCrawler em 20 de Abril de 1994. Ele foi o primeiro rastreador que indexava páginas inteiras. Foi o primeiro motor de pesquisa de texto completo na Internet, todo o texto de cada página foi indexada pela primeira vez.

Histórico

Lycos foi contruido na Carnegie Mellon University em torno de Julho de 1994. Michael Mauldin era responsável por este site de busca e continua a ser o cientista chefe no Lycos Inc.

Histórico

O site de busca Infoseek entrou em operação em 1995. Ele realmente não traz nada de novo à cena do motor de busca. É agora propriedade da Walt Disney Internet Group e o domínio encaminha para Go.com.

Histórico

Alta Vista também começou em 1995. Foi o primeiro motor de pesquisa que usava linguagem natural e avançadas técnicas de busca. Ela também fornece uma pesquisa de multimídia para fotos, músicas e vídeos.

Histórico

Looksmart foi fundada em 1995. Esse site de busca competiu com o site de busca do Yahoo!.

A corporação Inktomi surgiu em 20 de Maio de 1996 com o seu motor de busca Hotbot.

O que nos leva ao...

Histórico

Google foi lançada em 1997 por Sergey Brin e Larry Page, como parte de um projeto de pesquisa na Universidade de Stanford. Ele usa as ligações de entrada para classificar sites. Atualmente, o Google hospeda e desenvolve uma série de serviços e produtos baseados na internet e gera lucro principalmente através da publicidade pelo AdWords.

E mais recentemente...

Histórico

Bing é o nome do novo buscador da internet lançado pela Microsoft em 28 de maio de 2009, na feira de tecnologia All Things Digital. Ao contrário do Google, o novo buscador não mostra os resultados de acordo com sua popularidade, mas organiza os links de acordo com a relevância.

Quais são os Tipos de Máquinas de Busca?

Buscadores Globais

São buscadores que pesquisam todos os documentos na rede e a apresentação do resultado de acordo com o seu algoritmo de relevância.

Buscadores Verticais São buscadores que realizam pesquisas "especializadas" em bases de dados próprias de acordo com suas propensões.

Guias Locais São buscadores exclusivamente locais ou regionais. As informações se referem a endereços de empresas ou prestadores de serviços.

Por que isso é importante?

Google books

Google Earth

É importante agora?