Smart Search de Busca

12
Todo o conteúdo deste material é de propriedade intelectual da Tarkena. Esta apresentação é para uso exclusivo da Web Sites Factory. Nenhuma de suas partes pode ser veiculada, transcrita ou reproduzida para distribuição para terceiros fora da organização da Web Sites Factory, sem prévio consentimento por escrito da Tarkena.

Transcript of Smart Search de Busca

Page 1: Smart Search de Busca

Todo o conteúdo deste material é de propriedade intelectual da Tarkena. Esta apresentação é para uso exclusivo da Web Sites Factory. Nenhuma de suas partes pode ser veiculada, transcrita ou reproduzida para distribuição para terceiros fora da organização

da Web Sites Factory, sem prévio consentimento por escrito da Tarkena.

Page 2: Smart Search de Busca

Sistema Tarkena Busca

Page 3: Smart Search de Busca

Tarkena Busca

• Sistema de busca de expressões para bancos de dados– ex.: busca de ( títulos | autores | editoras ) para livros– ex.: busca de ( títulos | gênero | diretor | tags ) para filmes

• Baseada em algoritmos utilizados com sucesso documentado em tarefas complexas e de grande volume

– ex.: censo EUA

• Adaptado à grafia e à fonética do Português do Brasil

• Implementação no próprio banco de dados– a busca é uma simples função de banco de dados que retorna os resultados– facilidade de implantação e integração com os demais sistemas– tira proveito de todas as tecnologias de alto desempenho disponíveis para os

principais bancos de dados (SQL Server, Oracle, etc.)

• Alta performance e alta escalabilidade

Page 4: Smart Search de Busca

Tarkena Busca: Características Principais

Page 5: Smart Search de Busca

Relevância

• O sistema Tarkena Busca foi especialmente concebido para trazer resultados de máxima relevância entre o texto buscado e as entradas do banco de dados

• Resultados contendo termos não encontrados na expressão de busca são cuidadosamente analisados

• Exemplo: busca pela expressão “Redes Neurais” numa base de títulos de livros

– matching perfeito: Redes Neurais– alta relevância: Teoria de Redes Neurais– baixa relevância: Redes Neurais Artificiais Aplicadas à Hidrologia

– os termos “Teoria de” são menos específicos que “Artificiais” e “Hidrologia”

• As regras de relevância podem ser combinadas com as regras de negócios, trazendo resultados que consideram os 2 critérios

Page 6: Smart Search de Busca

Robustez

• Robustez = tolerância a erros na expressão de busca

• Tipos de erros frequentes– erros de grafia: “Harry Potter” x “Harry Poter”– erros fonéticos: “Barcelona” x “Barselona”– inversão de caracteres: “Neurais” x “Neuasi”– inversão de termos: “Teoria e Aplicações” x “Aplicações e Teoria”

• O sistema Tarkena Busca foi projetado para tratar todos estes tipos de erros

– algoritmos sofisticados de cálculo de distância entre termos– algoritmos especialmente concebidos para indexação fonética dos termos e

adaptados para o Português do Brasil– tolerância à inversão de termos

Page 7: Smart Search de Busca

Capacidade

• Capacidade = número de termos efetivamente utilizados da expressão de busca fornecida

• Baixa capacidade– 3 ~ 5 termos, problemas para encontrar expressões longas (ex.: resenhas,

parágrafos completos)

• Alta capacidade– ~ 50 termos (Google), grande capacidade para encontrar expressões longas

• Sistemas de alta capacidade devem selecionar os termos mais importantes dentro da expressão de busca

• O sistema Tarkena Busca permite adaptar a capacidade ao hardware disponível

– 15 termos de busca já disponíveis em hardware “low end” (notebook comum)

Page 8: Smart Search de Busca

Performance

• Algoritmos de busca com relevância, robustez e alta capacidade são computacionalmente mais custosos do que algoritmos simples

– a duração do processo de busca deve ser imperceptível ao usuário final

• Abordagens simples podem levar a resultados insatisfatórios– “nenhum produto encontrado” “busca avançada”– excesso de falsos positivos

• Abordagens complexas podem ter problemas de performance– resultados relevantes, mas num tempo inaceitável– problema mais grave quanto maior o tamanho da base a ser buscada– necessidade de investimentos gigantescos em hardware para compensar

• O sistema Tarkena Busca oferece performance e escalabilidade– tempo de 300 ms sobre base de 3.300.000 de expressões já disponível em

hardware “low end”– permite ampliar a complexidade das buscas conforme hardware disponível

Page 9: Smart Search de Busca

Regras de Negócios

• O sistema Tarkena Busca permite a incorporação de regras de negócio aos mecanismos de busca

• Ex. 1: produtos de determinados fornecedores devem ter preferência sobre os demais, sem abrir mão da relevância

• Ex. 2: produtos de maior margem devem ser trazidos mais próximos ao topo da lista

• Ex. 3: lançamentos devem ser trazidos antes de coleções antigas

Page 10: Smart Search de Busca

Test Drive gratuito sem compromisso

Page 11: Smart Search de Busca

Test Drive gratuito e sem compromisso

• A Tarkena oferece a possibilidade de avaliação do sistema com dados reais do cliente

• O cliente deve fornecer– arquivo (.txt) contendo somente nomes dos produtos em catálogo

• A Tarkena irá– construir uma base de testes com os nomes fornecidos– fazer uma demonstração in loco, permitindo a comparação com a solução de

busca atual do cliente

• Confidencialidade– um termo de confidencialidade com esta finalidade específica é firmado– os dados não serão fornecidos a terceiros sob qualquer hipótese– todos os dados fornecidos serão destruídos após a demonstração

• Gratuito, sem compromisso e rápido (apenas 2 dias)

Page 12: Smart Search de Busca

Contatos

Empresa Credenciada para Comercialização: Web Sites Factory

Rubens Neistein ([email protected])

Tel: 011-3361-2270