taxanomia

8
©TerraForum Consultores 1 Os portais de informação empresarial assumem importância cada vez maior para os negócios, traduzindo todo o manancial de conteúdo informacional proveniente das mais variadas fontes da empresa em informação útil para a tomada de decisões nos três níveis: estratégico, tático e operacional. ! " ! " ! " ! " #" " " " #$#% & #$#% & #$#% & #$#% & INTRODUÇÃO Quantas organizações falam de core competenciessem compreender que as competências essenciais das mesmas são baseadas em conjuntos de informações e conhecimentos que precisam ser criados, organizados, atualizados e disseminados de maneira sistemática. É no contexto da discussão de “core competencies” que iremos tratar do tema taxonomia. Taxonomia não é um termo muito comum no dia-a-dia do mundo dos negócios. De fato, taxonomia soa como algo restrito, capaz de despertar interesse apenas em cientistas ou bibliotecários. No entanto, vamos argumentar neste artigo que taxonomias são elementos estruturantes, estratégicos e centrais para negócios baseados em informação e conhecimento. A taxonomia é um sistema para classificar e facilitar o acesso à informação, e que tem como objetivos: representar conceitos através de termos; agilizar a comunicação entre especialistas e entre especialistas e outros públicos; encontrar o consenso; propor formas de controle da diversidade de significação; e oferecer um mapa de área que servirá como guia em processos de conhecimento. É portanto, um vocabulário controlado de uma determinada área do conhecimento, e acima de tudo um instrumento ou elemento de estrutura que permite alocar, recuperar e comunicar informações dentro de um sistema, de maneira lógica. Embora recentemente tenha ganho muita importância no mundo dos negócios, a disciplina da taxonomia não é nova. Ela sempre esteve presente, por exemplo, na biblioteconomia e no universo científico. O exemplo clássico é a Classificação dos Seres Vivos, de 1735, fruto do trabalho do botânico sueco Karl von Linné. Em sua taxonomia, o cientista dividiu os seres vivos em grupos, de acordo com suas características em comum, obedecendo a uma ordem hierárquica. Um exemplo bastante simplificado do que seria uma estrutura taxonômica vem a seguir:

description

asdfasdfas

Transcript of taxanomia

Page 1: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 1

������ ����������������������������������������� ����������������������������������������� ����������������������������������������� ������������������������������������������ ����������� ����������� ����������� ���������Os portais de informação empresarial assumem importância cada vez maior para os negócios, traduzindo todo o manancial de conteúdo informacional proveniente das mais variadas fontes da empresa em informação útil para a tomada de decisões nos três níveis: estratégico, tático e operacional.

��������� ������������������ ������������������ ������������������ ��������������������� ����� ����� ����� �����! ������"������ ! ������"������ ! ������"������ ! ������"������ ��������####�"�"�"�"������������# ����$��������#��%�&���# ����$��������#��%�&���# ����$��������#��%�&���# ����$��������#��%�&�������

������'�����������'�����������'�����������'�������������

INTRODUÇÃO Quantas organizações falam de “core competencies” sem compreender que as competências essenciais das mesmas são baseadas em conjuntos de informações e conhecimentos que precisam ser criados, organizados, atualizados e disseminados de maneira sistemática. É no contexto da discussão de “core competencies” que iremos tratar do tema taxonomia. Taxonomia não é um termo muito comum no dia-a-dia do mundo dos negócios. De fato, taxonomia soa como algo restrito, capaz de despertar interesse apenas em cientistas ou bibliotecários. No entanto, vamos argumentar neste artigo que taxonomias são elementos estruturantes, estratégicos e centrais para negócios baseados em informação e conhecimento. A taxonomia é um sistema para classificar e facilitar o acesso à informação, e que tem como objetivos: representar conceitos através de termos; agilizar a comunicação entre especialistas e entre especialistas e outros públicos; encontrar o consenso; propor formas

de controle da diversidade de significação; e oferecer um mapa de área que servirá como guia em processos de conhecimento. É portanto, um vocabulário controlado de uma determinada área do conhecimento, e acima de tudo um instrumento ou elemento de estrutura que permite alocar, recuperar e comunicar informações dentro de um sistema, de maneira lógica. Embora recentemente tenha ganho muita importância no mundo dos negócios, a disciplina da taxonomia não é nova. Ela sempre esteve presente, por exemplo, na biblioteconomia e no universo científico. O exemplo clássico é a Classificação dos Seres Vivos, de 1735, fruto do trabalho do botânico sueco Karl von Linné. Em sua taxonomia, o cientista dividiu os seres vivos em grupos, de acordo com suas características em comum, obedecendo a uma ordem hierárquica. Um exemplo bastante simplificado do que seria uma estrutura taxonômica vem a seguir:

�������������� �����

����������������������

� �� �����

Page 2: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 2

O conceito de taxonomia tem se tornado ainda mais importante nos tempos atuais na medida que o volume de informações cresce de forma exponencial e os usuários adquirem um papel essencial tanto na produção, como na categorização e uso de informações. No contexto do mundo de negócios, podemos definir de maneira simplificada que taxonomias são regras de alto nível para organizar e classificar informação e conhecimento. E isto é essencial, pois organizações que não conseguem fazer isto acabam não compreendendo as atividades agregadoras de valor dentro delas mesmas; atividades estas que crescentemente estão baseadas na produção e uso de informação e conhecimento. A importância da taxonomia para informações não estruturadas (Intranets, sites, e-mails, documentos Office, etc) é apontada, por alguns especialistas, como equivalente à importância que os bancos de dados tiveram para as informações tabulares. Sabendo que a maior parte das informações em uma empresa estão sob a forma de textos, vê-se que seu tratamento é um assunto essencial, e que seu uso correto no dia-a-dia deverá favorecer o desempenho de outras atividades corporativas. OBJETIVOS ESPECÍFICOS

As organizações necessitam desenvolver categorias e estruturas de informação que façam sentido para seus próprios negócios e comunidades específicas de usuários que utilizam o sistema. No ambiente web, em particular, as taxonomias servem para simplificar as buscas e a navegação e designar responsabilidades em termos de avaliação, organização, eliminação e arquivamento de informações. O verdadeiro teste de qualquer taxonomia é a eficiência que ela fornece para o grupo de usuários para o qual foi projetada. A seguinte pergunta resume bem essa questão: apoiados pela taxonomia, os usuários são capazes de encontrar informação relevante e significativa de maneira eficiente e em tempo hábil? As boas taxonomias devem facilitar a busca por documentos, permitindo que as pesquisas possam ser conduzidas por diferentes critérios (ex: autor, data, formato de arquivo, domínio de conhecimento, etc.). Não existe, ademais, certo ou errado universal: pessoas diferentes desenvolverão taxonomias diferentes. Conseqüentemente, a taxonomia deve ajudar a criar caminhos (categorias) múltiplos para encontrar a mesma informação, de acordo com o ponto de vista adotado. No entanto, alguns critérios devem ser observados:

�������

�������������� � ���������������� �

������ ����� ������ ���� � ������� �

�� ����� � ������

� ���� ����

Page 3: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 3

Comunicabilidade: os termos utilizados devem transparecer os conceitos carregados, de acordo com a linguagem utilizada pelos usuários do sistema. Em uma indústria química faz sentido a utilização do termo “cloreto de sódio” ou “NaCl”. No entanto, para um público leigo, o termo “sal” comunica de forma mais clara e objetiva.

Utilidade: uma taxonomia deve apresentar somente os termos necessários. Isto significa que ainda que um termo possa ser dividido em outros termos, isso somente é feito se esses termos forem utilizados na organização. Basta citar o termo frutas, ou é necessário especificar cada uma: maçã, limão, pêra...?

Estimulação: uma boa taxonomia apresenta termos que induzem o usuário a continuar a navegação pelo sistema. Este critério é relacionado ao da comunicabilidade, uma vez que também é o resultado de um estudo da linguagem dos usuários do sistema. Compatibilidade: a taxonomia deve conter somente estruturas do campo que se está ordenando e que façam parte das atividades ou funções da organização. A taxonomia deve tornar intuitivo para os empregados o processo de busca por uma informação específica, colocando-os em contato com tópicos e categorias relacionadas não previstas anteriormente. Isto é mais bem explicado se imaginarmos usuários buscando por livros colocados em prateleiras de uma biblioteca bem organizada, mas fazendo isto de maneira muito mais rápida e multidimensional. Os funcionários devem estar familiarizados com os nomes, categorias e sinais usados na taxonomia. Nesse ponto, a experiência on-line não deveria ser muito diferente da experiência off-line (com a diferença que no mundo off-line não é possível realizar buscas com várias visões e multidimensionais).

Feita esta analogia, é importante destacar também que são muitas as diferenças relacionadas à taxonomia entre o mundo tradicional da biblioteca e o espaço digital. A mais evidente é que um livro só pode estar em um único local e é acessado tradicionalmente nas bibliotecas por meio de uma única taxonomia. Na web, nenhuma destas restrições existe. Outra importante diferença é que os sistemas de classificação de conteúdos das bibliotecas tradicionais são estabelecidos de maneira totalmente centralizada sem nenhuma participação dos usuários. Isto é impossível no ambiente web ou de um portal desenhado a partir de princípios de gestão do conhecimento. TIPOS DE TAXONOMIA As taxonomias e as categorizações são usualmente hierárquicas. Entretanto, novas formas mais visuais, como por exemplo as árvores espaciais ou hiperbólicas, estão se tornando a cada dia mais comuns, como as fornecidas pela Antartic.ca, TheBrain ou InXight. Arquitetos da informação ajudados de perto pelos “proprietários” dos conteúdos são usualmente responsáveis pela definição da taxonomia empregada em cada empresa. Em alguns casos, eles usam ferramentas de classificação automática, como a SemioMap da Semio e a Verity, com o objetivo de simplificar ou acelerar o processamento (as ferramentas de classificação são algoritmos que permitem o agrupamento de documentos baseando-se em regras estatísticas ou de proximidade semântica). TAXONOMIA E METADADOS Metadados são classicamente definidos como informação sobre informação, responsáveis por fornecer o contexto informacional necessário, facilitando assim a localização dos documentos pelos mecanismos de busca independentemente de alguma informação prévia da localização física. Os metadados também desempenham um papel importante ao

Page 4: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 4

(�������� ����������������)���������������� ����*�� ������)���������������������+���������,���������������� �� ������������� ���� �����������-���������

��.� ��������� �����)��/�

permitir que documentos diferentes possam ser facilmente agrupados de forma lógica. Para que isso aconteça é necessário acontecer a rotulação (tagging) dos documentos, o que pode ser um processo muito trabalhoso, pois requer cooperação entre os criadores/geradores de conteúdo (para facilitar este processo, novas ferramentas são criadas com o objetivo de minimizar a maioria das entradas manuais através da geração automática de informações para índices como autor, data de criação, etc.). A captura de metadados ocorreria idealmente logo após a criação do conteúdo. Isso tem ocorrido cada vez mais através da combinação de processos automáticos (tipicamente autor, nome, data, etc.) e manuais (palavras-chave, categorias, etc.). Os metadados mais importantes, no entanto, são aqueles usualmente fornecidos pelos próprios autores e incluem informações detalhadas dos documentos (ex: resumo, contexto na criação, objetivo, outros autores que tenham contribuído, etc). Em um ambiente no qual exista uma taxonomia definida e compartilhada, os metadados são armazenados de forma

organizada e padronizada, e o trabalho tanto de quem publica informação, como de quem a pesquisa é otimizado. DESENVOLVIMENTO DE TAXONOMIAS Preferencialmente, a construção de uma taxonomia deveria começar com entradas construídas em conjunto com os especialistas ou “proprietários” dos conteúdos e os arquitetos da informação. Em muitos casos, esta é uma colaboração importante porque muitos especialistas não estão muito preocupados sobre como o conhecimento é organizado na

empresa. Isto ocorre porque estas pessoas já têm suas próprias maneiras idiossincráticas de procurar por informação que eles precisam. Sendo que, em geral, são os novatos e os agentes externos (clientes, parceiros, etc) que necessitam de ajuda para compreender como um determinado campo do conhecimento é organizado e se relaciona com outros campos do conhecimento. Na maioria dos casos, os integradores externos de sistemas ou firmas de desenvolvimento web são responsáveis por desenvolver um esboço de taxonomia inicial. No entanto, no processo de elaboração de taxonomias, além do cumprimento das etapas metodológicas para recolhimento das informações a serem organizadas, existe um momento de grande importância para o sucesso da empreitada: a validação. Neste momento, são reunidos grupos de funcionários com funções heterogêneas dentro da organização, que recebem conceitos relacionados à construção e à validação da taxonomia, e participam de exercícios de

pesquisa e classificação de informações geradas pela empresa. Essa etapa é fundamental por pelo menos três motivos:

1. Os geradores de informação se vêem como pesquisadores ou usuários da mesma, e passam a enxergar a padronização dos metadados com mais cuidado e relevância;

2. Atinge-se a consistência e coerência na validação das estruturas, uma vez que quem as utiliza (ou a utilizará) de fato tem a oportunidade de interferir no processo. Além disso, são trazidos

Page 5: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 5

elementos e conceitos que realmente representam as informações da organização;

3. Finalmente, há a integração dos funcionários no processo, que passam a entender a importância da taxonomia e a internalizar seus procedimentos.

Como resultado do processo, surge uma estrutura taxonômica que se apresenta como um mapa das informações da organização, de forma padronizada, e que integra as várias visões existentes dentro da empresa por meio de uma interface única, adaptável às necessidades de cada funcionário e usuário das informações da organização. USO DE FERRAMENTAS DE TI Há várias ferramentas disponíveis no mercado que visam auxiliar grandes corporações nas etapas de criação, população, utilização e manutenção de árvores de classificação. Empresas como Verity, Entrieva (antiga Semio) e Stratify oferecem softwares que incorporam algoritmos bastante diversificados, que visam interpretar documentos em texto, reconhecer semelhanças entre contextos e definir se devem pertencer a uma determinada categoria ou não. A definição de uma boa estrutura de categorias é um passo fundamental, e sua obtenção deve ser respaldada pelo uso de uma metodologia bem definida. Há, entretanto, ferramentas de TI que têm por finalidade analisar grandes números de documentos, mostrando pontos em que há semelhanças, bem como critérios para diferenciação entre eles. A análise deste resultado é útil, porque revela eventuais inter-relacionamentos que passariam despercebidos, e que, caso sejam considerados relevantes, poderão ser incorporados à árvore de categorização proposta. Há também fornecedores que têm estruturas de classificação já prontas. Tal como os resultados

obtidos pela aplicação das ferramentas, estas estruturas prontas (e já validadas em seus segmentos de mercado) podem ser usadas para confrontação e enriquecimento do resultado do trabalho realizado nas dinâmicas com usuários e arquitetos de informação. À primeira vista, a classificação manual seria uma boa forma para associar documentos a estruturas de categorias pré-definidas. Pessoas com conhecimento prévio dos documentos saberiam categorizar corretamente, o que garantiria a qualidade do resultado final (vide, por exemplo, o que as pessoas já fazem naturalmente nos diretórios de seus próprios desktops ou redes departamentais). Entretanto, o processo de categorização executado apenas manualmente não é viável quando o número de documentos é muito grande (dezenas de milhares). Os algoritmos de classificação automática, por sua vez, possuem capacidade para processar grandes quantidades, com regras uniformes para todo o universo de documentos. Dentre as técnicas mais utilizadas na classificação automática, encontram-se: Classificação baseada em regras, onde as “regras” definidas previamente por especialistas são aplicadas ao conteúdo dos documentos, metadados e situações específicas do negócio, como, por exemplo, o tempo de validade de documentos; Análises estatísticas aplicadas ao conteúdo, que tentam aprimorar o entendimento do contexto e reduzir ambigüidades de termos isolados. Examina-se a freqüência de palavras e sua localização no texto, entre outras características; Cálculos de probabilidade Bayesiana: em que o nível de correlação às palavras que definem uma categoria é determinado através da presença, no texto, de outras afins;

Page 6: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 6

Correlação semântica e lingüística: que dependem do idioma e utilizam dicionários e tesauros para aprimorar o “entendimento”; Support Vector Machines (SVM): que considera cada documento como sendo um “vetor”, com “direção” calculada em função da gama de palavras contidas e “magnitude” definida conforme a quantidade destas palavras. Documentos são classificados às categorias que possuem “vetores” semelhantes. As aplicações e ferramentas relacionadas às atividades relacionadas à classificação de documentos pertencem a um segmento excepcionalmente dinâmico de mercado, já que tanto as tecnologias quanto os usos para árvores taxonômicas estão em constante evolução. Ainda assim, algumas tendências podem ser antevistas, tais como:

1. Integração gradual de taxonomias a diversos sistemas corporativos, como mecanismos de busca, portais corporativos, geradores de conteúdo e outros;

2. Uso de representações espaciais de categorias e inter-relacionamentos;

3. Adoção de linguagens específicas, como a proposta pela iniciativa TopicMap.org, que procura incorporar contexto às informações de forma padronizada;

4. Reconhecimento dos usuários e das informações que têm interesse (personalização). Ainda, técnicas computacionais destinadas à interpretação de texto deverão se desenvolver bastante nos próximos anos, o que deverá favorecer ainda mais a utilização de software para esta finalidade.

VALIDAÇÃO E MANUTENÇÃO DAS TAXONOMIAS A validação da estrutura de categorias é feita através do constante monitoramento do

desempenho da taxonomia. Neste sentido, observam-se indicadores específicos, tais como:

1. A quantidade de usuários que não encontram os documentos que procuram;

2. Os documentos e categorias que têm volume de acessos muito acima ou abaixo da média;

3. Número de documentos não categorizados automaticamente;

4. Número de documentos presentes nas diversas categorias, bem como seu crescimento e diminuição no tempo. Os resultados obtidos podem indicar necessidade de re-estruturação da árvore, alteração de regras para alocação de documentos, etc.

A manutenção atualizada das categorias de informação validadas exigirá, porém, a designação de várias novas responsabilidades para os funcionários da empresa e o uso de ferramentas sofisticadas para automatizar parte do esforço de classificação do conteúdo existente. Neste processo, que é permanente, são diversos os desafios para os quais as empresas devem se preparar: • Quem traz a voz do cliente ou usuário? • Como permitir a re-categorização de

documentos com base em feedback dos usuários?

• Como conciliar diferentes visões sobre a organização do conhecimento organizacional?

• Quem deve decidir sobre quais categorias um documento deve ser enquadrado?

• Quem manterá a integridade da taxonomia à medida que ela cresce ao longo do tempo?

Estas questões são fundamentais para que se mantenha uma taxonomia de qualidade: suas respostas determinarão o rumo do mapeamento das informações na organização. Além disso, é importante ressaltar o caráter dinâmico desse

Page 7: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 7

0�� &���!���� ������

Taxonomia - Conceitos e Confusões

instrumento assim como das informações organizadas, o que explica a necessidade de freqüente manutenção, atualização e validação da taxonomia. CONSIDERAÇÕES FINAIS Empresas que vivem na Era da Informação e do Conhecimento precisam dar o devido tratamento aos seus principais inputs e fatores de produção: a informação e o conhecimento. O desenvolvimento de taxonomias específicas para o negócio da empresa é um dos pilares da gestão da informação do conhecimento. Esta disciplina ou conceito, no entanto, precisa da devida atenção dos níveis mais altos da organização e, como procuramos destacar neste artigo, do trabalho de especialistas com métodos e ferramentas testadas na prática.

* * * José Cláudio Cyrineu Terra é presidente da TerraForum Consultores. Atua como consultor e palestrante no Canadá, nos Estados Unidos, em Portugal, na França e no Brasil. Também é professor de vários programas de pós-graduação e MBA e autor de vários livros sobre o tema. Seu e-mail é [email protected] Ricardo Schoueri é consultor associado da TerraForum e sócio fundador da Íntegra Tecnologia. Ricardo atua há 15 anos como consultor e engenheiro de software, onde tem procurado adequar recursos de TI e modelos matemáticos a problemas reais de negócio. Seu e-mail é [email protected] Michely Jabala M. Vogel é consultora associada da TerraForum, Bibliotecária formada pela USP, mestranda em Ciência da Informação pela mesma instituição. Especialista na elaboração e aplicação de ontologias e

taxonomias. Seu e-mail é [email protected] Carlos Eduardo Franco é consultor associado da TerraForum e trabalha como consultor na criação e reestruturação de websites de empresas e organizações interessadas em otimizar os resultados de sua presença na Internet. Seu e-mail é [email protected]

0�1#�!1"0� A TerraForum Consultores é uma empresa de

consultoria e treinamento em Gestão do

Conhecimento (GC) e Tecnologia da

Informação. Os clientes da empresa são, em

sua maioria, grandes e médias organizações

dos setores público, privado e terceiro setor. A

empresa atua em todo o Brasil e também no

exterior, tendo escritórios em São Paulo,

Brasília e Ottawa no Canadá. É dirigida pelo Dr.

José Cláudio Terra, pioneiro e maior referência

em Gestão do Conhecimento no país. Além

disso, conta com uma equipe especializada e

internacional de consultores.

�23450671"��1!!0'8!2#�� Gestão do Conhecimento e E-learning na Prática Portais Corporativos, a Revolução na Gestão do Conhecimento Gestão do Conhecimento - O Grande Desafio Empresarial

Page 8: taxanomia

�������������� ����� ������ ������������������������������������������ �����

����������������������

©TerraForum Consultores 8

Gestão do Conhecimento em pequenas e médias empresas Realizing the Promise of Corporate Portals: Leveraging Knowledge for Business Success Gestão de Empresas na Era do Conhecimento