Sistemas de Apoio a Decisão - aranmorales.files.wordpress.com · Sistemas de Apoio a Decisão...
Transcript of Sistemas de Apoio a Decisão - aranmorales.files.wordpress.com · Sistemas de Apoio a Decisão...
Sistemas de Apoio a Decisão
(Inteligência nos Negócios - Business Inteligente)
Sistemas de Informação/Ciências da Computação
Aran Bey Tcholakian Morales, Dr. Eng.
(Unidade 1)
4
Quais são os objetivos dos sistemas de informação e da tecnologia
da informação nas empresas e organizações?
O avanço da tecnologia da informação e a disseminação dos sistemas
de informação contribuem para as organizações automatizarem e
controlarem os seus processos e as suas operações.
Automatizar e controlar os processos e operações, garantem a
quantidade e a qualidade de dados que atendem às necessidades de
informação das organizações e, nesse sentido, atingir o objetivo
principal da tecnologia da informação: informar.
Apresentação
5
Por que as empresas e as organizações necessitam de informação
sobre os seus processos e as suas operações?
Os dados (dos sistemas transacionais ) são insumos para as
necessidades gerenciais de informação (e conhecimento) que dão
apoio aos processos de gestão e decisão das organizações.
De outra forma, ter dados precisos e exatos é um fator essencial para
a geração de informação (e conhecimento) que permitem melhorar
a qualidade dos processos de gestão e decisão.
Isto significa que os dados são ativos de informação (e
conhecimento).
Apresentação
6
Muitas organizações possuem projetos de informática,
representados pelos seus sistemas transacionais (sistemas de apoio
à operação), os quais dão suporte ao cotidiano da organização
(sistemas que controlam seus processos e suas operações).
Possuir projetos de informática não significa ter a informação
disponível para suprir as necessidades gerenciais de apoio aos
processos de gestão e de decisão.
Apresentação
7
Quando as organizações perceberam esse fato, começaram a
desenvolver os seus projetos de informação como complemento aos
de informática.
Desta forma, foi necessário desenvolver repositórios de dados
adequados para o processo de decisão (Data Warehouse).
Os DW levaram as organizações a ter repositórios de dados
baseado em assuntos, integrado, não volátil, variável em relação
ao tempo (repositórios de apoio aos processos de gestão e decisão
dos analistas de negócios e da gerência).
Apresentação
8
O DW é um repositório de dados que facilita a transformação dos
dados, através do processo de descoberta, em informação e
conhecimento. Em outros termos os dados são ativos de informação
e conhecimento, e os DW facilitam esta transformação.
Para que a transformação e descoberta se concretizem, surge a
necessidade de haver técnicas de análise dos dados.
As técnicas de análises de dados procuram identificar padrões,
relações e tendências que auxiliem na interpretação dos dados e na
extração de informações explícitas e informações implícitas
(conhecimento), com o objetivo de suprir as necessidades gerenciais
de apoio aos processos de gestão e de decisão das organizações.
Apresentação
9
O conceito de análise de dados engloba ferramentas de
processamento analítico (OLAP), ferramentas de análise exploratória
de dados (AED) e ferramentas de extração de conhecimento
(processo de descoberta em banco de dados – KDD/mineração de
dados), as quais possibilitam a descoberta de informações (explícitas
e implícitas) que possam ser úteis às organizações.
Apresentação
10
Pergunta de pesquisa:
Como descobrir informações e conhecimentos de fontes de dados
que possam ser úteis aos analistas de negócios da organização para
auxiliar nos processos de gestão e decisão da própria organização?
A pergunta “esconde” duas outras perguntas e uma extensão natural:
Como representar as fontes de dados que “facilitem” a descoberta de
informações e conhecimentos (para auxiliar nos processos de gestão
e decisão)?
Quais são as ferramentas e técnicas que “permitem” a descoberta de
informações e conhecimentos?
Apresentação
11
BI
Dados (OLTP e outras fontes)
Data Warehouse/Data Marts
Ferramentas OLAP
Mineração de dados - KDD
Interpretação/
Avaliação
Decisões
Análise
de dados
Análises dos
tomadores de
decisão
Fundamentação da disciplina
Dados
Informação
Conhecimento
Análise exploratória de dados
13
Pesquisa do Gartner (2012) realizada com
mais de dois mil CIOs em todo mundo
identificou as prioridades para a TI.
Apresentação
14FONTE: Estudo de Mercado: BI – Rodrigo Lanna e Alexis Frick –
http://www.stratmarket.com.br/
Apresentação
15
Das fontes de dados estruturadas da organização, podemos descobrir
ativos de informação e conhecimento que auxiliam nos processos de
gestão e decisão da própria organização.
Ao mesmo tempo, as organizações identificaram outras fontes que
poderiam ser ativos de informação e conhecimento de seu interesse.
São fontes semiestruturadas e não estruturadas com dados
provenientes de fontes internas e externas a organização: redes
sociais, blogs, manuais, e-mails, chats, GPS, sensores, arquivos de
áudio e de imagens.
Apresentação
19
Dessa forma, além dos dados gerados pela organização, temos dados
provenientes de fora da organização. São dados com uma grande
variedade de formatos, gerados em alta velocidade e em grande
volume. A partir dessas caraterísticas, surgiu o conceito de Big Data.
O conceito Big Data pode ser resumidamente definido como uma
coleção de dados (ativos de informação e conhecimento) de extremo
volume, alta velocidade de geração e grande diversidade de
formatos.
Apresentação
Essas caraterísticas nos dados fazem necessário dispor de tecnologias
capazes de capturar, armazenar, gerenciar e analisar esses dados.
Big Data permite entender não só o perfil do consumidor com base
nos registros de seus sistemas transacionais (OLTP), como também seu
comportamento nas redes sociais, hábito de consumo, intenção de
compras, relevância e influência.
Apresentação
Volume dos dados: excede os limites físicos de ser escalável de forma
vertical (em 2012, foram gerados 1,2 zettabyte de dados; a previsão
para 2020 é 35 zettabytes)
Velocidade de geração dos dados: faz com que a captura, o
processamento e as análises dos dados tenham uma validade de
tempo menor.
Variedade dos dados: impõe desafios na integração e análise de
diferentes formatos de dados (dados estruturados, não estruturados,
imagens, vídeos, dados de sensores, etc.);
Apresentação
Encontrar correlações entre várias fontes diferentes de dados (48%),prever o comportamento dos clientes (46%) e prever as vendas de produtos ou serviços (40%) são os principais fatores de análisede Big Data.
29
Pergunta de pesquisa da disciplina: a extensão “natural” da pergunta
de pesquisa: como descobrir informações e conhecimento a partir de
fontes de dados semiestruturadas, não estruturadas, internas e
externas a organização .
Insights << informação << dados
Apresentação
30
A pergunta:
Como representar as fontes de dados que “facilitem” a descoberta de
informações e conhecimentos?
É estendida para:
Como capturar, armazenar e gerenciar dados com o volume,
a velocidade e a variedade com que são gerados?
Apresentação
31
A pergunta:
Quais são as ferramentas e técnicas que “permitem” a descoberta de
informações e conhecimentos?
É estendida para:
Quais são as ferramentas e técnicas que “permitem” analisar o
volume, a velocidade e a variedade de dados gerados para a
descoberta de informações e conhecimentos?
Apresentação
• As tecnologias que sustentam o Big Data, podem ser analisadas sob
as seguintes óticas:
• As tecnologias de infraestrutura, que armazenam os dados:
bancos NoSQL e NewSQL;
• As tecnologias envolvidas no processamento do grande
conjuntos de dados: Hadoop e Spark (entre outras);
• Depois da infraestrutura de armazenamento e processamento,
são necessários os componentes de análises, pois são eles que
transformam os dados em valor para o negócio;
Apresentação
NoSQLs
Google File System (GFS): sistema de arquivo distribuído entre vários servidores que dividia os arquivos em blocos (2003), para gravar grandes volumes de dados não estruturados (páginas HTML), que não cabiam em um único servidor; MapReduce: um framework que facilita extrair informação de dados armazenados no GFS, de forma paralela para aumentar a velocidade (2004).Amazon iniciou o desenvolvimento do banco de dados comercializado como Dynamo DB (2004).O Google iniciou o desenvolvimento do BigTable (2006).
O LinkedIn iniciou o projeto Voldemort criando uma base de dados não SQL para gerenciar os seus 135 milhões de usuários (2007).O Facebook baseou-se nas soluções da Amazon e do Google e desenvolveu a sua solução, que passou a ser distribuída como código aberto com o nome de Apache Cassandra (2008).O Yahoo criou o Sherpa (2009).
Apresentação
BD Relacionais NoSql/NewSql
Transações ACID: Atomicidade: a transação é executada totalmente ou não será executada; Consistência: o banco passará de uma forma consistente para outra forma consistente; Isolamento: a transação não será interferida por outra transação concorrente; Durabilidade: o que foi salvo não será perdido.
Transações BASE: BA-Basicamente Disponível, prioridade na disponibilidade dos dados (tolera falhas parciais); S-Estado Leve: o sistema não precisa ser consistente o tempo todo, isto é, a persistência não é necessariamente feita em tempo real; E – Eventualmente consistente: o sistema é consistente em momentos determinados.
Relacionado fisicamente (conceito ER). Não relacionado fisicamente.
Dificuldade em armazenar e recuperar grandes volumes de dados não estruturados (e outros tipos de dados heterogéneos).
Construído para tratar grandes volumes de dados não estruturados, escaláveis horizontalmente.
Esquema definido (tabelas, chaves, tipos de dados, relacionamentos), estrutura rígida, sem redundância de dados, normalizada.
Não tem esquema definidos (permite adicionar campos aos registros do banco livremente sem a necessidade de mudança na estrutura).
Escalabilidade vertical: mais CPU, mais memória, os dados não podem estar distribuídos.
Escalabilidade horizontal: servidores em paralelo, dados distribuídos em nodos diferentes.
No existe Sharding: uma FK não pode apontar para uma tabela que está em outro nodo.
Sharding: divide os dados horizontalmente, partes diferentes dos dados em servidores diferentes.
No existem algoritmos do tipo Map-reduce. Map-reduce: algoritmo de gerenciamento em larga escala. Organiza o processamento, aproveitando múltiplas máquinas de um cluster.
Usados em sistemas locais, corporativos; segurança da informação; consistência dos dados.
Usados em sistemas de alta escalabilidade e performance na consulta/escrita (redes sociais).
Banco de dados:
Key-value: Berkeley DB; Project Voldermort; MemcacheDB; SimpleBD
Orientadas a documentos: MongoDB, CouchDB, IBM Lotus Domino, Riak,
RavenDB
Família de colunas (bigTable): BigTable, Hbase, Cassandra (Facebook)
Orientadas a grafos: Neo4J, InfoGrid, HyperGraphDB;
Orientadas a colunas*: MonetDB, Vertica , Infobright, LucidDB
Apresentação
As tecnologias envolvidas no processamento do grande conjuntos de dados:
Hadoop e Spark (são as duas principais).
• Hadoop, é uma plataforma distribuída voltada para clusters e processamento
de grandes massas de dados. Foi inspirado pelo MapReduce e GFS;
• Spark, é uma plataforma que trabalha em memória, (e por isso muito mais
rápida no processamento que o Hadoop) e indicada para dados em stream;
Apresentação
38
BI
Fontes internas da organização e externas à organização
DW e Data Lake)
Ferramentas OLAP
Técnicas analíticas
Interpretação/
Avaliação
Decisões
Análise
de dados
Análises dos
tomadores de
decisão
Dados
Informação
Conhecimento
Análise exploratória de dados
Fundamentação da disciplina
39
A informação e o conhecimento sempre estiveram presentes nas
organizações. A sua importância e a necessidade de gestão (gestão
da informação e do conhecimento) têm aumentado devido à
percepção de bens intangíveis, os quais precisam ser gerenciados
como qualquer outro bem tangível.
Apresentação: a disciplina não é!
40
A informação e o conhecimento de interesse das organizações estão
presentes nos dados dos sistemas transacionais, nos documentos,
manuais e sites, e-mails e chat, blogs, redes sociais e outras fontes. É
o chamado conhecimento explícito, que pode ser formalizado,
sistematizado, comunicado e partilhado entre os indivíduos.
O conhecimento organizacional está também de forma tácita nos
próprios colaboradores da organização, conhecimento tácito, difícil
de ser capturado e formalizado.
A gestão do conhecimento organizacional refere-se à gestão de
todos os ativos de conhecimento da organização.
Apresentação: a disciplina não é!
41
A gestão do conhecimento não somente consiste na descoberta (que é
uma forma de aquisição). Consiste também no seguinte:
- na criação (essencial para o processo de inovação);
- na modelagem e no armazenamento (diz respeito à representação
e à integração do conhecimento que permita ser acessado e
compartilhado para a socialização do conhecimento);
- e na manipulação do conhecimento, que permite a utilização e o
reúso, assim como extrair outras informações (por elaboração de
informações já disponíveis) ou inferir outras informações novas (por
aprendizado).
Apresentação: a disciplina não é!
43
Ementa
Informação e decisão. Dados, informação e conhecimento. Sistemas
transacionais e de apoio a decisão. Data Warehouse: motivação,
conceitos, definição, características e arquiteturas de
implementação. Modelo Dimensional: fatos, dimensões, medidas e
granularidade. Sistemas ETL: extração limpeza, transformação e
carga de um modelo dimensional. Área de apresentação:
características das ferramentas OLAP. Mineração de dados: processo
de descoberta do conhecimento em banco de dados. Técnicas de
mineração: agrupamentos, classificação e regras de associação.
Programa da disciplina
44
Objetivo Geral
A informação e o conhecimento são diferenciais necessários ao
processo decisório das organizações. Apenas armazenar dados já
não é o suficiente. As organizações buscam transformar os dados em
informação e em conhecimento sobre seus clientes, colaboradores,
processos e assuntos de negócio.
O objetivo da disciplina é: apresentar metodologias, técnicas,
ferramentas e elementos necessários que permitam compreender a
importância da construção de estruturas de dados que permitam a
extração e aquisição de informações e conhecimentos dessas
estruturadas para auxilio aos processos de gestão e de decisão da
organização.
Programa da disciplina
45
Objetivos Específicos
Para alcançar o objetivo geral se faz necessário:
• Construir estruturas de dados para projetos de informação:
conceitos básicos de Data Warehouse;
• Elaborar e interpretar informações: processamento analítico on-
line (OLAP) e análises exploratória de dados (AED);
• Adquirir conhecimento: processo de extração de conhecimento em
bases de dados (KDD) e técnicas de mineração de dados.
Programa da disciplina
46
Unidade 1: O processo decisório nas organizações
Carga horária: 6 horas aula
Conteúdo.
1. Informação, conhecimento e o processo decisório nas organizações.
2. Sistemas de Informação (SI): Sistema OLTP e Sistema SAG.
3. Dados, Informação e Conhecimento.
4. Inteligência nos Negócios (BI-Business Intelligence): Sistemas de BI.
5. Arquitetura de um Sistema de BI.
Programa da disciplina
47
Unidade 2: Estrutura de dados para a construção de sistema de BI
Carga horária: 24 horas aula
Conteúdo.
1. Data Warehouse (DW) DW: a memória da organização.
2. Modelo dimensional: conceitos e características. Fatos, dimensões e medidas.
Modelo Estrela.
2. ETL: Extração, limpeza, transformação e carga de dados.
Ferramentas de ETL: Pentaho Data Integration.
3. Construção de modelos dimensionais lógicos e físicos.
Ferramentas de modelagem de dados: SQL Power Architec.
SGBD: base de dados PostgreSql.
Programa da disciplina
48
Unidade 3: Extração e descoberta de informação e conhecimento
Carga horária: 30 horas aula
Conteúdo.
1. Área de apresentação de um DW: navegando e visualizando os dados da
organização com técnicas e ferramentas de processamento analítico – OLAP.
Ferramentas OLAP: Mondrian Schema Workbench, Pentaho BI Server, Saiku , Excel.
.
2. Processo de Descoberta de Conhecimento em Bancos de dados (KDD).
Mineração de Dados: Tarefas, técnicas e algoritmos.
Ferramentas de mineração de dados: RapidMiner.
Programa da disciplina
49
Formas de Avaliação:
No transcorrer do semestre teremos quatro avaliações:
1. Trabalho em grupo de pesquisa bibliográfica;
2. Prova individual de modelagem dimensional;
3. Trabalho em grupo de modelagem dimensional e análises de dados;
4. Prova individual de análises de dados (utilizando ferramentas e técnicas
de OLAP e de Mineração de Dados);
As avaliações terão o mesmo peso, e os trabalhos poderão ser feitos
em grupos de até duas pessoas.
Programa da disciplina
50
Bibliografia principal (DW e BI)
1. INMON, W. H. Como construir o Data Warehouse. Rio de Janeiro: Campus,
1997.
2. KIMBALL, R. The Data Warehouse Toolkit: guia completo para modelagem
dimensional. Rio de Janeiro: Campus, 2002.
3. LEME FILHO, Trajano. Business Intelligence no Microsoft Excel. Rio de
Janeiro: Axcel Books do Brasil, 2004.
4. Machado, F. N. Tecnologia e projeto de Data Warehouse: uma visão
multidimensional. São Paulo: Érica, 2004.
5. TURBAN, Efrain; SHARDA, Ramesh; ARONSON, Jay; KING, David. BUSINESS
INTELLIGENCE: um enfoque gerencial para a inteligência do negócio. Porto
Alegre: Bookman, 2009.
Programa da disciplina
51
Bibliografia principal (OLAP, AED e KDD)
1. THOMSEM, Erik. OLAP: construindo sistemas de informações dimensionais.
Rio de Janeiro: Campus, 2002.
2. LAPPONI, J. C. Estatística usando Excel. São Paulo: Lapponi Treinamento e
Editora, 2000.
3. TAN, P.; STEINBACH, M.; KUMAR, V. Introdução a mineração de dado. Rio
de Janeiro, Editora Ciência Moderna, 2009.
Programa da disciplina
52
Bibliografia complementar
1. BARBIERI, C. BI-Business Intelligence: modelagem e
tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001.
2. LAUDON, K. C.; LAUDON, J. P. Sistemas de informação com
Internet. 4. ed. Rio de Janeiro: LTC, 1999.
3. O’BRIAN, J. A. Sistemas de informação e as decisões gerenciais
na era da Internet. São Paulo: Saraiva, 2001.
Programa da disciplina
• DataWarehouse:
– Banco de dados: PostgreSQL;
– Modelagem: SQL Power Architect;
• ETL:
– SQLs;
– PDI (Kettle) (Pentaho )
• Análises de dados: OLAP, AED, Mineração de Dados:
– Excel;
– BiServer (Pentaho);
– RapidMiner ;
Programa da disciplina
54
BI
Dados (OLTP e outras fontes)
Data Warehouse/Data Marts
Ferramentas OLAP
Mineração de dados - KDD
Interpretação/
Avaliação
Decisões
Análise
de dados
Análises dos
tomadores de
decisão
Fundamentação da disciplina
Dados
Informação
Conhecimento
Análise exploratória de dados
56
Sistemas de informação
“ [...] é um conjunto interdependente de pessoas, estruturas
organizacionais, software, hardware, processos e métodos
Interligados com o objetivo de facilitar o planejamento e o controle
em organizações, de forma que as informações se tornem
utilizáveis na coordenação do fluxo de trabalho de uma organização
[...] ”
(LAUDON; LAUDON, 1998).
Sistemas de BI
57
Hardware Pessoas
Software Tele-Comunicações
ProcedimentosBanco de Dados
Mainframes
DW
Data Mart
DB
Transacional
Sistemas de BI
58
Sistemas de Informação
Visão operacional da TI
Visão estratégicada TI
Sistemas de apoioàs operações
(Sistemas OLTP)
Sistemas de apoioà gerência
(Sistemas SAG)
59
Características Visão operacional da TI (OLTP) Visão estratégica da TI (SAD)
Características dos sistemas
Função Monitorar e processar asfunções básicas e rotineiras do
dia a dia
Elaboração das informações que
sejam pertinentes (embasar) ao
processo decisório
Forma Baseado em transações Baseado em análises
Características dos dados
Natureza Dados atuais Dados históricos
Organização Por processo ou sistema de informação
Orientado a assuntos denegócios
Conteúdo Armazenam dados em detalhe Dados sumarizados
Modelo Modelo relacional (ER) Modelo dimensional
Sistemas de BI
60
Características Visão operacional da TI (OLTP)
Visão estratégica da TI (SAD)
Características dos usuários e responsáveis
Tipo de usuário Comunidade operacional Tomadores de decisão, analistas de negócios
Representante na empresa
Gerente ou diretor de informática
Diretor de informação, analista de negócios
Responsabilidadedo representante
Qualidade dos dados efuncionamento dos serviços
de informática
Qualidade da informação para decidir
Forma de uso Processo repetitivo, estruturado
Processo analítico, heurístico
Tipo de decisão Suporte a decisões cotidianas (diárias)
Suporte a decisões estratégicas (em longo prazo)
Sistemas de BI
61
Os sistemas de BI são a evolução dos SAG.
Os sistemas de BI são um conjunto de conceitos, metodologias e
tecnologias que, fazendo uso de fatos ou de acontecimentos e
Sistemas baseados nesses fatos, apoiam o processo de tomada de
decisão.
Conhecido também por Inteligência Empresarial, ou Inteligência nos
Negócios, o termo BI é usado como guarda-chuva.
Sistemas de BI
62
O objetivo das técnicas de BI é definir regras e técnicas para a
formação adequada dos dados da organização, visando transformá-
los em depósitos de informações e conhecimento que atendam às
necessidades dos processos de gestão e de decisão.
Em outras palavras, isso quer dizer transformar os dados em
informações e conhecimentos relevantes para suprir as necessidades
gerenciais de apoio aos processos de gestão e de decisão.
Sistemas de BI
64
A arquitetura de um sistema típico de BI é composta das seguintes
partes:
• Módulo ETL (back-end): componente dedicado à Extração, à
Transformação e à carga (Load) dos dados.
A extração é a parte responsável pela coleta dos dados.
A transformação unifica os formatos e faz a “limpeza” dos registros
incompletos e das inconsistências dos dados. Os dados tratados são
carregados em um repositório de dados comum.
Sistemas de BI
65
• Repositório de dados: estrutura de armazenamento de
informações como Data Warehouse e Data Marts (repositório de
dados baseados em assuntos de negócios, integrado, não volátil,
variável em relação ao tempo).
• Aplicações de front-end: são as ferramentas de análise de dados
com a possibilidade da descoberta de informações explícitas e
implícitas que pudessem ser úteis para as organizações
(ferramentas de processamento analítico (OLAP), de análise
exploratória de dados (AED) e processo de descoberta de
conhecimento em bancos de dados (KDD)).
Sistemas de BI
66
Requisitos para obter “valor do BI” para o negócio da empresa:
Tecnicamente, o valor do BI resulta de uma boa análise das
necessidades de informação (requisitos para o DW), da pertinência e
da qualidade das fontes de coleta (dados) e da qualidade das análises
e informações extraídas (análises de dados) para os analistas de
negócio.
Gerencialmente, o êxito do BI, depende da cultura analítica da
organização.
Sistemas de BI
68
Os dados são uma entidade puramente sintática, sem significado
nem semântica (não carregam caráter informativo). No contexto
dos sistemas de informação, dados são registros de transações.
Os dados são os componentes básicos (matéria-prima) a partir dos
quais a informação é criada. O dado deve então ser trabalhado
para que se torne uma informação e seja utilizável.
Dados, Informação e Conhecimento
70
Informação são dados formatados de uma maneira inteligível e útil
ao usuário. Informar é dar forma, relevância e propósito aos dados.
Informação são dados em um contexto dotado de semântica.
Um conjunto de dados representa uma informação para uma
pessoa quando ela consegue perceber suas relações com outros
dados e/ou informações que lhe definem um contexto.
Dados, Informação e Conhecimento
A interpretação dos dados contextualizados (informação), para
estabelecer novas relações, fazer inferências, reformular significados
e tirar conclusões é o que chamamos de conhecimento.
Esta interpretação, depende de cada pessoa porque envolve fatores
intangíveis como crenças pessoais, perspectivas, insights, intuições,
vivencias e experiências anteriores sobre o assunto em questão.
Neste sentido, conhecimento é um tipo de informação mais
estruturada, com alto grau de refinamento, com valor agregado,
carregada de entendimento sobre um domínio.
71
Dados, Informação e Conhecimento
72
Exemplo: em um sistema de vendas, podemos ter o seguinte:
Informações:
Vendas por mês dos últimos anos; Crescimento das vendas;
Sazonalidade dos produtos; Total de faturamento; Lucratividade dos
produtos, etc.
Conhecimentos:
Saber o retorno das campanhas publicitárias; Identificar o perfil do
cliente para um novo produto; Saber se existe venda “conjunta”
(arroz e feijão); Identificar os clientes para uma mala direta; etc.
Dados, Informação e Conhecimento
77
Sendo assim, o conhecimento pode ser definido como estratégias
(modelos, métodos, regras, técnicas, mecanismos) usadas por uma
pessoa (ou máquina) para interpretar, analisar e responder
apropriadamente às situações de um determinado assunto.
Por esse motivo, o conhecimento deve ser adquirido de forma
construtivista, em que o processo de descoberta é guiado por
hipóteses, numa interação entre o analista do negócio e os dados.
Dados, Informação e Conhecimento
79
Dados, Informação e Conhecimento
Dados Informação Conhecimento
São simples observaçõesou fatos sobre eventos
São dados dotados de relevância (semântica) e
propósito
Informação com valoragregado e entendimentosobre o domínio
Fácil de estruturar e capturar por sistemas
Facilmente contextualizada
por sistemas
De difícil estruturação, captura e apresentação
Facilmente transferível Transferível com certa dose de esforço
De difícil transferência
Claro, apresentável Apresentação por gráficos,indicadores, índices.
De difícil apresentação ecompartilhamento
Frequentementequantificado
Exige análises, contexto emedições humanas
Inclui interpretação,reflexão e contexto
Fonte: Business Intelligence no Microsoft Excel (LEME FILHO, 2004)
80
O processo de construir um modelo para representar um conjunto de
dados com o propósito de encontrar padrões, tendências e relações
interessantes entre os dados é o principal objetivo das técnicas de
análises de dados.
Os modelos construídos têm o intuito de facilitar as análises e
as visualizações dos dados para os analistas de negócios, na procura
de informações (explícitas e implícitas) que auxiliem nos processos de
gestão e decisão da organização.
Dados, Informação e Conhecimento
81
Dados, Informação e Conhecimento
ID Sexo Cidade Idade Comprou?
1 M Floripa 25 S
2 M Criciúma 21 S
3 F Floripa 23 S
4 F Criciúma 34 S
5 F Floripa 30 N
6 M Blumenau 21 N
7 M Blumenau 20 N
8 F Blumenau 18 N
9 F Floripa 34 N
10 M Floripa 55 N
Idade
Cidade
27
Blumenau
Criciúma
Floripa
SIM NÂO Cidade
Idade
Não Sim
Floripa
SimNão
Dados, Informação e Conhecimento
Se Cidade = Blumenau então comprou = Não;
Se Cidade = Criciúma então comprou = Sim;
Se Cidade = Floripa e Idade > 27 então comprou = Não;
Se Cidade = Floripa e Idade <= 27 então comprou = Sim;