Post on 28-Jul-2020
1
Universidade de Passo FundoCurso de Ciência da Computação
Sistemas de InformaçãoProf. Alexandre Lazaretti Zanatta
2/135
Tecnologia da Informação
■ Valor da informação
– São recursos não humanos destinados aoprocessamento, armazenamento eresultados das informações
2
3/135
Evolução da Tecnologia
Nível deIntegraçao
Década Sistemas Ambiente
Pequeno 60 Mainframe Cpd
Médio 70 Mini Pdd
Alto 80 Micro Sistemasdistribuídos
Ultra 90 Chip C/S
??? ??? ??? ???
4/135
Fatores Críticos■ Tecnologia e recursos de informática
– dramática evolução capacidade, redução doscustos, aumento na facilidade do uso
■ Mão de Obra– desde executivos até técnica especializada
■ Mudança da Natureza dos problemas– competição e condições econômicas
■ Aspectos Psicológicos, políticos eorganizacionais– conseqüência dos anteriores, criando novas
necessidades
3
5/135
Estágios do processo■ 1º Manual
– Organização e Métodos
■ 2º Automação– Sistemas Isolados
■ 3º Integração– utilização de BD
6/135
Histórico do CPD
■ Início– Primeira Aplicação. Ex: Contabilidade– processar dados
■ Contágio– Segunda Aplicação: Gerar relatórios,– fornecer informações
■ Maturidade– Terceira Aplicação: SAD– apoiar decisões
4
7/135
Novo Papel do Analista de Sistemas
Organização
Informática
Analista deNegócios
Administrador
Analista deSistemas
8/135
Definição de um sistema
■ Coleção de componentes que estãocuidadosamente integrados para buscar umaproposta comum.
■ Buscam um sinergismo, isto é, a açãointegrada dos componentes, que tem umefeito mais positivo do que a soma dosefeitos dos componentes individuaisoperando independentemente ( Reynolds,1988).
5
9/135
Características do sistema
• Os sistemas interagem com seuambiente
• Todo sistema pode ser dividido dentrode subsistemas
• Os sistemas serão afetados pelamudança
• O feedback e controle são essenciais
10/135
Dados
■ Dado é uma coleção de fatosdesorganizados que ainda não foramtransformados em informação.
■ Representa fatos brutos no qual asconclusões podem ser desenhadas.Estes fatos devem descrever pessoas,lugares, coisas, idéias, processos eeventos.
6
11/135
Informação
■ Informação é o conhecimento adquiridodo processamento do dado.
■ A informação freqüentemente leva àação. Obter dados de diferentes fontes,processa-los para produzir informaçõesrelevantes e usar esta informação paratomar decisões.
12/135
A qualidade do dado e informação
■ Acuracidade :– sem erro.
■ Completariedade :– Cada parte do dado deve ser completamente
acurada, mas se apenas metade do dado forrecebida então a informação derivada do dadodeve ser inválida.
7
13/135
■ Relevância :– dado recebido deve ser importante para aquela
decisão a ser tomada.
■ Oportunidade :– é importante para decisões que envolvem
condições que mudam rapidamente.
■ Auditabilidade :– habilidade para verificar a acuracidade e a
completariedade dos dados.– Possibilidade de trazer de volta a sua fonte
original
14/135
Convergindo dado em informação
■ O processamento do dado paraconverter em informação envolve um oumais das seguintes atividades:
– entrada,– processo ,
– armazenagem– saída
8
15/135
Entrada
■ Originar/surgir : A ocorrência de um evento outransação no negócio resulta na origem do dado quesão entradas para o sistema de informação.
– Ex: recebimento de uma ordem do consumidor, recebimentode uma fatura de um fornecedor
■ Capturar : é necessário obter a transação básica dodado de alguma maneira para que ele de entrada nosistema de informação.
16/135
Entrada■ Coletar : Deve ser necessário para combinar dados
de diversas fontes para ter todos os fatosnecessários
■ Verificar : O dado deve ser editado de uma formaque valide a sua entrada no sistema.
– Dados de quantidade e custo devem ser numéricos,
– nomes devem ser alfabéticos
■ Codificar : Antes de processar os dados devem serconvertidos de uma forma aceitável para a máquina.
9
17/135
Processo■ Classificar :
– O dado deve ser agrupado de acordo com algumascaracterísticas que são úteis.
■ Sortear : – arranjado em uma seqüência para simplificar o
processamento ou fornecer uma idéia do dado.
■ Calcular :– deve envolver e realizar alguma operação matemática com
o dado
■ Sumarizar :– O resumo é a acumulação do dado dentro de um
determinado nível.
18/135
Armazenagem■ Atualizar :
– envolve acrescentar novo dado, deletar o dado desnecessário oumudar o dado velho para torná-lo atual.
■ Indexar :– é a criação e manutenção do endereço do computador utilizado
para ajudar a localizar o dado quando ele for necessário no futuro.
■ Proteger :– precisa ser colocado em um local onde ele esteja seguro e pode
ser acessado no futuro.
■ Recuperar :– envolve recuperar o dado de sua localização para que ele possa
ser visto ou acessado em um novo processamento de dado
10
19/135
Saída■ Converter :
– freqüentemente a forma no qual o dado é apresentado não é aforma mais útil.
■ Relatar :– O relatório impresso é a saída mais comum para apresentar a
informação derivada do dado.
■ Apresentar :– A informação está mais e mais freqüentemente sendo apresentada
à administração na forma de relatório, dados tabulados ou gráficos,no terminal de computador em vez de no papel.
■ Comunicar :– O dado precisa ser movido de um local a outro para alcançar o
usuário final.
20/135
Planejamento - Organizações
■ Visão Sistêmica– Elementos: (humanos, materiais, energia,
financeiros, informação)
– Relação entre os elementos-processo
– Meio Ambiente: (fornecedores,mantenedores, sociedade, governo,clientes)
– Objetivo: missão, atender necessidade docliente, valor agregado, lucro?
11
21/135
Planejamento
■ Qualidade nas organizações■ Metodologia de planejamento - FCS■ BSP - Planejamento de sistemas de negócios
■ Engenharia da Informação■ MASP - Método de Análise e Solução de problemas
■ PEI■ Metodologia de Planej. Informações
22/135
Qualidade nas Organizações
■ total satisfação do cliente■ gerência Participativa■ desenvolvimento de RH■ gerência de processos■ delegação■ disseminação de informações■ garantia da qualidade■ não aceitação de erros
12
23/135
Fatores Críticos de Sucesso (FCS)
“FCS são as poucas coisas que têm que andar bem para garantir sucesso a um gerente ou organização”
Áreas gerenciais de atenção especial e contínua.
Metodologia FCS (CSF) : explicita os FCS
Diálogos estruturados entreanalistas e gerentes
24/135
Metodologia de Planej. Informações
■ Análise da organização■ Diagnóstico■ PEI - Planejamento Estratégico de Informações
■ PESI - Planejamento Estratégico Sistemas Informação
■ PDI - Plano diretor de informática
■ Estudo da viabilidade
13
25/135
Pirâmide da Engenharia de Informação
Análise de Informações
Planejamento de Informática
Planejamento EvolucionárioPlanejamento
Análise de Dados
Formação de Procedimentos
Estratégias Implementação
Especificação
Usu
ário
Pro
totip
ação Projeto de BD
Descrição Programas
Programação Convencional Programação
nãoConvencional
Desenvol-vimento
26/135
Planejamento de Informática
Visa a obtenção de uma estratégia de informatização da empresa e do plano de ação necessário para o seucumprimento.
Comparar
Agir
ControlarExecutar
Decidir Medir
PlanejarObjetivo Plano
14
27/135
Planejamento de InformáticaX
Níveis Organizacionais Clássicos
Estratégico
Tático
Operacional
Resultado a Longo Prazo, Instrumento
de Análise global - Produção/Meio Ambiente
Resolver, em cada área operacional,
problemas dealocação de recursos
Detalhamento de todas as atividades e
recursos necessários p/concretizar objetivos
28/135
Níveis de Decisão
■ Estratégico– longo prazo
■ Tático– médio prazo
■ Operacional– curto prazo
15
29/135
Estratégico
■ Necessitam de amplas fontes deinformação e flexibilidade namodelagem.– Dados corporativos
– Políticas globais da companhia e direçõesda organização
– Comunicação de idéias é um componenteimportante
30/135
Tático■ Controlam recursos corporativos,
– como monitoração da performance
– planejamento do orçamento, paraimplantar e apoiar a estratégia dacompanhia.
■ Não tratam os fatos rotineiros.– Dados sumarizados
– Alocar recursos para atingir objetivos
– Precisa de feedback das unidadesoperacionais
16
31/135
Operacional
■ Processamento de transações econtrole dos dados do processos sãoas principais atividades do níveloperacional
■ Dados são detalhados
32/135
Etapas de um Planejamento deInformática
■ Identificar a Equipe
■ Preparar encontros de planejamento
■ Abertura do Encontro
■ Análise do Planejamento Estratégico
■ Definição dos SI´s
■ Estabelecer Prioridades deDesenvolvimento
■ Construir o PDI
17
33/135
Etapa 1:Identificar a Equipe
Pessoas - mesma equipe de Análise de Informações;
– Entendimento global da organização– objetivos
– estrutura interna
– Necessidades de informação nos diversos níveis(pessoal da alta administração)
– Recursos de Informática e sua utilização(setor de informática)
– Planejamento(assessor interno ou externo ou ambos)
Equipes– Atribuições– Tarefa realizada pela alta direção e consultores
34/135
Etapa 2:Preparar Encontros de Planejamento
❍ Planejando o Planejamento❍ Definição clara dos objetivos a serem
atingidos:
■ Qualidade■ Escopo■ Horizonte
■ Recursos■ Prioridades■ Metodologia
18
35/135
❶ Elemento de Motivação e Direcionamento doProcesso (realizada pelo Presidente daorganização);
❷ Motivos do Planejamento de Informática;❸ Responsável pela Informática apresenta
cenário atual;❹ Apresentação da Metodologia para o
desenvolvimento do processo;
Etapa 3:Abertura do Encontro
36/135
■ Decisões e posicionamentos a longoprazo, ligadas ao planejamentocorporativo– Estrutura de decisões desejadas
– Forças direcionadoras
– Orientações Tecnológicas
Etapa 4:Abertura do Encontro
19
37/135
■ As Bases de Dados (relacionamentos,entidades polarizadoras, grau de informaçãoadequado a cada área, etc...)
■ Os Processos■ Análise dos Processos & Entidades
– identificar as diferentes possibilidades desub-sistemas de informação
Etapa 5:Definição dos SI´s
38/135
■ Esta base de dados será utilizado por quaissistemas?
■ Este sistema necessita de quais bases de dados?■ Qual a probabilidade de sucesso deste sistema e em
que prazo?■ Os recursos para este sistema existem ou deverão
ser adquiridos?■ Qual a resistência do usuário deste sistema?■ A tecnologia para este sistema é nova ou já está
dominada?
Etapa 6:Prioridades de Desenvolvimento
20
39/135
■ Plano Diretor de Informática (resultadodo processo de planejamento)
■ Especifica o Plano de Ação para odesenvolvimento do Sistema Integradode Informações
Etapa 7:Construir o PDI
Universidade de Passo FundoCurso de Ciência da Computação
Plano Diretor de InformáticaProf. Alexandre Lazaretti Zanatta
21
41/135
Roteiro Básico Construção de um PDI
■ 1.1 Objetivo Geral– Traçar um projeto global de informatização da
empresa, visando o desenvolvimento, o controle e oatendimento das necessidades
■ 1.2 Objetivo Específico– Avaliar a atual demanda de dados cadastrais, os
sistemas e equipamentos disponíveis de forma apromover um planejamento ordenado,compatibilizando a atual situação às necessidadesimediatas e aos objetivos traçados pelas políticas eestratégias da empresa
42/135
Construção de um PDI.■ 1.3 Situação Atual da Área de Informática
– Esta etapa deverá conter a descrição atualsituação da informática na empresa,englobando os seguintes aspectos:
• Histórico e Evolução• Recursos Humanos• Equipamentos• Aplicação - Os sistemas• Dispêndios
22
43/135
Construção de um PDI.
■ 1.4 Avaliações e Considerações– Deverá ser apresentado uma análise do que foi
realizado na primeira implantação de informática.– Devem ser enfatizados os benefícios decorrentes
da execução de determinadas ações previstase/ou problemas lançados pela não realização deoutros
■ 1.5 Base de Planejamento– Políticas e Diretrizes– Objetivos e Metas– Objetivos Básicos do Planejamento
44/135
Construção de um PDI.
■ 1.5.1 Políticas e Diretrizes– Deverá ser apresentado os princípios básicos que
conduzem a forma de implantação das atividadesda área de informática, bem como, critérios elinhas de ação que orientarão o processo detomada de decisão
■ 1.5.2 Objetivos e Metas– Deverão ser apresentados os resultados ou
situações futuras a serem alcançadas, segundoPolítica de Informática da empresa
23
45/135
Construção de um PDI.
■ 1.5.3 Objetivos Básicos do Planejamento– Contribuição para capacitação da empresa com
fins de um melhor atendimento dos programasprioritários de desenvolvimento econômico
– Adequação e otimização do uso dos recursos deinformática, inclusive através de intercâmbio comoutras empresas (parceria)
– Sigilo dos dados armazenados, processados eveiculados de interesse da privacidade e dasegurança das pessoas
46/135
Construção de um PDI.
■ 1.6 O Projeto de Informática– Novas aplicações de informática, recursos humanos,
equipamentos, sistemas, dispêndios, justificativa
■ 1.7 Orçamento Estimativo– Projeto, aquisição de equipamentos, aquisição de
sistemas, treinamento.
■ 1.8 Cronograma Financeiro deDesembolso
24
47/135
Custos do Sistema■ Hardware:
– Tipo de máquina – configuração, impressoras, comunicaçãode dados, no-break / estabilizadores, dispositivos desegurança, manutenção
■ Software : Comprar x Fazer■ Pessoal:
– Gerenciamento e coordenação, consultoria e auditoria,projeto e análise de sistemas preparação e entrada dedados, operação, programação, suporte adminstrativo
■ Comuns de operação:– Treinamento, transmissão e comunicação de dados,
instalação e teste de programas, troca de sistemas, materialde consumo
■ Ambientais:– Espaço físico, ar condicionado, impostos e seguros,
equipamentos de escritório, instalação especial?
Universidade de Passo FundoCurso de Ciência da Computação
Sistemas de InformaçãoProf. Alexandre Lazaretti Zanatta
25
49/135
Introdução
■ "O conhecimento técnico é importante,mas não é o suficiente”
■ O negócio deve ser colocado nafrente da tecnologia.– o que nós queremos fazer– como nós podemos fazê-lo?– como a tecnologia deve nos ajudar?
50/135
Definição
■ “É uma série de elementos oucomponentes inter-relacionados quecoletam (entrada), manipulam earmazenam (processo), disseminam(saída) os dados e informações efornecem um mecanismo de feedback”
(Laudon)
26
51/135
Porquê desenvolver SI■ concorrência se torna cada vez mais acirrada
■ consumidor torna-se cada vez mais exigente em
relação ao custo e a qualidade do produto e dos
serviços associados.
■ rentabilidade e competitividade das empresas
■ Mão-de-obra, matéria-prima, máquinas, etc.,
normalmente são considerados como recursos de
uma empresa
■ Informação também é um recurso
■ planejamento, organização e controle de uma
atividade de negócios
52/135
Componentes de um SI
■ A - Sistemas
■ B - Sistemas de Informação
■ C - SI baseados em computadores
27
53/135
Componentes de um SI■ Sistemas
– Um sistema é um conjunto de elementosinter-relacionados
• Ex: sistema de ar-condicionado ou sistemafilosófico (dialética)
– Um sistema com intenções é um sistemacriado pelo homem que busca um conjuntode objetivos para o qual ele foi criado (SItêm objetivos)
54/135
B - Sistemas de Informação
■ É um sistema aberto, com intenções,dinâmico e que produz informação
■ Informação mínima possui 3elementos: pessoas, procedimentose dados
■ pessoas seguem procedimentos paramanipular dados e criar informações
28
55/135
C - SI baseados em computadores
■ Constituídos por pessoas, procedimentos,dados, programas e computadores.
56/135
29
57/135
Componentes de um SIAbordagem Sócio-técnica
Sistema de
Informações
PessoasOrganizações
TecnologiaAmbiente Externo
Universidade de Passo FundoCurso de Ciência da Computação
Tipos de SIProf. Alexandre Lazaretti Zanatta
30
59/135
Tipos
■ Sistemas Especialistas■ Sistemas de Simulação■ Sistemas Distribuídos■ SGBD■ Sistemas de Hipertexto■ S. Hiperdocumentos■ GIS■ Groupware /■ Intranet
■ SI Transacionais■ SI Gerenciais■ SAD■ SAE - Sist Aut Escrit.
■ DataWarehouse■ DataMining
60/135
Sistemas de Informação Transacionais - SIT -(Transaction Processing Systems )
■ Transação: evento que ocorre num negócio(compras, vendas, pagamentos, etc...)
■ Os SIT apoiam as atividades rotineiras eoperacionais da companhia, mantêm a maioria dosdados da Cia.– Processos simples, mais altamente repetitivos– Grande volume de transações,– Necessidade de precisão e segurança.
■ Exemplos SI Transacionais (SIT):– Reserva de passagens, Compras, Pagamentos
31
61/135
Tipos de SIT■ On-line (Tempo Real): Ligação direta entre o usuário e o
programa, cada transação é processada individualmente.– Exemplo: sistema de cartões de crédito.– Vantagem: Resposta imediata.
■ Batch: As transações são agrupadas e processadas comouma só unidade.– Exemplo: Folha de pagamento.– Vantagens: em alguns casos mais eficientes e mais
baratos; Facilidade de controle.
■ Saídas: relatórios com sumários dos detalhes operacionaise relatórios de casos excepcionais, que auxiliam o controlee supervisão das atividades rotineiras
62/135
SIT
32
63/135
Sistema Informação Gerencial SIG■ Objetivo:
– Controle das atividades, podendo também ser utilizadospara o planejamento e organização.
■ Facilitam a gerência de atividades operacionais,– Produzem periodicamente relatórios estruturados e
resumidos.
■ Decisões táticas e de planejamento dasoperações.
■ Utilizados pelas gerências de nível intermediário■ Saídas (relatórios SIG): sumários (impressos,
tempo real).– Exemplos: relatórios de orçamentos, projeções de mão-
de-obra, previsões de vendas.
■ Semi-estruturados
64/135
SIG
■ Questões que um SIG pode ajudar a responder– Quais os cursos mais rentáveis da universidade? (Matrícula
+ pagamentos)– Qual o número médio de alunos por curso da UPF ao longo
dos últimos 3 anos?– Devo duplicar os horários de uma turma? (Matrícula + dados
históricos de desistência)
33
65/135
Sistema de Apoio à Decisão - SAD
Definições:
– “É um sistema de informação baseado em computador queapoia pessoas engajadas em atividades de tomada de decisão”.
– “É um sistema de informação baseado por computador queafeta ou que tem a intenção de afetar como as pessoas tomamdecisões”.
■ Características:– A necessidade de um SAD pode ser eventual.
– Problemas menos estruturados.
– Flexibilidade e adaptabilidade são essenciais.
– São dinâmicos pois mudam
• entendimento da questão
• as necessidades do problema
66/135
SAD■ SADS específicos
– aplicativo de SI com características particulares (hw esw)
• ex: sistema de locação de imóveis; sistema de alocaçãode recursos, etc...
■ Gerador de SADs– pacote de HW e SW que oferece conjunto de recursos
para criação de um SAD específico• ex: Excel, Access, Delphi, etc...
■ Ferramentas para SAD– elementos de HW e SW que oferecem recursos para
facilitar a criação de Geradores de SADs e SADsespecíficos
• bibliotecas para construção de Excel; macros, etc...
34
67/135
Questões:Devo criar um novo curso de engenharia ambiental?Devemos abrir um novo campus?Devemos aumentar os preços?
68/135
Sistema de Automação de Escritório■ Editores de texto■ Sistema de correio eletrônico■ Grupos de Notícias, Máquinas de Fax■ Correio de voz■ Sistemas multi-mídia■ Sistemas de Informação Distribuídos■ Video-conferência■ Tendência:
– SAEs integrados => Internet. Compartilhamento de
informações.■ Obstáculos à difusão dos SAEs:
– Dificuldade de integrar componentes (diferentes padrões).– Custo de armazenar informações não usuais (imagens,
som, vídeos)
35
69/135E.I.S.
70/135
EIS■ Utilizados para obter informações globais da
organização■ Apresentam os dados de maneira muito agregada
– sendo porém possível detalhar os dados.■ ("drill-down") => Visão estratégica■ Características:
– Gráficos , Interface intuitiva, Integram várias fontesde dados com contextos (séries históricas,comparações, etc).
■ Questões (de um reitor de uma universidade):– Qual é o departamento com maior relação entre número de alunos
e número professores?
– Qual o departamento que mais cresceu nos últimos 3 anos?
– Comparação dos dados da UPF com outras universidadescomunitárias
36
71/135
EIS / SAD(foco decisão)
Alta Gerência
SIG (foco informação)
Sist. Especialistas
Gerência Nível MédioProfissionais Especializados
SIT (foco dado)PessoalOperacional
VendasProdução FinançasRH
Tipologias de SI
72/135
Futuro■ Integração de EIS + SIG + Fontes externas de dados
■ Bancos de dados multi-dimensionais: duplicação
planejada de dados
■ Inteligência na recuperação de informações.
■ Datamining ( Mineração ou garimpagem de dados)
■ Inteligência de Negócios (competitiva, estratégica,
empresarial) Processo estruturado e sistemático de
disseminar, para executivos de uma empresa,
■ informações de ambientes externos, que podem
representar ameaças e novas oportunidades.
■ Banco de dados OO, Multimidia
37
73/135
74/135
SE - Sistemas Especialistas■ Ramo da inteligência artificial, são sistemas que usam
raciocínio simbólico especializado para resolver
problemas complexos.
– Exs:CADUCEUS - SE p/diagnóstico médico, ILDC -SE
p/escalonamento de atividades e recursos e PROSPECTOR-
SE p/diagnóstico de solos
■ Concebidos especificamente para atender asnecessidades de executivos
■ Orientado a informações internas■ Englobam sistemas de monitoramento e controle,
verificação de performance, indicadores■ Atuar na comunicação do grupo.
– Ex: correio eletrônico
38
75/135
SE
interface Base de conhecimento
Motor de inferência
justificador
Subsistema deaquisição deconhecimento
Engenheirodo
conhecimentoespecialista
Universidade de Passo FundoCurso de Ciência da Computação
Data WarehouseProf. Alexandre Lazaretti Zanatta
39
77/135
Conceito 1
■ Data Warehouse– consiste basicamente em uma grande
massa de dados• não-voláteis, organizados em assuntos,
integrados e variável em relação ao tempo
– tecnologia recente
– estudos indicam que não existam produtosque apliquem todos os requisitos para suautilização
78/135
Conceito 2
■ O Data Warehouse (DW) é um conjuntode técnicas que aplicadassimultaneamente geram um sistema dedados que nos proporcionaminformações para tomada de decisões.
■ Funciona tipicamente na arquiteturacliente/servidor.
40
79/135
Objetivo
■ fornecer os subsídios necessários paraa transformação de uma base de dadosde uma organização de OLTP paraOLAP.
80/135
OLTPOn-Line Transaction Processing
■ processamentos que executam asoperações do dia-a-dia da organização
■ ênfase ao suporte do negócio, atravésde um processamento rápido, acuradoe eficiente de dados– Ex: movimento bancário
41
81/135
Exemplo Processamento. Transação - OLTP
Início
Débito
R$1000,00
Crédito
R$ 700,00
Crédito
R$ 300,00
Fim
Conta A
Conta B
Conta C
ContaA = R$ 5.000,00
ContaB = R$ 2,00
ContaC = R$ 100,00
ContaA = R$ 4.000,00
ContaB = R$ 702,00
ContaC = R$ 400,00
82/135
OLAPOn Line Analytical Processing
■ processamentos que suportam atomada de decisões
■ permite analisar tendências e padrõesem grande quantidades de dados– ao longo do tempo (histórico)
– e em diferentes localizações (geográficos)
42
83/135
OLTP OLAPOrientados a aplicações Orientados a assuntosAs Vezes de Grande tamanho Quase sempre grandesDados granulados Dados constituídos de sumarizaçõesDados de pouca fontes Dados de múltiplas fontesSuporta consultas e atualizações Atualizações em modo batchDados que mudam constantemente Dados mais estáveisDados atuais Dados históricosTabela 1 Diferenças entre banco de dados OLTP e OLAP(fonte: [COR 97])
84/135
Extração eIntegração dos
dados
DWOLTP
Acesso aDados
Ambiente do DW
43
85/135
Características do Data Warehouse
■ Orientado por temas
■ Integrado
■ Variante no tempo
■ Não volátil
86/135
Orientado por temas
■ refere-se ao fato do DW armazenarinformações sobre temas específicosimportantes para o negócio daempresa.
• Exemplos produtos, atividades, contas,clientes, etc.
■ o ambiente operacional é organizadopor aplicações funcionais.
• Exemplo, em uma organização bancária, estasaplicações incluem empréstimos, investimentose seguros.
44
87/135
Integrado
■ refere-se à consistência de nomes, dasunidades das variáveis.
■ dados foram transformados até umestado uniforme.
• Exemplo, considere-se sexo como umelemento de dado.
88/135
Variante no tempo
■ refere-se a algum momento específico,– não é atualizável
■ enquanto que o dado de produção éatualizado de acordo com mudanças deestado do objeto em questão, refletindo,em geral, o estado do objeto no momentodo acesso.
■ a cada ocorrência de uma mudança,– uma nova entrada é criada, para marcar esta
mudança.
45
89/135
Não volátil■ Permite o "load-and-access”
■ Após integração e transformação, dadosarmazenados em bloco para o DW– após aos usuários
■ rollback, recuperação de falhas, commits ebloqueios
90/135
Ambiente do DW
46
91/135
Arquitetura do DW
■ Arquitetura Genérica• Camada de Bancos de Dados Operacionais• Camada de Acesso à Informação• Camada de Acesso aos Dados• Camada de Metadados (Dicionário de Dados)• Camada de Gerenciamento de Processos• Camada de Transporte ou Middleware• Camada do DW• Camada de Gerenciamento de Replicação
■ Arquitetura de Dados
92/135
Data Marts■ É um SAD que incorpora um
subconjunto de dados focalizado em
funções ou atividades específicas
■ relacionado ao negócio
■ ex: previsão de vendas, medida de
impacto da introdução de novos
produtos
■ alternativa popular a DW
47
93/135
Data Marts
DW
94/135
Data Mining
■ Ou KDD (Knowledge Discovery inDatabases)
■ extração implícita dos dados nãoconhecidos previamente epotencialmente úteis
■ diferentes técnicas– clustering, sumarização, regras de
classificação e detecção de anomalias
48
95/135
Passos para aplicação de um DW
■ DW não é um produto que se compra,mas sim um projeto que envolve:– análise e implementação, com a
participação de várias tecnologias.
■ sete passos para a criação de um DW,que pode ser inicialmente um data mart(assunto específico) até mesmo um DWno nível corporativo.
96/135
Passo 1 -
■ os primeiros resultados devem estardisponíveis a curto prazo. É importantetraduzir rapidamente as necessidadesdo negócio em uma especificação quepossa ser construída em etapas.
■ minimiza riscos e o tempo deapresentação dos resultados iniciais.
49
97/135
Passo 2 -
■ desafio de integração de sistemas.– Dados de produção e de fontes externas
precisam ser mapeados para o modelo dedados do DW.
■ sincronismo– entre os dados operacionais e os dados de
tomada de decisão.
■ sincronia em um banco de dados multi-dimensional.
98/135
Passo 3 -
■ a escolha do banco de dados desuporte ao DW precisa ser criteriosa.
■ critérios– desempenho na carga e indexação dos
dados,
– tempo de resposta,
– capacidade de armazenamento,
– paralelismo,
– escalabilidade.
50
99/135
Passo 4 -
■ considerar as ferramentas disponíveisno mercado
■ devem prover:– interfaces amigáveis,
– geração de relatórios,
– análises multi-dimensionais,
– acesso via Web e data mining.
100/135
Passo 5 -
■ construir um DW que possa serexpandido, mantendo níveis aceitáveisde desempenho até gigabytes.
51
101/135
Passo 6 -
■ ambiente DW deve ser aberto parapermitir que os componentes ouferramentas identificadas no passo 4possam ser substituídas por outrasmais atuais e eficientes.
Ferramentas
102/135
Passo 7 -
■ considerar o sistema dearmazenamento que fisicamentegerencia– o tráfego,
– alocação,
– backup e
– restauração dos dados.
52
103/135
104/135
Ferramentas de Extração
■ Como o DW é um BD que fica separadodo sistema OLTP, existem ferramentasque automatizam o processo.
■ Ex: Platinum, Prism, Power Stage (sybase)
Exemplos de BD■ Oracle 9. Sybase IQ 12, DB2, Informix,
SQL Server 7.0
53
Universidade de Passo FundoCurso de Ciência da Computação
Projeto Data WarehouseProf. Alexandre Lazaretti Zanatta
106/135
Projeto de BD Dimensional
■ Diferença entre sistemas transacionais
OLTP e DW está na organização dos
dados - modelo de dados
■ Modelo ER divide os dados em várias
entidades distintas, cada uma gerando
uma tabela do BD OLTP
54
107/135
Observações sobre MER■ Simétrico
– Todas tabelas parecem iguais, sendodifícil visualização
■ Consulta a duas tabelas– Número imensos de conexões possíveis
entre duas tabelas. Quando várias tabelasmuito complexo para usuário entender efazer análises.
■ “modelos E-R não são adequados paraambientes de consultas (read-only) enão podem ser utilizados como basepara DW”
108/135
MERCADO
Região
Estado
Distrito
Cidade
MERCADO
PRODUTO
PERÍODO
Qtd Vendas
Unidades
Preço
PRODUTO
Fabricante
Tp Produto
Cor
Tamanho
PERÍODO
Ano
Trimestre
Mês
Dia
Modelo Dimensional de Dados
55
109/135
Opções de Projeto de DW■ Star
– (estrela)
■ Parcial Star– (estrela parcial)
■ Fact Partitioning– (particionamento de fatos)
■ Dimension Partitioning– (particionamento de dimensão)
■ Snowflake – (floco de neve)
110/135
Star
■ Dentro de cada tabela existe uma únicacategoria de dados históricos
■ chave primária da tabela de dados contém umaúnica tabela de chaves de cada dimensão
■ cada chave é uma chave gerada
■ cada dimensão é representada por uma únicatabela, também através de uma chave gerada
56
Universidade de Passo FundoCurso de Ciência da Computação
Data MiningProf. Alexandre Lazaretti Zanattacolaboração Prof Marcos Brusso
112/135
Conceito
■ Mineração de dados (data mining)– É o processo de análise de conjuntos de
dados
– objetivo: descoberta de padrõesinteressantes e que possam representarinformações úteis.
• Um padrão pode ser definido como sendo umaafirmação sobre uma distribuição probabilística
57
113/135
O Processo de Descoberta de Conhecimentoem Bancos de Dados - DCBD
■ Conhecido também por KDD(Knowledge Discovery in Databases)
■ Objetivo é a extração do conhecimentoimplícito e previamente desconhecido ea busca da informação potencialmenteútil dos dados
114/135
DCBD (cont...)
■ Este processo consiste em uma sériede etapas que são executadas de formainterativa e iterativa.
■ Interativa:– envolve a cooperação da pessoa
responsável pela análise dos dados
■ Iterativa:– este processo não é executado de forma
sequencial
58
115/135
Passos do Processo
■ Seleção dos dados
■ Pré-processamento
■ Transformação
■ Mineração de dados
■ Interpretação dos resultados
116/135
Seleção dos dados
■ Etapa onde o conjunto de dados que serviráde base para o processo é criado através da– seleção do conjunto de origem,– de um subconjunto das variáveis ou,– uma amostra.
■ Dados são extraídos de um banco de dadosoperacional ou de um armazém de dados(data warehouse) criado para servir àdiversas necessidades de análise.
59
117/135
Pré-processamento
■ Nesta etapa são decididas asestratégias e realizada a limpeza dosdados a fim de– remover ruídos e
– tratar dados incompletos, se for o caso.
118/135
Transformação
■ Algoritmos de mineração não podem acessaros dados em seu formato nativo– seja devido à forma em que são armazenados ou
devido à normalização adotada na modelagem dobanco
– é necessária a conversão dos mesmos para umformato apropriado.
■ Pode-se ainda sumarizar os dados a fim dereduzir o número de variáveis sobconsideração.
60
119/135
Mineração de dados
■ Consiste na efetiva aplicação doalgoritmo escolhido sobre os dados aserem analisados,– objetivo de localizar os padrões desejados.
■ Qualidade dos resultados deste passodepende diretamente da corretarealização das etapas anteriores.
120/135
Interpretação dos resultados
■ Nesta etapa as informações resultantesdas etapas anteriores são interpretadase avaliadas de forma que se selecioneo conhecimento resultante de todo oprocesso
61
121/135
O Processo de Descoberta de Conhecimento em BD
por Fayyad 1996
122/135
Tipos de Padrões
■ Preditivos
– São encontrados para resolver o problemade predizer o valor futuro ou desconhecidode um ou mais atributos do banco dedados a partir do valor conhecido dosdemais atributos.
62
123/135
Tipos de Padrões (cont...)
■ Descritivos ou informativos
– Têm por objetivo encontrar padrõesinteressantes, de forma interpretável pelohomem, que descrevam os dados
124/135
Tipos de Padrões Descritivos
■ Agrupamento
■ Regras de associação
■ Padrões sequenciais
63
125/135
Agrupamento ou Clustering
■ Resulta do processo de agrupar objetosfísicos ou abstratos– em categorias ou grupos de objetos baseado em
algum critério de similaridade,– de forma a identificar aglomerações que
descrevam os dados.
■ Categorias podem ser mutuamenteexclusivas e exaustivas ou consistir derepresentações mais aprimoradas como ahierárquica ou categorias sobrepostas
126/135
Agrupamentos hipotéticos de clientes
64
127/135
Regras de associação
■ são padrões descritivos que representam aprobabilidade de que um conjunto de itensapareça em uma transação, dado que outroconjunto esta presente.
■ Tais regras são representadas comoexpressões na seguinte forma: X → Y.
128/135
Exemplo de Regras de associação
■ 80% dos clientes que adquirem o produto A,também adquirem o produto B na mesmaocasião
■ 80% = grau de confiança■ A = antecedente■ B = consequente
65
129/135
Padrões sequenciais
■ são regras que descrevem a tendênciade que certos eventos aconteçamobedecendo uma determinadasequência temporal
130/135
Exemplo Padrão Sequencial
■ "Quando as ações da AT&T sobem doisdias seguidos e as ações da DEC nãocaem no período (antecedente daregra), as ações da IBM sobem no diaseguinte (conseqüente da regra) em75% das vezes (grau de confiança daregra)."
66
131/135
Tipo de Padrão Preditivo:Regressão
■ Refere-se a descoberta de padrõespreditivos onde o atributo a ser encontradoé uma variável de valor real.– Pode ser utilizada a técnica de regressão
linear,• onde o atributo predito é modelado como uma simples
função linear do seus atributos de entrada.
■ Ex: Redes Neurais Artificiais
132/135
Tipo de Padrão Preditivo:Classificação
■ Mais conhecida
■ Objetivo classificar itens de dados emuma entre diversas classespreviamente definidas,– baseado em propriedades comuns entre
um conjunto de objetos no banco dedados.
67
133/135
Exemplo de Sucesso - Supermercado
■ Considerando:– usa scanners de código de barras no caixa de
compras.– O sistema é quem identifica o nome e preço do
produto sendo "scaniado", e atualiza a lista deestoque
– prateleiras podem ser reabastecidas em poucotempo.
– conjuntos de dados contém muitas informaçõesvaliosas que podem ser usadas para outrospropósitos
134/135
■ Informação usada para:– providenciar resumos de vendas,– estar ciente das preferências do cliente,– ganhar na competição contra outros varejistas,
para ficar sabendo quais itens (ou combinação deitens) devem ser colocados a venda,
– adquirir vários tipos de informações de marketing.
68
135/135
DM pode apontar:
■ Quais itens são frequentemente– comprados em combinação
• (ex: cereais e leite; mostarda, pão de cachorro quente econdimentos; petiscos e refrigerante; fralda e comidapara recém nascidos)
– adquiridos numa compra em torno de R$ 100,00– comprados por famílias ( uma família pode ser
identificada através dos tipos de certos produtosque são tipicamente vistos por crianças)
– comprados por pessoas fazendo pequenascompras