Iscad ti 2010_2011_1 - dados informação e bases de dados

46
AGP Tecnologias da Informação Dados, Informação e Bases de Dados

Transcript of Iscad ti 2010_2011_1 - dados informação e bases de dados

Page 1: Iscad ti 2010_2011_1 - dados informação e bases de dados

AGP

Tecnologias da Informação

Dados, Informação

e Bases de Dados

Page 2: Iscad ti 2010_2011_1 - dados informação e bases de dados

Tecnologias da Informação (TI)

Conjunto de recursos tecnológicos e

computacionais para recolha, tratamento,

difusão e uso da informação.

Componentes:

• Hardware

• Software

• Sistemas de telecomunicações

• Gestão de dados e informações

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 3: Iscad ti 2010_2011_1 - dados informação e bases de dados

Actividades de informação

Actividades económicas que utilizam

profissionais e infra-estruturas ou

equipamentos para produzirem bens e

serviços de informação. As actividades

económicas do sector da informação

produzem e distribuem a informação

necessária à execução de outras actividades

económicas. As actividades são conjuntos de

tarefas executadas no âmbito de um

processo.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 4: Iscad ti 2010_2011_1 - dados informação e bases de dados

Dados e Informação

Informação é todo o conjunto de dados devidamente

ordenados e organizados de forma a terem significado.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

• Dados com significado

num determinado contexto

• Dados após o seu

processamento

• Dados numa determinada

sequência

Page 5: Iscad ti 2010_2011_1 - dados informação e bases de dados

Dados

Em informática designa-se por dados os elementos de partida

que servem de base para o tratamento e sobre os quais o

computador efectua as operações necessárias à tarefa em

questão.

Os dados são uma representação dos factos, conceitos ou

instruções de uma maneira normalizada que se adapte à

comunicação, interpretação e processamento pelo ser humano

ou através de máquinas automáticas.

Os dados são representados por símbolos (letras do alfabeto:

a, b, c, números, etc, mas não são em si a informação

desejada.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

O I O C O M B

São dados mas não é informação perceptível ao homem

Page 6: Iscad ti 2010_2011_1 - dados informação e bases de dados

Dados e Informação

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Dados

O I O C

O M B

Informação

COMBOIO

Processa-

mento

Page 7: Iscad ti 2010_2011_1 - dados informação e bases de dados

7

Dados vs Informação

• Dados - elementos ou valores discretos que

isoladamente não têm valor; transformam-se

em informação quando relacionados e

interpretados de alguma forma.

• Informação - resultado de alguma forma de

processamento/tratamento dos dados, sendo

que estes são a matéria prima necessária.

Page 8: Iscad ti 2010_2011_1 - dados informação e bases de dados

Qualidade dos Dados

• Oportuna

• Precisa

• Rigorosa

• Compreensível

• Actual

• Concisa

• Em formato adequado

• Quantificável

• Disponível de forma

rápida e fácil

• Verificável de forma

independente

• Livre de modificação e

influências

• Fiável independentemente

de quem a recolhe

• Apropriada para as

necessidades do utilizador

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 9: Iscad ti 2010_2011_1 - dados informação e bases de dados

Valor da Informação

• Actualidadea validade da informação é cada vez mais curta

• Correcçãoa informação deverá ser rigorosa e correcta

• Relevânciao excesso de informação pode ser um obstáculo, pelo que é

necessário filtrá-la para que seja usada a que é relevante

• Disponibilidadea informação só é útil se estiver disponível, quando necessária

• Legibilidadea informação só é informação se puder ser interpretada

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 10: Iscad ti 2010_2011_1 - dados informação e bases de dados

Necessidades de Informação

• Como lidar com a incerteza?

• Necessidades não reconhecidas

• Necessidades reconhecidas

• Necessidades perseguidas

• Necessidades satisfeitas

• Definir, Referir, Conferir

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 11: Iscad ti 2010_2011_1 - dados informação e bases de dados

Dado, Informação e ConhecimentoDavenport (1998)

Dado Informação Conhecimento

Definição Simples

observação

sobre o estado

do mundo

Dado dotado de

relevância e propósito

Informação valiosa da

mente humana,

incluindo reflexão,

síntese e contexto

Caracte-

rísticas

• Facilmente

estruturado

• Facilmente

obtido por

máquinas

• Frequente-

mente

quantificado

• Facilmente

transferível

• Requer unidade

de análise

• Exige consenso

em relação ao

significado

• Exige necessa-

riamente a

mediação humana

• Difícil estruturação

• Difícil captura em

máquinas

• Frequentemente

tácito

• Difícil

transferência

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 12: Iscad ti 2010_2011_1 - dados informação e bases de dados

Dados, Informação e Conhecimento

Dados

• 12 Graus Celsius

• 85 km / hora

Informação

• 12 Graus Celsius em

Lisboa

• 85 km / hora no Castelo

de S. Jorge

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Conhecimento

Se estão 12 Graus

Celsius, 85 km / hora e

estamos em Novembro, é

provável que chova

Page 13: Iscad ti 2010_2011_1 - dados informação e bases de dados

Sabedoria

• Carnaval na rua: Páscoa em casa.

• Natal à lareira: Páscoa na soalheira.

• Natal em casa: Páscoa na praça.

• Março marçagão, manhã de Inverno tarde de Verão.

• Abril, águas mil.

• O Agosto será gaiteiro, se for bom o Janeiro.

• Aberta para Castela: chuva como terra.

• Arco da velha por água espera.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 14: Iscad ti 2010_2011_1 - dados informação e bases de dados

A Pirâmide da Sabedoria

Serviços

Informação

Produtos

DadosMatérias Primas

Ruído

Experiências

Conhecimento

Transformações

Sabedoria

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Intuição

Significado

Contexto

• Onde está a Vida

que perdemos ao viver?

• Onde está a sabedoria que

perdemos no conhecimento?

• Onde está o conhecimento que

perdemos na informação?

T.S. Eliot (1934)

Page 15: Iscad ti 2010_2011_1 - dados informação e bases de dados

Suportes e Sistemas

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Dados

Informação

Conhecimento

Sabedoria

Real

Sistemas de

Organização

do Conhecimento

Sistemas de

Suporte

à Decisão

Sistemas de

Informação

Bases de Dados

Interacções e inter-relações

Co

mp

lexid

ad

e

Page 16: Iscad ti 2010_2011_1 - dados informação e bases de dados

Hierarquiados componentes da Informação

• Caracteres - podem ser numéricos,

alfabéticos ou sinais de pontuação.

• Campos - são conjuntos de caracteres que

identificam um componente de um registo.

• Registos - são agrupamentos de campos

descritivos de uma realidade.

• Ficheiros - são conjuntos de registos cuja

informação é estruturalmente analógica.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 17: Iscad ti 2010_2011_1 - dados informação e bases de dados

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

c

Brinquedos, Lda. Ficheiro de Artigos

Refª Artigo 0001 Descrição Barbie

Preço de Compra 40.00

Preço de venda 60.00

Taxa Iva 21%

Ficheiro

Caracteres

Campos

Registo

Hierarquiados componentes da Informação

Exemplo:

Page 18: Iscad ti 2010_2011_1 - dados informação e bases de dados

Informação organizada por assunto(extensões de ficheiros)

• COM: ficheiro de comandos

• EXE: executáveis

• BAT: processamento batch

• TXT: texto no formato ASCII

• PAS: programas em Linguagem Pascal

• C: programas em Linguagem C

• BACK: backup ou cópias de segurança

• SYS: ficheiros de sistema

• XLS: folha de cálculo Excel

• PPT: apresentações do Powerpoint

• MBD: base de dados do Access

• DOC: documentos de um processador de texto

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 19: Iscad ti 2010_2011_1 - dados informação e bases de dados

Organização dos dados

• Dados quantitativos - são os que exprimem quantidades e

por isso, normalmente, servem de base para cálculos

aritméticos.– Exemplo: a ficha escolar : as notas do período, as faltas, o total das faltas.

• Dados classificativos - são os que descrevem ou

especificam os elementos envolvidos e quantificados.

Normalmente servem de complemento aos dados

quantitativos, identificando pessoas, objectos, situações, etc.

Não servem para elementos de cálculo.– Exemplo: a ficha escolar : o nome do aluno, o nome da disciplina, o nome do

professor.

• Dados referenciais - são dados que permitem controlar e

referenciar os elementos tratados.– Exemplo: a ficha escolar : o ano lectivo, o número do aluno, a turma.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 20: Iscad ti 2010_2011_1 - dados informação e bases de dados

Tipos de Operaçõesrealizadas sobre os dados

• Operações aritméticas - são efectuadas apenas sobre

dados numéricos e são basicamente constituídas por somas,

subtracções, multiplicações, divisões e outras similares.

• Operações lógicas - são efectuadas sobre dados numéricos

ou não numéricos. Estas operações são também, por vezes,

designadas por operações de comparação.

• Operações de movimentação interna - são efectuadas

sobre qualquer tipo de dados e consistem na cópia e

mudança de localização interna dos dados na memória do

computador.

• Operação de Input / Output - são as operações que

envolvem os órgãos de entrada e saída, permitindo a

comunicação entre o operador e a máquina.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 21: Iscad ti 2010_2011_1 - dados informação e bases de dados

Funções do processamento de dados

• Input - fase de selecção e aquisição dos dados pelo computador.

• Ordenação - esta é uma função auxiliar . O seu objectivo é dispor os

dados de uma forma organizada (ordenada), de modo a facilitar o seu

tratamento. Se os dados se mantiverem ordenados segundo um

determinado critério, pré-definido, a sua pesquisa é mais fácil, o que faz

aumentar a velocidade do processamento.

• Processamento - considera-se processamento ao conjunto de todas

as operações efectuadas, internamente pelo computador na

manipulação dos dados.

• Armazenamento - esta é uma função muito importante, que permite,

posteriormente, analisar as etapas e os resultados do processamento.

• Output - é a obtenção de resultados sob a forma de informação

significativa para as pessoas a quem se destina.

• Controlo - a sua finalidade é detectar, corrigir e eliminar possíveis

erros ou afastamentos em relação aos objectivos inicialmente traçados.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 22: Iscad ti 2010_2011_1 - dados informação e bases de dados

Leis de Beal (2004)

1ª Lei:

A informação é (infinitamente) partilhável

Ao contrário dos activos comuns, a informação pode

ser partilhada infinitamente e usada simultaneamente

por inúmeras pessoas, sem que seja consumida

nesse processo.

À medida que um maior número de utilizadores é

atingido o valor da informação aumenta, fortalecendo

os vínculos e os relacionamentos da organização com

o seu ambiente externo.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal “Ask once - Use many”

BEAL, Adriana - Gestão estratégica da informação, São Paulo: Atlas, 2004.

Page 23: Iscad ti 2010_2011_1 - dados informação e bases de dados

Leis de Beal (2004)

2ª Lei:

O valor da informação aumenta com o seu uso

Quanto mais utilizada, maior o seu valor.

3ª Lei:

A informação é perecível

Perde parte do seu valor potencial à medida que o

tempo passa.

4ª Lei:

O valor da informação aumenta com a precisão

Quanto mais precisa for uma informação, mais útil ela

é, e, portanto mais valiosa se torna.AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 24: Iscad ti 2010_2011_1 - dados informação e bases de dados

Leis de Beal (2004)

5ª Lei:

O valor da informação aumenta quando há

combinação de informações

Quanto mais integrada estiver a informação, maior o seu

valor potencial dentro das organizações.

6ª Lei:

Mais informação não é necessariamente melhor

A quantidade excessiva reduz seu valor.

7ª Lei:

A informação multiplica-se

A informação é „autogenerativa‟, multiplicando-se com

operações de síntese, análise e combinação.AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 25: Iscad ti 2010_2011_1 - dados informação e bases de dados

Redundância de Informação

Os custos de dados e informações redundantes

incluem o custo de reinserção de dados em

diferentes sistemas, gastos com

armazenamento, com esforço adicional de

desenvolvimento, com interfaces, actividades

de reconciliação necessárias para manter os

dados consistentes etc.

Moody e Walsh (1999)

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 26: Iscad ti 2010_2011_1 - dados informação e bases de dados

Leis da Informação de Finagle

• A informação que temos não é a que

pretendemos

• A Informação que pretendemos não é a que

necessitamos

• A informação que necessitamos não é a que

actualmente se obtém

• A informação que se obtém custa mais do

que podemos pagar

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 27: Iscad ti 2010_2011_1 - dados informação e bases de dados

Pensamentos sobre os dados

“A cada ano que passa, novos e melhores métodos

são desenvolvidos para quantificar informação e obter

desta enormes quantidades de unidades autónomas

de dados”

Bill Gates

“Por volta do ano 2047, toda a informação sobre

objectos físicos, incluindo os seres humanos, edifícios,

processos e organizações estarão em linha. Este

fenómeno é tão desejável como inevitável”

Gordon Bell e Jim Gray

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 28: Iscad ti 2010_2011_1 - dados informação e bases de dados

Pensamentos

Conhecimento

“Confusão é a palavra que inventamos para

uma ordem que não entendemos”

Henry Miller

Sabedoria

“Nós não podemos resolver problemas

recorrendo ao mesmo tipo de pensamento

utilizado para os criar”

Albert Einstein

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 29: Iscad ti 2010_2011_1 - dados informação e bases de dados

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Ficheiros

Ficheiros

FicheirosFicheiros

Ficheiros

Base de

Dados

SGBD

Sistema

de Ficheiros

Page 30: Iscad ti 2010_2011_1 - dados informação e bases de dados

30

Sistema de Ficheiros

• Uma das características principais é a associação

aplicação ficheiros, de que resulta que o mesmo

documento seja tratado em várias vias, com destino a

processamentos diferentes (replicação);

• Cada sistema é tratado como ilha isolada, sem

relação com os sistemas já existentes, sendo os

mesmos dados armazenados e recolhidos por

aplicações diferentes em momentos diferentes;

Page 31: Iscad ti 2010_2011_1 - dados informação e bases de dados

31

DadosAplicação A

DadosAplicação B

DadosAplicação C

DadosAplicação D

Cada aplicação com os seus dados

Sistemas Isolados

Page 32: Iscad ti 2010_2011_1 - dados informação e bases de dados

Guia de Produção Nº 1234 2ª Via

Ref. Descrição Dta

Guia de Produção Nº 1234 1ª Via

Ref. Descrição Dta

Guia de Produção Nº 1234 3ª Via

Ref. Descrição Dta

Controlo de Produção

Gestão de Stocks

Expedição

Replicação de Dados

Page 33: Iscad ti 2010_2011_1 - dados informação e bases de dados

Inconvenientes dos sistemas de

ficheiros no armazenamento de dados

Redundância e inconsistência de dados

• Múltiplos formatos, duplicação de informação em

ficheiros diferentes

Dificuldades no acesso aos dados

• Necessidade de escrever um novo programa para

efectuar uma nova tarefa

Isolamento de dados

Múltiplos ficheiros e formatos

Problemas de integridade

• Restrições de integridade (e.g. saldo da conta> 0)

estão incluídas no código dos programas

• Difícil alterar ou adicionar novas restriçõesAGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 34: Iscad ti 2010_2011_1 - dados informação e bases de dados

Inconvenientes dos sistemas de

ficheiros no armazenamento de dados

Atomicidade das alterações• Falhas podem colocar a base de dados num estado

inconsistente com alterações parciais já efectuadas. – E.g. transferência de dinheiro de uma conta para outra ou

deve ser totalmente realizada ou nenhuma alteração deve ser efectuada

Acessos concorrentes por diversos utilizadores• Acessos concorrentes necessários por motivos de

eficiência

• Os acessos concorrentes não controlados podem originar inconsistências

– E.g. duas pessoas a consultarem um saldo e a alterá-lo ao mesmo tempo

Problemas de segurança

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 35: Iscad ti 2010_2011_1 - dados informação e bases de dados

Os SGBDs devem

• Evitar redundâncias

• Facilitar o acesso aos dados

• Permitir acesso simultâneo à informação

• Garantir a segurança dos dados

• Garantir a integridade da informação

– de acordo com restrições pré-definidas

• Permitir vários níveis de abstracção

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 36: Iscad ti 2010_2011_1 - dados informação e bases de dados

36

A importância das Bases de Dados

• Hoje olha-se para a organização como um todo, cabendo à

Informática o papel de implementador do Sistema de

Informação

• O elemento principal do sistema de informação são os dados

(memória de eventos)

• Os arquivos de dados são repositórios lógicos, integrados e

não redundantes, ao qual está associada informação sobre

esses dados (metadados)

• O utilizador adquire a capacidade de intervir directamente

sobre a informação que necessita, reservando-se à informática

tarefas de concepção, administração e gestão dos sistemas

Page 37: Iscad ti 2010_2011_1 - dados informação e bases de dados

Níveis de Abstracção

• Nível físico: descreve como um registo (e.g.,

cliente) é armazenado.

• Nível lógico: descreve os dados

armazenados na base de dados, assim como

as relações entre os dados.

• Nível das vistas: as aplicações ocultam os

detalhes dos tipos de dados. As vistas

também podem esconder informação (e.g.,

salário) por motivos de segurança.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 38: Iscad ti 2010_2011_1 - dados informação e bases de dados

38

Conceitos

• Ficheiro - colecção de todas as ocorrências de um determinado tipo

de registos (lógicos)

• Registo Lógico- conjunto de dados elementares ou agregados.

• Registo Físico - unidade de dados que são lidos ou escritos por um

comando de input ou output; pode não coincidir com um registo

lógico

• Data set - conjunto de registos físicos

• Base de Dados - conjunto de ocorrências de múltiplos tipos de

registos, contendo relações entre si, sem redundâncias, capaz de

servir múltiplas aplicações. Os dados encontram-se estruturados

para servirem de base ao desenvolvimento de aplicações, as quais

são completamente independentes dos dados a utilizar.

• Sistema de Bases de Dados - conjunto de bases de dados,

disjuntas

Page 39: Iscad ti 2010_2011_1 - dados informação e bases de dados

39

Base de Dados(na óptica do utilizador)

É um conjunto de dados partilhados e utilizados com

múltiplos objectivos, permitindo a cada objectivo ter uma

visão e manipulação própria, no entanto sujeito a regras e

procedimentos comuns.

Cada utilizador não se apercebe de todos os tipos de dados

existentes numa base de dados, mas olha e está unicamente

preocupado com os dados que servem as suas

necessidades específicas.

Page 40: Iscad ti 2010_2011_1 - dados informação e bases de dados

40

Sistema de Gestão

de Base de Dados

• Os dados estão organizados num único conjunto, isto

é, encontram-se interligados numa única unidade de

armazenamento (do ponto de vista lógico, não físico);

• O SGBD centraliza o acesso físico aos dados;

• As aplicações têm apenas um interface lógico e não

físico;

• As aplicações não necessitam de conhecer os

detalhes físicos do armazenamento dos dados, sendo

o SGBD que os fornece no formato pretendido;

Page 41: Iscad ti 2010_2011_1 - dados informação e bases de dados

41

• O SGBD é a única entidade que manipula a

base de dados;

• O interface lógico entre as aplicações e os

dados, faz-se através do armazenamento na

base de dados dos:

– Metadados - descrição dos dados

– Dicionário de Dados - catálogo de entidades

Sistema de Gestão

de Base de Dados

Page 42: Iscad ti 2010_2011_1 - dados informação e bases de dados

42

• O dicionário de dados actua como um filtro, permitindo ao SGBD interpretar a estrutura dos dados disponibilizando um interface lógico para as aplicações;

• É assim obtida uma separação entre os dados e as aplicações;

• E é reduzida a redundância dos dados e os problemas daí decorrentes.

Sistema de Gestão

de Base de Dados

Page 43: Iscad ti 2010_2011_1 - dados informação e bases de dados

43

Base

de

Dados

S

G

B

D

Aplicação

A

Aplicação

B

Aplicação

C

Aplicação

D

Aplicação

E

Sistema de Base de Dados

Page 44: Iscad ti 2010_2011_1 - dados informação e bases de dados

Modelação de Dadosindependente da tecnologia

Estruturar os dados de forma a:

• Diminuir da redundância e garantir a

integridade dos dados;

• Partilha de dados por diversas aplicações

(independência entre dados e processos);

• Capacidade de resposta a questões não

previstas.

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 45: Iscad ti 2010_2011_1 - dados informação e bases de dados

Modelação de Dadosindependente da tecnologia

• Questionar regras da organização

• Salientar novas necessidades de informação

• Revelar incoerências actuais

• Construção faseada, “Top-Down”

• Facilidade de comunicação entre utilizadores

e informáticos

AGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal

Page 46: Iscad ti 2010_2011_1 - dados informação e bases de dados

Modelação de Dadosindependente da tecnologia

• Ferramentas ( formais) para descrever:– os vários tipos de dados

– as relações entre eles

– o seu significado

– as restrições de integridade

• Modelo Entidade-Associação (ER – EntityRelationship)

• Modelo Relacional

• Outros modelos:– Modelo orientado para objectos

– Modelos de dados semi-estruturados

– Modelo hierárquico

– Modelo em redeAGP - Tecnologias da Informação 2010 - 2011 - Luís Vidigal