1 Desenvolvimento de uma base de dados Realidade Modelo conceptual (e.g. Modelo...

Post on 07-Apr-2016

216 views 0 download

Transcript of 1 Desenvolvimento de uma base de dados Realidade Modelo conceptual (e.g. Modelo...

1

Desenvolvimento de uma base de dados

Realidade

Modelo conceptual(e.g. Modelo Entidade-Associação)

Modelo lógico(e.g. Modelo Relacional)

2

Modelos conceptuais de tipo E-A

Os modelos de tipo E-A são compostos por entidades e associações.

As entidades representam objectos reais que possuem uma descrição que é determinada pelos problemas que se pretendem resolver por meio da Base de Dados.

As associações representam relacionamentos relevantes entre entidades.

3

Tipo de entidades e atributos

As entidades que possuem uma descrição comum são representadas por um tipo de entidade, o qual é caracterizado por um conjunto de atributos.

Os valores que tomam cada um dos atributos de um tipo de entidade permitem descrever e distinguir entre si as entidades que pertencem a um mesmo tipo de entidade.

4

Exemplo

Num sistema de informação geográfica, um tipo de entidade pode ser constituído por polígonos (objectos espaciais). Cada polígono pode ter um conjunto de atributos (e.g. área, perímetro,...).

Um segundo tipo de entidade poderia ser constituído por unidades territoriais (e.g. concelhos), tendo atributos (e.g. código, designação).

Polígonos e concelhos podem estar relacionados.

5

Diagrama do modelo conceptual: exemplo

concelho empresa

representa

actua

polígono

6

Atributos de um tipo de Associação

Um tipo de associação pode possuir atributos que permitam descrever as características próprias de cada associação.– por exemplo, cada empresa tem um certo número de

trabalhadores em cada concelho.

7

Diagrama do modelo conceptual

concelho empresa

representa

actua

polígono

poli-IDáreaperímetro

códigodesignação

número trab.NIFnome

8

Grau de um tipo de associação

Um tipo de associação caracteriza-se pelo número de tipos de entidade que envolve, podendo ser unária, binária (o caso mais frequente), ternária, ...

9

Multiplicidade (ou cardinalidade) de um tipo de associação

Um tipo de associação binária pode ser:– de um para um (1:1) quando cada entidade só pode

ocorrer numa única associação desse tipo;– de um para muitos (1:n) quando cada entidade de um

tipo só pode ocorrer numa associação, mas as entidades do outro tipo podem ocorrer em mais do que uma associação desse tipo;

– de muitos para muitos (n:n) quando não existe nenhuma restrição ao número de ocorrências de cada entidade em associações desse tipo.

10

Multiplicidade (continuação)

A multiplicidade de um tipo de associação binária é indicada por 4 números: número mínimo e máximo de entidades que ocorrem numa associação, em cada sentido.

A multiplicidade é frequentemente 0,1 ou 1,1 ou 0,n ou 1,n, mas pode ser diferente (2,2 ou 2,n, por exemplo).

11

Exemplo

concelho empresa

representa

actua

polígono

poli-IDáreaperímetro

códigodesignação

número trab.NIFnome

1:n

1:1

1:n 1:n

1:n

n:n

12

Criação de um modelo conceptual de dados

1. Identificar tipos de entidade e seus atributos2. Identificar tipos de associação e seus atributos3. Definir multiplicidades dos tipos de associação

Exercício: Suponha que tem que estruturar um tema relativo a árvores notáveis numa estrutura de dados vectoriais de um sistema de informação geográfica (SIG). Para cada árvore pretende registar o nome comum, o nome científico, a família, a altura da árvore e o diâmetro do tronco (DAP). Existe um milhar de árvores notáveis na região de interesse, havendo várias espécies representadas por diversos indivíduos. Como estruturaria essa informação no SIG?

13

Modelo lógico: SGBD relacional

Baseiam-se num conjunto de conceitos teóricos apresentados em 1970 por E. F. Codd.

Vantagens dos SGBD relacionais:– simplicidade dos conceitos que utilizam– existência de definições formais para os conceitos

• permitiram uma rápida divulgação • permitiram a adesão de diversos fabricantes de software;

– adequação à representação de muitos dos aspectos que constituem a realidade

14

Relação

Nas bases de dados relacionais a estrutura fundamental é a relação.

Uma relação é definida por um esquema e por uma tabela.

Um esquema é composto:– pelo nome da relação– pelos nomes dos atributos

15

1. Esquema

Exemplos:

Polígono(poli-ID, área, perímetro)

Concelho(código,designação)

16

Atributos

Um atributo Ai toma valores num conjunto Di chamado domínio do atributo. – O domínio determina o tipo de valores que o atributo

pode tomar.

Dado U={A1, A2,...,An}, uma relação R sobre U é um subconjunto de D1 x D2 x ... x Dn.

A cada tuplo deste produto cartesiano dá-se o nome de instância da relação R.

17

2. Tabela

O conjunto das instâncias da relação R constituí uma tabela em que - as linhas são as instâncias (ou registos)- as colunas são os atributos (ou campos)

18

Observações os valores de cada atributo pertencem a um mesmo

domínio; o valor de um atributo é sempre atómico;

– isto é, numa tabela, no cruzamento de uma linha com uma coluna só pode existir um valor de atributo;

numa relação não podem existir instâncias iguais; a ordem porque se encontram as instâncias de uma relação

e os seus atributos é irrelevante; podem existir instâncias sem valores em alguns dos seus

atributos; neste caso o atributo diz-se opcional e o seu valor é null;

os nomes (ou identificadores) dos atributos que constituem o esquema de uma relação são únicos nessa relação.

19

Chave(s) de uma relação

Um conjunto de atributos que tomam valores diferentes para cada instância da relação é uma chave da relação. – cada instância pode ser identificada pelo valor da

chave: o valor da chave nunca se repete. Uma chave pode ser composta por um ou mais

atributos. Atributo primário: pertence à chave Atributo não primário: não pertence à chave

20

Chave primária e chave estrangeira

Nos SGBD relacionais, para representar as associações existentes entre as várias entidades utilizam-se esquemas de relações em que figuram atributos comuns.

Chave primária de uma relação é um subcon-junto mínimo de atributos cujos valores permitem identificar de modo único cada uma das instâncias dessa relação.

Uma chave estrangeira de uma relação é um conjunto de atributos que é chave primária de outra relação.

21

Passagem do modelo E-A para relacional

Um modelo de tipo E-A descreve de uma forma natural e simples a realidade.

Os modelos deste tipo são suficientemente flexíveis para poderem ser utilizados eficazmente numa fase em que a estruturação dos dados é ainda confusa.

A estas vantagens pode ainda adicionar-se a facilidade com que é possível efectuar a sua passagem para um SGBD relacional, bem formalizado e comercializado por diversos fornecedores de software.

22

Regras para transformação de um modelo E-A num esquema relacional (1)

Cada tipo de entidades do modelo E-A traduz-se por uma relação em que a chave primária e os atributos provêm do tipo de entidade.

23

Regras para transformação de um modelo E-A num esquema relacional (2)

Um tipo de associação de 1:n (um para muitos) entre dois tipos de entidades Ei e Ej que tenha uma multiplicidade igual a 0,1 ou 1,1 para um tipo de entidade Ei traduz-se por uma chave estrangeira na relação R que é tradução de Ej.

Ej Ei1,n 1,1

Rj Ri

24

Regras para transformação de um modelo E-A num esquema relacional (2')

Um tipo de associação de 1:1 (um para um) entre dois tipos de entidades Ei e Ej é tratado como um caso especial do tipo de associação 1:n– traduz-se por uma chave estrangeira na relação que é

tradução de Ej ou de Ei; – se apenas para um destes tipos entidades a

multiplicidade for 1,1 (sendo para a outra 0,1) dá-se preferência à relação que traduz este tipo de entidade,

– no caso contrário é indiferente qual a relação que é escolhida.

25

Regras para transformação de um modelo E-A num esquema relacional (3)

Um tipo de associação n:n (muitos para muitos) traduz-se por uma relação R em que a chave primária inclui as chaves estrangeiras que são chave primária dos tipos de entidade que a constituem; os outros atributos são a tradução dos tipos de atributos da associação (se esta possuir algum).

Ej Ei1,n 1,n

RjRiR

26

Nota: se nas associações n:n as chaves estrangeiras não são suficientes para formar a chave primária da relação R, na constituição desta devem também ser utilizados outros atributos de forma a ser obtida uma chave primária.

27

Consistência, redundância e formas normais

Para evitar redundâncias e para facilitar a manutenção da consistência dos dados na base de dados, as tabelas devem verificar algumas propriedades.

As duas primeiras formas normais são obrigatoriamente respeitadas por uma relação.

A terceira forma normal assegura a não existência de um certo tipo de redundâncias na base de dados.

28

Modelo relacional: 1ª forma normal

• Todos os atributos tomam valor único.

Exemplo: Em vez de

Fazer:

Tejo principal marítima, terrestre

Mondego principal marítima

Tejo principal sim sim

Mondego principal sim não

29

Modelo relacional - Dependências funcionais

• Dada um relação R definida sobre um conjunto de atributos U={A1, A2, …, An}, diz-se que o atributo Ak depende funcionalmente do atributo Ai (AiAk) se e só se sempre que duas instâncias tiverem o mesmo valor em Ai tiverem também o mesmo valor em Ak.

30

Modelo relacional: 2ª forma normal

• A relação tem que estar na 1ª forma normal• Todos os atributos não primários são

funcionalmente dependentes da chave primária.

31

2ª forma normal

As tabelas num sistema de informação geográfica devem estar na segunda forma normal.

No entanto, essa condição não é suficiente para garantir que as bases de dados não apresentam redundâncias indesejáveis.

32

Exemplo de redundância:

33

Modelo relacional: 3ª forma normal

• A tabela tem que estar na 2ª forma normal• Não existem dependências funcionais entre

atributos que não são chave primária

34

Normalização

• A passagem de uma forma normal para outra pode implicar a decomposição de uma tabela num conjunto de tabelas.

35

Exemplo: 2ª FN 3ª FN

Exemplo: dada a tabela na 2ª forma normal

Fazer:

e

25 RC11802 Bragança

26 RC11808 Vinhais

25 RC11802

26 RC11808

RC11802 Bragança

RC11808 Vinhais

36

Tabela normalizada (3ª forma normal)

• Numa tabela que verifica as primeiras três formas normais, qualquer atributo que não pertence à chave primária depende completamente e exclusivamente da totalidade dessa chave.

37

Structured Query Language (SQL)

SQL é uma linguagem normalizada (ANSI) para consultas e actualizações de bases de dados relacionais.

38

A instrução SELECT

As consultas a uma base de dados relacional fazem-se em SQL recorrendo à instrução SELECT. Esta instrução permite criar conjuntos de registos de uma ou mais tabelas da base de dados seleccionados segundo diversos critérios.

39

A cláusula WHERE: selecção de linhas

SELECT atributo1, atributo2, .... (ou *)FROM tabela1, tabela 2, ...WHERE condição;

onde o argumento de WHERE é uma condição que os registos seleccionados verificam; podem ser utilizados operadores relacionais (<, <=, >, >=, =, <>) , operadores lógicos (NOT, AND, OR) e os operadores IN, IS, BETWEEN e LIKE.

40

A cláusula WHERE (exemplos) select * from conc where area > 500000000 select * from conc where concelho like ‘A%’ select * from rios where "TIPO" = 'Principal' or

"DESIGNACAO" in ( 'Fronteira terrestre' , 'Fronteira marítima' )

41

Cruzamento de tabelas (“join”)

A cláusula FROM especifica o(s) nome(s) da(s) tabela(s) em que se encontram os registos a seleccionar.

A instrução SELECT produz o produto cartesiano das tabelas especificadas, isto é, cada registo do resultado é composto por um registo de cada uma dessas tabelas.

Num cruzamento (join) de tabelas a cláusula WHERE é utilizada para seleccionar no resultado do produto cartesiano os tuplos que correspondem a registos em que o valor de uma chave estrangeira é igual ao valor de uma chave primária.

42

SELECT *FROM conc,ValorAcrescentadoWHERE DTCC=codigo;

Exemplo (cruzamento ou join):

onde codigo é a chave primária da tabela ValorAcrescentado e DTCC é a correspondente chave estrangeira na tabela conc.

43

Problema: criar um mapa de valor acrescentado por concelho para produção agrícola e silvícola. Usar dados da tabela ValorAcrescentadoConcelhos.mdb

Procedimento:1. Adicionar a tabela ValorAcrescentadoConcelhos.mdb2. Cruzar 2 tabelas que têm um atributo comum

– abrir a tabela de atributos do layer conc e a tabela ValorAcrescentadoConcelhos

– ambas têm o um atributo que é o código de concelho• fechar as tabelas

– activar o layer conc e right-click Join and Relates / Join...• Join attributes from a table: escolher os atributos DTCC de conc e

Codigo de ValorAcrescentadoConcelhos• alterar a legenda do layer conc para criar um mapa com categorias de

valor acrescentado, % produção agrícola, ...– Join and Relates / Join... / Remove Joins(s)

44

A cláusula GROUP BY e as funções de agregação

As funções de agregação aplicam-se a selecções de registos. Podem ser utilizadas as funções SUM, AVG, MAX, MIN e COUNT,...

A utilização de funções de agregação é feita frequentemente em conjunto com a cláusula GROUP BY. Esta especifica os conjuntos de registos seleccionados que são objecto da(s) função(ões).

Quando é utilizada a cláusula GROUP BY, só podem ser indicados na cláusula SELECT os atributos incluídos na cláusula GROUP BY (para além daqueles que são argumento de uma função).

45

GROUP BY

Group by indica o atributo que define o agrupamento Select atrib1From tabela_entradaGroup by atrib1

Se se quiser também incluir no resultado da operação uma função f dos valores do atributo atrib2, aplicada a cada grupo definido da forma acima:

Select atrib1, f(atrib2)From tabela_entradaGroup by atrib1

46

Dissolve vs GROUP BY

Num SIG, a operação de “dissolução” de objectos espaciais (dissolve) corresponde a uma pesquisa com cláusula GROUP BY na tabela do tema que se quer “dissolver”.

47

SELECT DT as conc.DT, area AS SUM(conc.area) FROM conc GROUP BY conc.DT;

48

Resultado da operação de dissolução

49

Problema: Construir um mapa com informação sobre a densidade populacional (nº hab/Km2) ao nível das unidades territoriais de nível 3 (NUT3) e indicar sobre o mapa a designação dessas unidades

Procedimento:Cruzar tabelas

Primeiro: cruzar conc com NUT4NUT3.dbfSegundo: cruzar conc com NUT3PopPT2000.dbf

Dissolver conc com o atributo NUTS3 e criar uma novo tema NUT3Adicionar uma coluna a uma tabela

abrir a tabela de atributos de NUT3 Options button / Add Field (name: pop_dens + type: double)

CálculosEditor button na standard toolbar / Editor / Start Editingright click na coluna pop_dens / Calculate ValuesNUT3.pop_dens = 1000000* [POPNUT3PT2000.RESIDENTES] / ([NUT3.Shape_Area])

Editor menu na editor toolbar / Stop EditingConstruir o mapa cuja legenda corresponde às densidades populacionais

por unidade NUT3 e adicionar os nomes dessas unidades