OLAP: Modelagem Multidimensional
Modelagem Multidimensional
Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri
Prof. Dr. Ricardo Rodrigues Ciferri
OLAP: Modelagem Multidimensional
Modelagem Multidimensional • Análises dos usuários de SSD
– representam requisições multidimensionais aos dados do DW
• visualização dos dados segundo diferentes perspectivas
– permitem a identificação de problemas e de tendências
OLAP: Modelagem Multidimensional
Arquitetura de 3 Camadas co
ncei
tual
lógi
co
físic
o
metáfora do cubo de dados
ROLAP
…
…
… … … …
…
MOLAP 1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
ROLAP MOLAP
estruturas e algoritmos
proprietários
Cube Álgebra
SQL MDX
...
processamento e otimização
de consultas
esquema operações
esquemas estrela e floco de neve estruturas matriciais
índices: árvores índices bitmap
OLAP: Modelagem Multidimensional
(Hiper)cubo de Dados Multidimensional (QualidadeAr)
visão multidimensional concentração por poluente por tempo por estação
T4 T3
T2 T1 E1
P3
P2
P1
E2
• representação gráfica • semântica subjacente
OLAP: Modelagem Multidimensional
(Hiper)cubo de Dados Multidimensional (QualidadeAr)
E2
E1 E2
T4 T3
T2 T1
T4 T3
T2 T1
visão multidimensional concentração por poluente por estação
visão multidimensional
concentração por poluente
por tempo
visão multidimensional concentração por tempo por estação
E1
P3
P2
P1
P3
P2
P1
T4 T3
T2 T1 E1
P3
P2
P1
E2
OLAP: Modelagem Multidimensional
T4 T3
T2 T1
(Hiper)cubo de Dados Multidimensional (QualidadeAr)
visão multidimensional concentração por estação visão multidimensional
concentração por tempo
visão multidimensional concentração por poluente
T4 T3
T2 T1 E1
P3
P2
P1
E2
E2 E1
P3
P2
P1
OLAP: Modelagem Multidimensional
(Hiper)cubo de Dados Multidimensional (QualidadeAr)
visão multidimensional concentração
T4 T3
T2 T1 E1
P3
P2
P1
E2
OLAP: Modelagem Multidimensional
(Hiper)cubo de Dados Multidimensional (QualidadeAr)
T4 T3
T2 T1 E1
P3
P2
P1
E2 T4 T3
T2 T1
P3
P2
P1
E1 E2
T4 T3
T2 T1
E2 E1
P3
P2
P1
E2 E1
P3
P2
P1
T4 T3
T2 T1
OLAP: Modelagem Multidimensional
Modelo de Dados Multidimensional
aspectos estáticos
modelagem dos dados
dimensões (atributos) medidas numéricas
aspectos dinâmicos
operações analíticas
drill-down/roll-up slice and dice
pivot drill-across ...
OLAP: Modelagem Multidimensional
Dimensão • Representa uma perspectiva de análise
dos usuários de SSD • Composta por atributos • Exemplo: dimensão tempo
– atributos: dia, mês, trimestre, semestre, ano – semântica: dia 15/09/2015, do mês de
setembro, do terceiro trimestre, do segundo semestre, de 2015.
OLAP: Modelagem Multidimensional
Dimensão • Exemplo: dimensão poluente
– atributos: poluente, categoria, tipo, grupo – semântica: poluente CO, da categoria gás – semântica: poluente CO, do tipo químico, do
grupo ar • Exemplo: dimensão estação
– atributos: estação, cidade, estado, região, país – semântica: estação E1, da cidade de São
Carlos, do estado de São Paulo, da região Sudeste, do país Brasil
OLAP: Modelagem Multidimensional
Hierarquia de Atributos • Definição
– permite que atributos de uma dimensão relacionem-se com outros atributos da mesma dimensão
– especifica níveis de agregação e, portanto, granularidade dos itens de dados
– especifica as dependências existentes entre as granularidades dos atributos
OLAP: Modelagem Multidimensional
Ordenação Parcial ( ≺ ) • Significado
– um atributo de maior nível de granularidade de uma hierarquia de atributos pode ser determinado usando um atributo de menor nível de granularidade dessa hierarquia
• Exemplo: dimensão tempo – (semestre) ≺ (trimestre)
menor nível de granularidade
maior nível de granularidade
semestres podem ser calculados por meio dos trimestres
OLAP: Modelagem Multidimensional
Exemplos • Dimensão tempo
– atributos: dia, mês, trimestre, semestre, ano – (ano) ≺ (semestre) ≺ (trimestre) ≺ (mês) ≺
(dia) • Dimensão poluente
– atributos: poluente, categoria, tipo, grupo – (categoria) ≺ (poluente) – (grupo) ≺ (tipo) ≺ (poluente) podem ser definidas
uma ou mais hierarquias de atributos
por dimensão
OLAP: Modelagem Multidimensional
Exemplos • Dimensão estação
– atributos: estação, cidade, estado, região, país
– (país) ≺ (região) ≺ (estado) ≺ (cidade) ≺ (estação)
OLAP: Modelagem Multidimensional
Definição Formal • Lattice (Reticulado de Cuboides)
<L, ≺>, onde – L: conjunto de visões (ou agregações) – ≺: relação de dependência
• Propriedades de L – contém pelo menos a visão do nível inferior – pode conter uma visão completamente
agregada (all/none), a qual pode ser calculada a partir de qualquer outra visão
Harinarayan, V. Rajaraman, A., Ullman, J. D. Implementing Data Cubes Efficiently. In Proceedings of the ACM SIGMOD International Conference of Management of Data, p. 205-216,1996.
OLAP: Modelagem Multidimensional
Definição Formal • Para três visões v, w, u, podem ser
definidas as seguintes funções:
sendo que
OLAP: Modelagem Multidimensional
níveis de agregação superior
inferior
all
ano
semestre
trimestre
mês
dia
Exemplo • Dimensão tempo
(all) ≺ (ano) ≺ (semestre) ≺ (trimestre) ≺ (mês) ≺ (dia)
CIFERRI, C., CIFERRI, R., GÓMEZ, L., SCHNEIDER, M., VAISMAN, A., ZIMÁNYI, E. Cube algebra: A generic user-centric model
and query language for OLAP cubes. Journal of Data Warehousing and Mining,
v. 9, n. 2, p. 39-65, 2013.
OLAP: Modelagem Multidimensional
all
grupo
categoria tipo
poluente
Exemplo • Dimensão poluente
(all) ≺ (categoria) ≺ (poluente) (all) ≺ (grupo) ≺ (tipo) ≺ (poluente)
níveis de agregação superior
inferior
OLAP: Modelagem Multidimensional
níveis de agregação superior
inferior
all
país
região
estado
cidade
estação
Exemplo • Dimensão estação
(all) ≺ (país) ≺ (região) ≺ (estado) ≺ (cidade) ≺ (estação)
OLAP: Modelagem Multidimensional
Medida Numérica • Objeto de análise relevante ao negócio • Definida como uma função de suas
dimensões correspondentes
Classificação Definição Função de Agregação
aditiva somada através de todas as suas dimensões
SOMA (todas as dimensões)
semi-aditivas somadas somente através de algumas de suas dimensões
SOMA (apenas algumas dimensões)
não aditivas não podem ser somadas AVG, MAX, MIN ou outra função complexa
OLAP: Modelagem Multidimensional
Operações Analíticas Operação Definição
drill-down analisa os dados em níveis de agregação progressivamente mais detalhados, ou de menor granularidade
roll-up analisa os dados em níveis de agregação progressivamente menos detalhados, ou de maior granularidade
slice and dice
restringe os dados sendo analisados a um subconjunto destes dados
slice: corte para um valor fixo dice: seleção de faixas de valores
pivot reorienta a visão multidimensional dos dados, oferecendo diferentes perspectivas dos mesmos dados
drill-across compara medidas numéricas distintas que são relacionadas entre si através de pelo menos uma dimensão em comum
OLAP: Modelagem Multidimensional
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Station
(Sta
tion)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
(Hiper)cubo de Dados Multidimensional (QualidadeAr) visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
Roll-up visão multidimensional concentração
por poluente por semestre por estação
função agregação: SOMA
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
Drill-down
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)função agregação: SOMA
visão multidimensional concentração por poluente por mês por estação
visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
21
28
11
14
Q4
S4
S3
S1
Pollut
ion
(Poll
utan
t)
Time (Quarter)
P1
25
Q3Q2Q1
S2
P3P4
P2
27 26
13
323533
12 14
2324 18
10 14 12 20
35 30 32 3118 11 35 47
282033
194718
172110
Stat
ion
(Sta
tion)
Pivot
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional concentração por semestre por estação por poluente
visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
Slice
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)função agregação: SOMA
visão multidimensional concentração por poluente por trimestre, para S1
visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
Dice
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional concentração por poluente por trimestre por estação,
para S1 ou S2 e Q1 ou Q2
visão multidimensional concentração por poluente por trimestre por estação
OLAP: Modelagem Multidimensional
Drill-across
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional concentração, qualidade
por poluente por trimestre por estação
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional
concentração por poluente por
trimestre por estação
21
12
11
35
Q4
S1S2
S4
Pollution (Pollutant)
Tim
e (Q
uart
er)
P1
47
Q3
Q2
Q1
S3
P3
P4P2
10 18
30
3226
14
2014 31
12 20 24 33
24 18 28 1433 25 23 25
122017
103318
142318
Statio
n(S
tatio
n)
measure values
dimensions
35
27
Time
Day
Month
Semester
Pollution
Pollutant
Category Type
Group
Quarter
Year
Station
Station
All AllAll
dateseason
name
nameloadLimit
name name
name
month
quarter
semester
year
(b)(a)
visão multidimensional
qualidade por poluente por
trimestre por estação
21,21
14,14
35,35
31,31
12,12 25,25
28,28
33,33
Top Related