PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation...
Transcript of PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation...
![Page 1: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/1.jpg)
Método de Partição com Distâncias Adaptativas
para Dados Intervalares
![Page 2: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/2.jpg)
22
Introdução – Métodos de Partição
Obter uma partição de um conjunto de objetos em um número predefinido de grupos de tal maneira que os grupos obtidos são os mais homogêneos e bem separados possíveis.
Normalmente as partições são construídas otimizando um critério de qualidade sobre uma partição.
O problema de classificação torna-se um problema perfeitamente definido em otimização discreta:
– Encontrar, entre o conjunto de todas as partições possíveis, uma partição que otimize um critério definido à priori.
![Page 3: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/3.jpg)
33
Método de Nuvens Dinâmicas
Família de métodos de cluster não hierárquicos com o objetivo de obter simultaneamente:
– Uma partição de um número predefinido de classes– Identificar um conjunto de representantes das classes ou
protótipos
A idéia principal é associar uma representação a um conjunto de elementos
– Minimizando um critério W de adequação entre classes e protótipos
– Uma das vantagens é poder formular um problema de classificação em termos de otimização de um critério
Etapas importantes: representação e alocação
![Page 4: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/4.jpg)
44
Método de Nuvens Dinâmicas (Diday 1972)
Seja Ω={ω1,…, ωi ,…, ωN } um conjunto de N objetosou individuos descrito por p variáveis e cada objetoωi descrito por p variáveis xi ={x1,...,xi
p}.Seja L={L1,...,LK } o conjunto de representantes da
partição P={P1,...,PK} onde Lk é representado por um vetor de p medidas
O critério W é definido por
onde D(Pk,Lk) mede a adequação entre a classe Pka sua representação Lk e d(xi,yk) mede a distância entre xi e yk.
( )Tpi
jii yyy ,...,,...,1
∑ ∑∑= ∈=
==K
k iki
K
kkk yxdLPDLPW
1 P 1 k
),(),(),(
![Page 5: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/5.jpg)
55
Método de Nuvens Dinâmicas (Diday 1972)
O problema de otimização é definido por: encontrar uma partição P={P1,...,PK} e um conjunto de protótipos L={L1,...,lK} de P tal que minimize o critério
ou
∑ ∑∑= ∈=
==K
k iki
K
kkk yxdLPDLPW
1 P 1 k
),(),(),(
},/),({*)*,( kk LLPPLPWMinLPW ∈∈=
![Page 6: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/6.jpg)
66
Algoritmo Geral (Nuvens Dinâmicas)
(1) inicializaçãoNo início tem-se uma partição C ou um subconjuntode K elementos de Ω.
(2) Etapa de representaçãoPara todo j de 1 a K faça calcular o protótipo yk
(3) Etapa de afetaçãotest←0Para todo i de 1 a N faça
determinar uma classe Ck* tal que
(4) se test ≠ 0 vá para (2)
),(minarg*,,1 jiKj
yxdkL=
=
faça então * se kj ≠ test←1{ } { }iCCiCC jjkk −←∪← e **
![Page 7: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/7.jpg)
77
Método de Nuvens Dinâmicas
Algoritmo de Nuvens Dinâmicas com distâncias Fixas
– Distância L1 (City-Block)– Distância L2 (Euclidiana)– Distância de Mahalanobis
Algoritmo de Nuvens Dinâmicas com distâncias Adaptativas
– Distância L1 (City-Block) (Diday e Govaert, 1977)– Distância L2 (Euclidiana) (De Carvalho et al, 2004)– Distância de Mahalanobis– Distância L∞ (Chebychev)
E suas respectivas versões para dados intervalares
![Page 8: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/8.jpg)
88
Método de Nuvens Dinâmicas
Usando Distância L1 (City-Block) Fixa
Problema de otimização– Encontrar yk
j tal que minimize
– A solução para ykj é a mediana do conjunto {xi
j} i ∈Pk
∑ ∑∑∑= ∈∈ =
−==p
j Ci
jk
ji
Ci
p
j
jk
ji
kk
yxyxdLPW11
||),(),(
![Page 9: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/9.jpg)
99
Método de Nuvens Dinâmicas
Usando Distância L2 (Euclidiana) Fixa
Problema de otimização– Encontrar yk
j tal que minimize
– A solução para ykj é a média do conjunto {xi
j} i ∈Pk
∑ ∑∑∑= ∈∈ =
−==p
j Ci
jk
ji
Ci
p
j
jk
ji
kk
yxyxdLPW1
2
1
2 )(),(),(
![Page 10: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/10.jpg)
1010
Nuvens Dinâmicas com Distâncias Adaptativas
A idéia é associar uma distância diferente para cada classe que muda a cada iteração.
O problema de otimização é definido por: encontrar uma partição P={P1,...,PK}, um conjunto de protótipos L={L1,...,LK} de P e um conjunto de distâncias d={d1,..,dk} tal que minimize o critério
onde dk(xi,yk) é a distância adaptativa entre xi e yk
∑ ∑∑= ∈=
==K
k ikik
K
kkkk yxddLPDdLPW
1 Q 1 k
),(),,(),,(
![Page 11: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/11.jpg)
1111
Algoritmo Geral (Versão Adaptativa)
(1) inicializaçãoNo início tem-se uma partição C ou um subconjuntode K elementos de Ω.
(2) Etapa de representaçãoPara todo j de 1 a K faça calcular o protótipo yk e a distância dk
(3) Etapa de afetaçãotest←0Para todo i de 1 a N faça
determinar uma classe Ck* tal que
(4) se test ≠ 0 vá para (2)
),(minarg*,,1 jiKj
yxdkL=
=faça então * se kj ≠ test←1
{ } { }iCCiCC jjkk −←∪← e **
![Page 12: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/12.jpg)
1212
Método de Nuvens Dinâmicas
Usando Distância L1 (City-Block) Adaptativa
Problema de otimização é divido em duas partes(1) Com a partição P e o conjunto de parâmetros fixos,
encontrar o protótipo ykj tal que minimize
– A solução para ykj é a mediana do conjunto {xi
j} i ∈Pk
∑=
−=p
j
jk
jikik yxyxd
1
jk || ),( λ
∑ ∑∑∑∑= ∈∈ =∈
⎜⎜⎝
⎛−=−==
p
j
jk
ji
CiCi
p
j
jk
ji
Cikik yxyxyxddLP
kkk 1
jk
1
jk | || ),(),,( λλ ⎟⎟
⎠
⎞W |
![Page 13: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/13.jpg)
1313
Métodos de Nuvens Dinâmicas
Usando Distância L1 (City-Block) Adaptativa
Problema de otimização é divido em duas partes(2) Com a partição P e o conjunto de protótipos fixos, encontrar
o parâmetro λkj tal que minimize
Satisfazendo as condições λkj > 0 e Πj λk
j = 1
– A solução para λkj é
∑ ∑∑∑∑= ∈∈ =∈
⎜⎜⎝
⎛−=−==
p
j
jk
ji
CiCi
p
j
jk
ji
Cikik yxyxyxddLP
kkk 1
jk
1
jk | || ),(),,( λλ ⎟⎟
⎠
⎞W |
∑
∏ ∑
∈
= ∈
−
⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jk yx
yx
||
||1
/1
λ
![Page 14: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/14.jpg)
1414
Método de Nuvens Dinâmicas
Usando Distância L2 (Euclidiana) Adaptativa
Problema de otimização é divido em duas partes(1) Com a partição P e o conjunto de parâmetros fixos,
encontrar o protótipo ykj tal que minimize
– A solução para ykj é a média do conjunto {xi
j} i ∈Pk
∑ ∑∑∑∑= ∈∈ =∈
⎜⎜⎝
⎛−=−==
p
j
jk
ji
CiCi
p
j
jk
ji
Cikik yxyxyxddL
kkk 1
jk
1
2jk )( )( ),(),, λλ
∑=
−=p
j
jk
jikik yxyxd
1
2jk )( ),( λ
⎟⎟⎠
⎞PW 2(
![Page 15: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/15.jpg)
1515
Método de Nuvens Dinâmicas
Usando Distância L2 (Euclidiana) Adaptativa
Problema de otimização é divido em duas partes(2) Com a partição P e o conjunto de protótipos fixos, encontrar
o parâmetro λkj tal que minimize
Satisfazendo as condições λkj > 0 e Πj λk
j = 1
– A solução para λkj é
∑
∏ ∑
∈
= ∈
−
⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jk yx
yx
21
/1
2
)(
)(λ
∑ ∑∑∑∑= ∈∈ =∈
⎜⎜⎝
⎛−=−==
p
j
jk
ji
CiCi
p
j
jk
ji
Cikik yxyxyxddL
kkk 1
jk
1
2jk )( )( ),(),, λλ ⎟⎟
⎠
⎞PW 2(
![Page 16: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/16.jpg)
1616
Nuvens Dinâmicas versão para Intervalo
O problema de otimização é definido por: encontrar uma partição P={P1,...,PK} e um conjunto de protótipos L={L1,...,lK} de P tal que minimize o critério
ou
∑ ∑∑= ∈=
==K
k iki
K
kkk yxdLPDLPW
1 P 1 k
),(),(),(
},/),({*)*,( kk LLPPLPWMinLPW ∈∈=
![Page 17: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/17.jpg)
1717
Nuvens Dinâmicas versão para Intervalo
Representação
xi é representado por um vetor de intervalos xi = (xi
1,…,xip)T, xi
j = [aij,bi
j] a ≤ b.
yk é representado por um vetor de intervalos yk = (yk
1,…,yKp)T, yk
j = [αkj,βk
j] α ≤ β.
Um intervalo [a,b] é considerado como um ponto (a,b) em ℜ2 onde o eixo x é representado pelo limite inferior a e o eixo y é representado pelo limite superior b.
![Page 18: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/18.jpg)
1818
Nuvens Dinâmicas versão para Intervalo
Usando Distância L1 (City-Block) Fixa com intervaloProblema de otimização
– Encontrar ykj tal que minimize
– A solução para ykj = [αk
j,βkj] é:
∑∑∑=∈ =
+==p
jCi
p
j
jk
ji
k
yxdLPW1
jk
ji
jk
ji
1|– b| |– a|),(),( βα
As diferenças entre oslimites inferiores
As diferenças entre os limites superiores
αkj A mediana de {ai
j, i ∈ Ck}, o conjunto dos limites inferiores
dos intervalos de Ck.
βkj A mediana de {bi
j, i ∈ Ck}, o conjunto dos limites superiores
dos intervalos de Ck.
![Page 19: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/19.jpg)
1919
Nuvens Dinâmicas versão para Intervalo
Usando Distância L2 (Euclidiana) Fixa com intervaloProblema de otimização
– Encontrar ykj tal que minimize
– A solução para ykj = [αk
j,βkj] é:
∑∑∑=∈ =
+==p
jCi
p
j
jk
ji
k
yxdLPW1
2jk
ji
2jk
ji
1)– (b )– (a),(),( βα
As diferenças entre oslimites inferiores
As diferenças entre os limites superiores
αkj A média de {ai
j, i ∈ Ck}, o conjunto dos limites inferiores
dos intervalos de Ck.
βkj A média de {bi
j, i ∈ Ck}, o conjunto dos limites superiores
dos intervalos de Ck.
![Page 20: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/20.jpg)
2020
Nuvens Dinâmicas versão para Intervalo
Usando Distância L∞ (Chebychev) Fixa com intervaloProblema de otimização
– Encontrar ykj tal que minimize
– A solução para ykj = [αk
j,βkj] é:
∑∑∑=∈ =
==p
jCi
p
j
jk
ji
k
yxdLPW1
jk
ji
jk
ji
1|}– b| , |– amax{|),(),( βα
As diferenças entre oslimites inferiores
As diferenças entre os limites superiores
αkj A mediana do conjunto dos pontos médios
dos intervalos de Ck - a mediana do conjunto dos comprimentos médios dos intervalos de Ck.
βkj A mediana do conjunto dos comprimentos médios
dos intervalos de Ck + a mediana do conjunto dos comprimentos médios dos intervalos de Ck.
![Page 21: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/21.jpg)
2121
Nuvens Dinâmicas versão para Intervalo
Nuvens Dinâmicas com distâncias Adaptativas de um componente
– Distância L1 (City-Block) (De Souza e De Carvalho, 2004)– Distância L2 (Euclidiana) (De Carvalho et al, 2002)– Distância L∞ (Chebychev) (Chavent e Lechevalier, 2002)
Nuvens Dinâmicas com distâncias Adaptativas de dois componentes
– Distância L1 (City-Block) (De Souza e De Carvalho, 2004)– Distância L2 (Euclidiana) (De Souza e De Carvalho, 2003)– Distância L∞ (Chebychev) (De Souza e De Carvalho, 2004)
O problema de otimização depende da escolha
Coeficientes: {λk1,…, λ k
p}.
Protótipo: {yk1,…, yk
p} com ykj = [αk
j,βkj];
![Page 22: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/22.jpg)
2222
Nuvens Dinâmicas versão para Intervalo
Usando Distância L1 (City-Block) Adapt. com intervaloUm componente
– λkj é um coeficiente que define dk.
Dois componentes
– λkLj é o coeficiente do limite inferior
– λkUj é o coeficiente do limite superior
∑=
+=p
j
jk
ji yxd
1
jk
ji
jk
ji
jk |)– b| |– a(|),( βαλ
∑=
+=p
j
jk
ji yxd
1
jk
ji
jkU
jk
ji
jkL |)– b(| ) |– a(|),( βλαλ
![Page 23: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/23.jpg)
2323
Nuvens Dinâmicas versão para Intervalo
Usando Distância L1 (City-Block) Adapt. com um componente
O coeficiente λkj é obtido
como descrito em Diday e Govaert ( 1977) .
∑
∏ ∑
∈
= ∈⎟⎟⎠
⎞⎜⎜⎝
⎛
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jk yx
yx
),(
),(1
/1
φ
φλ
αkj
βkj
Mediana dos limites inferiores
Mediana dos limites superiores
φ(xij,yk
j) = |aij – αk
j| + |bij – βk
j|
![Page 24: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/24.jpg)
2424
Nuvens Dinâmicas versão para Intervalo
Usando Distância L1 (City-Block) Adapt. com dois componente
A solução é a mesma da versão
de um componente
∑
∏ ∑
∈
= ∈
β−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛β−
=λ
k
k
Ci
jk
ji
p
1h
p/1
Ci
hk
hi
jkU |b|
|b|
∑
∏ ∑
∈
= ∈
α−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛α−
=λ
k
k
Ci
jk
ji
p
1h
p/1
Ci
hk
hi
jkL |a|
|a|
βkj
Mediana dos limitesinferiores
Mediana dos limitessuperiores
αkj
![Page 25: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/25.jpg)
2525
Nuvens Dinâmicas versão para Intervalo
Usando Distância L2 (Euclidiana) Adapt. com intervaloUm componente
– λkj é um coeficiente que define dk.
Dois componentes
– λkLj é o coeficiente do limite inferior
– λkUj é o coeficiente do limite superior
∑=
+=p
j
jk
ji yxd
1
2jk
ji
2jk
ji
jk ])– (b )– [(a),( βαλ
∑=
+=p
j
jk
ji yxd
1
2jk
ji
jkU
2jk
ji
jkL )– (b )– (a),( βλαλ
![Page 26: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/26.jpg)
2626
Nuvens Dinâmicas versão para Intervalo
Usando Distância L2 (Euclidiana) Adapt. com um componente
O coeficiente λkj é obtido
como descrito em Diday e Govaert ( 1977) .
∑
∏ ∑
∈
= ∈⎟⎟⎠
⎞⎜⎜⎝
⎛
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jk yx
yx
),(
),(1
/1
φ
φλ
αkj
βkj
Média dos limites inferiores
Média dos limites superiores
φ(xij,yk
j) = (aij – αk
j)2 + (bij – βk
j) 2
![Page 27: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/27.jpg)
2727
Nuvens Dinâmicas versão para Intervalo
Usando Distância L2 (Euclidiana) Adapt. com dois componente
A solução é a mesma da versão
de um componente
∑
∏ ∑
∈
= ∈
−
⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jkU b
b
21
/1
2
)(
)(
β
βλ
∑
∏ ∑
∈
= ∈
−
⎟⎟⎠
⎞⎜⎜⎝
⎛−
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jkL a
a
21
/1
2
)(
)(
α
αλ
βkj
Média dos limitesinferiores
Média dos limitessuperiores
αkj
![Page 28: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/28.jpg)
2828
Nuvens Dinâmicas versão para Intervalo
Usando Distância L∞ (Chebychev) Adapt. com intervaloUm componente
– λkj é um coeficiente que define dk.
∑=
=p
j
jk
ji yxd
1
jk
ji
jk
ji
jk |})– b| ,|– a(max{|),( βαλ
![Page 29: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/29.jpg)
2929
Nuvens Dinâmicas versão para Intervalo
Usando Distância L∞ (Chebychev) Adapt. com um componente
O coeficiente λkj é obtido
como descrito em Diday and Govaert ( 1977) .
∑
∏ ∑
∈
= ∈⎟⎟⎠
⎞⎜⎜⎝
⎛
=
k
k
Ci
jk
ji
p
h
p
Ci
hk
hi
jk yx
yx
),(
),(1
/1
φ
φλ
αkj
βkj
A mediana do conjunto dos pontos médiosdos intervalos de Ck – a mediana do conjunto dos
comprimentos médios dos intervalos de Ck.
A mediana do conjunto dos comprimentos médiosdos intervalos de Ck + a mediana do conjunto dos
comprimentos médios dos intervalos de Ck.
φ(xij,yk
j) = max{|aij – αk
j|,|bij – βk
j|}
![Page 30: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/30.jpg)
Resultados do Experimentos comDados Artificiais e Reais
![Page 31: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/31.jpg)
Estrutura do Sistema
Geração de Dados Simbólicos
Aplicação do Algoritmo de Cluster
AvaliaçãoQuantitativa
MONTE
CARLO
![Page 32: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/32.jpg)
Etapa de geração de Dados Simbólicos
Dado usual
Dado simbólico
[x - γ/2 , x + γ/2 ]
γ -parâmetro
1) Geração de dados usuaisSementes: Dados normais bidimensionais assumindo
independência entre as variáveis
2) Geração de dados do tipointervalo
A partir de um intervalo pré-definido, selecionar aleatoriamente dois valorespara um parâmetro γ e obter o hipercubo.
![Page 33: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/33.jpg)
Etapa de avaliação Quantitativa
Índice de Rand Corrigido mede a dissimilaridade entre uma partição a priori e uma partição obtida por um algoritmo de classificação.
U={u1,...,ui,...,uR} - uma partição obtida por um métodoV={v1,...,vj,...,vC} - uma partição a priori
∑ ∑∑ ∑
∑ ∑∑∑
= =
−
= =
= =
−
= =
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎟⎠
⎞⎜⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛
⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛−⎟⎟
⎠
⎞⎜⎜⎝
⎛−⎟⎟
⎠
⎞⎜⎜⎝
⎛
=R
i
C
j
jiR
i
R
i
ji
R
i
C
j
jiR
i
C
j
ij
nnnnn
nnnnn
CR
1 1
..1
1 1
..
1 1
..12
1 1
2222221
22222
nij representa o número de objetos que estão nas classes ui e vj;ni. representa o número de objetos que estão na classe ui ;n.j representa o número de objetos que estão na classe vj;
![Page 34: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/34.jpg)
3434
Configuração dos Experimentos
Para cada conjunto de dados usuais foram obtidoscinco conjuntos de dados de intervalos. O parâmetroγ foi selecionado aleatoriamente nos intervalos[1,8], [1,16], [1,24], [1,32] e [1,40].O desempenho dos métodos foi avaliado pelo índicede RandForam consideradas 100 réplicas para cada conjuntode intervalos. A estimativa do índice de Rand foi a média dos 100 valores observados nas 100 replicações. 50 iterações são consideradas para cadaprocedimento. Em cada iteração o algoritmo éexecutado até a convergência.
![Page 35: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/35.jpg)
3535
Resultados dos Experimentos
Dois conjunto de dados de intervalo (três classes)
Classes bem Separadas Classes com OverlappingConjunto 1 Conjunto 2
![Page 36: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/36.jpg)
3636
Resultados dos Experimentos – L1
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo 1
Método Adaptativo 2
Método NãoAdaptativo
Parâmetroγ
0,9330,9340,8870,7640,683
0,9390,9320,8840,7660,691
0,6800,6510,6300,6200.619
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo 1
Método Adaptativo 2
Método NãoAdaptativo
Parâmetroγ
0,4640,4260,3990,3850,368
0,4640,4250,3990,3850,367
0,3820,3660,3600,3590,354
Conjunto 1(três classes)
Conjunto 2(três classes)
Índice de Rand
![Page 37: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/37.jpg)
3737
Resultados dos Experimentos
Dois conjunto de dados de intervalo (quatro classes)
Classes bem Separadas Classes com OverlappingConjunto 1 Conjunto 2
![Page 38: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/38.jpg)
3838
Resultados dos Experimentos – L2
Conjunto 1(quatro classes)
Conjunto 2(quatro classes)
Índice de Rand
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo 1
Método Adaptativo 2
Método NãoAdaptativo
Parâmetroγ
0,9440,9340,8870,8230,781
0,9480,9270,8820,8300,776
0,7100,7110,7050,7110,716
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo 1
Método Adaptativo 2
Método NãoAdaptativo
Parâmetroγ
0,5230,4960,4730,4490,397
0,5250,4950,4770,4420,374
0,4040,4080,4040,4050,394
![Page 39: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/39.jpg)
Resultados dos Experimentos – L∞
Conjunto 1(quatro classes)
Conjunto 2(quatro classes)
Índice de Rand
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo
Método NãoAdaptativo
Parâmetroγ
0,9420,9360.933
0.9200,904
0,8000,7890,7870,7980,769
[1,8][1,16][1,24][1,32][1,40]
MétodoAdaptativo
Método NãoAdaptativo
Parâmetroγ
0,4920,4830,4630,4360,340
0,4360,4320,4300,3900,329 39
![Page 40: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/40.jpg)
A estimativa da média do índice de Rand para osmétodos adaptativos é maior do que a estimativapara o método não adaptativo .
Os testes t-Student emparelhados, em nível de 5% de significância, evidenciam a hipótese que o desempenho dos métodos adaptativos é superior ao do método não adaptativo e não existe diferença significativa entre os desempenhos dos métodos adaptativos 1 e 2.
Conclusão para os conjuntos 1 e 2
![Page 41: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/41.jpg)
Conjunto com 12 elementosagrupados em quatro
classes. Cada elemento é descritopor 13 variáveis do tipo
intervalo.
Espécies = ((0,"AA00", "Ageneiosusbrevifili 1" ),
(1,"AA01", "Cynodongibbus 1" ),(2,"AA02", "Hopliasaïmara 1" ),
(3,"AA03", "Potamotrygonhystrix 1" ),(4,"AA04", "Leporinusfasciatus 3" ),(5,"AA05", "Leporinusfrederici 3" ),(6,"AA06", "Dorasmicropoeus 2" ),
(7,"AA07", "Platydorascostatus 2" ),(8,"AA08", "Pseudoancistrusbarbatus 2" ),
(9,"AA09", "Semaprochilodusvari 2" ),(10,"AA10", "Acnodonoligacanthus 4" ),
(11,"AA11", "Myleusrubripinis 4" ) ),
Classes = ((1 ,"AO01" ,"Carnivores" ,0),(2 ,"AO02" ,"Détritivores" ,0),(3 ,"AO03" ,"Omnivores" ,0),(4 ,"AO04" ,"Herbivores" ,0 )
)
Dados Reais: Conjunto de espécies de peixes
![Page 42: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/42.jpg)
Espécie/classe
Variáveis do tipo intervalo
Comprimento Peso Músculo/Intestin
Músculo/Estom.
Ageneiosusbrevifili 1 [22.5:35.5] [170:625] … [0.23:0.63] [0:0.55]
Cynodongibbus 1 [19:32] [77:359] … [0:0.5] [0.2:1.24]
Hopliasaïmara 1 [25.5:63] [340:5500] [0.11:0.49] [0.09: 0.4]
: : : … : :
Semaprochilodusvari 2 [22:28] [330:700] [0.4:1.68] [0:1.25]
Acnodonoligacanthus4
[10:16.2] [34.9:154.7] … [0:2.16] [0.23: 5.97]
Myleusrubripinis 4 [2.7:8,4] [2.7:8.7] … [8.2:20] [5.1:13.3]
Conjuntos de espécies de peixes
![Page 43: PowerPoint Presentationrmcrs/ADS/arquivos/Agrupamento_aula02.pdf · Title: PowerPoint Presentation Created Date: 9/30/2009 5:28:19 PM](https://reader033.fdocumentos.com/reader033/viewer/2022053100/605c8deea4cfc53b2d25c918/html5/thumbnails/43.jpg)
Resultados da classificação usando o conjunto de peixes usando a distanciaCity-Block
Método Adapatativo 1: 0.34
Método Adaptativo 2: 0.139
Método Não Adaptativo: 0.016
Ìndice de Rand Corrigido
Classe 1: 1 2 6 Classe 2: 4 5 8 10 11
Classe 3: 0 9 Classe 4: 3 7
Classe 1: 10 11 Classe 2: 0 1 2 Classe 3: 6 7 9
Classe 4: 3 4 5 8
Classe 1: 1 9 Classe 2: 4 6 7
Classe 3: 5 8 10 11 Classe 4: 0 2 3