CLASSIFICAÇÃO EM GÊNEROS MUSICAIS -...

32
CLASSIFICAÇÃO EM GÊNEROS MUSICAIS Gabriel BRITTO Luiz CHAMON

Transcript of CLASSIFICAÇÃO EM GÊNEROS MUSICAIS -...

Page 1: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

CLASSIFICAÇÃO EM GÊNEROS MUSICAIS

Gabriel BRITTOLuiz CHAMON

Page 2: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Introdução• Contexto e justificativa• O problema e a solução

Features

RNA• Estrutura• Aprendizado

Resultados e discussões

Demonstração

Conclusão e perspectivas

Page 3: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Aumentaram enormemente as bases de dados musicais

(30 musicólogos levaram 1 ano para categorizar 100.000 músicas

do MSN music search)

Gêneros são a principal fonte de classificação musical ...

(iTunes: 14 milhões de músicas)

... mas é difícil defini-los

O que é rock?O que é jazz?

Discordância entre taxonomias

(Amazon: 719 gênerosiTunes: 244 gêneros)

CLASSIFICAÇÃO MUSICAL É UM PROBLEMA NÃO-TRIVIAL

CONTEXTO E JUSTIFICATIVA

Page 4: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Categorizar músicas em gêneros automaticamente baseado em trechos de suas gravações e exemplos rotulados a priori

A SOLUÇÃO

Cálculo de features

Trecho de 30 s

Gênero

Chamon GabrielGTZAN [6]

DESCRIÇÃO DO PROBLEMA

Page 5: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

RMS [2]

Usado como medida da energia média da música.

Spectral Centroid [2]

Uma espécie de centro de massa do espectro, determina uma relação entre altas e baixas freqüências.

20 MFCCs [2]

Muito usado em reconhecimento de voz. É uma medida de variações no tom.

FEATURES

Page 6: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Zero-crossing [2]

Representa uma medida do “ruído” de fundo em uma música. Trata-se simplesmente do número de cruzamentos por zero no domínio do tempo.

Spectral bandwidth [2]

Mede a variação do espectro em torno da centróide espectral.

Band energy ratio [2]

Razão da energia no primeiro quarto do espectro com relação ao espectro todo.

FEATURES

Page 7: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

FEATURES

Loudness [4]

Modelo psicoacústico de sensação sonora (“intensidade” percebida).

Sharpness [4]

Medida de conteúdo espectral de altas freqüências. Avaliação psicoacústicado quão “afiado”, “agudo” um som é.

Octave spectral contrast [3]

Medida da diferença entre espectros em bandas de oitava.

Page 8: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

ESTRUTURA

Gêneros Musicais Considerados

1) Blues2) Classical3) Country4) Disco5) Hip-Hop6) Jazz7) Metal8) Pop9) Reggae10) Rock

Page 9: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

.

.

.

.

.

.

.

.

.

f

f

f

f

f

f

f

f

x1

x2

x3

x75

N1

N2

N3

N20

y1

y2

y3

y10

CamadaOculta

Camadade

Saída

PesosV

PesosW

Entradas(Features)

Saídas(Gêneros)

ESTRUTURA

Page 10: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

100amostras

100amostras

100amostras

Entradas(75 features)

Saídas(10 gêneros)

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

...

...

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

#

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

1

1

1

1

1

1

1

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

1

1

1

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

Gênero 1

Gênero 2

Gênero 10

ESTRUTURA

Formato das Entradas e Saídas

Page 11: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1

Gênero 2

Gênero 10

.

.

.

Conjunto de Treinamento

Gênero 1

Gênero 2

.

.

.

Gênero 10

Conjunto de Validação

Gênero 1Gênero 2

Gênero 10

.

.

.

Conjunto de Teste

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Conjunto Completo

75% das Amostras

15% das Amostras

10% das Amostras

APRENDIZADO

Conjuntos de Treinamento, Validação e Teste

Page 12: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

2 abordagens

Gradiente Descendente com “Cross-Validation”

Gradiente Normalizado com “Early Stopping”

APRENDIZADO

Page 13: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

oAlgoritmo:•“Backpropagation” e “Cross-Validation”

oParâmetros:•Número de nós:

20 na camada oculta10 na camada de saída (1 para cada gênero)

•Taxa de aprendizagem:η = 0,35

•Erro máximo no aprendizado:erro = 0.1

•Número máximo de iterações:numMaxIt = 50000

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

Page 14: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Treinando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

1º treino

Page 15: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Validando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

1º treino

Page 16: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Treinando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

2º treino

Page 17: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Validando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

2º treino

Page 18: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Treinando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

3º treino

Page 19: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Validando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

V W

3º treino

Page 20: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Escolhendo o melhor conjunto de pesos...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

V W

1º treino

V W

2º treino

V W

3º treino

V W

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

Page 21: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gênero 1(Blues)

Gênero 2(Classical)

.

.

.

Gênero 10(Rock)

Testando RNA...

.

.

..

.

.

.

.

.

f

f

f

f

f

f

f

f

APRENDIZADO

Gradiente Descendente com “Cross-Validation”

Matriz de Confusão

Page 22: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

o Algoritmo:• “Scaled conjugate gradient” e “early stopping”

o Parâmetros:• Número de nós:

20 na camada oculta10 na camada de saída

• Regularização:λ = 5e-7

• Erros na validação:max_fail = 10

• Número máximo de iterações:epochs = 50000

APRENDIZADO

Gradiente Normalizado com “Early Stopping”

Fonte: Haykin [7]

Page 23: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

AMOSTRAS DE TESTE x RNA

Gradiente Descendente com “Cross-Validation”

Na figura acima, amostras de teste de cada gênero (azul) comparadas aos resultados obtidos com a RNA treinada (vermelho).

Page 24: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

MATRIZES DE CONFUSÃO (TREINO E VALIDAÇÃO)

Gradiente Descendente com “Cross-Validation”

Page 25: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

MATRIZES DE CONFUSÃO (TREINO E VALIDAÇÃO)

Gradiente Normalizado com “Early Stopping”

Page 26: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

MATRIZES DE CONFUSÃO (TESTE)

Gradiente Descendente com “Cross-Validation”

Page 27: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

Gradiente Normalizado com “Early Stopping”

MATRIZES DE CONFUSÃO (TESTE)

Page 28: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

COMPARAÇÃO COM A LITERATURA

Referência Base de Dados Precisão

Bergstra GTZAN 82.50%

Li GTZAN 78.50%

Panagakis GTZAN 78.20%

Britto, Chamon ¹ GTZAN 77.00%

Lidy GTZAN 76.80%

Benetos GTZAN 75.00%

Holzapfel GTZAN 74.00%

Britto, Chamon ² GTZAN 68.00%

Tzanetakis GTZAN 61.00%

Fonte: Panagakis et al. [5]

Page 29: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

0 20 40 60 80 100 1200.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

0.65

0.7

Confusão em função do número de nós

Número de nós

Índic

e d

e c

onfu

são

0 20 40 60 80 100 1200.008

0.01

0.012

0.014

0.016

0.018

0.02

0.022

0.024

Número de nós

Err

o m

édio

quadrá

tico

Erro médio quadrático em função do número de nós

CONFUSÃO x NÚMERO DE NÓS

Page 30: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

DEMONSTRAÇÃO

1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Gladiators - Dreadlocks the time is now

1 2 3 4 5 6 7 8 9 100

0.02

0.04

0.06

0.08

0.1

0.12

0.14BB King - My Guitar Sings The Blues.mp3

Page 31: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

CONCLUSÃO E PERSPECTIVAS

O problema de classificação em gêneros musicais é não-trivial, devido à indefinição e subjetividade destes.

É fundamental para um bom desempenho da solução que os conjuntos de treinamento, validação e teste sejam adequados, assim

como a técnica de aprendizagem adotada.

Os resultados talvez pudessem ser melhorados com a inclusão de novos “features” (e.g. ritmo) e uma base de dados mais extensa.

Page 32: CLASSIFICAÇÃO EM GÊNEROS MUSICAIS - lsi.usp.brlsi.usp.br/icone/psi2672/2011/gr_I_apresentacao_Musicas.pdf · (30 musicólogos levaram 1 ano para categorizar 100.000 músicas do

Introdução Features RNA Resultados

REFERÊNCIAS[1] SCARINGELLA, N.; ZOIA, G.; MLYNEK, D. Automatic genre classification of music content: a survey. Signal Processing Magazine. Piscataway, v. 23[2], p. 133-141, 2006.

[2] LI,D.; SETHI, I. K.; DIMITROVA, N.; McGEE, T. Classification of general audio data for content-based retrieval. Pattern Recognition Letters. Amsterdam, v. 22, p. 533-544, 2001.

[3] JIANG, D.-N.; LU, L.; ZHANG, H.-J.; TAO, J.-H.; CAI, L.-H. Music type classification by spectral contrast feature. In: IEEE ICME, 2002, Lausanne. Anais… Lausanne: Swiss Federal Institute of Techonology, 2002.

[4] McKINNEY, M. F.; BREEBAART, J. Features for audio and music classification. In: ISMIR, 2003, Baltimore. Anais…

[5] PANAGAKIS, Y.; KOTROPOULOS, C.; ARCE, G. R. Music genre classification via sparse representations of auditory temporal modulations. In: EUSIPCO, 2009, Glasgow. Anais…

[6] TZANETAKIS, G.; COOK, P. GTZAN Genre Collection. Disponível em: http://marsyas.info/download/data_sets. Acesso em: 7 de jun. 2011.

[7] HAYKIN, S. Neural Networks: A comprehensive foundation. Upper Saddle River: Prentice-Hall, 1999. 842 p.

[8] REFAEILZADEH, P.; TANG, L.; LIU, H. Cross-Validation. In: ÖSZU, M. T.; LIU, L. Encyclopedia of Database Systems. New York: Springer, 2009. Disponível em: http://www.public.asu.edu/~ltang9/papers/ency-cross-validation.pdf. Acesso em: 7 de jun. 2011.