Sumarização Automática de Vídeos Baseada em Características de Cor e Agrupamentos Sandra Eliza...

Post on 18-Apr-2015

106 views 1 download

Transcript of Sumarização Automática de Vídeos Baseada em Características de Cor e Agrupamentos Sandra Eliza...

Sumarização Automática de Vídeos Baseada em Características de Cor e

Agrupamentos

Sandra Eliza Fontes de AvilaUniversidade Federal de Minas Gerais

Departamento de Ciência da Computaçãosandra@dcc.ufmg.br

Visão Computacional – 2008/1 2

Sumário

Introdução Definição do Problema Objetivo

Metodologia Experimentos

Método Proposto x Open Video Conclusões Trabalhos Futuros

Visão Computacional – 2008/1 3

Introdução (1/1) Sumarização automática de vídeos

Fornece rapidamente a informação concisa do conteúdo do vídeo, preservando a mensagem original (Pfeiffer et al., 1996)

Tipos de resumos Resumos estáticos (Keyframes)

Conjunto de quadros-chave Resumos dinâmicos (Video skim)

Conjunto de tomadas (shots)

Visão Computacional – 2008/1 4

Definição do Problema (1/1) Por que resumir vídeos?

Popularização da distribuição de vídeos através da web Muitas vezes o usuário necessita assistir todo o

conteúdo do vídeo para descobrir do que realmente se trata

Visão Computacional – 2008/1 5

Objetivo (1/1)

Desenvolver uma abordagem simples e eficiente para sumarização automática de vídeos, que gere resumos com o menor número de quadros necessários para apresentação das informações, possibilitando o reconhecimento dos principais objetos e eventos presentes no vídeo.

Visão Computacional – 2008/1 6

Metodologia (1/6)

Visão Computacional – 2008/1 7

Metodologia (2/6) 1) Segmentação do Vídeo

Separação do vídeo em quadros FFmpeg Pré-amostragem dos quadros

Visão Computacional – 2008/1 8

Metodologia (2/6) 1) Segmentação do Vídeo

Separação do vídeo em quadros FFmpeg Pré-amostragem dos quadros

Visão Computacional – 2008/1 9

Metodologia (3/6) 2) Extração de Características

Histograma de cor Perfil de linha (horizontal, vertical, diagonal) Espaço de cor

RGB Quantização de cores

Visão Computacional – 2008/1 10

Metodologia (4/6) 3) Técnica de Agrupamento (clustering)

k-means Método mais simples de agrupamentos Definição prévia do número de agrupamentos (k)

Para cada agrupamento, o quadro mais próximo do centróide é selecionado como quadro-chave

Visão Computacional – 2008/1 11

Metodologia (5/6) 4) Eliminação dos quadros-chave semelhantes

Determinação de limiar (experimentação visual) Comparação entre todos os quadros-chave selecionados,

conforme característica extraída

Visão Computacional – 2008/1 12

Metodologia (6/6) 5) Geração do resumo

Ordenação cronológica dos quadros-chave

Visão Computacional – 2008/1 13

Avaliação através de Usuários (1/1)

Visão Computacional – 2008/1 14

Experimentos (1/6) Base de dados

The Open Video Project 20 vídeos 1 a 4 minutos formato MPEG-1 30 fps 320 x 240 pixels Documentários

Visão Computacional – 2008/1 15

Experimentos (2/6) Análise da Taxa de Amostragem

Todos quadros, 30, 45, 60, 75, 90 Histograma 95% de confiança

90 -> perda de informação Todos, 30, 45, 60, 75 -> estatisticamente há diferença 60, 75 -> estatisticamente não há diferença 75

Tempo de execução (segundos)

todos 30 45 60 75 90

média 113,49 3,63 2,59 1,95 1,54 1,35

Visão Computacional – 2008/1 16

Experimentos (3/6) Análise das Características

Projeto Fatorial 2k, k = 2 (histograma) ou k = 3 (perfis de linha)

1) Número de agrupamentos: 15 ou 35 agrupamentos 2) Número de cores quantizadas: 16 ou 256 cores 3) Intervalo entre os perfis de linha: 10 ou 40 linhas

Visão Computacional – 2008/1 17

Experimentos (4/6)

A BTempo de

execução (s)

15 16 1,50

35 16 1,56

15 256 1,68

35 256 1,91

A B CTempo de

execução (s)

Hor. Ver. Diag.

15 16 10 0,87 1,00 1,01

35 16 10 1,26 1,27 1,29

15 256 10 0,81 0,95 1,12

35 256 10 0,96 1,13 1,45

15 16 40 0,65 0,90 0,82

35 16 40 0,67 1,05 1,05

15 256 40 0,86 0,72 0,79

35 256 40 1,11 0,78 0,90

Histograma

Perfis de linha(95% de confiança)

Visão Computacional – 2008/1 18

Experimentos (5/6)

Vídeos

Pontuação

Hist.Perfil de linha

Hor. Ver. Diag.

video2 3,6 3,7 3,5 3,7

video8 2,9 3,4 3,1 2,8

video9 2,8 3,3 2,9 2,9

video11 3,3 3,7 3,5 3,3

video12 3,3 3,4 3,5 3,3

video17 3,7 3,4 3,3 3,1

video18 3,4 3,5 3,4 3,3

video20 3,3 3,3 3,2 3,1

média 3,3 3,5 3,3 3,2

Avaliação dos resumos

Visão Computacional – 2008/1 19

Experimentos (6/6) Execução do algoritmo para os 20 vídeos

6 perfis de linha horizontal 16 cores 15, 20, 25, 30 e 35 agrupamentos

Agrupamentos Pontuação

15 3,6

20 4,2

25 4,3

30 4,0

35 3,7

AgrupamentosTempo de

execução (s)

15 0,59

20 0,64

25 0,63

30 0,64

35 0,65

Visão Computacional – 2008/1 20

Método Proposto x Open Video (1/4) Open Video

Os resumos são gerados utilizando o algoritmo desenvolvido por (DeMenthon et al., 1998)

Refinamentos manuais

Resultados

9 melhores, 5 iguais, 6 piores em relação ao Open Video Pontuação

Maior: 4,4 (Método proposto) x 4,0 (Open Video) Pior: 3,3 Método proposto >= 4,0 -> 5 vídeos Open Video >= 4,0 -> 1 vídeo

Visão Computacional – 2008/1 21

Método Proposto x Open Video (2/4)

vid.Pontuação #Q-chave

MP OV MP OV

v1 4,4 4,0 10 20

v2 3,8 3,8 9 14

v3 3,5 3,5 10 18

v4 4,1 3,8 9 12

v5 3,5 3,9 7 7

v6 3,3 3,3 10 12

v7 3,6 3,0 8 12

v8 3,7 3,8 7 12

v9 3,3 3,4 6 6

v10 3,7 3,4 8 12

vid.Pontuação #Q-chave

MP OV MP OV

v11 3,8 3,8 15 29

v12 3,8 3,6 10 26

v13 4,0 3,7 6 8

v14 3,5 3,8 6 10

v15 3,6 3,7 10 12

v16 4,0 3,7 5 6

v17 4,0 3,7 9 19

v18 3,8 3,8 13 22

v19 3,6 3,3 8 13

v20 3,6 3,8 11 19

Visão Computacional – 2008/1 22

Método Proposto x Open Video (3/4) Exemplo

http://www.youtube.com/watch?v=ZE_zZ2fm39Y

Visão Computacional – 2008/1 23

Método Proposto x Open Video (4/4)

MétodoProposto

OpenVideo

Visão Computacional – 2008/1 24

Conclusões (1/1)

Os resultados gerados apresentaram qualidade com baixo consumo de tempo

Na maioria dos casos, os resumos do método proposto apresentaram qualidade superior em relação aos resumos do Open Video

Mais testes devem ser feitos para confirmar a aplicabilidade da abordagem

Visão Computacional – 2008/1 25

Trabalhos Futuros (1/1) Algumas idéias/necessidades/emergências

Pré-processamento dos quadros Espaço de cor Características Número de agrupamentos Refinamento dos agrupamentos Diferentes gêneros de vídeos Método de avaliação?

Visão Computacional – 2008/1 26

Referências The Open Video Project. http://www.open-video.org.

B. T. Truong and S. Venkatesh. Video abstraction: A systematic review and classification. ACM Trans. on Mult. Comp., Comm., and Appl. (TOMCCAP), 3(1), 2007.

S. Pfeiffer, R. Lienhart, S. Fischer, and W. Effelsberg. Abstracting digital movies automatically. J. Visual Comm. And Image Representation, 7(4):345–353, 1996.