Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há...

124
LCS EPUSP EPUSP - Guido Stolfi 1 / 125 Codificação Perceptual de Vídeo e Áudio Guido Stolfi – 2017 PTC3452

Transcript of Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há...

Page 1: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 1 / 125

Codificação Perceptual de Vídeo e Áudio

Guido Stolfi – 2017

PTC3452

Page 2: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 2 / 125

Tópicos Abordados

• Comunicações Digitais

• Codificação Adaptada à Fonte

• Necessidade de Compressão de Dados

• Codificação Adaptada ao Receptor

• Princípios de Percepção Sensorial

• Percepção Visual

• Compressão de Imagens

• Compressão de Vídeo

• Percepção Auditiva

• Compressão de Áudio

Page 3: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 3 / 125

Sistema de Comunicação Digital

Codificador de Fonte

Codificador de Canal

Fonte Modulador

Canal

Demodu-lador

Decodif. de Canal

Decodif. de Fonte

Receptor

Page 4: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 4 / 125

Codificadores

• Codificador de Fonte: – Aproveita as características da Fonte (e/ou do Receptor) para efetuar

uma representação eficiente da informação

– Ex.: MPEG, JPEG, ADPCM

• Codificador de Canal: – Introduz redundância para possibilitar a sobrevivência da informação

após as degradações do canal

– Ex.: Paridade, códigos de Hamming, Reed-Solomon

Page 5: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 5 / 125

Modulador

• Mapeia a informação digital em formas de onda

– Considera as características do canal (meio de propagação,

resposta em frequência, potência admissível, atenuação etc.)

– Não existe “ transmissão digital”, mas sim “transmissão analógica

de informação digital”.

Page 6: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 6 / 125

Modelo de um Canal de Comunicação

Fading RuídoBranco

RuídoImpulsivo

BandaPassante

SinalTransmitido

Em um canal digital, todas as degradações contribuem para a taxa de erros, que corresponde a uma relação S/R equivalente.

Page 7: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 7 / 125

Codificação Adaptada à Fonte

• Exemplo: TV de Alta Definição – HDTV

• Características de uma Fonte (Câmera):

– Resolução Espacial: 1080 linhas x 1920 pontos

– Resolução Temporal: 30 imagens por segundo

– Resolução de Contraste: 10000 : 1 (13 bits)

– Codificação Cromática: R-G-B

Page 8: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 8 / 125

TV de Alta Definição (HDTV) x TV Convencional

1920

640

480

1080

1’

1,778 : 1

Page 9: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 9 / 125

Decomposição dos Elementos de Imagem

R P F dR ( ) ( )

G P F dG ( ) ( )

B P F dB ( ) ( )

R

G

B

Page 10: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 10 / 125

Volume de Dados para HDTV

30 quadros por segundo

1080 linhas por quadro

1920 colunas cada linha

3 cores cada ponto (pixel)

13 bits por cor ______________________________________________________

= 2,43 Gbps

Page 11: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 11 / 125

Capacidade Limite de um Canal

• Teorema de Shannon:

– Canal com banda passante B

– Sinal com potência média S

– Ruído aditivo gaussiano com potência N

– Canal estacionário (N constante)

sbitsN

SBC /1log 2

Page 12: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 12 / 125

Capacidade Limite de Canais de Comunicação

• Exemplo: – Canal telefônico, B = 3,4 kHz, S/N = 50 dB (S/N = 100000)

– Canal de TV, B = 5,8 MHz, S/N = 22 dB

skbC

N

SBC

/47,56609,163400

1000001log34001log 22

sMbC

N

SBC

/5,4232,75800000

5,1581log58000001log 22

Page 13: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 13 / 125

Capacidade Prática de Canais Digitais

• Exemplo:

– Canal de TV, B = 6 MHz, Sistema ISDB-T:

Modulação Taxa de Bits S/N mínimo

DQPSK, 1/2 4,06 Mb/s 6,2 dB

DQPSK, 5/6 6,76 Mb/s 9,6 dB

16-QAM, 2/3 10,82 Mb/s 13,5 dB

64-QAM, 1/2 12,17 Mb/s 16,5 dB

64-QAM, 7/8 21,30 Mb/s 22,0 dB

Page 14: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 14 / 125

Necessidade de Compressão de Dados

• Volume necessário para HDTV é 100x maior que a capacidade de um canal:

– Radiodifusão VHF/UHF: 20 Mbps

– Satélite: 50 Mbps por transponder

– Cabo: 40 Mbps por canal

• Há necessidade de codificação perceptual e processos de compressão “com perdas”, que exploram as características e limitações da percepção visual humana.

Page 15: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 15 / 125

Percepção Sensorial

Page 16: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 16 / 125

Processo de Percepção Sensorial

Transdutor Estímulo

Distal Processa-

mento Reconheci-

mento Estímulo Proximal

Receptor

Física

Neurologia

Cognição

Page 17: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 17 / 125

Processo de Percepção Sensorial

• Estímulo Distal: – Origem do sinal que pode ser percebido

– Ex.: Objeto iluminado pela luz solar

– Moldado pelas características da fonte (Refletância, iluminamento, espectro da luz solar etc.)

• Receptor: – Órgão que implementa um sentido

– Ex.: Olho humano

• Estímulo Proximal: – É o estímulo local que excita os transdutores

– Ex.: Imagem projetada pela córnea sobre a retina

– Moldado pelas características do receptor (diâmetro da pupila, transmitância da córnea, focalização do cristalino)

Page 18: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 18 / 125

Processo de Percepção Sensorial

• Transdutor: – Converte o estímulo proximal em impulsos nervosos

– Ex.: Células sensíveis à luz na retina ocular (cones e bastonetes)

– Sujeito às limitações da transmissão nervosa (sensibilidade espectral, persistência, período refratário, atividade basal, etc.)

• Processamento Neural: – Elaboração e combinação dos estímulos nervosos nas redes neurais em direção

ao cérebro

– Ex.: Camadas do córtex visual

• Percepção e Reconhecimento: – Capacidade de classificar um estímulo em uma categoria que lhe dá significado.

– Identificação, permite à consciência gerar uma ação relacionada.

Page 19: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 19 / 125

Estímulos Distal e Proximal

Espectro da Luz Solar

Espectros refletidos pelos objetos

Pupila, Córnea e Cristalino

Imagem Projetada na Retina Ocular

Page 20: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 20 / 125

Elementos de Neurologia

• Fibras nervosas transmitem impulsos químicos

• Potencial elétrico é consequência do impulso químico

• Impulsos têm sempre mesma amplitude

• Intensidade do estímulo afeta a taxa de repetição dos impulsos

• Cada fibra nervosa transmite apenas uma qualidade de estímulo

Page 21: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 21 / 125

Propagação do Impulso Nervoso

Na+

K+

Na+

Na+

Na+ Na+

Na+

Na+

Na+

K+

K+ K+ K+

K+ Fibra em repouso: Potencial de –75 mV

Na+

K+ Na+

Na+

Na+ Na+

Na+

Na+

Na+

K+

K+ K+ K+

K+

Início do impulso pelo ingresso de um íon de Sódio: Potencial de Ação vai a + 55 mV, parede da fibra torna-se permeável ao Sódio

Page 22: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 22 / 125

Propagação do Impulso Nervoso

Propagação com entrada de mais íons de Sódio; paredes da fibra tornam-se permeáveis ao potássio. Potencial retorna a –70 mV

Fim do impulso com a saída do Potássio (paredes tornam-se impermeáveis): Potencial de polarização –70 mV

Na+

K+

Na+

Na+

Na+

Na+

Na+

Na+

Na+

K+

K+ K+

K+

K+

Na+

K+

Na+

Na+

Na+ Na+ Na+

Na+

Na+ K+

K+

K+

K+

K+

Page 23: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 23 / 125

Propagação do Impulso Nervoso

Bomba Sódio-Potássio entra em ação (período refratário): Potencial de –70 mV

Na+

K+

Na+

Na+

Na+ Na+ Na+

Na+

Na+ K+

K+

K+

K+

K+

Na+

K+

Na+

Na+

Na+ Na+

Na+

Na+

Na+

K+

K+ K+ K+

K+ Fibra em repouso: Potencial de –75 mV

Page 24: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 24 / 125

Impulsos Nervosos em Células Sensoriais

E = 1000

E = 10

E = 0

T

Page 25: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 25 / 125

Percepção de Diferenças de Intensidade

log T

P E = 0 E = 1000

100 102

Média de N pulsos

log T

P E = 0 E = 1000

100 102

Média de 10N pulsos

Page 26: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 26 / 125

Impulsos Nervosos em Células Sensoriais

Para percepção de brilho, DAP > 1% Para contraste de 10000:1 1,01n = 10000 n= 925 10 bits são suficientes

Page 27: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 27 / 125

Transdução do Estímulo Proximal

Imagem Projetada na Retina Ocular

Espectros refletidos pelos objetos, P()

Respostas espectrais das células sensoras (cones) na retina ocular, F()

dFPR R )()(

G P F dG ( ) ( )

B P F dB ( ) ( )

FB()

FG()

FR()

Page 28: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 28 / 125

Aproximação da Curva de Percepção de Brilho

1018,0099,0099,1

018,005,4

'

45,0 VV

VV

V

Recomendação ITU-R BT.709

Page 29: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 29 / 125

Volume de Dados com Codificação Não-Linear

30 quadros por segundo

1080 linhas por quadro

1920 colunas cada linha

3 cores cada ponto (pixel)

10 bits por cor ______________________________________________________

= 1,87 Gbps

Page 30: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 30 / 125

Modelo de Oponentes para Percepção Visual

Page 31: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 31 / 125

Representação de Cores por Oponentes

Luminância: Y’ = 0.2627 R’ + 0.6780 G’ + 0.0593 B’

''8814.1

1'

''4746.1

1'

YBP

YRP

B

R

Crominância:

Recomendação ITU-R BT.709

Page 32: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 32 / 125

Resolução Espacial das Componentes

Luminância Y’

Page 33: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 33 / 125

Resolução Espacial das Componentes

Crominância PB’

Page 34: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 34 / 125

Resolução Espacial da Visão

Page 35: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 35 / 125

Decimação das Oponentes Cromáticas

64 pixels

64 amostras de Luminância

16 + 16 amostras de Crominância

Recomendação ITU-R BT.709

Page 36: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 36 / 125

Taxa de Bits com Decimação da Crominância

30 quadros por segundo

1080 linhas por quadro

1920 colunas cada linha

1 + ¼ + ¼ componentes por pixel

10 bits por componente ______________________________________________________

= 933 Mbps

Compressão de 2:1 !

Page 37: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 37 / 125

Compressão de Imagens Fotográficas:

Processo JPEG

Page 38: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 38 / 125

Redução da Redundância Espacial por DCT: JPEG

JPEG = Joint Photographic Experts Group

Page 39: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 39 / 125

F u vC u C v

f x yx u y v

y x

( , )( ) ( )

( , )cos( )

cos( )

2 2

2 1

16

2 1

160

7

0

7

C k se k

C k se k

( )

( )

1

20

1 0

Transformada Discreta de Cossenos (DCT)

DCT

f(x,y) = 64 elementos de imagem (8x8 pixels)

F(u,v) = 64 componentes de frequências espaciais

Page 40: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 40 / 125

P0,0 P0,7

P7,0 P7,7

P1,0

Primitivas da Transformada Discreta de Cossenos (DCT)

Page 41: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 41 / 125

Exemplo de Codificação DCT

52 55 61 66 70 61 64 73

63 59 66 90 109 85 69 72

62 59 68 113 144 104 66 73

63 58 71 122 154 106 70 69

67 61 68 104 126 88 68 70

79 65 60 70 77 68 58 75

85 71 64 59 55 61 65 83

87 79 69 68 65 76 78 94

0

5

10

0

5

1050

100

150

200

Bloco de 8 x 8 pixels

Page 42: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 42 / 125

Coeficientes DCT

-415 -29 -62 25 55 -20 -1 3

7 -21 -62 9 11 -7 -6 6

-46 8 77 -25 -30 10 7 -5

-50 13 35 -15 -9 6 0 3

11 -8 -13 -2 -1 1 -4 1

-10 1 3 -3 -1 0 2 -1

-4 -1 2 -1 2 -3 1 -2

-1 -1 -1 -2 -1 -1 0 -1

52 55 61 66 70 61 64 73

63 59 66 90 109 85 69 72

62 59 68 113 144 104 66 73

63 58 71 122 154 106 70 69

67 61 68 104 126 88 68 70

79 65 60 70 77 68 58 75

85 71 64 59 55 61 65 83

87 79 69 68 65 76 78 94

DCT

Page 43: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 43 / 125

Quantização dos Coeficientes

Page 44: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 44 / 125

compressãodefatoronde),(

),(round),(

k

vuQk

vuFvuFQ

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

79 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

Q(u,v) =

(Ex. Luminância )

17 18 24 47 99 99 99 99

18 21 26 66 99 99 99 99

24 26 56 99 99 99 99 99

47 66 99 99 99 99 99 99

99 99 99 99 99 99 99 99

99 99 99 99 99 99 99 99

99 99 99 99 99 99 99 99

99 99 99 99 99 99 99 99

(Ex. Crominância )

Quantização dos Coeficientes

Page 45: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 45 / 125

Coeficientes DCT Quantizados (k=2)

-26 -1 -3 1 1 0 0 0

0 -1 -2 0 0 0 0 0

-2 0 2 -1 0 0 0 0

-2 0 1 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

-415 -29 -62 25 55 -20 -1 3

7 -21 -62 9 11 -7 -6 6

-46 8 77 -25 -30 10 7 -5

-50 13 35 -15 -9 6 0 3

11 -8 -13 -2 -1 1 -4 1

-10 1 3 -3 -1 0 2 -1

-4 -1 2 -1 2 -3 1 -2

-1 -1 -1 -2 -1 -1 0 -1

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

79 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

),(2

),(round

vuQ

vuF

Page 46: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 46 / 125

Coeficientes da DCT reconstruídos

16 11 10 16 24 40 51 61

12 12 14 19 26 58 60 55

14 13 16 24 40 57 69 56

14 17 22 29 51 87 80 62

18 22 37 56 68 109 103 77

24 35 55 64 81 104 113 92

79 64 78 87 103 121 120 101

72 92 95 98 112 100 103 99

-26 -1 -3 1 1 0 0 0

0 -1 -2 0 0 0 0 0

-2 0 2 -1 0 0 0 0

-2 0 1 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

416 -22 -60 32 48 0 0 0

0 -24 -56 0 0 0 0 0

-56 0 64 -48 0 0 0 0

-56 0 44 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

DCT-1

Page 47: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 47 / 125

Imagem Reconstruída

50 45 53 66 64 53 60 78

55 54 69 95 99 81 69 71

64 62 83 121 135 111 78 61

74 64 79 118 139 117 79 56

82 62 62 91 111 98 73 59

86 62 53 69 80 74 67 70

87 69 60 67 68 61 67 83

87 75 72 76 70 59 70 92

-2 -10 -8 0 -6 -8 -4 5

-8 -5 3 5 -10 -4 0 -1

2 3 15 8 -9 7 12 -12

11 6 8 -4 -15 11 9 -13

15 1 -6 -13 -15 10 5 -11

7 -3 -7 -1 3 6 9 -5

2 -2 -4 8 13 0 2 0

0 -4 3 8 5 -17 -8 -2

Erro de Reconstrução

Page 48: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 48 / 125

Reconstrução de Imagem JPEG

Imagem Original Imagem Reconstruída

Page 49: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 49 / 125

Codificação R.L.E. (Run-Length Encoding)

Compactação

Codificação Perceptual

Reorgnização

Page 50: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 50 / 125

Reordenação em Zig-zag

[ -26 -1 0 -2 -1 -3 1 -2 0 -2 0

0 2 0 1 0 0 -1 1 EOB ]

-26 -1 -3 1 1 0 0 0

0 -1 -2 0 0 0 0 0

-2 0 2 -1 0 0 0 0

-2 0 1 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

(20 símbolos)

Page 51: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 51 / 125

Codificação RLE (Run-Length Encoding )

[ -26 0/-1 1/-2 0/-1 0/-3 0/1 0/-2

1/-2 2/2 1/1 2/-1 0/1 EOB ]

1o. coeficiente

Número de zeros anteriores

Valor do coeficiente

Símbolo

(13 símbolos)

Page 52: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 52 / 125

Codificação Estatística (Huffman)

Page 53: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 53 / 125

Codificação Estatística – Código de Huffman Modificado

• Símbolos de Comprimento Variável

• Comprimento do símbolo é tanto menor quanto maior a sua probabilidade de ocorrência

• Sequência de símbolos concatenados (bit stream) é univocamente decodificável

• Código especial para “Fim de Bloco” (EOB)

• Tabela incompleta

• Código de “Escape” para sequências não contidas na tabela

Page 54: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 54 / 125

Tabela de Codificação para Coeficientes AC

Zeros/

Categoria Prefixo

Comprim.

total

0/1 00x 3

0/2 01xx 4

0/3 100xxx 6

0/4 1011xxxx 8

0/5 11010xxxxx 10

0/6 111000xxxxxx 12

0/7 1111000.. 14

0/8 1111110110.. 18

0/9 1111111110000010.. 25

0/A 1111111110000011.. 26

1/1 1100x 5

1/2 111001xx 8

1/3 1111001xxx 10

Zeros/

Categoria Prefixo

Comprim.

total

3/1 111010x 7

3/2 111110111xx 11

3/3 11111110111xxx 14

3/4 1111111110010000.. 20

...

13/1 11111111010x 12

13/2 1111111111100011xx 18

13/3 1111111111100100.. 19

...

15/7 1111111111111011.. 23

15/8 1111111111111100.. 24

15/9 1111111111111101.. 25

15/A 1111111111111110.. 26

(Trechos)

Page 55: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 55 / 125

Codificação Huffman por Tabela de Códigos

11000101 000 11100110 000 0100 001 0101

11100101 111110010 11001 110110 001 1010

Bloco original: 8 8 8 = 512 bits (8 bits por pixel) Bloco comprimido: 68 bits (1,06 bits/pixel)

Compressão de 7,5:1 !

[ -26 0/1/-1 1/2/2 0/1/-1 0/2/-3 0/1/1 0/2/-2

1/2/-2 2/2/2 1/1/1 2/1/-1 0/1/1 EOB ]

-26 0/1/-1 1/2/2

EOB

No. Zeros Categoria

Valor

2/2/2

Page 56: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 56 / 125

Exemplo: Compressão JPEG 20:1

“Lena”, © Playboy 1972

Original 512 x 512 Reconstruída

Page 57: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 57 / 125

Compressão de Imagens Em Movimento:

Processo MPEG

Page 58: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 58 / 125

Codificador MPEG

• MPEG-1: Moving Pictures Experts Group - ISO/IEC 11172a • Compressão com Preditor para Compensação de Movimento • Compressão com DCT para o erro de predição

Preditor Preditor

y(t)

y(t) ^ y(t) ^

y(t) e(t) +

-

Transmissor Receptor

Canal

S1 S2

Page 59: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 59 / 125

Preditor de Ordem Zero: “Frame Store”

Anterior Atual Erro de Predição (diferença entre as

duas imagens)

(referência)

Page 60: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 60 / 125

Diferença Entre Imagens Sucessivas

Page 61: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 61 / 125

Diferença Entre Imagens Sucessivas

Histograma de amplitudes da imagem original

Histograma da diferença entre 2 imagens

0 128 255 -255 0 255

Page 62: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 62 / 125

Preditor com Compensação de Movimento

Erro de Predição (sem compensação)

Vetor de Movimento Predição (com compensação) Erro de Predição

(com compensação)

Anterior Atual (referência)

Page 63: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 63 / 125

Compensação de Movimento por Blocos

Imagem de Referência Imagem atual

x

y

x

y

Área de Busca

Bloco de MaiorSemelhança

Vetor de Movimento

Bloco a serEstimado

Page 64: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 64 / 125

Compensação de Movimento

Sem Compensação de Movimento

Com Compensação de Movimento

Page 65: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 65 / 125

Histogramas do Erro de Predição

Sem compensação de movimento

Com compensação de movimento

-255 0 255 -255 0 255

Page 66: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 66 / 125

Codificador MPEG-1

Page 67: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 67 / 125

Decodificador MPEG-1

Page 68: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 68 / 125

Preditor MPEG com Compensação de Movimento

Compensador de

Movimento Vetores de Movimento

Imagens de Referência

Imagem Compensada

Imagem Reconstruída

Erro de Reconstrução

Page 69: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 69 / 125

Tipos de Imagens em MPEG-1

• Imagens I (Independentes, Intra-frame): codificadas sem predição de movimento, apenas por DCT, quantização e compactação

• Imagens P (predição progressiva de movimento): reconstruídas através de predição de movimento, baseando-se em imagens de referência anteriormente codificadas, tipo I ou P

• Imagens B (predição bidirecional): o preditor baseia-se em duas imagens de referência (anterior e posterior, do tipo I ou P)

Page 70: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 70 / 125

Compensação de Movimento Bidirecional

Ex.: Movimento de Câmera (Translação)

Imagem anterior Imagem atual Imagem futura

Predição regressiva Predição progressiva Predição bidirecional

Page 71: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 71 / 125

Predição de Movimento Bidirecional

y

x

y+dy

x+dx

referencia anterior (I ou P)

quadro atual (B)

referencia futura (I ou P)

Page 72: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 72 / 125

Grupos de Imagens em MPEG

I B B B B B

B P P

1 2 3 4 5 6 7 8 9 10

I

1 3 4 2 6 7 5 9 10 8

Ordem de Apresentação:

Ordem de Transmissão:

Predição Progressiva

Predição Bidirecional

Page 73: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 73 / 125

Hierarquia dos Elementos de uma Sequência de Vídeo MPEG

SEQUÊNCIA

GRUPO DE IMAGENS

IMAGEM

FATIA DE IMAGEM

MACROBLOCO

BLOCO 1

BLOCO 2

BLOCO

3 BLOCO

4

BLOCO 5

BLOCO 6

(LUMINÂNCIA)

U V (CROMINÂNCIA)

Page 74: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 74 / 125

Estrutura do Macrobloco MPEG

Y 8x8

Cb (B-Y)

Cr (R-Y) 8x8

8x8

Y

Y 8x8

Page 75: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 75 / 125

Estrutura de Amostragem “4:2:0”

Y

U, V

Amostras:

Page 76: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 76 / 125

Tabelas de Quantização MPEG-1

Intra-Frame (Imagens Tipo I)

8

16

19

22

26

27

29

34 16

16

22

24

27

29

34

37

19

22

26

27

39

34

34

38 22

22

26

27

29

34

37

40

22

26

27

29

32

35

40

48 26

27

29

32

35

40

48

58

26

27

29

34

38

46

56

69 27

29

35

38

46

56

69

83

16

16

16

16

16

16

16

16 16

16

16

16

16

16

16

16

16

16

16

16

16

16

16

16 16

16

16

16

16

16

16

16

16

16

16

16

16

16

16

16 16

16

16

16

16

16

16

16

16

16

16

16

16

16

16

16 16

16

16

16

16

16

16

16

Inter-Frame (Imagens Tipo P, B)

(Tabelas Padrão)

Page 77: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 77 / 125

Quantização dos Coeficientes da DCT

0,/),(

8),(

08

)0,0(

),(

vupvuQq

vuF

vuparaF

vuFq

Blocos tipo I: arredondamento p/ inteiro mais próximo Blocos tipo P, B: arredondamento em direção a zero

Page 78: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 78 / 125

Exemplos: Fotograma Original

512 x 480 8 bits

0 128 255

Page 79: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 79 / 125

Erro de Reconstrução (apenas DCT)

Contraste aumentado (x 16)

-15 0 15

Page 80: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 80 / 125

Erro de Reconstrução (apenas Compensação de Movimento)

Contraste aumentado (x 16)

-15 0 15

Page 81: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 81 / 125

Erro de Reconstrução (Compensação de Movimento + DCT)

Contraste aumentado (x 16)

-15 0 15

Page 82: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 82 / 125

Erro de Reconstrução (Compensação de Movimento + DCT)

Contraste real

-127 0 127

Page 83: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 83 / 125

Desempenho dos Codificadores de Vídeo

• MPEG-1: compressão da ordem de 50:1 – Uso em Multimídia, Video-CD

• MPEG-2: da ordem de 100:1 – Recursos para TV com imagens entrelaçadas

– Adotado para HDTV nos sistemas ATSC (EUA), ISDB-T (Japão) e DVB (Europa)

• H.264: até 200:1 – Blocos de tamanho variável (16 x 16 a 4 x 4), preditor para imagens Tipo I, filtro anti-

blocagem, codificação aritmética

– Adotado no sistema ISDB-TB (Brasil)

– Permite transmitir 2 programas HDTV em um canal de VHF/UHF

• H.265: maior que 300:1 – Permite transmissão no modo “4k” (3840 x 2160 pixels)

Page 84: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 84 / 125

Desempenho dos Codificadores

0,00

1,00

2,00

3,00

4,00

5,00

0 5 10 15 20

H.264

MPEG-2

H.264

MPEG-2

Mb/s

Avaliação subjetiva de sequencias de vídeo HDTV

Page 85: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 85 / 125

Codificador HEVC / H.265

• ISO/IEC MPEG + ITU-T VCEG (Moving Pictures Experts Group e Video Coding Experts Group)

• Finalizado e ratificado em 13/04/2013

• Recursos:

– “Coding Tree Unit”: 64 x 64, 32 x 32, 16 x 16, 8 x 8, 4 x 4

– Vários espaços de Cromaticidade: NTSC, PAL, Rec.601, Rec.709, Rec.2020, RGB, etc.

– Focado em vídeo sem entrelaçamento

– Transformadas inteiras 4x4, 8x8, 16x16 e 32x32

– Preditores Intra com mais direções de interpolação

– Suporte para vídeo UHDV (“8k”)

Page 86: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 86 / 125

Codificador HEVC / H.265

• Partições 16 x 16 vs. 64 x 64

Page 87: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 87 / 125

Codificador HEVC / H.265

• Comparação com H.264:

Page 88: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 88 / 125

Codificação de Áudio

Page 89: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 90 / 125

Estímulo Distal

• Ondas de pressão sonora, longitudinais, produzidas por: – Cordas e membranas vibrantes

– Percussão e atrito entre objetos

– Turbulências em fluxos de gás

– Voz humana

– Transdutores eletroacústicos

– etc.

• Caracterizadas por: – Frequências até >100 kHz (audíveis até 20 kHz)

– Amplitudes toleráveis acima de 20 Pa até 20Pa (0 a 120 dB SPL)

– Reflexões múltiplas no ambiente (reverberação)

– Fontes não puntiformes

Page 90: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 91 / 125

Pressão Sonora: Unidade de Medida

Pa20onde)SPLdb(log20Sonora Pressão o

o

pp

p

• Limiar de Audibilidade: 20 Pa rms = 2x10-5 N/m2 @ 1 kHz (1 pw/ m2)

• ( Pressão atmosférica: ~ 100 kPa )

• Volume Sonoro = grandeza subjetiva associada à percepção sensorial da intensidade de um som

– 1 Phon = 1 dB SPL @ 1 kHz

Page 91: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 92 / 125

Situações Sonoras

dB SPL dB SPL

Foguete 195 Conversação 65

Avião a jato 155 Restaurante 60

Limiar de dor 140 Residência urbana 40

Limiar de desconforto 120=1W/m2 Casa de campo 30

Orquestra fortíssimo 110 Orquestra pianíssimo 30

Rebitadeira 100 Estúdio de gravação 20

Fábrica 78 Folhagens na brisa 10

Tráfego pesado 68 Limiar de audição 0=1pw/m2

Escritório ruidoso 65 Ruído térmico do ar -10

Page 92: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 93 / 125

Estrutura do Receptor Auditivo

cóclea

nervo

martelo bigorna canais semicirculares

janela oval

estribotímpano

janela circular

auditivatrompa

orelha

canal auditivo

osso da têmpora

lóbulo temporal

Page 93: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 94 / 125

Representação Esquemática do Ouvido

15k 1k 60Hz2504k

~2,2 cm

~3 cm

Membrana Basilar

Janelas

canal

cóclea

nervos

Órgãos de Corti

Page 94: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 95 / 125

Resposta em Frequência do Canal Auditivo

Page 95: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 96 / 125

Ouvido Médio

Page 96: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 97 / 125

Estrutura da Cóclea

Page 97: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 98 / 125

A Cóclea Distendida

Page 98: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 99 / 125

Secção da Cóclea

Page 99: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 100 / 125

Secção da Cóclea

Page 100: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 101 / 125

Detalhe dos Órgãos de Corti

Page 101: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 102 / 125

Células de Corti

Page 102: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 103 / 125

Células de Corti

Internas Externas

Page 103: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 104 / 125

Atuação das Células Ciliares

Page 104: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 105 / 125

Seletividade da Membrana Basilar

Page 105: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 106 / 125

Alguns Números:

• 3.500 Células Ciliares Internas

• 12.000 Células Ciliares Externas

• 30.000 Fibras Nervosas Aferentes:

– 90~95% provenientes das Células Internas

– Células Internas com até 20 sinapses

• ~500 Fibras Nervosas Eferentes:

– Destinadas às Células Externas

Page 106: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 107 / 125

Resposta das Células Internas

Page 107: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 108 / 125

Células Externas como Atenuadores

Page 108: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 109 / 125

Células Externas como Atuadores

Page 109: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 110 / 125

Curvas de Igual Volume Sonoro (tons senoidais)

Page 110: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 111 / 125

Faixa Dinâmica para Música e Voz

Page 111: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 112 / 125

Exemplo de Mascaramento

Page 112: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 113 / 125

Compressão de Áudio:

Processo MPEG

Page 113: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 114 / 125

Necessidade da Compressão de Áudio

• “Qualidade CD” – 2 canais de áudio (som estereofônico)

– resposta em frequência de 20 a 20.000 Hz

– relação Sinal/Ruído de 90 dB

– 2 x 44.1 kHz x 16 bits = 1.41 Mbits / s

• “Qualidade Cinema” – 5 canais de áudio de 20 a 20.000 Hz:

• Direito, Esquerdo, Central, Traseiro Direito e Traseiro Esquerdo

• 1 canal efeitos sonoros de 3 a 150 Hz ("Sub-Woofer", omnidirecional)

– Faixa dinâmica de 100 dB

– 5.1 x 48 kHz x 24 bits = 5,9 Mbits / s

Page 114: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 115 / 125

Tecnologias Chave para Compressão de Áudio

• Codificação por Sub-bandas

• Modelo Psico-acústico do Mascaramento

• Quantização Adaptativa

• Codificação Estatística

Page 115: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 116 / 125

Codificação por Sub-Bandas

Sinal de Áudio

Banco de Filtros

Sub - bandas

Page 116: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 117 / 125

Codificador MPEG Áudio

Page 117: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 118 / 125

Exemplo de Modelo Psico-Acústico

FFT Separador

Tonal

Não- Tonal

Cálculo da

Potência

por Banda

Cálculo do

Limiar

Absoluto

Limiar

Tonal

Limiar

Não-Tonal

SPL(b)

SMR(b)

Funções de Mascaramento

mínimo

M(b)

PCM

Page 118: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 119 / 125

Exemplo de Cálculo de Limiar de Mascaramento Total

freq.

Limiar Absoluto

Mascaramento não-tonal

Mascaramento tonal

Limiar Total

SMR

Som tonal (banda estreita)

Som não-tonal (banda larga)

Som tonal inaudível (abaixo do mascaramento)

Page 119: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 120 / 125

Limiar de Mascaramento na Sub-banda

Sinal de Áudio

Mascaramento Total

Amplitude de Pico na Banda b

Limiar de Ruído de Quantização na Banda b

SMR(b)

SPL(b)

Fundo de Escala do Quantizador Qb SPL(b) Ruído de Quantização SMR(b) = 6,02Nb + 4,77 (dB) Número de bits Nb = (SMR(b)-4,77)/6,02

Page 120: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 121 / 125

Desempenho dos Sistemas de Compressão

Padrão Canais Taxa de

Compressão

Taxa

Original

Taxa

Comprimida

Atraso

A/D/A

MPEG-1:I 2 4:1 1,41 Mb/s 384 kb/s 19 ms

Sony ATRAC 2 5:1 1,41 Mb/s 292 kb/s

MPEG-1:III (MP3) 2 8:1 1,41 Mb/s 128 kb/s > 80 ms

MPEG-2:III 5.1 10:1 3,53 Mb/s 384 kb/s

Dolby AC-3 5.1 12:1 3,53 Mb/s 290 kb/s 45 ms

AAC 2 16:1 1,54 Mb/s 96 kb/s

Page 121: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 122 / 125

Comparações

Original .wav,44.1k

MPEG-1 Layer III 32 kbps

Page 122: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 123 / 125

Comparações

MP3 48 kbps 24 kHz

MP3 16 kbps 12 kHz

MP3 8 kbps 8 kHz

Page 123: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 124 / 125

Processo de Percepção Sensorial

Transdutor Estímulo

Distal Processa-

mento Reconheci-

mento Estímulo Proximal

Receptor

Física

Neurologia

Cognição

Page 124: Codificação Perceptual de Vídeo e Áudio - lcs.poli.usp.brpjj/Codif_Perceptual.pdf · •Há necessidade de codificação perceptual e processos de compressão “com perdas”,

LCS E P U S P

EPUSP - Guido Stolfi 125 / 125

Obrigado!

Apresentação baseada na ementa do curso:

PTC2547 – Princípios de Televisão Digital

Prof. Dr. Guido Stolfi

Departamento de Telecomunicações - PTC

Escola Politécnica da USP

[email protected]