1 Codificação Diferencial. Universidade Federal do Paraná Setor de Tecnologia Departamento de...

1

Codificação DiferencialCodificação Diferencial

TE073 – Processamento Digital de Sinais II 2

Universidade Federal do ParanáSetor de TecnologiaDepartamento de Engenharia Elétrica

Introdução

Formas de quantização (perdas): Quantização Escalar

Uniforme / não-uniforme Side information

Quantização Vetorial Codebook e Codeword Ótimas taxas Complexo computacionalmente



Introdução Codificação Diferencial

Codificação das diferenças Aplicação: Voz Sinal amostrado {xn} Ex 1. Senóide dn = { xn – xn-1 }

Menor Faixa Dinâmica Menor Variância:

Amostras mais centradasem zero.



Ex 2. Imagem Sinan

Histograma original Histograma das diferenças

8 bits 7 bits 99%-> 5bits



Exemplo 3:

Considere a sequência:x={6.2 9.7 13.2 5.9 8.0 7.4 4.2 1.8}

A sequência diferença será:d={6.2 3.5 3.5 -7.3 2.1 -0.6 -3.2 -2.4}

Se codificarmos sem perdas, voltamos à seqüência original fazendo:

Porém: Quantizando com perdas [-6 -4 -2 0 2 4 6]:

d={6 4 4 -6 2 0 -4 -2}

Reconstruindo temos: xq={6 10 14 8 10 10 6 4}

Que corresponde ao erro de quantização:{0.2 -0.3 -0.8 -2.1 -2.0 -2.6 -1.8 -2.2} crescente!

1

[ ] [ ] [ ]n

qk

x n x n q k

[ ] [ ] [ 1]d n x n x n

[ ] [ 1] [ ]x n x n d n



Mesmo erro de quantização tendo média zero, pode causar overflow

Q

z-1

+

-

x[n]

x[n-1]

d[n] dq[n]Q-1

z-1

+

+

dq[n] xq[n]

xq[n-1]

•Solução:

Q

z-1

+

-x[n]

xq[n]

d[n] dq[n]

++

xq[n-1]

Q-1

z-1

+

+

dq[n] xq[n]

xq[n-1]

[ ] [ ] [ 1]qd n x n x n

[ ] [ ] [ 1]d n x n x n



Ex 4. Sinal senoidalAproximação I

• Intervalo dinâmico de diferenças: [-0,2 0,2]

• Passo do quantizador = 0,1

Aproximação II• Intervalo dinâmico de

diferenças: [-0,4 0,4]• Passo do quantizador = 0,2



Generalização:

Preditor: [ ] [ 1], [ 2], [ 3],...., [0]q q q qp n f x n x n x n x

Se: [ ] [ 1]qp n x n Temos o DPCM(Differential Pulse Code Modulation)



Adaptativo Direto

Side information transmitida ao decodificador Separação em blocos (estimativas por bloco)

Reverso Não há necessidade de side info – adaptação obtida

da saída do decodificador. Mais utilizado Algoritmo de Jayant



Modulação Delta Quantizador de 1-bit (2 níveis) Variação da taxa de amostragem

Slope overload



Ex.: Codificação de Voz Principal aplicação de codificadores

diferenciais (ADPCM) Vários padrões ITU (G.721, G.723, G.722,...) G.726

Quantização adaptativa reversa Algoritmo de quantização similar a Jayant Predição reversa adaptativa Combinação linear dos 2 últimos valores reconstruídos Uso dos 6 últimos diferenças quantizadas para a

predição (40, 32, 24 e 16 kbits) 8000 amostras 5, 4, 3, 2 bits/amostraComparando com PCM (8bits /amostra):

Taxas de compressão 1,6:1 2:1 2,67:1 4:1 respectivamente



Codificação de Imagem Comparação com JPEG

PSNR=31.42dB PSNR=41.60dB



PSNR=38.28dB PSNR=41.60dB

14

Conceitos Básicos paraConceitos Básicos para

Transformadas, Transformadas, Subbandas e WaveletsSubbandas e Wavelets



Para entendermos os conceitos utilizados em codificaçãopor transformada, subbandas e wavelets é necessário umconhecimento prévio dos seguintes assuntos:

• Espaços Vetoriais• Série de Fourier• Transformada de Fourier• Sistemas Lineares• Amostragem• DFT• Transformada Z

Já vistos em DSP-I



11.3. Espaços Vetoriais

Representação de um vetor no espaço 2-D:

3

4v

3.4v yx uu3

4

Logo: um vetor pode ser representado como uma decomposiçãoem vetores base (ux, uy).

Qualquer vetor neste espaço 2-D pode ser decomposto.



Então, dado um vetor A e um conjunto base, a decomposiçãosignifica encontrar os coeficientes os quais ponderam os vetoresunitários do conjunto base.

Ferramenta matemática: Produto Escalar ou Interno



11.3.1. Produto Escalar ou Produto Interno

Dado dos vetores:

2

1

2

1 bab

be

a

a

O produto interno é definido por: 2211ba baba

Dois vetores são ditos ortogonais se seu produto interno é zero.Um conjunto de vetores é dito ortogonal se cada vetor for ortogonala todos os outros vetores do conjunto.



O produto interno entre um vetor e um vetor unitário de umconjunto base ortogonal nos fornece o coeficiente correspondentea aquele vetor. E pode ser visto também como a projeção do vetor sobre o vetor da base.

Ex.:

1

0,

0

1yx uuSeja a base ortogonal:

Claramente: 0 yx uu

E um vetor a pode ser decomposto em:

221

121

10a

01a

aaau

aaau

y

x



b

a

ux

uy

O produto interno entre dois vetores pode representar, comum certo cuidado, uma medida de similaridade entre eles

a é mais próximo de ux logo: yx uu aa



11.3.2. Espaço Vetorial

Generalizando os conceitos vistos em 2-D e 3-D:

Espaço vetorial consiste em um conjunto de elementos chamados vetores que têm as operações de adição vetoriale multiplicação escalar definidas. Os resultados destas operações são também elementos deste espaço vetorial



Adição Vetorial:

Sejam os vetores:

3

2

1

3

2

1

,

b

b

b

a

a

a

ba

33

22

11

ba

ba

ba

baDefinimos:

Multiplicação Escalar:

Multiplicação de um vetor por um numero real ou complexo.Para que o conjunto de elementos seja um espaço vetorialé necessário que cumpra os seguintes axiomas:



Seja: V um espaço vetorial x,y,z vetores e e números escalares

1. x+y=y+x comutatividade

2. (x+y)+z=x+(y+z) e ()x= (x) associatividade

3. Existe elemento em V tal que x+ =x para todo x V

4. (x+y)= x+ y e (+)x= x+x distributividade

5. 1.x=x e 0.x=

6. Para todo x V existe elemento (-x) tal que x+(-x)=

Ex.: Um exemplo de espaço vetorial são os números reais, neste conjunto: zero=



Outro exemplo de espaço vetorial: conjunto das funções f(t)que possuem energia finita:

dttf

2

)(

Neste caso: (t)=0

E o espaço vetorial é chamado L2



11.3.3. Subespaço

Um subespaço S de um espaço vetorial V é um subconjuntode V cujos membros satisfazem todos os axiomas do espaçovetorial e têm a propriedade adicional que se x e y S, e é um escalar, então x+y e x estão também em S.

Ex.: Considere S o conjunto das funções limitadas aointervalo [0,1]. Então S é um subspaço de L2



11.3.4. Bases

Uma das formas de se gerar um subespaço é fazendo combinações lineares de um conjunto de vetores.

Se o conjunto de vetores for linearmente independente, oconjunto é chamado de base para o subespaço.

Um conjunto de vetores {x1,x2,...} é dito linearmenteindependente se nenhum vetor do conjunto puder ser escritocomo uma combinação linear dos outros vetores do conjunto.



Teorema:Um conjunto de vetores X={x1,x2,...,xN} é linearmente independenteSe e somente se a expressão

Implicar que

N

iii

1

x

0i para todo i=1,2,...,N



Ex.: Seja o espaço vetorial V dos vetores definidos por [a b]T,onde a e b são números reais.

1

0,

1

1

1

0,

0

121 XeX

São bases de V. Quaisquer 2 vetores não paralelos formam uma base para V.

O número de vetores necessários para gerar o espaço é chamadodimensão do espaço vetorial.No exemplo: Dimensão 2No exemplo anterior, espaço das funções limitadas [0,1] de L2

possui dimensão infinita.



Ex.: Seja o vetor

4

3a

1

04

0

13a

0

1)1(

1

14a

Então a representação de a na base X1 é (3,4) e nabase X2 é (4,-1)



11.3.5. Definição formal do produto interno

O produto interno pode ser denotado como: yxyx ,

Satisfaz os seguintes axiomas:

1. <x,y>=<y,x>*2. <x+y,z>=<x,z>+<y,z>3. <x,y>= <x,y>4. <x,x>0 com equalidade se e somente se x=

xxx , É chamada norma de x e é análogo à distância



11.3.6. Conjuntos Ortogonais e Ortonormais

No espaço Euclidiano, dois vetores são ditos ortogonais se seu produto interno for zero.

Se selecionarmos conjunto base formada por vetores ortogonaise ainda se a norma desses vetores for unitária, o conjunto é chamado

Base Ortonormal.



Dada um espaço vetorial SN com uma base ortonormal{xi} i=1,2..N. Dado um vetor y no espaço SN podemos escrever y como uma combinação linear dos vetores xi

N

iii

1

xy

Para encontrar os coeficientes i , podemos tirar o produtoInterno de ambos os lados com respeito a xi

N

ikii

1k x,xxy,



Como a base é ortonormal:

ki

kiki ,0

,1x,x

Logo:kkxy,



Conclusões:

• Vetores não são simplesmente pontos nos espaços 2-D e 3-D. Funções do tempo podem serem vistas como elementos de um espaço vetorial.

• Conjuntos de vetores que satisfazem a certos axiomas formam um espaço vetorial

•Todos os membros de um espaço vetorial podem ser representados como combinações lineares dos vetores bases (podem ter diferentes bases para um mesmo espaço). As bases formadas por vetores de magnitude unitária e ortogonais são conhecidas como bases ortonormais.

•Se uma base é ortonormal os coeficientes podem ser obtidos tirando o produto interno do vetor com cada vetor da base.

35

Codificação Por TransformadaCodificação Por Transformada



Introdução Fonte é decomposta ou transformada em componentes

de modo que a energia fique concentrada em poucas amostras.

Para uma fonte gaussiana a entropia é dada por:

O aumento da variância causa um aumento na entropia, o que mede a quantidade de informação contida no sinal.

22log2

1 e



Ex: Analisando a sequência de dois números, representando peso e altura:

Peso Altura

65 170

75 188

60 150

70 170

56 130

80 203

68 160

50 110

40 80

50 153

69 148

62 140

76 164

64 120



Podemos observar que os valores estão ao redor da reta y=2.5x

Podemos rotacionar o conjunto de valores usando:

Ax

1

0

x

xx

cossin

sincosA

1

0

Onde é o ângulo da reta com eixo x arctan 2.5 68o



37139068,092847669,0

92847669,037139068,0A

Peso

Altura

65 170

75 188

60 150

70 170

56 130

80 203

68 160

50 110

40 80

50 153

69 148

62 140

76 164

64 120

1o 2o

182 3

202 0

162 0

184 -2

141 -4

218 1

174 -4

121 -6

90 -7

161 10

163 -9

153 -6

181 -9

135 -15

.A x



A energia foi compactada no primeiro elemento. Desenhando o gráfico temos:

Podemos ignorar a segunda coordenada de , causando um erro, porém reduzindo a quantidade de dados pela metade!



Fazendo a anti-transformação podemos recuperar os dados x.

cossin

sincos1A

1.x A

1o 2o

182 0

202 0

162 0

184 0

141 0

218 0

174 0

121 0

90 0

161 0

163 0

153 0

181 0

135 0

Peso Altura

68 169

75 188

60 150

68 171

53 131

81 203

65 162

45 112

34 84

60 150

61 151

57 142

67 168

50 125

Peso Altura

65 170

75 188

60 150

70 170

56 130

80 203

68 160

50 110

40 80

50 153

69 148

62 140

76 164

64 120

Reconstruído Original



Neste exemplo foi utilizada apenas duas dimensões, mas o princípio pode ser expandido para mais dimensões.

Com duas dimensões podemos reduzir os dados em um fator de 2, com mais dimensões esse fator pode aumentar.

Descartar as componentes com menor quantidade de informação (menor entropia) (menor variância)

O erro de reconstrução foi pequeno pois nessa transformaçãoem particular temos:

1 1 22

0 0

ˆˆN N

i i i ii i

x x



Prova-se que a melhor compactação ocorre quando descorrelacionamos as amostras da transformada.

A descorrelação de dados discretos foi introduzida em 1933 por Hotteling.

Em 1947, Karhunen e em seguida, 1948, Loève desenvolveram a transformação para funções contínuas.

Kramer e Mathew em 1956 utilizaram esses conceitos da descorrelação, para codificação de sinais, gerando então o termo codificação por transformada.



A codificação por transformada consiste em três passos: A seqüência de dados é dividida em blocos de tamanho N

e mapeada em seqüências transformadas, usando um mapeamento reversível.

Quantizar a seqüência transformada Taxa de bits que eu desejo conseguir? A estatística dos elementos transformados? Efeitos de distorções causados pela quantização?

Binary encoding



A Transformada Todas as transformadas que veremos são transformadas

lineares, podendo serem representadas por:

Em sinal de voz mudanças radicais como a passagem do silêncio para a conversa dificultam a implementação de N grandes. O mesmo acontece em imagem.

1

0,

N

iinin ax

1

,0

N

n i n ii

x b

O tamanho N do bloco é definido por considerações práticas,tais como: Taxa de compressão versus complexidade computacional



A transformada pode ser escrita na forma matricial:

onde A e B são matrizes N×N

xABx

jiji aA ,,][

jiji bB ,,][

IBAAB

A : Matriz Transformada DiretaB : Matriz Transformada Inversa

Se a transformada é ortonormal ela tem a propriedade de que a inversa é a própria transposta.

TAAB 1



A eficiência da transformada depende da compactação de energia.

Uma das maneiras de medir a compactação é tirar a média aritmética da variância dos coeficientes de transformação.

NN

i i

N

i i

TCNG 1

1

0

2

1

0

21

Ganho de Codificação da Transformada



Ex: Considere a matriz

Note que a primeira linha representa um filtro passa-baixa e a segunda um passa alta

Supondo a sequência de entrada sendo

11

11

2

1A

),(

0

2

11

11

2

1

1

0

Coeficiente de

baixa-frequência



Analisando duas outras seqüências (3,1) e (3,-1) A segunda é mais alta frequência que a primeira, pois

difere de 4 enquanto a outra de 2. Teremos:

2

22

1

3

11

11

2

1

1

0

22

2

1

3

11

11

2

1

1

0

Observe que a energia da sequência transformada é igual a da original, caracterizando uma transformada ortonormal.

222231)22(2



Transformada Karhunen-Loéve As linhas da transformada discreta KLT consiste nos

autovetores da matriz de autocorrelação da sequência. A matriz de autocorrelação para um processo randômico X

é dada por:

A matriz construída desta forma reduz a variância dos coeficientes da transformada. Resultando na Transformada Ótima do ponto de vista de compactação da energia.

Transformada dependente do sinal: Grande informação Lateral

[ ]ij n n i jR E X X



Transformada Karhunen-Loéve

Ex: KLT tamanho 2 A matriz de autocorrelação de tamanho 2

é:

Resolvendo a equação

Temos os autovalores

)0()1(

)1()0(

xxxx

xxxx

RR

RRR

0 RI

)1()0(

)1()0(

2

1

xxxx

xxxx

RR

RR



Transformada Karhunen-Loéve

Os autovetores associados são

Impondo as condições de ortonormalidade

A matriz da transformada é

1V

2V

2

1

11

11

2

1K



Discrete Cosine Transform (DCT)

Tem este nome porque a matriz de transformada é obtida em função do cosseno, segundo a regra:

,

1 (2 1)cos 0, 0... 1

2

2 (2 1)cos 1... 1, 0... 1

2

i j

j ii j N

N NC

j ii N j N

N N



Funções base da DCT:



Parecida com a DFT porém a DCT é melhor para efeitos de compactação

A DFT considera que a seqüência é periódica de período N, introduzindo descontinuidades no final da seqüência, interferindo nas altas frequências.



A DCT duplica a seqüência N porém em espelho, não gerando descontinuidades e gerando periodicidade na seqüência 2N.



Discrete Sine Transform (DST)

A DCT obtém performance tendendo a KLT para coeficientes de correlação altos e a DST para valores baixos de correlação.

É utilizada de forma complementar a DCT em aplicações de áudio e image

1,...0,1

)1)(1(sin

1

2

Nji

N

ji

NS ij



Discrete Walsh-Hadamard Transform (DWHT)

Baixa complexidade computacional Não tão eficiente quanto a DCT Matrizes de Hadamard DWHT: Ortonormal

2N N

NN N

H HH

H H

logo:

2

1 11

1 12H

1

11

1H

4

1 1 1 1

1 1 1 11

1 1 1 14

1 1 1 1

H



Quantização dos Coeficientes

Cada coeficiente possui uma quantidade de informação diferente, logo alocar diferentes números de bits para quantizar escalarmente cada coeficiente. Duas approaches:

Alocar o número de bits baseado em estatísticas dos coeficientes (variância). Coeficiente com > variância recebe mais bits.

Classificar várias matrizes de quantização de acordo com características do sinal de entrada.

Quantizar vetorialmente o bloco de transformada: Medida da distância ponderada pela variância dos coeficientes.

61

Codificação por Subbandas



Introdução

Do que vamos tratar? Uma descrição geral de sistemas de

codificação subbandas. Uma descrição de uma aproximação

popular de alocação de bit. Aplicações de compressão de áudio e

vídeo.



IntroduçãoNós vimos:

Quantização VetorialQuantização EscalarCodificação Diferencial

Porém, existem fontes que combinam várias características e é difícil determinar qual tipo de codificação utilizar.

Codificação por Transformada = decompõe o sinal em uma estrutura (bloco) artificial, gerando efeitos indesejáveis de blocagem (Lapped Orthogonal Transform (LOT) - Malvar 92)



Decompor o sinal em diferentes partes sem uma imposição de estrutura.

Usar a técnica de codificação que mais se adeque a cada parte.

Adequar a alocação de bits de acordo com características da percepção humana



21

nnn

xxy

2211

nnnnnnnn

xxxxxyxz

Desta forma a seqüência {yn} e {zn} podem ser codificadas independentemente, usando o esquema de compressão que é mais adequado para cada seqüência.

Fazendo:

Filtragem PB

Filtragem PA



Exemplo:

Suponha que quiséssemos codificar a seqüência:xn = {10, 14, 10, 12, 14, 8, 14, 12, 10, 8, 10, 12}

Utilizando DPCM:xn –xn-1= {10, 4, -4, 2, 2, -6, 6, -2, -2, -2, 2, 2}

Então utilizaremos M=2m níveis de quantização, Faixa dinâmica [-6,6] e o intervalo de quantização (delta) será:

M

12

e o erro máximo de quantização:M

6

2



Vamos gerar então duas novas seqüências {yn} e {zn}:

xn=yn+zn

Então para yn temos:

{10, 12, 12, 11, 13, 11, 11, 13, 11, 10, 9, 11}

A sequência yn é mais suave que xn.



Considerando a seqüência das diferenças de yn:

{10, 2, 0, -1, 2, -2, 0, 2, -2, -1, -1, 2}

Note que a faixa dinâmica reduziu de [-6,6] para [-2,2]



Notamos que o passo de quantização agora é 4/M e portanto o máximo erro de quantização será 2/M.

No entanto precisamos ainda transmitir zn

{0, 2, -2, 1, 1, -3, 3, -1, -1, -1, 1, 1}Faixa dinâmica: 6, metade da faixa de

{xn}.

Precisamos apenas 6/M níveis. Dando um erro máximo de quantização de 3/M.

Erro de quantização total = 5/M



Então: Para um mesmo número de bits teremos menos

erro!PORÉM

Teremos o dobro da taxa de bits! Pois temos o dobro do número de amostras a quantizar e transmitir.

Como evitar?Transmitindo apenas os número pares.

2

2

1222

1222

nnn

nnn

xxz

xxy

Na reconstrução:1222

222

nnn

nnn

xzy

xzy



Exemplo – (Conclusão)

Decompondo a seqüência {xn} em subseqüência, não resulta num incremento dos valores a serem transmitidos.

As duas subsequencias são distintas e podem ser codificadas diferentemente.

Nós podemos usar a mesma aproximação na decomposição das duas seqüências.



Então:

2

2

1

1

nnn

nnn

xxz

xxy

Podemos implementar estas operações usando filtros discretos.



Filtros Magnitude da Função de Transferência – relação

da magnitude da entrada e saída do filtro em função da freqüência.

Filtro Ideal x Filtro Real



Filtros Critério de Nyquist : fa = 2.fo

Sinais Passa-Banda: fa=2.B

Aliasing. Forma geral da relação de entrada-saída de um filtro:

0 1

N M

n i n i i n ii i

y a x b y

FIR IIR



Alguns Filtros Usados na Codificação Subbanda

Filtros QMF (Quadrature Mirror Filter) – PR (Perfect Reconstruction)Filtros Espelhados em Quadratura de Reconstrução Perfeita

Propriedades do Filtro QMF - Johnston: Passa baixa -> {hn} Passa alta -> {(-1)n.hN-1-n} O filtro é simétrico ou seja:

hN-1-n = hn

n=0,1,...,N/2 -1



1

{ }

1

n

n

N n

Passa Baixas h

Passa Altas h



Filtro Smith-Barnwell

A freqüência de corte do filtro smith-barnwell é bem melhor definida do que a freq. do filtro de Johnston.

Filtro Johnston


Universidade Federal do ParanáSetor de TecnologiaDepartamento de Engenharia ElétricaAlgoritmo de Codificação

Subbanda



Quantização e Codificação

Alocação de bits entre as subbandas. Cada subbanda possui uma quantidade

diferente de informação.

Exemplo: Forma de alocar 4 bits em 4 subbandas.



Síntese Upsampling – insere zeros – filtragem pelos

filtros de reconstrução- Soma das componentes 3 maiores componentes do sistema:

análise e síntese de filtros; esquema de alocação de bits; esquema de codificação.

Separação em bandas ->Possibilidade de formas inovadora para o uso dos algoritmos de compressão.

Percepção humana (audio e visual) depende da frequência, logo podemos alocar melhor os bits.



Design de Bancos de Filtros

Vamos analisar: downsampling upsamplig síntese de operação



Dowsampling e Upsampling



Reconstrução Perfeita Usando Bancos de Filtros de 2 Canais



Filtros de QMF-PR de dois canais.



Filtros FIR Fortemente Simétricos

Neste método o aliasing, distorção de amplitude e fase podem ser completamente eliminados.



Banco de Filtros QMF com M-Bandas




Somente é viável utilizá-los quando a característica espectral do filtro é boa.

Quando o número de estágios aumentam ocorre a sobreposição entre as bandas e consequentemente aliasing.




o conjunto de filtros pode ser substituído por apenas um filtro e em seguida ser feito a redução das amostras.

)().().()( 42 zHzHzHzA LLL



Alocação de Bits

M

kkR

MR

1

1

Quanto recurso de codificação deve ser usado para codificar a saída de cada filtro sintetizado. Em outras palavras, precisamos alocar os bits entre as subbandas.

Suponhamos um sistema dividido em M subbandas onde a média de bits por amostra é conhecida, então:

Desejamos encontra Rk tal que R seja minimizado e o erro de reconstrução seja mínimo.

Onde na curva de distorção eu devo operar para que eu possa minimizar a distorção média?



Alocação de Bits

Yaacov Shoham e Allen Gersho (1988)

kkk RDJ .

Como deve ser o valor de λ e como ele deve variar entre as subbandas? Deve-se buscar o lambda que melhor cumpra os

requerimentos do seu problema. Mesmo lambda para todas as subbandas



Alocação de Bits

Normalmente não temos a curva de taxa de distorção.

Caso o número de amostras em cada subbanda é o mesmo.

Do contrário: É dado peso para cada subbanda, então:

kkkkk RDwJ .

kkkk RDJ .

De forma geral:



Aplicação para Codificação de Voz – G.722

Padrão da ITU para codificação em bandalarga. Codificação de alta qualidade à 64kbps (56kbps e

48kbps). Processo:

Saída de áudio passa por um filtro de 7kHz para prevenir aliasing em seguida é amostrada em 16.000 amostras/s.

Cada amostra é quantizada com 14bits/amostra através de uma quantizador uniforme.

As amostras são passadas em um banco de filtros (2 filtros FIR) de 24 coeficientes cada.



Aplicação para Codificação de Voz – G.722

P.B -> freqüências menores que 4kHz. P.A. outras.

A saída do filtro é decimada por um fator de 2.

A sequencia decimada é codificada utilizando ADPCM.

O sistema ADPCM usa 6 bits/amostra para o filtro P.B. e 2 bits/amostra para o P.A.

O sistema portanto possui:kbpssamostraskbitsbitsTx 64]/[8]).[2][6(



Aplicação para Codificação de Áudio – MPEG Áudio

Esquema de codificação de áudio proposto pelo MPEG.

Atualmente já propôs 3 esquemas de codificação: Layer 1, Layer 2 e Layer 3 – Todos com back compatibility (decoder layer N pode decodificar os anteriores).

Layers 1 e 2 – Banco de 32 filtros, dividindo a entrada em 32 bandas, cada um com uma banda de fs/64.

fs permitidas são: 32k, 44,1k e 48k amostras/s.

A saída é quantizada utilizando um quantizador uniforme com um número variado de bits. Número de bits é determinado pelo modelo psicoacústico.

Sinal de amplitude alta em uma freq. afeta a audibilidade do sinal em outra freq., então podemos tolerar mais erros de quantização nas bandas vizinhas e usar poucos bits.



Aplicações na Compressão de Imagens.

O que fazer quando temos seqüências de dados bidimensionais? Utilizar filtros bidimensionais, ou seja, que

separem a saída da fonte em componentes baseadas nas freq. verticais e horizontais.

Normalmente implementado em 2 x 1 dimensional. Chamados filtros “separáveis”.

Filtros bidimensionais não-separáveis são extremamente complexos.

Geralmente a imagem é filtrada linha a linha utilizando filtros P.A. e P.B.

A saída do filtro é decimada por um fator de 2. O mesmo é feito com as colunas. Resultando numa imagem N/2 x N/2.

104

Codificação baseada em wavelets



INTRODUÇÃO Por que wavelets?

Transformada de Fourier Apenas resolução na freqüência, sem resolução no tempo.

Função temporal f(t) Apenas resolução no tempo, sem resolução na freqüência.

Problema com a STFT (Short-Term Fourier Transform) Largura fixa da janela

TE073 – Processamento Digital de Sinais II


STFT

WAVELETS



Representação de função em termos de wavelets localização no tempo e na freqüência alta resolução em freqüência em baixas

freqüências (janela de tempo maior) alta resolução no tempo em altas

freqüências (janela de tempo menor)



Itens: construção de wavelets; descrição de como obter uma

decomposição de um sinal utilizando análise em multiresolução;

descrição de alguns esquemas populares para compressão de imagens



Transformada wavelet contínua

dtttftftsssw )()()(),(,,,

s = variável escala

= variável translação

Transformada wavelet inversa:

dsdswtfs

,),()(



As wavelets são geradas a partir de uma única wavelet básica (wavelet mãe), (t), através de translações e escalamentos:

s

t

st

s

1)(

,

s = fator de escala

= fator de translação

= normalização de energia

As funções base wavelets não são especificadas.

Esta é uma diferença entre a transformada wavelet e outras transformadas

s



Propriedades de wavelets Condição de admissibilidade

d2

)(

Pode ser utilizada para analisar e reconstruir um sinal sem perda de informação.

Implica que:

Wavelets têm espectro de potência passa-faixa

O valor médio da wavelet no domínio do tempo é zero (tem que ser oscilatória).

0)(0

2

0)( dtt



• Condição de regularidade

• A função wavelet deve ser suave

• diminuir rapidamente com a escala s

• ter concentração nos domínios do tempo e da freqüência.

• Exemplo de wavelet mãe

Wavelet de Haar:

1t0,5 1

0,5t0 1 )(t



Wavelets discretasAs versões discretas dos parâmetros de escala e de translação devem estar relacionadas entre si: se a escala é tal que as funções de base são estreitas, o passo de translação deve ser pequeno, e vice-versa.

Selecionaremos s e da seguinte maneira: 0

0 0

j

j

s s

k s

Portanto:

)()( 002/

0, ktsst jjkj

Zkj ,



• Normalmente, escolhemos s0=2, de tal maneira que a amostragem do eixo da freqüência seja diádica.

• Escolhemos o fator de translação como 0=1, de modo que a amostragem no eixo do tempo também seja diádica. )2(2)( 2/

, ktt jjkj

Os coeficientes wavelet são dados por:

)(),( ,, ttfw kjkj

A função f(t) pode ser reconstruída a partir dos coeficientes wavelet:

j kkjkj twtf )()( ,,



Filtro passa-faixa É necessário um número infinito de escalamentos

e translações para calcular a transformada wavelet.

As translações das wavelets são limitadas superiormente pela duração do sinal em questão. Quantas escalas precisamos para analisar o sinal? Como conseguimos uma fronteira inferior?

A wavelet tem um espectro de freqüências passa-faixa. Sabemos que a compressão no tempo equivale ao alargamento do espectro e a um deslocamento para frente.

aF

aatfF

||

1



• Isso significa que uma compressão no tempo por um fator 2 alargará o espectro da wavelet e deslocará todos os componentes de freqüência por um fator 2.

• Podemos, então, cobrir o espectro finito do sinal com os espectros de wavelets dilatadas, da mesma forma que cobrimos o sinal no domínio do tempo com wavelets transladadas



• Logo, se uma wavelet pode ser vista como um filtro passa-faixa, uma série de wavelets dilatadas pode ser vista como um banco de filtros passa-faixas.

• A razão entre a freqüência central de um espectro de wavelet e a largura deste espectro é a mesma para todas as wavelets.

• Esta razão é normalmente chamada fator de fidelidade Q de um filtro. No caso das wavelets, temos, então, um banco de filtros com fator Q constante.



Função de escalamento Como cobrir o espectro até a freqüência zero?

Neste caso, seria necessário um número infinito de wavelets.

Solução: Utilizar uma espécie de “rolha” para tapar o buraco, quando ele for suficientemente pequeno: um espectro passa-baixas, que pertence à função de escalamento.



Podemos considerar a função de escalamento como um sinal com um espectro passa-baixas. Desta forma, podemos decompô-lo em componentes wavelet:

kj

kjkj twt,

,, )()(

A expressão acima utiliza um número infinito de wavelets até uma determinada escala j.

Se analisarmos um sinal utilizando uma combinação de função de escalamento e wavelets, a função de escalamento cobre o espectro até a escala j, enquanto o restante do espectro é coberto por wavelets.

Se uma wavelet pode ser vista como um filtro passa-faixa e uma função de escalamento é um filtro passa-baixas, então (uma série de wavelets dilatadas + uma função de escalamento) pode ser vista como um banco de filtros.



Codificação sub-banda

Transformada wavelet banco de filtros Transformada de um sinal pode ser feita passando o sinal através deste banco de filtros.

As saídas dos diferentes estágios de filtros são os coeficientes das funções wavelet e escalamento.

Codificação sub-banda Análise de um sinal através de sua passagem por um banco de filtros.



• Dividimos o espectro do sinal em duas partes iguais: uma passa-baixas e outra passa-altas.

• A parte passa-altas contém os detalhes menores nos quais estamos interessados e podemos parar aqui.

• Agora há duas faixas. Apesar disso, a parte passa-baixas ainda contém alguns detalhes e podemos dividi-la novamente.

• E novamente, até estarmos satisfeitos com o número de faixas de freqüência criadas.

• Desta maneira, construímos o banco de filtros.Vantagem – Temos que projetar apenas dois filtros.

Desvantagem – A cobertura do espectro do sinal é fixa.



Banco de filtros dividindo o espectro de freqüências do sinal



Observamos, na figura anterior, que, após a repetida divisão do espectro de freqüências, temos uma série de bandas passa-faixa com duplicação da largura de faixa e uma banda passa-baixas.

Isto é o mesmo que aplicar a transformada wavelet ao sinal.

As wavelets nos dão as bandas passa-faixa, com duplicação da largura de faixa, e a função de escala fornece a banda passa-baixa.

A partir disso, conclui-se que a transformada wavelet é equivalente ao esquema de codificação sub-banda, utilizando um banco de filtros com Q constante.

Logo, se implementarmos a transformada wavelet como um banco de filtros iterado, não é necessário especificar as wavelets explicitamente.


Universidade Federal do ParanáSetor de TecnologiaDepartamento de Engenharia ElétricaTransformada wavelet

discreta Em aplicações práticas (como compressão de

imagens), o sinal de interesse é amostrado. É necessário, portanto, que a transformada

wavelet seja também discreta. As wavelets discretas não são discretas no

tempo (somente os passos de translação e de escala são discretos).

Intuitivamente, deve-se implementar o banco de filtros como um banco de filtros digitais



Se adicionarmos um espectro de wavelet ao espectro de função de escala, teremos uma nova função de escala, duas vezes mais larga que a primeira.

Podemos, então, expressar a primeira função de escala em termos da segunda.

Formulação de multiresolução ou relação entre duas escalas:

k

jj

j ktkht )2()()2( 11

Podemos expressar,também, as wavelets nesta escala em termos das funções de escala transladadas da escala anterior:

k

jj

j ktkgt )2()()2( 11

(*)

(**)



Uma vez que o sinal f(t) pode ser expresso em termos de wavelets dilatadas e transladadas até uma escala j-1, f(t) pode ser expressa em termos de funções de escala dilatadas e transladadas em uma escala j:

k

jj ktktf )2()()(

Se utilizarmos uma escala de j-1, temos que adicionar wavelets, a fim de que tenhamos o mesmo nível de detalhes:

k

jj

k

jj ktkwktktf )2()()2()()( 1

11

1



Se a função de escalamento e as wavelets forem ortonormais, os coeficientes e são encontrados a partir dos produtos internos:

)(, tkj )(, tkj)(1 kj )(1 kw j

)(),()(

)(),()(

,1

,1

ttfkw

ttfk

kjj

kjj

Se substituirmos e nos produtos internos por versões escaladas e transladadas de (*) e (**) e manipular um bit, levando em consideração que o produto interno também pode ser escrito como integração, chegamos a:

)(, tkj )(, tkj

mjj

mjj

mwkmgkw

mkmhk

)()2()(

)()2()(

1

1



• h(k) Filtro passa-baixas Filtro de escalamento

• g(k) Filtro passa-altas Filtro wavelet

• É possível implementar a transformada wavelet como um banco de filtros digitais.

• Os filtros de escalamento e wavelet têm um passo de 2 na variável k. Portanto, o número de amostras do estágio seguinte é metade do número de amostras do estágio atual.

• Normalmente, as iterações param quando o número de amostras é menor que o tamanho do filtro de escalamento ou do filtro wavelet.



Compressão de imagens

Uma das aplicações mais populares de wavelets é na compressão de imagens.

O padrão JPEG 2000 utiliza wavelets ao invés de DCT para fazer a decomposição da imagem.

Na discussão anterior, sempre nos referimos a um sinal unidimensional. Imagens, porém, são sinais bidimensionais.

Há duas maneiras de se fazer decomposição sub-banda de um sinal bidimensional: utilizando filtros bidimensionais ou transformadas separadas, que podem ser implementadas usando filtros unidimensionais primeiro nas linhas e depois nas colunas (como o JPEG 2000)



Começamos com uma imagem N X M. Filtramos cada coluna e sub-amostramos, obtendo duas imagens N X M/2. Então filtramos cada coluna e sub-amostramos as saídas dos filtros, obtendo 4 imagens N/2 X M/2.



TRANSFORMADA WAVELET DIRETA



TRANSFORMADA WAVELET INVERSA



Exemplo: Utilizando o filtro 4-tap Daubechies (Decomposição de primeiro nível)



Imagem de Sinan codificada com 0,5 bits/pixel, utilizando o filtro 8-tap Johnson (codificação sub-banda)

Imagem de Sinan codificada com 0,5 bits/pixel, utilizando o filtro wavelet 4-tap Daubechies



Uma das decomposições mais populares é a (a). Após cada decomposição, a imagem LL é decomposta em mais 4 sub-imagens, resultando em 10 sub-imagens (organização de Mallat).



ORGANIZAÇÃO DE MALLAT



EXEMPLO DE ORGANIZAÇÃO DE MALLAT



SISTEMA DE COMPRESSÃO WAVELET BÁSICO



Embedded Zerotree Wavelet (EZW) Coder

• Uma característica particular utilizada pelo EZW é que há coeficientes de wavelets em diferentes sub-bandas que representam a mesma localização espacial na imagem.

• Se a decomposição é tal que os tamanhos das sub-bandas são diferentes (caso da organização de Mallat), um único coeficiente na sub-banda menor pode representar a mesma localização espacial que múltiplos coeficientes nas outras sub-bandas.



a – raiz da árvore com descendentes – a1, a2, a3

a1 – tem descendentes a11, a12, a13, a14

a2 a21, a22, a23, a24

a3 a31, a32, a33, a34

Cada um desses coeficientes tem 4 descendentes – total de 64 coeficientes nesta árvore.



Limiar T0 – Freqüentemente, um coeficiente tem magnitude menor que um determinado limiar, e todos os seus descendentes também são menores que T0.



Se determinarmos que todos os coeficientes partindo de uma determinada raiz têm magnitudes menores que T0 e informarmos o decodificador, então necessitamos apenas de 2 bits por amostra para este ramo da árvore.

Na figura anterior, o primeiro bit é o bit de sinal e o segundo bit é o bit mais significativo da magnitude. A informação de que um conjunto de coeficientes tem valor menor que T0 equivale a dizer que o bit mais significativo é 0.

Se há N coeficientes na árvore, isto poupará N bits.



JPEG 2000 O padrão atual JPEG tem excelente

performance em taxas acima de 0,25 bits/pixel. Apesar disso, em pequenas taxas, há uma grande degradação na qualidade da imagem reconstruída.

O padrão JPEG-2000 é baseado na transformada wavelet discreta, utilizando wavelets biortogonais de Daubechies.

O padrão JPEG-2000 também utiliza modos recentes de quantização escalar, modelamento no contexto e codificação aritmética.

1 Codificação Diferencial. Universidade Federal do Paraná Setor de Tecnologia Departamento de...

Documents

Transcript of 1 Codificação Diferencial. Universidade Federal do Paraná Setor de Tecnologia Departamento de...