UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO...

58
UNIVERSIDADE PRESBITERIANA MACKENZIE ESCOLA DE ENGENHARIA ENGENHARIA ELTRICA BIANCA GALVˆO SCATAMACCHIA `UDIO DIGITAL EM SISTEMAS DE TV SˆO PAULO 2006

Transcript of UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO...

Page 1: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

UNIVERSIDADE PRESBITERIANA MACKENZIEESCOLA DE ENGENHARIAENGENHARIA ELEacuteTRICA

BIANCA GALVAtildeO SCATAMACCHIA

AacuteUDIO DIGITAL EM SISTEMAS DE TV

SAtildeO PAULO2006

BIANCA GALVAtildeO SCATAMACCHIA

AacuteUDIO DIGITAL EM SISTEMAS DE TV

Trabalho de Graduaccedilatildeo Interdisciplinarapresentado ao Curso de Engenharia Eleacutetricada Escola de Engenharia da UniversidadePresbiteriana Mackenzie como requisitoparcial agrave obtenccedilatildeo do grau de Bacharel emEngenharia

ORIENTADOR PROFESSOR DOUTOR MARCIO EISENCRAFT

SAtildeO PAULO2006

AGRADECIMENTOS

A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada

A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho

Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho

Soacute se realiza quem troca suas queixas por atitudes ousadas

(Jorge Forbes)

RESUMO

Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos

Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 2: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

BIANCA GALVAtildeO SCATAMACCHIA

AacuteUDIO DIGITAL EM SISTEMAS DE TV

Trabalho de Graduaccedilatildeo Interdisciplinarapresentado ao Curso de Engenharia Eleacutetricada Escola de Engenharia da UniversidadePresbiteriana Mackenzie como requisitoparcial agrave obtenccedilatildeo do grau de Bacharel emEngenharia

ORIENTADOR PROFESSOR DOUTOR MARCIO EISENCRAFT

SAtildeO PAULO2006

AGRADECIMENTOS

A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada

A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho

Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho

Soacute se realiza quem troca suas queixas por atitudes ousadas

(Jorge Forbes)

RESUMO

Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos

Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 3: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

AGRADECIMENTOS

A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada

A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho

Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho

Soacute se realiza quem troca suas queixas por atitudes ousadas

(Jorge Forbes)

RESUMO

Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos

Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 4: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

Soacute se realiza quem troca suas queixas por atitudes ousadas

(Jorge Forbes)

RESUMO

Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos

Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 5: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

RESUMO

Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos

Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 6: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

ABSTRACT

Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility

Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 7: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

LISTA DE ILUSTRACcedilOtildeES

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 8: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

LISTA DE SIGLAS

AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 9: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

SUMAacuteRIO

1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE

TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 10: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

7

1 INTRODUCcedilAtildeO

A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de

entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a

defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia

mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido

definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)

Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de

transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de

recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos

telespectadores

Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de

proporcionar qualidade de imagem e som consideravelmente superior assim como maior

quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de

informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais

completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros

O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no

Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a

conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras

de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de

graduaccedilatildeo interdisciplinar sobre este assunto

O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio

digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA

No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como

sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e

japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV

1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 11: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

8

High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo

5

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 12: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

9

2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL

Para se transformar um sinal sonoro em sinal digital adequado ao

processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o

sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos

que podem ser interpretados por processadores

Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo

componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-

se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN

2000)

O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A

primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital

geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada

para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de

comunicaccedilatildeo (LATHI 1998)

A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os

princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo

21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL

Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo

(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma

qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A

comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na

realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)

Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits

teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80

dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 13: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

10

cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para

representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica

como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal

ruiacutedo

A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A

extensatildeo dinacircmica por sua vez eacute representada por

2log20)2log(20 nn (1)

Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)

A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de

microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais

podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)

Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos

analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees

repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a

certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do

limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos

limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de

ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos

pulsos nas estaccedilotildees repetidoras

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 14: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

11

Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados

resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico

natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute

amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando

o sinal eacute amplificado

Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta

algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo

AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde

ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)

Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando

embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de

substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um

grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo

AD e DA

22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL

A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia

para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)

A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem

(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma

sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)

Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por

circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1

(LUTHER 1997)

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 15: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

12

Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)

A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima

da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em

seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para

tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo

em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um

dos niacuteveis de quantizaccedilatildeo

Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por

um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente

221 Filtragem anti-Aliasing

De acordo com o Teorema de Nyquist a quantidade de amostras por unidade

de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o

dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido

integralmente sem erro de aliasing (LATHI 1998)

max2 ff am (2)

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 16: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

13

O inverso da frequumlecircncia de amostragem amf

T 1 eacute chamado de periacuteodo de

amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e

corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute

possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar

o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de

Nyquist (LUTHER1997)

A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta

impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na

Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf

esteja presente no sinal provocando aliasing (COSTA 2005)

0

1)(

ccT

H Cd

(3)

Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para

T minimizando a distorccedilatildeo de aliasing

Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)

222 Amostragem

A amostragem (ou sampling) consiste na medida da amplitude de uma forma

de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 17: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

14

No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou

carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um

sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute

representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas

da frequumlecircncia de amostragem (ROBIN 2000)

A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no

domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais

resultando num terceiro sinal

Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia

Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se

sobrepor Assim deve-se ter

MM T2

M

T

max2

1

ff am

max2 ff am (4)

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 18: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

15

Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de

4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada

segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia

maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que

corresponde a 40000 amostras por segundo)

O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por

um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem

for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave

se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de

pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos

modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4

exemplifica o principio da amostragem (COSTA 2005)

Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 19: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

16

O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de

impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas

frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf

4 amf

A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do

sistema de acordo com a seguinte expressatildeo (LUTHER 1997)

Taxa bit (bit rate) = amostra

bitsf am (5)

Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)

a) 32 kHz Usado como padratildeo de transmissatildeo profissional

b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de

videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio

digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)

c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e

facilita a conversatildeo de padratildeo

223 Sample and Hold

O circuito sample and hold eacute usualmente implementado para manter os valores

de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito

mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno

periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra

Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de

amostragem (LUTHER 1997)

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 20: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

17

Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)

224 Quantizaccedilatildeo

A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda

analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer

(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a

amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a

representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados

por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores

numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)

Por exemplo no caso de uma placa de som Sound Blasterreg da empresa

Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16

bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor

numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores

possiacuteveis neste caso

A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo

mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os

valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de

amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 21: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

18

quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o

processo de recuperaccedilatildeo do sinal original (ROBIN 2000)

O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis

discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de

quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por

nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para

representar cada amostra (LUTHER 1997)

Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)

A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra

Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria

8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este

quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1

pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um

exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os

pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 22: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

19

digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem

onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por

valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros

inteiros

Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)

Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de

quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para

funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8

Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade

O valor meacutedio quadraacutetico do erro eacute dado entatildeo por

1

2

3

4

5

6

7

(b)

(a)

(c)

(d) 010 101 101 110010 100 110 010 001

Amplitude

Tempo

0

(010)

(000)

(001)

(011)

(100)

(101)

(110)

(111)

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 23: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

20

12150

50

22 deefe E (6)

Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute

12

1 (7)

Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16

bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de

quantizaccedilatildeo ou distorccedilatildeo harmocircnica

a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de

aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de

quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela

situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico

4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado

na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por

256

4

256

4

resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10

Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com

a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de

quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03

Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser

analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada

amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 24: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

21

Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo

Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits

A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por

14

1281

1281

22

23

164

dee (8)

Portanto como a 14

14

23

23

11

RUIDO

SINAL

PPSNR seu valor em dB eacute

dBdBSNR 9146)23log(10)( 14 (9)

justificando assim o valor de 48dB explicitado anteriormente

b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante

ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas

geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 25: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

22

de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo

Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20

KHz

225 Codificaccedilatildeo Sistema PCM

Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de

quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo

e transmiti-lo

O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal

analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs

e muacutesica em geral

O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo

digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno

de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes

acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por

exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O

sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8

bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave

telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por

exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos

de 64 (LATHI 1998)

23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO

No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo

valor que elas representam e logo depois convertidas para a amplitude da tensatildeo

representativa do sinal de aacuteudio original (ROBIN 2000)

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 26: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

23

A conversatildeo AD pode causar erros se existirem transientes chamados de

glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem

(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)

Na entrada do processo existe um circuito sample and hold para cada bit para

fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os

glitches (ROBIN 2000)

Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de

reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima

de 2Sf

) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)

Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)

A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM

Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)

Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo

igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes

quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 27: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

24

mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de

valores de quantizaccedilatildeo

Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)

Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um

filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da

filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no

item (c)

Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um

sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem

cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo

corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo

com a mesma velocidade que foi usada pelo conversor AD

(a) 010 101 101 110010 100 110 010 001

1

2

3

4

5

6

7

(b)

(c)

Amplitude

Tempo

0

(010)

(001)

(011)

(100)

(101)

(110)

(111)

(000)

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 28: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

25

3 INTERFACES DIGITAIS DE AacuteUDIO

31 SINAL BPM - BIPHASE MARK-ENCODED

A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e

transmissatildeo digital para casar certas propriedades dos dados codificados com as

caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados

originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal

(ROBIN 2000)

As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor

frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do

espectro de sinais digitais e minimizar as distorccedilotildees

Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma

com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a

European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio

digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992

Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre

as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)

vistas na Ilustraccedilatildeo 14

No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e

negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN

2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada

um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este

coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas

e codificaccedilatildeo do formato AESEBU (ROBIN 2000)

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 29: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

26

Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)

Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na

transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante

jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na

Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas

frequumlecircncias (ROBIN 2000)

Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)

32 PROTOCOLO AESEBU

Conhecido como AESEBU Standard o AESEBU eacute um protocolo de

interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES

juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos

possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 30: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

27

O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os

sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados

307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48

kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)

seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)

A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este

formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo

agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de

aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute

40001928320 micros (REIMERS 2001 ROBIN 2000)

Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)

Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-

1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial

(ROBIN 2000)

O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms

sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 31: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

28

impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer

curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital

Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado

para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda

coaxial deve-se usar um adaptador de 110 ohms para 75 ohms

33 SINCRONIZACcedilAtildeO DO AacuteUDIO

Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou

ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte

geradora de referecircncia (ROBIN 2000)

Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar

pequenos desvios nas saiacutedas caso natildeo estejam sincronizados

Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um

gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio

331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo

No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em

sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem

atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN

2000)

Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de

aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz

Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de

viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido

pelo caacutelculo

61601833320

33366 amostras (10)

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 32: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

29

em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio

Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido

8008561601 (11)

A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames

de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas

Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)

34 MULTICANAL

Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo

espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de

diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas

multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o

objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais

reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)

A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode

ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting

de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees

dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois

canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV

Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e

um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 33: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

30

Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada

forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som

digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby

em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana

O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees

entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito

surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency

enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal

pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do

canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN

2000)

341 Reduccedilatildeo da Taxa de Bits

Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as

taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de

6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps

(SPRATLING 1999)

Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da

armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)

A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o

ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado

um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel

aceitaacutevel (SPRATLING 1999)

A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e

fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final

visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 34: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

31

de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a

taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em

384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)

Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais

tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de

48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps

para aacuteudio a ser multiplexado (ROBIN 2000)

Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)

342 Aacuteudio Embedded

O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido

no sinal SDI (signal digital interface interface de sinal digital)

A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio

embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital

no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias

de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute

associado com o viacutedeo

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 35: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

32

Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a

comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing

switcher) (BENSON 2002)

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 36: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

33

4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV

Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced

Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)

europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a

transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande

eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de

fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de

alta definiccedilatildeo

Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para

HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-

3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que

eacute a base do MPEG-2

41 MPEG SISTEMA EUROPEU

O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz

normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC

(International Organization for Standardization International Electrotechnical

Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste

apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta

monografia

O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio

codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio

sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma

codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o

custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 37: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

34

O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros

sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e

o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e

esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2

com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um

canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34

Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os

sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa

operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os

sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os

como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco

canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em

funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al

2000)

21

1

(12)

2 (13)

)(0 SLCLL (14)

)(0 SRCRR (15)

em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo

do sinal esteacutereo compatiacutevel ( ) 00 RL

411 Modelo Psico acuacutestico

A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua

maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 38: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

35

sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias

(IANO et al 2000)

O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som

dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)

(16)

em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )

Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno

chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma

propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia

simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro

do sinal (PINHO 2005)

Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)

Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de

entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo

log200p

pL

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 39: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

36

desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de

resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a

estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar

412 MPEG - 1

O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de

codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio

reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave

codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema

alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o

ouvido humano apresenta menor sensibilidade

Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o

niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da

anaacutelise do banco de filtros

A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo

19 (REIMERS 2001)

Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 40: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

37

Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos

que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais

atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de

amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na

digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com

precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros

com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de

rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando

em perda de informaccedilatildeo

De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente

atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto

na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada

sub-banda

O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to

mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-

banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)

Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a

representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream

Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os

valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-

banda

Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de

alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam

frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)

Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O

modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 41: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

38

codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000

ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame

de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado

para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para

transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira

a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo

Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos

paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de

transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar

a escolha dos paracircmetros citados aos custos de implementaccedilatildeo

Para cada layer a norma especifica o formato do bit-stream Os layers satildeo

autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de

decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica

sequumlecircncias dos layers II e I (IANO et al 2000)

O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo

as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A

escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos

A diferenccedila baacutesica entre os layers eacute que a complexidade do

codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo

aumenta do layer I para o layer III

4121 Layer I

O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384

kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 42: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

39

Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-

bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que

conteacutem 384 amostras por canal

3841232 amostras (17)

A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute

sk

T frame 832048

1 (18)

O comprimento do frame para uma taxa de amostragem de 48 kHz eacute

calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num

bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)

883201232 ms (19)

Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de

escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)

Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em

estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact

Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)

4122 Layer II

O layer II melhora a performance do layer I permitindo uma compressatildeo

adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384

kbps (ROBIN 2000)

Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda

e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)

Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal

11523632 amostras (20)

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 43: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

40

O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute

calculado por

2483203384 ms (21)

Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em

um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)

Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia

entre outros sistemas

4123 Layer III

Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de

aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros

proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para

melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64

kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps

(ROBIN 2000)

O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e

um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do

banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2

(FRAUNHOFER IIS 2006)

O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida

pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os

valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores

para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o

ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute

um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 44: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

41

Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os

valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e

niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)

Como nos dois casos anteriores pode ser utilizado em um ou dois canais

sendo o uacuteltimo esteacutereo ou joint esteacutereo

Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em

transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees

links de sateacutelite e aacuteudio de alta qualidade na internet

413 MPEG-2

O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de

novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado

para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)

codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)

O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16

kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo

praticamente os mesmos

No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os

canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um

decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um

codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward

Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC

constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de

canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por

qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 45: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

42

uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas

apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)

4131 MPEG-2 AAC

O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute

um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel

com os padrotildees anteriores MPEG-1 e MPEG-2 BC

Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta

qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui

maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem

O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores

quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta

forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute

mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)

As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo

(FRAUNHOFER IIS 2006)

a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um

banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do

tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada

b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do

ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia

c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que

certos tipos de sinais de aacuteudio satildeo previsiacuteveis

d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta

forma a taxa de bits pode ser utilizada com mais eficiecircncia

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 46: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

43

As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de

reproduccedilatildeo portaacuteteis

42 DOLBY AC-3 SISTEMA AMERICANO

O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de

aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps

conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor

desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)

A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por

canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51

canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo

designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema

completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2

americano) junto com o sinal de aacuteudio (VASQUES et al 2000)

Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a

fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal

original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade

do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que

formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a

possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de

percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as

degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de

audiccedilatildeo

A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada

canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441

kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 47: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

44

portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a

fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES

et al 2000)

Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)

No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute

gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo

de sincronizar o codificador de aacuteudio e o codificador de viacutedeo

Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com

frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com

frequumlecircncia de corte de 3 Hz (-3 dB)

Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do

frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG

(ROBIN 2000)

ms3283204384 (22)

Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 48: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

45

na Ilustraccedilatildeo 21

Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)

Primeiramente os pulsos PCM passam por um banco de filtros no qual o

sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise

do banco de filtros eacute implementada atraveacutes da MDCT

No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da

frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma

superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute

formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras

novas (VASQUES et al 2000)

Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 49: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

46

Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser

processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som

reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de

infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras

Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a

codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos

valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a

representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto

decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e

codificada juntamente com o expoente (VASQUES et al 2000)

Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do

agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo

sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de

aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)

No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes

cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu

correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado

por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada

conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O

modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O

D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45

codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)

No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em

um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio

para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 50: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

47

modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja

percebida pelo sistema auditivo humano

Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o

tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a

direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)

Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os

ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa

correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que

corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa

O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia

internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da

normalizaccedilatildeo do sistema de volume que eacute discutido a seguir

421 Normalizaccedilatildeo do Sistema de Volume

O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo

convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo

canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que

alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma

que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os

canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al

2000)

O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o

sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que

foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)

(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 51: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

48

volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel

de volume ajustado pelo telespectador

Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas

distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores

facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo

classificados em principais e associados

Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um

programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos

especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar

os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps

Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas

facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo

Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que

posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro

de um determinado programa de TV (VASQUES et al 2000)

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 52: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

49

5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES

DE TV DIGITAL

O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993

atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve

como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo

digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)

adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e

teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB

Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na

transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees

terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos

Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)

Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na

utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de

sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela

importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)

Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma

configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC

emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio

implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado

para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo

recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)

A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 53: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

50

Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC

(INATEL 2001)

O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2

AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora

desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade

regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD

operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas

mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute

feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no

BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e

eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)

Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB

(INATEL 2001)

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 54: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

51

Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB

(INATEL 2001)

As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e

transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded

Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC

O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o

MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores

dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes

fabricantes apresentarem comportamento consideravelmente desigual

Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma

qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC

tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a

que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 55: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

52

6 CONCLUSOtildeES

Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes

no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes

padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel

desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)

Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de

interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo

recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e

serviccedilos usando o canal de TV digital (datacasting)

Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas

em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de

aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos

disponiacuteveis para tanto

Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute

imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD

partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos

processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra

algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo

como sonorizaccedilatildeo espacial e multicanais

Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um

estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no

Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB

empregam o MPEG-2 AAC e MPEG-2 BC respectivamente

O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes

essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 56: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

53

dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de

compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os

padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC

em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC

O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas

transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2

Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece

funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute

baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem

disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de

codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e

codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto

atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo

no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de

patentes dessas tecnologias

Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida

neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se

desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para

comparaccedilatildeo entre os padrotildees de aacuteudio apresentados

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 57: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

54

REFEREcircNCIAS

ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006

BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005

BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002

COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005

CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005

NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005

HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000

FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006

IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000

IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006

INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006

KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006

LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998

LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997

MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000

Page 58: UNIVERSIDADE PRESBITERIANA MACKENZIE …professor.ufabc.edu.br/marcio.eisencraft/Artigos/TGI...`UDIO DIGITAL EM SISTEMAS DE TV Trabalho de Graduaçªo Interdisciplinar apresentado

55

PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006

POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005

REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001

ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000

SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999

VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000