Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Transcript

Page 1: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO S UL

FACULDADE DE ENGENHARIA

CURSO DE ENGENHARIA ELÉTRICA

DISCIPLINA DE TRABALHO DE INTEGRAÇÃO

TÉCNICAS DE REDUÇÃO DE RUÍDO PARA ÁUDIO

CHRISTIAN INÁCIO VOGT

ORIENTADOR: DENIS FERNANDES

Porto Alegre, Novembro de 2006.

Page 2: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Dedicatória

Este trabalho é dedicado aos meus pais, Aristides e Leni, e aos meus irmãos, Felipe e Marqueli, pelo esforço e pelo amor sem medidas que sempre tiveram na minha formação pessoal e profissional.

Page 3: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Agradecimentos

À Deus por ter saúde, paciência, serenidade e discernimento perante os desafio e as tomadas de decisões. Ao Professor, Dr. Denis Fernandes, que me acolheu muito bem no difícil cargo de orientador. Obrigado pelos seus conselhos enquanto trabalhamos juntos. Foram importantes para a minha visão de mundo e para a minha formação como engenheiro. Aos colegas de curso e professores da PUCRS, pelo companheirismo e pela amizade durante todo esse caminho.

Page 4: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Resumo

O ruído de fundo é uma forma comum de degradação em todos sistemas de

armazenamento e gravações analógicas. No caso de sinais de áudio, geralmente percebido pelo

ouvinte como um “hiss”, esse tipo de ruído é composto por ruídos em circuitos elétricos, por

irregularidades na mídia de armazenamento e, além disso, pelo ruído presente no ambiente de

gravação. O ruído aleatório, geralmente, tem suas componentes espalhadas por todo o espectro

de freqüências de áudio, sendo que dessa forma torna-se inadequado um simples procedimento

de equalização.

No campo de processamento de voz, um grande número de técnicas tem sido

desenvolvido para a redução de ruído. Certamente, hoje os métodos mais populares para redução

de ruído em sinais de áudio são baseados na transformada de Fourier de tempo curto. O Short-

Time Spectral Attenuation (STSA) é um método de redução de ruído que, basicamente, consiste

em aplicar uma atenuação, que varia no tempo para cada quadro produzido pela transformada de

tempo curto. As técnicas STSA são não paramétricas e, geralmente, necessitam de pouco

conhecimento do sinal a ser processado. Além desses fatores, as técnicas citadas estão entre os

métodos mais populares para a melhoria de voz e seu uso tem sido largamente predominante

para a restauração de gravações musicais.

O objetivo deste trabalho é fazer, a partir de técnicas baseadas na STSA como a

Subtração Espectral e a MMSE, um estudo sobre algumas técnicas STSA, desenvolvendo

conhecimentos teóricos necessários para a implementação em um software capaz de restaurar

gravações fonográficas que apresentem ruídos de fundo "hiss".

Page 5: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Sumário

1. Introdução................................................................................................................................8 2. Restauração de Áudio............................................................................................................10

2.1. Uma breve História das Tecnologias de Gravação.......................................................10 2.2. Restauração Tradicional de Áudio ................................................................................10 2.3. Modelagem AR e ARMA .............................................................................................12

2.3.1. Definições Básicas ................................................................................................12 2.4. Tipos de Ruídos.............................................................................................................13

2.4.1. De-thumping..........................................................................................................14 2.4.2. De-clicking ............................................................................................................15 2.4.3. De-Hissing.............................................................................................................18

3. Short-Time Spectral Attenuation ..........................................................................................20 3.1. Introdução......................................................................................................................20 3.2. Considerações Históricas ..............................................................................................22 3.3. Short-time Spectral Attenuation (STSA) ......................................................................23

3.3.1. Transformada de tempo curto ...............................................................................23 3.3.2. Atenuação Espectral ..............................................................................................24 3.3.3. Análise Determinística ..........................................................................................26 3.3.4. Audibilidade do ruído na saída..............................................................................27 3.3.5. Sinal Transitório....................................................................................................28 3.3.6. Estimação de Ruído...............................................................................................29 3.3.7. Ruído musical........................................................................................................29 3.3.8. Soluções para o ruído musical...............................................................................30

3.4. Regras de Supressão......................................................................................................31 3.4.1. EMSR....................................................................................................................31 3.4.2. Subtração Espectral ...............................................................................................35

4. Projeto Restauração do Acervo de Gravações do Laboratório de Línguas da PUCRS ........36 4.1.1. Objetivos Gerais e Específicos..............................................................................36 4.1.2. Justificativa............................................................................................................37 4.1.3. O Laboratório de Línguas da PUCRS...................................................................37 4.1.4. Descrição do Material ...........................................................................................38 4.1.5. Identificação dos Problemas Encontrados.............................................................39

5. Desenvolvimento do Trabalho ..............................................................................................41 5.1. Algoritmo de Redução de Ruído...................................................................................41

5.1.1. Diagrama de blocos...............................................................................................42 5.1.2. Descrição do algoritmo .........................................................................................43

6. Resultados .............................................................................................................................46 7. Conclusões ............................................................................................................................51 8. Referências Bibliográficas ....................................................................................................52 9. Anexos...................................................................................................................................54

9.1. Programa MMSE.m ......................................................................................................54 9.1.1. MMSE ...................................................................................................................54

Page 6: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

9.1.2. OverlapAdd ...........................................................................................................56 9.1.3. Segment.................................................................................................................57 9.1.4. VAD ......................................................................................................................57

9.2. Programa Subtração Espectral (SS.m) ..........................................................................59 9.2.1. SS ..........................................................................................................................59 9.2.2. OverlapAdd ...........................................................................................................60 9.2.3. Segment.................................................................................................................61 9.2.4. VAD ......................................................................................................................62

9.3. Programa gerador de ruído (noisegen.m)......................................................................63

Page 7: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Lista de Figura

Figura 2.1 – Exemplos de pulsos longos: (a) pulsos simples e (b) pulsos sobrepostos. 14

Figura 2.2 – Estágio de processamento de um modelo padrão para de-thumping. 15

Figura 2.3 – Modelo base para o método de-clicking. 16

Figura 2.4 – Sistema de redução de hiss baseado na técnica STSA. 18

Figura 3.1 – Hipótese básica para as técnicas STSA. 20

Figura 3.2 – Estrutura geral do método STSA. 21

Figura 3.3 – Ganho versus nível de sinal relativo. 25

Figura 3.4 – Restauração de um sinal senoidal dentro de ruído branco com potência

de 0dB.

Figura 3.5 – Diagrama de blocos do algoritmo original Ephraim and Malah 31

Figura 3.6 – Ganho EMSR versus Rprio, para diferentes valores de Rpost. 33

Figura 3.7 – As relações sinal-ruído Rpost e Rprio ao longo de sucessivos quadros. 34

Figura 6.1 – Arquivo ‘testesom.wav’ 47

Figura 6.2 – Arquivo ‘testesom10dB.wav’ 47

Figura 6.3 – Restauração por Subtração Espectral (‘testesom10dB_SS.wav’) 48

Figura 6.4 – Restauração por MMSE (testesom10dB_MMSE.wav’) 49

Page 8: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

1. Introdução

A introdução ao Áudio Digital de alta qualidade com o Compact Disc (CD) e o

Digital Áudio tape (DAT) tem destacado uma consciência e uma expectativa geral sobre a

qualidade do som em todos os tipos de gravações. Isso, combinado com uma onda de interesse

em restaurar materiais históricos e antigos, vem conduzindo para um grande desenvolvimento

nas técnicas de restauração em função das gravações feitas em rolos analógicos no século XIX,

através de discos (78 rpm, LP, etc.), e em tecnologias de fita magnética, a qual é disponível

desde os anos 50. A redução de ruído, ocasionalmente, pode ser usada até em gravações digitais

contemporâneas, caso o ruído de fundo se torne muito presente.

A degradação de uma fonte de áudio é considerada como qualquer modificação

indesejada ao sinal de áudio, o qual ocorre como resultado do processo de gravação. Além disso,

o ruído pode ser introduzido por imperfeições no material, por transcrição para outra mídia ou,

até mesmo, pelo desgaste do uso da mídia.

Uma restauração ideal irá reconstruir a fonte de som original exatamente como

ela era antes. Claro que esse ideal, na prática, jamais será alcançado, pois os métodos somente

podem ser desenvolvidos de acordo com um critério de erro, baseado nas características

perceptuais do ouvido humano.

Técnicas de restauração analógica estão disponíveis, pelo menos, desde as fitas

magnéticas, em forma de edição manual para “clicks” e equalização de freqüências para o ruído

de fundo. Os redutores eletrônicos de “clicks” mais sofisticados eram baseados em filtros passa

alta, para detecção dos mesmos, e filtros passa baixa, para mascarar os seus efeitos. Nenhum

desses métodos era, suficientemente, sofisticado para apresentar um passo significante na

redução de ruído sem interferir com a qualidade do sinal base. Métodos digitais levaram em

conta um importante grau de flexibilidade em processamento e, portanto, um grande potencial

para a remoção de ruído, embora aplicações com métodos digitais inapropriados possam ser mais

desastrosos que o processamento analógico.

Page 9: T CNICAS DE REDU O DE RU DO PARA UDIO 7educatec.eng.br/engenharia/Monografia de apoio/Tecnicas de reducao... · indesejada ao sinal de áudio, o qual ocorre como resultado do processo

Aleatório, o ruído de fundo é uma forma comum de degradação em toda medida,

em todo armazenamento e em todos sistemas de gravações analógicas. No caso de sinais de

áudio, geralmente percebido pelo ouvinte como um “hiss”, esse tipo de ruído é composto por

ruídos em circuitos elétricos, por irregularidades na mídia de armazenamento e pelo ruído

presente no ambiente de gravação. O efeito combinado dessas fontes será generalizado como um

único processo, o qual talvez possa ser considerado como parte da performance original. O ruído

aleatório, geralmente, tem seus componentes espalhados por todo o espectro de freqüências do

áudio. Dessa forma, torna-se inadequado o simples procedimento de equalização.

As gravações em fitas analógicas demonstram características de ruído

estacionárias e, para a maioria das finalidades, ruído branco. As primeiras gravações em 78 rpm

e em cilindros demonstram características de ruído altamente não estacionárias, pois o ruído

pode variar, consideravelmente, em cada revolução do sistema de reprodução. Isso resulta na

característica “swishing” ou “assobio”, efeito associado com as primeiras gravações. Nas

gravações que também são afetadas por perturbações locais como “clicks” e ressonâncias de

baixas-freqüências, como padrão, é aconselhado restaurar esses efeitos previamente a qualquer

tratamento de ruído de fundo.