treinamentosphinxtrain-140521075026-phpapp02

download treinamentosphinxtrain-140521075026-phpapp02

of 16

Transcript of treinamentosphinxtrain-140521075026-phpapp02

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    1/16

    Sphinx Voxforge Pt-BrTreinando um modelo acstico para o toolkit

    CMU Sphinx com o corpus de fala Voxforge

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    2/16

    O que precisamos para treinar?

    Arquivos de udio e suas respectivas transcries

    Arquivos .raw, .sph, .wav

    amanh chove forte Dicionrio fontico

    e um alfabeto fontico

    mapeamento palavrasequncia de fonemas

    Modelo Lingustico necessrio para a avaliao do modelo

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    3/16

    CMU Sphinx Toolkit

    Pocketsphinx reconhecedor leve (em C)

    Sphinxbase biblioteca de suporte ao Pocketsphinx

    Sphinx4 reconhecedor flexvel e customizvel (em Java)

    Sphinxtrain ferramenta de treinamento de modelo acsticos

    Sphinx3

    reconhecedor desatualizado (em C) CMUclmtk

    toolkit para o treinamento do modelo lingustico

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    4/16

    Pr-requisitos...

    Perl ActivePerl no Windows

    Linux

    ~$ sudo apt-get install perl(debian-based)~$ sudo yum install perl(RPM repo-based)

    Python ActivePython no Windows

    Linux

    ~$ sudo apt-get install python(debian-based)

    ~$ sudo yum install python(RPM repo-based)

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    5/16

    Agora vamos instalar...

    baixe os pacotes .tar.gz sphinxbase-0.8

    pocketsphinx-0.8

    sphinxtrain-1.0.8 extrair os pacotes e entrar no diretrio

    ~$ tar -zxf

    ~$ cd /

    executar os comandos...~$ ./autogen.sh

    ~$ ./configure

    ~$ make

    ~$ make install

    http://sourceforge.net/projects/cmusphinx/files/sphinxtrain/1.0.8http://sourceforge.net/projects/cmusphinx/files/sphinxbase/0.8/http://sourceforge.net/projects/cmusphinx/files/sphinxtrain/1.0.8http://sourceforge.net/projects/cmusphinx/files/pocketsphinx/0.8http://sourceforge.net/projects/cmusphinx/files/sphinxbase/0.8/
  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    6/16

    Variveis de ambiente...

    export PATH=/usr/local/bin:$PATH

    export LD_LIBRARY_PATH=/usr/local/lib

    export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    7/16

    Estrutura das pastas

    etc nome_db.dic

    nome_db.phone

    nome_db.lm.DMP

    nome_db.filler

    nome_db_train.fileids

    nome_db_train.transcription

    nome_db_test.fileids

    nome_db_test.transcription

    wav

    speaker_1 file_1.wav

    speaker_2

    file_2.wav

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    8/16

    Voxforge

    Repository voxforge Pt - 16kHz, 16bit Pacotes .tgzpara cada locutor

    etc

    prompts wav

    arquivos .wav

    http://www.repository.voxforge1.org/downloads/pt/Trunk/Audio/Main/16kHz_16bit/
  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    9/16

    Preparando os diretrios...

    baixar e executar scripts~$ git clone https://github.

    com/gabrielaraujof/voxforge2sphinxPtBr.git scripts

    ~$ chmod +x scripts/setupam.py

    ~$ ./scripts/setupam.py -s voxforge

    Copiar os arquivos (disponvel aqui) voxforge.dic (**converter para iso-8859-1)

    voxforge.phone

    voxforge.filler

    Converter e copiar o modelo lingustico voxforge.lm.DMP (formato ARPA aqui)

    Primeiramente deve-se ordernar com o comando: sphinx_lm_sort < 3gram.lm > 3gram_sorted.lm

    http://www.laps.ufpa.br/falabrasil/files/constituicao_sphinx.rarhttp://www.laps.ufpa.br/falabrasil/files/LaPSLM.rarhttp://www.laps.ufpa.br/falabrasil/files/constituicao_sphinx.rar
  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    10/16

    Configurar Sphinxtrain...

    De dentro da pasta configurada, executar

    ~$ sphinxtrain -t setup

    Editar parmetros de treinamento arquivo etc/sphinx_train.cfg

    $CFG_HMM_TYPE

    $CFG_INITIAL_NUM_DENSITIES

    $CFG_FINAL_NUM_DENSITIES

    $CFG_N_TIED_STATES

    Executar o trainamento...

    ~$ sphinxtrain run

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    11/16

    Logs do treinamento...

    Arquivo .html links para os logs de cada fase do treinamento

    indicaes de erros

    resultado da avaliao do modelo

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    12/16

    Resumindo...

    Executar

    ~$ ./scripts/setupam.py -s

    Copiar restante dos arquivos

    Executar

    ~$ sphinx_train setup

    modificar parmetros

    Executar~$ sphinx_train run

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    13/16

    Observaes

    Locutores incompatveis udios e transcries em ingls

    Palavras fora do dicionrio

    quinta-feira fim-de-semana

  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    14/16

    Resultados

    Modelo acstico Sphinx

    https://docs.google.com/spreadsheets/d/10eslV99s4bFEQX1Gmdeii234SC0oU76nY7cyYTmIS5A/edit?usp=sharing
  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    15/16

    Referncia

    http://cmusphinx.sourceforge.

    net/wiki/tutorialam

    http://cmusphinx.sourceforge.net/wiki/tutorialamhttp://cmusphinx.sourceforge.net/wiki/tutorialam
  • 7/25/2019 treinamentosphinxtrain-140521075026-phpapp02

    16/16

    Dvidas e contato

    E-mail: [email protected]

    mailto:[email protected]