Classificação fonética utilizando Boosting e SVM


Autoria(s): TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz
Contribuinte(s)

KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha

PELAES, Evaldo Gonçalves

Data(s)

07/03/2012

07/03/2012

2006

17/02/2006

Resumo

Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.

ABSTRACT: With the aim of setting up a Automatic Speech Recognition (ASR) system, a task named Phonetic Classification can be used. That task consists in, from a speech sample, deciding which phoneme was pronounced by a speaker. To ease the classification task and to enhance the most marked characteristics of the phonemes, the speech samples are usually pre-processed by a front-end. A front-end, as a general rule, extracts a set of features to each speech sample. After that, these features are inserted in a classification algorithm, that (already properly trained) will try to decide which phoneme was pronounced. There is a rule of thumb which says that the more features the system uses, the smaller the classification error rate will be. The disadvantage to that is the larger computational cost. Feature Selection task aims to show which are the most relevant (or more used) features in a classification task. Therefore, it is possible to discover which are the redundant features, that make little (or no) contribution to the classification task. The aim of this work is to apply SVM classificator in Phonetic Classification task, using TIMIT database, and discover the most relevant features in this classification using Boosting approach to implement Feature Selection.

Identificador

TEIXEIRA JÚNIOR, Talisman Cláudio de Queiroz. Classificação fonética utilizando Boosting e SVM. 2006. 78 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica.

http://repositorio.ufpa.br/jspui/2011/2533

Idioma(s)

por

Direitos

Open Access

Palavras-Chave #Classificação fonética #Sistema de processamento da fala #Fonema #SVM
Tipo

masterThesis