Desenvolvimento de aplicativos usando reconhecimento e síntese de voz
Contribuinte(s) |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
---|---|
Data(s) |
17/01/2013
17/01/2013
2006
30/08/2006
|
Resumo |
A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java. ABSTRACT: Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an API. In contrast, there are no such resources in public domain for Brazilian Portuguese. This work discusses some of these issues and compares SAPI and JSAPI, which are APIs promoted by Microsoft and Sun, respectively. We also present two examples: a CALL application using SAPI-based speech synthesis in English and Portuguese, recognition in English, and visual agents; and a JSAPI-based software that incorporates speech synthesis and recognition to IRC through Java APIs. |
Identificador |
SAMPAIO NETO, Nelson Cruz. Desenvolvimento de aplicativos usando reconhecimento e síntese de voz. 2006. 86 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. |
Idioma(s) |
por |
Direitos |
Open Access |
Palavras-Chave | #Reconhecimento automático da voz #Síntese da voz |
Tipo |
masterThesis |