Biblioteca Digital

Desenvolvimento de aplicativos usando reconhecimento e síntese de voz

**Autoria(s):** SAMPAIO NETO, Nelson Cruz
Contribuinte(s)	KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
Data(s)	17/01/2013 17/01/2013 2006 30/08/2006
Resumo	A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java. ABSTRACT: Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an API. In contrast, there are no such resources in public domain for Brazilian Portuguese. This work discusses some of these issues and compares SAPI and JSAPI, which are APIs promoted by Microsoft and Sun, respectively. We also present two examples: a CALL application using SAPI-based speech synthesis in English and Portuguese, recognition in English, and visual agents; and a JSAPI-based software that incorporates speech synthesis and recognition to IRC through Java APIs.
Identificador	SAMPAIO NETO, Nelson Cruz. Desenvolvimento de aplicativos usando reconhecimento e síntese de voz. 2006. 86 f. Dissertação (Mestrado) - Universidade Federal do Pará, Centro Tecnológico, Belém, 2006. Programa de Pós-Graduação em Engenharia Elétrica. http://repositorio.ufpa.br/jspui/handle/2011/3341
Idioma(s)	por
Direitos	Open Access
Palavras-Chave	#Reconhecimento automático da voz #Síntese da voz
Tipo	masterThesis

Acesso ao item digital