7 resultados para Text-to-Speech synthesis

em Universidade Federal do Pará


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Sistema Texto-Fala (TTS) é atualmente uma tecnologia madura que é utilizada em muitas aplicações. Alguns módulos de um sistema TTS são dependentes do idioma e, enquanto existem muitos recursos disponíveis para a língua inglesa, os recursos para alguns idiomas ainda são limitados. Este trabalho descreve o desenvolvimento de um sistema TTS completo para português brasileiro (PB), o qual também apresenta os recursos já disponíveis. O sistema usa a plataforma MARY e o processo de síntese da voz é baseado em cadeias escondidas de Markov (HMM). Algumas das contribuições deste trabalho consistem na implementação de silabação, determinação da sílaba tônica e conversão grafema-fonema (G2P). O trabalho também descreve as etapas para a organização dos recursos desenvolvidos e a criação de uma voz em PB junto ao MARY. Estes recursos estão disponíveis e facilita a pesquisa na normalização de texto e síntese baseada em HMM par o PB.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Nesta dissertação de mestrado, desenvolvemos um estudo sobre a produção de texto escrito em turmas de 8ª série do ensino fundamental visando: identificar os procedimentos e dificuldades habituais do professor observado para ensinar produção de texto escrito aos seus alunos; analisar o material didático utilizado nessas aulas; e propor, a título de sugestão, práticas de ensino de LM para o desenvolvimento da interação verbal através da produção escrita. Como ferramenta de trabalho para o desenvolvimento desse estudo, foi utilizado o Quadro Europeu Comum de Referência (QECR). Quanto aos procedimentos metodológicos, utilizamos o estudo de caso. Na análise, refletimos sobre a prática de ensino de produção de texto escrito, observando 13 (treze) aulas de LM e o material nelas trabalhado como também as “redações” escritas pelos alunos da turma observada. Os resultados da pesquisa indicam que podemos mudar nossa prática de um ensino de LM descontextualizado e sem propósito prático e social para aulas que proporcionem o desenvolvimento da competência de produção escrita dos alunos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Focalizando o período de 1836 a 1839, essa dissertação aborda as ações de tentativa de reorganização da Província do Pará, nos conturbados anos da Cabanagem, sob o comando do governo do português Francisco José de Sousa Soares d‟Andréa. Enviado pela Regência, Soares d’Andréa usou de medidas firmes para retomar o controle da Província das mãos dos cabanos, que para ele eram homens malvados que espalhavam o terror no Pará. Para ele, e outras lideranças anticabanas, havia uma importante relação entre a natureza, a índole da população e os cabanos, assim como a ausência de civilização estava relacionada com as carências da Província; elementos esses facilmente percebidos nos seus discursos, nas suas correspondências trocadas com seus superiores e outras autoridades. A documentação pesquisada também aponta para discursos destoantes do pensamento de Soares d’Andréa, permitindo, portanto, uma nova visão da imagem construída sobre o Presidente da Província. Portanto analisa-se a construção de uma imagem sobre os cabanos e as forças contrárias ao discurso de Soares d’Andréa. Também discute-se as ideias do Presidente e de lideranças anticabanas relativas a um antagonismo entre a humanidade e a natureza da Província e o entendimento que faziam sobre as necessidades do Pará no seu processo de reconstrução e civilização.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

O presente trabalho tem como objetivo geral analisar como ocorre a intertextualidade dos escritores T. S. Eliot, James Joyce, Robert Stock, Emily Dickinson, Walt Whitman e Ezra Pound, na obra de Mário Faustino. De acordo com autores como Bosi (1994) e Benedito Nunes (1985), a poesia de Faustino resulta da soma de poetas que ele leu, em diferentes momentos, tais como: Mallarmé, Yeats, Rilke, cummings, Joyce e Pound, deste último se utilizou do lema “repetir para aprender, criar para renovar”. O lema de Pound remete direta ou indiretamente à presença de outros autores em alguns poemas de Faustino. Mas este fato sempre foi tratado com poucas comprovações práticas. Assim, estabelecemos alguns parâmetros para escolher quais autores seriam analisados: utilizaremos somente autores anglófonos e, dentre eles, apenas autores que Faustino traduziu em suplementos literários e em uma revista. Partindo desse princípio, os autores foram distribuídos em dois momentos que definimos como ciclos: o ciclo-norte, o qual abrangeu o suplemento Arte-Literatura e a revista Norte; e o ciclo-sudeste, o qual abrangeu o suplemento Poesia-Experiência. Em ambos os ciclos, procuramos meios que nos permitissem mostrar que determinados autores estão presentes na obra de Faustino, seja por meio da criação de novos poemas com base em um poema de um autor anglófono ou por meio da incorporação de elementos característicos de determinado escritor também anglófono. Para esta pesquisa utilizamos alguns autores como: Chaves (1986) Kristeva (1974) e Bakhtin (2003; 2006), Santiago (1978), Nunes (1985; 1986; 1997; 2009) e Campos (1977; 1992). Percebemos, de acordo com Compagnon (2007), como ocorre o trabalho de reconstrução da escrita, neste caso na análise entre as traduções realizadas por Mário Faustino e os poemas dele, no qual cada etapa é um liame de uma imensa trama que liga este texto a outros lidos e “recortados”, que é manipulado por um indivíduo, ao mesmo tempo, autor e leitor (Faustino). Assim, o autor/leitor, possuiu como prática a tarefa de citar, ou seja, redizer o que já havia sido dito por outros.