Ambiente web de suporte à transcrição fonética automática de lemas em verbetes de dicionários do português do Brasil


Autoria(s): Serrani, Vanessa Marquiafável
Contribuinte(s)

Universidade Estadual Paulista (UNESP)

Data(s)

17/05/2016

17/05/2016

25/03/2015

Resumo

Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)

Processo FAPESP: 2011/01299-4

Pós-graduação em Estudos Linguísticos - IBILCE

Automatic Phonetic Transcription is a crucial task for many applications of different areas. Besides Text-to-Speech systems, which need high quality transcriptions in order to have a good performance, automatic phonetic transcription tools can be useful in many areas (phonetics, phonology, language learning, and so on) in order to obtain preliminary transcriptions of large corpora. This kind of system often generate a phonetic transcription directly from the orthographic form. Considering the effort expended by lexicographers in the development of manual phonetic transcriptions to be added in their dictionaries, this study aimed the creation of a computational environment to support automatic phonetic transcription of lemmas, from mono or multilingual Brazilian dictionaries entries, to be available free of charge, via the Web, called PETRUS - PhonEtic TRanscriber for User Support. We intend to contribute, even modestly, so that lexicographers, our main target audience, can enjoy the benefits of automating the phonetic transcription, reducing the time and difficulty in integrating this kind of information in their lexicographical works. Preliminary results indicate a phone error rate accuracy of 97.5%, with the possibility of increase

A transcrição fonética automática é uma tarefa essencial para muitas aplicações de diferentes áreas. Além de sistemas de síntese de fala que necessitam de transcrições de alta qualidade para obter um bom desempenho, sistemas de transcrição fonética automática podem ser utilizados em muitas outras áreas (fonética, fonologia, ensino-aprendizagem de língua, e assim por diante) com o objetivo de se obter transcrições preliminares de grandes córpus. Esse tipo de sistema frequentemente gera uma transcrição fonética a partir da forma ortográfica. Considerando o esforço despendido por lexicógrafos no desenvolvimento de transcrições fonéticas manuais para obras lexicográficas, este estudo teve como objetivo principal a criação de um ambiente computacional para transcrever foneticamente unidades lexicais que fazem parte da cabeça do verbete de dicionários mono ou multilíngues, do Português Brasileiro, com disponibilização gratuita, via Web, denominado PETRUS - PhonEtic TRanscriber for User Support. O propósito deste trabalho é contribuir, mesmo que modestamente, para que lexicógrafos, nosso principal público-alvo, possam desfrutar dos benefícios da automatização da transcrição fonética, diminuindo o tempo e as dificuldades de inserção desse tipo de informação em suas obras lexicográficas. Os resultados preliminares indicam uma taxa de acerto de 97.5% ao fone, com possibilidade de aumento

Formato

202 f. : il., tabs.

Identificador

SERRANI, Vanessa Marquiafável. Ambiente web de suporte à transcrição fonética automática de lemas em verbetes de dicionários do português do Brasil. 2015. 202 f. Tese (doutorado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2015.

http://hdl.handle.net/11449/138398

000864228

http://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/02-05-2016/000864228.pdf

33004153069P5

Idioma(s)

por

Publicador

Universidade Estadual Paulista (UNESP)

Direitos

openAccess

Palavras-Chave #Linguistica aplicada #Língua portuguesa - Brasil - Lexicografia #Lingua portuguesa - Fonetica #Linguagens e línguas Transcrições fonéticas #Linguistica - Processamento de dados #Applied linguistics
Tipo

info:eu-repo/semantics/doctoralThesis