78 resultados para Vogais pretônicas
Resumo:
In the area of Phonetics, current studies are mainly geared toward acoustic analysis of the speech. The technology of personal computers and available software made these analyses easier to be carried out. The following work used the software called PRAAT. Besides showing how it helps the researcher, the aim of this work is to bring new data for future consultation in this field, allowing comparisons and discussions about this subject. At FONAC, a place where a Project of Departmental Traineeship is run, coordinated by Prof. Dr. Luiz Carlos Cagliari and aimed at training on Acoustic Phonetics for undergraduates and graduates, there is a good quality recording, in which a speaker of the paulista dialect reads an excerpt of Michael Ende and Annegert Fuchshuber’s book named ‘The Dream-eater’ twice. The data obtained through it were analyzed directly or by statistic procedures. Tables and charts, created from these data, helped to visualize the similarities and differences between the vowels allowing an easier comprehension of the articulatory phenomenon. With the formants, specifically, prototypical values for the vowels of Portuguese and the dialect in study were obtained
Resumo:
This study aims to verify the reduction phenomenon and/or disappearance of vowels, especially unstressed vowels in PE compared to the PB, obtained by analysis of the recording of an oral reading sample of the Mar Português poem, by Fernando Pessoa, made by informants of the two variants. The noticeable difference in pronunciation of the informants, with any possibility of reaching up to no understanding of European pronunciation by Brazilian speakers motivated the development of an experiment that allowed us to compare the duration of vowels produced in the two variants. By isolating and measuring the vowels at Praat audio analysis program, this study was to confirm the reduction and, in extreme cases, the disappearance of unstressed vowels in PE, a phenomenon described in Mateus and D'Andrade (2000)
Resumo:
This work aims to obtain a phonological description of unstressed word-final vowels of Medieval Portuguese (MP). The corpus of this research is comprised of Alfonso X’s Cantigas de Santa Maria, composed on the second half of the 13th century. This work maps all the graphemes that represent, in the corpus considered, the unstressed word-final vowels. From the analyses of writing and rhymes in Alfonso X’s Cantigas de Santa Maria, it was possible obtain some important information about the realization of the unstressed wordfinal vowels in MP.
Resumo:
This research analyzes the average previous stressed vowels [ε] and [e] and later [ɔ] and [o] in nominal and verbal forms in the 1st person singular and 3rd person singular and plural in the present tense, specifically the umlaut process of mid vowels /e/ and /o/, which assimilate in /ε/ and /ᴐ/ in stressed position. The general objective of this research is to describe and quantify the occurrence of umlaut and subsequently analyze in which words there is regularity or not. As specific objectives we have: i) to compile and to label an oral, spontaneous, synchronic and regional corpus, from radio programs produced in the city of Ituiutaba, Minas Gerais; ii) to describe the characteristics of the corpus to be compiled; iii) to investigate the alternating timbre of mid vowels in stressed position; iv) to identify instances of nominal and verbal umlaut of the middle vowels in stressed position; v) to describe the identified cases of nominal and verbal umlaut; vi) to analyze the probable causes for the variation of the middle vowels. To perform the proposed analysis, we have adopted as a theoretical-methodological basis multi-representational models: Phonology of Use (BYBEE, 2001) and Exemplar Theory (PIERREHUMBERT, 2001) combined with the precepts of Corpus Linguistics (BEBER SARDINHA, 2004). The corpus consisted of 16 radio programs – eight political and eight religious – from the city of Ituiutaba-MG, with recordings of about 20 to 40 minutes. We note, by means of the results generated by WordSmith Tools® software, version 6.0 (SCOTT, 2012), that the analyzed forms show little variation, which shows that the umlaut is a process already lexicalized in participants of the radio programs analyzed. We conclude that the results converge with the proposal of the Phonology of Use (BYBEE, 2001; PHILLIPS, 1984) that less frequent words that have no phonetic environment conducive to change, are changed first.
Resumo:
Forensic speaker comparison exams have complex characteristics, demanding a long time for manual analysis. A method for automatic recognition of vowels, providing feature extraction for acoustic analysis is proposed, aiming to contribute as a support tool in these exams. The proposal is based in formant measurements by LPC (Linear Predictive Coding), selectively by fundamental frequency detection, zero crossing rate, bandwidth and continuity, with the clustering being done by the k-means method. Experiments using samples from three different databases have shown promising results, in which the regions corresponding to five of the Brasilian Portuguese vowels were successfully located, providing visualization of a speaker’s vocal tract behavior, as well as the detection of segments corresponding to target vowels.
Resumo:
Motivados pelo propósito central de contribuir para a construção, a longo prazo, de um sistema completo de conversão de texto para fala, baseado em síntese articulatória, desenvolvemos um modelo linguístico para o português europeu (PE), com base no sistema TADA (TAsk Dynamic Application), que visou a obtenção automática da trajectória dos articuladores a partir do texto de entrada. A concretização deste objectivo ditou o desenvolvimento de um conjunto de tarefas, nomeadamente 1) a implementação e avaliação de dois sistemas de silabificação automática e de transcrição fonética, tendo em vista a transformação do texto de entrada num formato adequado ao TADA; 2) a criação de um dicionário gestual para os sons do PE, de modo a que cada fone obtido à saída do conversor grafema-fone pudesse ter correspondência com um conjunto de gestos articulatórios adaptados para o PE; 3) a análise do fenómeno da nasalidade à luz dos princípios dinâmicos da Fonologia Articulatória (FA), com base num estudo articulatório e perceptivo. Os dois algoritmos de silabificação automática implementados e testados fizeram apelo a conhecimentos de natureza fonológica sobre a estrutura da sílaba, sendo o primeiro baseado em transdutores de estados finitos e o segundo uma implementação fiel das propostas de Mateus & d'Andrade (2000). O desempenho destes algoritmos – sobretudo do segundo – mostrou-se similar ao de outros sistemas com as mesmas potencialidades. Quanto à conversão grafema-fone, seguimos uma metodologia baseada em regras de reescrita combinada com uma técnica de aprendizagem automática. Os resultados da avaliação deste sistema motivaram a exploração posterior de outros métodos automáticos, procurando também avaliar o impacto da integração de informação silábica nos sistemas. A descrição dinâmica dos sons do PE, ancorada nos princípios teóricos e metodológicos da FA, baseou-se essencialmente na análise de dados de ressonância magnética, a partir dos quais foram realizadas todas as medições, com vista à obtenção de parâmetros articulatórios quantitativos. Foi tentada uma primeira validação das várias configurações gestuais propostas, através de um pequeno teste perceptual, que permitiu identificar os principais problemas subjacentes à proposta gestual. Este trabalho propiciou, pela primeira vez para o PE, o desenvolvimento de um primeiro sistema de conversão de texto para fala, de base articulatória. A descrição dinâmica das vogais nasais contou, quer com os dados de ressonância magnética, para caracterização dos gestos orais, quer com os dados obtidos através de articulografia electromagnética (EMA), para estudo da dinâmica do velo e da sua relação com os restantes articuladores. Para além disso, foi efectuado um teste perceptivo, usando o TADA e o SAPWindows, para avaliar a sensibilidade dos ouvintes portugueses às variações na altura do velo e alterações na coordenação intergestual. Este estudo serviu de base a uma interpretação abstracta (em termos gestuais) das vogais nasais do PE e permitiu também esclarecer aspectos cruciais relacionados com a sua produção e percepção.
Resumo:
Estudar os mecanismos subjacentes à produção de fala é uma tarefa complexa e exigente, requerendo a obtenção de dados mediante a utilização de variadas técnicas, onde se incluem algumas modalidades imagiológicas. De entre estas, a Ressonância Magnética (RM) tem ganho algum destaque, nos últimos anos, posicionando-se como uma das mais promissoras no domínio da produção de fala. Um importante contributo deste trabalho prende-se com a otimização e implementação de protocolos (RM) e proposta de estratégias de processamento de imagem ajustados aos requisitos da produção de fala, em geral, e às especificidades dos diferentes sons. Para além disso, motivados pela escassez de dados para o Português Europeu (PE), constitui-se como objetivo a obtenção de dados articulatórios que permitam complementar informação já existente e clarificar algumas questões relativas à produção dos sons do PE (nomeadamente, consoantes laterais e vogais nasais). Assim, para as consoantes laterais foram obtidas imagens RM (2D e 3D), através de produções sustidas, com recurso a uma sequência Eco de Gradiente (EG) rápida (3D VIBE), no plano sagital, englobando todo o trato vocal. O corpus, adquirido por sete falantes, contemplou diferentes posições silábicas e contextos vocálicos. Para as vogais nasais, foram adquiridas, em três falantes, imagens em tempo real com uma sequência EG - Spoiled (TurboFLASH), nos planos sagital e coronal, obtendo-se uma resolução temporal de 72 ms (14 frames/s). Foi efetuada aquisição sincronizada das imagens com o sinal acústico mediante utilização de um microfone ótico. Para o processamento e análise de imagem foram utilizados vários algoritmos semiautomáticos. O tratamento e análise dos dados permitiu efetuar uma descrição articulatória das consoantes laterais, ancorada em dados qualitativos (e.g., visualizações 3D, comparação de contornos) e quantitativos que incluem áreas, funções de área do trato vocal, extensão e área das passagens laterais, avaliação de efeitos contextuais e posicionais, etc. No que respeita à velarização da lateral alveolar /l/, os resultados apontam para um /l/ velarizado independentemente da sua posição silábica. Relativamente ao /L/, em relação ao qual a informação disponível era escassa, foi possível verificar que a sua articulação é bastante mais anteriorizada do que tradicionalmente descrito e também mais extensa do que a da lateral alveolar. A resolução temporal de 72 ms conseguida com as aquisições de RM em tempo real, revelou-se adequada para o estudo das características dinâmicas das vogais nasais, nomeadamente, aspetos como a duração do gesto velar, gesto oral, coordenação entre gestos, etc. complementando e corroborando resultados, já existentes para o PE, obtidos com recurso a outras técnicas instrumentais. Para além disso, foram obtidos novos dados de produção relevantes para melhor compreensão da nasalidade (variação área nasal/oral no tempo, proporção nasal/oral). Neste estudo, fica patente a versatilidade e potencial da RM para o estudo da produção de fala, com contributos claros e importantes para um melhor conhecimento da articulação do Português, para a evolução de modelos de síntese de voz, de base articulatória, e para aplicação futura em áreas mais clínicas (e.g., perturbações da fala).
Resumo:
Orientado por: Professor Doutor Eduardo Sá e Silva Co-Orientado por: Professor Doutor José Pedro T. Fernandes Júri Presidente: Professora Doutora Cristina Melo Vogais: Professora Doutora Paula Odete Fernandes Professor Doutor Eduardo Sá e Silva Professor Doutor José Pedro T. Fernandes
Resumo:
Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em Ciências Musicais, na especialidade de Ensino e Psicologia da Música
Resumo:
Objetivo: O objetivo deste estudo consistiu na descrição da aquisição fonética e fonológica de crianças falantes do Português Europeu (PE), da região Centro de Portugal Continental, com idades compreendidas entre os [18-‐36[ meses. Mais especificamente pretendeu-‐se traçar uma ordem cronológica de aquisição dos fones e verificar quais os processos fonológicos mais utilizados nas 3 faixas etárias ([18-‐24[, [24-‐30[, [30-‐36[ meses). Foi ainda objetivo averiguar se existiam diferenças em relação ao número de fones produzidos adequadamente e ao número de processos fonológicos utilizados entre as faixas etárias e os sexos. Definir a ordem pela qual os fones vão surgindo no discurso da criança, isto é, a sua ordem de aquisição, também foi um objetivo deste estudo. Método: A amostra foi constituída por 69 crianças (2 da faixa etária [18-‐24[m, 31 dos [24-‐30[m e 36 dos [30-‐36[m, de ambos os sexos, que frequentavam 6 creches do distrito de Aveiro. Para recolher os dados recorreu-‐se a gravações digitais áudio usando as imagens do Teste Fonético-‐Fonológico-‐ALPE. Resultados: Na aquisição fonética verificou-‐se que que a produção de fones aumentou significativamente à medida que a idade avançou. Também foram encontradas diferenças entre as 3 faixas etárias (p<0,05), mas não entre os sexos (p>0,05). Foi ainda possível traçar a ordem cronológica de aquisição de fones: vogais orais < vogais nasais < oclusivas orais < oclusivas nasais < fricativas < líquidas Laterais < líquidas vibrantes. Relativamente à aquisição fonológica não se verificaram diferenças entre as 3 faixas etárias e entre os sexos (p>0,05). Quanto aos processos fonológicos, os mais utilizados foram os de estruturação silábica, nomeadamente a redução de grupo consonântico, palatalização e omissão de consoante final. Conclusão: As conclusões de maior relevo incidem no facto das diferenças nas faixas etárias serem mais notórias para a aquisição fonética do que para a aquisição fonológica. Também se verificou que não existiam diferenças entre os sexos na aquisição fonética-‐fonológica. Constatou-‐se que nesta amostra as crianças mais velhas adquiriram mais fones que as crianças das faixas etárias mais precoces.
Resumo:
Sabe-se que a fala é a principal maneira de comunicação entre as pessoas. A Síntese de fala (geração automática da fala pelo computador) tem recebido atenção da comunidade acadêmica e profissional por várias décadas. Ela envolve a conversão de um texto de entrada em fala, usando algoritmos e algumas formas de fala codificada. O texto pode ser digitado pelo teclado ou obtido por reconhecimento de caracteres ou, ainda, obtido de um banco de dados. A síntese de fala pode ser usada em vários domínios de aplicação, tais como: auxílio para deficientes visuais, telecomunicações, multimídia, etc. Este trabalho apresenta um estudo sobre a produção da fala e da área de síntese de fala visando servir de subsídio para dissertações e pesquisas futuras, bem como para o Projeto Spoltech, um projeto de cooperação entre os Estados Unidos e o Brasil para o avanço da tecnologia da língua falada no Brasil (Português Brasileiro). Dentro deste estudo serão apresentadas as principais técnicas de síntese de fala, entre as quais destaca-se: Texto para Fala (TPF). Problemas de separação de sílabas, determinação da sílaba tônica, pronunciação das vogais “e” e “o” como um fonema aberto ou fechado, etc, são enfrentados dentro do contexto da área de síntese de fala para o português falado no Brasil. Tendo conhecimento destes problemas, o principal objetivo deste trabalho será criar regras para resolver o problema de pronunciação das vogais “e” e “o” de forma automática, visando obter produção sonora mais inteligível, por intermédio da implementação de um analisador estatístico, o qual verificará a letra anterior e posterior ao “e” ou “o” de uma palavra e, com isso, determinar a pronúncia dos mesmos para aquela seqüência de letras. As mesmas poderão tornar-se regras válidas para a solução do problema se atingirem 80% dos casos de ocorrência no dicionário com fonema “e” ou “o” aberto (limiar), sendo que elas serão lidas por um interpretador Scheme utilizado pelo programa Festival - ferramenta para a construção de sistemas de síntese de fala desenvolvida pelo Centre for Speech Technology Research (University of Edinburgh, Reino Unido), a qual utiliza TPF como método de síntese. Sabendo-se que o Festival gera os fonemas “e” e “o” como fechados se não há uma regra para inferir o contrário, serão consideradas apenas as regras encontradas para os fonemas abertos. Para possibilitar esta análise será utilizado um dicionário eletrônico de pronunciação (com 19.156 palavras), o qual possui a palavra e a sua respectiva pronúncia, conforme pode-se verificar no exemplo do Anexo 1.
Resumo:
No português brasileiro (PB) há basicamente dois tipos de nasalidade: a nasalidade dita fonológica é a marca de nasalidade obrigatória que recebe a vogal quando seguida por uma consoante nasal na mesma sílaba (como em ‘campo’); a nasalidade dita fonética é a marca de nasalidade que recebe a vogal de uma rima vazia seguida de uma consoante nasal no onset da sílaba seguinte (como em ‘cama’). Em língua espanhola (LEsp), considera-se que o traço [+ nasal] não tem relevância fonológica, apenas fonética. Entretanto, mesmo que ocorra alguma nasalização, esta é praticamente imperceptível para um falante nativo e também não é auditivamente relevante para os falantes não-nativos em geral. Devido à proximidade entre português e espanhol e considerando a grande quantidade de brasileiros estudantes de LEsp que nasalizam a vogal oral /a/ em LEsp quando seguida de consoante nasal, desejamos verificar se o estudante de graduação tem dificuldade em perceber esse segmento. Para isso, os sujeitos da pesquisa – estudantes do Curso de Graduação em Letras-Licenciatura da UFRGS de diferentes semestres e falantes nativos de LEsp (grupo de controle) – foram submetidos a dois testes de percepção – um constituído por um texto e outro por uma lista de palavras -, nos quais deveriam identificar se um som vocálico era nasal [ã] ou oral [a]. Com esses instrumentos e baseados nos estudos de Sampson (1999), Moraes (1997) e Beddor (1993) sobre nasalidade e percepção vocálica, desejamos verificar se os estudantes percebem categoricamente a distinção entre vogal nasal e não-nasal e também se os estudantes em níveis médio e avançado mostram uma percepção melhor do que a dos estudantes dos níveis básicos. Falantes nativos de LEsp foram submetidos aos testes para fins de controle da confiabilidade dos mesmos e para verificarmos até que ponto a nasalização indevida das vogais pode prejudicar a comunicação.
Resumo:
A Região Sul do Brasil, do ponto de vista da diversidade lingüística, caracteriza-se, entre diversos outros aspectos, pelo contato do português com as línguas dos imigrantes europeus que colonizaram a região desde o século XIX. Monolíngües no início, esses imigrantes tornaram-se bilíngües ao adquirir o português ao longo dos anos e, atualmente, a tendência é serem monolíngües em português. Em tal contexto, os italianos assumem posição de destaque, não só pelo número de falantes, mas também pelas áreas ocupadas e pela influência no contexto lingüístico, sociocultural e econômico. O português falado nas regiões em que ocorre o contato com o italiano assumiu traços específicos que refletem a constituição social e étnica dessas áreas, distinguindo-se, assim, do português falado em outras regiões e da variedadepadrão subjacente. Considerando esse cenário, o objetivo deste estudo é explicitar a dinâmica de difusão do português no espaço pluridimensional de contato com o italiano, mais especificamente em oito pontos (municípios) do Rio Grande do Sul e de Santa Catarina. A linha teórica da pesquisa segue a perspectiva da dialetologia pluridimensional e relacional, a qual busca constituir uma ciência da variação lingüística que corrija as deficiências da geolingüística tradicional e acrescente à sociolingüística uma importância maior ao valor do espaço no debate sobre a variação: “o conceito das interrelações no espaço”, segundo Harald Thun. Os dados foram coletados através de trinta e duas entrevistas, nos estilos conversa semidirigida, resposta a questionário e leitura, nas quais foram controladas dimensões sociais e geográficas, visando a verificar a pronúncia variável do ditongo nasal tônico [A)w)], do [r] forte, da vogal [a] seguida de consoante nasal, do alçamento das vogais átonas finais [e] e [o], da africação de [t] e [d] diante de [i], da realização das fricativas [S] e [Z]. Os resultados, demonstrados através de tabelas estatísticas e de mapas pluridimensionais, evidenciam que a difusão dos traços associados ao português varia no modo e na intensidade. No plano diatópico, ocorre difusão mais intensa em Orleans (SC) e Caxias do Sul (RS), ao passo que a maior resistência à inovação lingüística foi detectada em Rodeio (SC) e Sananduva (RS). Na perspectiva diassocial, o uso de variantes sem interferência do italiano é liderado, sucessivamente, pelos falantes urbanos, pelos mais jovens e mais escolarizados.
Resumo:
Módulo 7
Resumo:
The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literature