9 resultados para speaker diarization

em Universidade Federal do Pará


Relevância:

10.00% 10.00%

Publicador:

Resumo:

A fala apresenta aspectos paralinguísticos que não pertencem ao código linguístico convencional, mas contribuem significativamente para a unidade temática do discurso, Essas realizações se constituem em enunciados não-lexicalizados que funcionam que funcionam como atos de fala completos nas interações comunicativas interpessoais. Sobre essas emissões não-verbais, Campbell (2002a, 2002b, 2003 e 2004), Maekawa (2004), Fujie et. al (2004), Hoult (2004), Key (1958) apud Steimberg (1988) postulam que elas constribuem para a manifestação da fala expressiva. Para os autores, é justamente o fenômeno da paralinguagem que sinaliza informações sobre atitudes, opiniões e emoções do falante em relação ao interlocutor ou ao tópico discursivo. Nesse sentido, investigamos, neste trabalho, as manifestações paralinguísticas recorrentes em conversas informais para demonstrarmos seu papel expressivo na linguagem falada. Para tanto, fizemos um levantamento de 450 ocorrências de elementos paralinguísticos no processo de transcrição de amostras de falas do Português Regional Paraense produzidas em situações reais de conversação. Pressupondo que essas realizações não-verbais são caracterizadas por variações prosódicas, nós as submetemos a uma análise fonética por meio do software PRAAT. A partir dessa análise, constatamos a contribuição de duas propriedades: a frequência fundamental (F0) e o tempo de emissão, para a manifestação expressiva dos elementos paralinguísticos no discurso falado. Além disso, identificamos também a silabação como uma propriedade comum às realizações sonoras focalizadas. Após o processo de análise, fizemos a descrição do uso e do funcionamento desses elementos nas conversas, bem como da contribuição deles para a manifestação da fala expressiva. Os resultados nos mostram que os elementos paralinguísticos, além de contribuírem para a fluência do discurso falado, desempenham a função de sinalizar compreensão, interesse e/ou atenção, gerenciar relações interpessoais e expressar emoções, atitudes e afeto.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Analisa os principais problemas teóricos, práticos e metodológicos diretamente relacionados à concepção e elaboração de materiais de ensino da escrita na língua apurinã, uma língua sem tradição escrita. A partir da metodologia de análise de um caso, a pesquisa incluiu a revisão da literatura relevante e análise de dados coletados in loco nas comunidades de língua apurinã. Os problemas são identificados e as soluções propostas foram implementadas na elaboração do material didático resultante, "Escrevendo em apurinã". Esse material foi elaborado por mim em co-autoria com o indivíduo apurinã Norá, falante nativo da língua, com o objetivo de apresentar de maneira didática o alfabeto da língua apurinã. Descreve como esse material foi desenvolvido, quais foram as dificuldades encontradas durante a elaboração do livro, quais foram os critérios considerados na sequenciação e organização dos conteúdos, além de apresentar as dificuldades encontradas pelos professores em entender e utilizar esse material nas suas aulas, quais soluções foram encontradas para cada problema. Mostra também como esse material de cunho didático/pedagógico pode contribuir no processo de revitalização da língua apurinã, uma língua minoritária, quase sem nenhum prestígio social e falada pela minoria dos apurinã.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Esta pesquisa está fundamentada na visão sistêmico-funcional da linguagem e tem como objetivo principal descrever e analisar as categorias de appraisal, em 50 textos publicados na seção 'Cartas do Leitor', veiculada pela revista Veja, mostrando a importância das escolhas linguísticas na construção de significados relacionados à emoção do falante. Adotamos os pressupostos teóricos do lingüista Michael Halliday (1994) que concebe a linguagem como uma forma de ação sobre a realidade, por meio da qual o falante comunica três grupos de significados: ideacional, interpessoal e textual. Enfocamos a metafunção interpessoal, particularmente, a teoria de appraisal, defendida por Martin (2000), Martin e Rose (2003) e Martin e White (2005). A análise das expressões lexicais utilizadas na elaboração das cartas comprova que os escreventes recorrem às categorias de appraisal para extravasar o que sentem, positiva ou negativamente, seja para julgar comportamentos ou atitudes, seja para externar afetos ou desafetos, seja para apreciar pessoas ou objetos. Ficou constatado que, no gênero textual "Cartas do Leitor", há uma predominância da categoria avaliativa 'Julgamento'.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

“Mistura irregular de dois sistemas distintos” (Labov, 1971, p. 457). A afirmação de Labov reflete o que durante décadas se pensou sobre um comportamento linguístico comum a falantes bilíngues: a alternância de código (ou code-switching). Esse fenômeno, que se caracteriza pela mudança de uma língua para outra sem haver mudança de tópico ou falante, é, no entanto, sistematicamente organizado e está sujeito a restrições gramaticais, ocorrendo em pontos específicos e recorrentes nas sentenças, não de maneira aleatória. Um dos modelos teóricos frequentemente usados para dar conta da gramaticalidade do code-switching é o proposto por Poplack (1978/1881), que sugere duas restrições ao fenômeno: a “restrição morfema livre”, segundo a qual a alternância pode ocorrer após qualquer constituinte desde que não seja um morfema fixo; e a “restrição de equivalência”, que prevê a ocorrência em pontos onde elementos de ambas as línguas são equivalentes, para não haver violação de regras sintáticas das línguas envolvidas. Este trabalho apresenta a aplicação desse modelo à análise descritiva de alternância de código entre português e parkatêjê, língua Timbira falada no sudeste do Pará. Os dados que embasam este estudo são histórias tradicionais do povo, coletadas entre os anos de 2008 e 2011, nas quais é possível encontrar diversas ocorrências do fenômeno.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O objetivo principal dessa Dissertação de Mestrado é caracterizar a variação prosódica dialetal do português falado no município de Abaetetuba (PA). Todos os procedimentos metodológicos adotados, aqui, neste estudo, seguem as orientações estabelecidas pela equipe do Projeto AMPER, na condução do tratamento dos dados, para a confecção do Atlas Prosódico Multimídia das Línguas Românicas. As produções linguísticas dos falantes foram gravadas usando um único padrão, garantindo uma produção do sinal acústico de qualidade uniforme e uma boa representatividade da variedade dialetal. O corpus é constituído de 102 frases, SVC (sujeito + verbo + complemento) e suas expansões (sintagma adjetival e preposicionado), estruturadas com as mesmas restrições fonéticas e sintáticas. Cada uma das sentenças foi repetida seis vezes, por cada um dos quatro informantes, e o corpus total é composto por 612 frases. O pitch, para os informantes do sexo masculino, está entre 50 Hz e 250 Hz; e 110 Hz a 370 Hz para os informantes do sexo feminino. Foram utilizados três parâmetros acústicos controlados: a Frequência fundamental (F0), a Duração (ms) e a Intensidade (dB). O tratamento dos dados foi realizado por meio de sete etapas: 1) codificação das repetições, 2) isolamento de cada sentença em áudio individual; 3) segmentação fonética realizado no software PRAAT; 4) aplicação do PRAAT script; 5) seleção das três melhores repetições; 6) aplicação da interface MATLAB; e 7) utilização do EXCEL para gerar os gráficos para análise comparativa dos dados. Os resultados mostram que “as três maiores variações dos parâmetros acústicos controlados ocorrem preferencialmente na sílaba tônica da parte central do sintagma e/ou no sintagma final do enunciado” (CRUZ; BRITO, 2011).

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A presente pesquisa tem como tema o estudo perceptual da prosódia como elemento de segmentação de narrativas orais espontâneas e visa confirmar, ou não, se a prosódia facilita ao ouvinte leigo e inexperiente perceber a estrutura do texto narrativo. Este estudo investiga se a diferença de tom é um elemento prosódico relevante. A dissertação tem como corpus quatro narrativas espontâneas, as quais fazem parte do corpus analisado por Oliveira Jr.(2000), autor do projeto que inspirou esta pesquisa. Para saber se os participantes são capazes de delimitar a estrutura narrativa, baseando-se apenas no aspecto perceptual, conduziu-se um teste de percepção com 112 voluntários, recrutados na Universidade Federal do Pará e na Universidade Federal de Alagoas. Coube aos participantes a tarefa de indicar os pontos em que o falante teve a intenção de finalizar uma unidade comunicativa nas narrativas. A interpretação sobre unidade comunicativa foi subjetiva. Apresentou-se cada narrativa em quatro condições diferentes, a saber: (i) transcrição sem marca de pontuação e sem paragrafação; (ii) transcrição da narrativa acompanhada de áudio ; (iii) narrativa somente em áudio e (iv) áudio filtrado da narrativa, resultando numa versão deslexicalizada (fala ininteligível), mas com preservação da estrutura prosódica do discurso. Nas duas primeiras condições, a segmentação foi no texto transcrito, com barras transversais (/); nas demais, utilizou-se um programa de computador chamado ELAN. A análise dos dados obtidos baseou-se em tabelas, gráficos, análise estatística (teste do Qui-Quadrado), análise acústica (utilização do Programa PRAAT). Os resultados sinalizam que a prosódia ajuda o ouvinte leigo a perceber a estrutura básica do discurso narrativo. Com relação ao peso do Pitch Reset para auxiliar os ouvintes na demarcação de fronteiras, pode-se dizer que o teste estatístico do Qui-Quadrado encontrou evidências que lhe atribui essa função. Assim, neste contexto, ratifica-se o relevante papel da prosódia para o reconhecimento da estrutura de narrativas orais espontâneas e identifica-se o reflexo do peso da diferença de tom na percepção dos participantes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este estudo faz considerações sobre a investigação histórico-comparativa da língua tapajúna (Jê), mais especificamente sobre as consoantes em seu aspecto fonético-fonológico, comparando cognatos dessa língua e da língua suyá (também da família Jê) com o objetivo de verificar suas semelhanças e diferenças no contexto das consoantes, tendo em vista contribuir para a reconstrução do tronco linguístico Macro-Jê. Para o estudo aqui desenvolvido, foi utilizado o método comparativo por meio do qual são verificadas as correspondências existentes entre as línguas envolvidas em um estudo dessa natureza, com o fim de observar como seria possivelmente constituída a forma original, que teria originado as formas das duas línguas. Os dados de tapajúna e de suyá também foram comparados aos dados do Proto-Jê, reconstruído por Davis (1966). De um modo geral, observa-se que há poucas diferenças entre tapajúna e suyá. No caso das variações em contextos fonético-fonológicos idênticos, há a questão da variação de faixa etária, como a ocorrência das consoantes pré-nasalizadas na fala dos mais jovens do povo tapajúna, enquanto os mais velhos usam as nasais.