818 resultados para speaker diarization
Resumo:
This paper describes the development of the 2003 CU-HTK large vocabulary speech recognition system for Conversational Telephone Speech (CTS). The system was designed based on a multi-pass, multi-branch structure where the output of all branches is combined using system combination. A number of advanced modelling techniques such as Speaker Adaptive Training, Heteroscedastic Linear Discriminant Analysis, Minimum Phone Error estimation and specially constructed Single Pronunciation dictionaries were employed. The effectiveness of each of these techniques and their potential contribution to the result of system combination was evaluated in the framework of a state-of-the-art LVCSR system with sophisticated adaptation. The final 2003 CU-HTK CTS system constructed from some of these models is described and its performance on the DARPA/NIST 2003 Rich Transcription (RT-03) evaluation test set is discussed.
Resumo:
This paper discusses the development of the CU-HTK Mandarin Broadcast News (BN) transcription system. The Mandarin BN task includes a significant amount of English data. Hence techniques have been investigated to allow the same system to handle both Mandarin and English by augmenting the Mandarin training sets with English acoustic and language model training data. A range of acoustic models were built including models based on Gaussianised features, speaker adaptive training and feature-space MPE. A multi-branch system architecture is described in which multiple acoustic model types, alternate phone sets and segmentations can be used in a system combination framework to generate the final output. The final system shows state-of-the-art performance over a range of test sets. ©2006 British Crown Copyright.
Resumo:
This paper discusses the Cambridge University HTK (CU-HTK) system for the automatic transcription of conversational telephone speech. A detailed discussion of the most important techniques in front-end processing, acoustic modeling and model training, language and pronunciation modeling are presented. These include the use of conversation side based cepstral normalization, vocal tract length normalization, heteroscedastic linear discriminant analysis for feature projection, minimum phone error training and speaker adaptive training, lattice-based model adaptation, confusion network based decoding and confidence score estimation, pronunciation selection, language model interpolation, and class based language models. The transcription system developed for participation in the 2002 NIST Rich Transcription evaluations of English conversational telephone speech data is presented in detail. In this evaluation the CU-HTK system gave an overall word error rate of 23.9%, which was the best performance by a statistically significant margin. Further details on the derivation of faster systems with moderate performance degradation are discussed in the context of the 2002 CU-HTK 10 × RT conversational speech transcription system. © 2005 IEEE.
Resumo:
现有的半导体激光干涉仪存在测量精度与测量范围的矛盾。本文提出一种新的实时位移测量半导体激光干涉仪,并分析了干涉仪的测量原理。首先提出一种新的解相算法,它通过两路实时相位探测电路从干涉信号中得到待测量相位,消除了光强波动、初始光程差、电路放大倍数、调制深度、Bessel函数等参数对测量精度的影响,提高了测量精度。其次,提出一种扩大测量范围的技术,并用解包裹电路得到真实相位和待测量的位移, 将测量范围从半个波长提高到几个波长。在实验中,测得喇叭的峰峰值为2361.7nm,重复测量精度为2.56nm,测量时间为
Resumo:
Este trabalho, em sua forma de tese de doutorado, pretende investigar as formulações discursivas do orador nos sermões do padre Antônio Vieira, partindo da problematização do conceito de sujeito vigente no século XVII. Entendendo que a noção de sujeito não é transistórica, e, sim, uma noção que veio sendo construída ao longo da história da humanidade, investigamos elementos formadores do que se entende hoje por eu. Nesse percurso analisamos, especialmente, os conceitos de cuidado de si e de livre-arbítrio. Não poderíamos deixar de estudar, ainda, as particularidades dos procedimentos das produções letradas do século XVII, fatores essenciais para a compreensão do lugar do eu que fala na elaboração dos sermões religiosos seiscentistas. Nesse sentido, a função que a imagem ocupava nos seiscentos vem a ser de suma importância para a compreensão do pensamento do período e, consequentemente, para o entendimento da figura do eu. Enveredamo-nos também pela teoria de Michel Foucault, investigando a função-autor exercida por Vieira em sua sermonística
Resumo:
O objeto deste estudo é a análise do comportamento da palavra nos discursos de posse dos Presidentes do Supremo Tribunal Federal, tendo como foco o enunciador e o lugar que ocupa no mundo em que constrói seu discurso, quando toma a palavra que lhe é de direito. Verificamos as relações de poder estabelecidas pela palavra e a ação que ela é capaz de realizar: a construção de imagens, a percepção do outro no momento do costuramento discursivo e os ajustamentos necessários entre o eu e o outro para o desenvolvimento da argumentação. Considerando que o poder imanente da palavra política é premissa fundamental para identificar o ethos dos enunciadores discursivos, demos, pois, enfoque ao modo como se dá a sua constituição nesses discursos, tendo em vista a representação histórica, social, linguística e discursiva dos sujeitos enunciadores, cuja identidade individual ou coletiva, bem como a do auditório a que se destina inscreve o binômio língua/sociedade como premissa fundamental para a realização do estudo da estrutura linguística utilizada em sua redação. Analisar os discursos de posse dos presidentes do Supremo Tribunal Federal, nos últimos 47 anos da República no Brasil, permite que apontemos uma das imagens do Poder Judiciário, forjada pelos membros do próprio Poder e o espelhamento inegável entre presidência e presidentes; que observemos as características que os inserem em determinados domínios discursivos e o contrato que confirma a interdependência e relevância de enunciador e auditório para a constituição do ethos de credibilidade nesses discursos, que tratamos como subgênero textual do gênero discurso de posse; que identifiquemos os ajustamentos e interação entre a tríade enunciador, discurso e auditório responsável pelo desenvolvimento da argumentação e da construção de uma das faces do ethos do Poder Judiciário
Resumo:
A internação hospitalar da irmã obriga a narradora de O sistema dos Anjos a realizar uma viagem às pressas do Rio de Janeiro para uma cidade ao sul do Brasil. A partir deste deslocamento, histórias da infância, da adolescência e do início da vida adulta vão surgindo na memória da viajante. A dissertação, em forma de romance, foi estruturada a partir de duas narrativas, ambas escritas em primeira pessoa, que formam um sistema único e colocam em dúvida a identidade daquela que está narrando. Quem o eu, quem o outro é o fio invisível que atravessa essa ficção composta de capítulos que ambientam diferentes fases, desde a gênese da família dos Anjos até a sua dissolução
Resumo:
Study of emotions in human-computer interaction is a growing research area. This paper shows an attempt to select the most significant features for emotion recognition in spoken Basque and Spanish Languages using different methods for feature selection. RekEmozio database was used as the experimental data set. Several Machine Learning paradigms were used for the emotion classification task. Experiments were executed in three phases, using different sets of features as classification variables in each phase. Moreover, feature subset selection was applied at each phase in order to seek for the most relevant feature subset. The three phases approach was selected to check the validity of the proposed approach. Achieved results show that an instance-based learning algorithm using feature subset selection techniques based on evolutionary algorithms is the best Machine Learning paradigm in automatic emotion recognition, with all different feature sets, obtaining a mean of 80,05% emotion recognition rate in Basque and a 74,82% in Spanish. In order to check the goodness of the proposed process, a greedy searching approach (FSS-Forward) has been applied and a comparison between them is provided. Based on achieved results, a set of most relevant non-speaker dependent features is proposed for both languages and new perspectives are suggested.
Resumo:
O presente trabalho objetiva discorrer acerca do potencial semântico-expressivo do predicativo, bem como de seu perfil modalizador. Enxergamos essa função sintática como um elemento modalizante em essência, já que, em muitos casos, o falante consegue demonstrar sua opinião por meio de seu uso, agregado a escolhas lexicais convenientes. Em muitas partes da dissertação, a semântica e a estilística conseguem explicar melhor o fenômeno modal do predicativo. A sintaxe não dá conta disso sozinha. Falamos ainda da topicalização do predicativo como um recurso modalizador, bem como da noção de balizamento.Usamos também como exemplos um corpus exemplificativo heterogêneo para mostrar que o predicativo, topicalizado ou não, funciona como recurso modalizador, semântico e expressivo
Resumo:
A linguagem veiculada pela mídia eletrônica, produzida por jovens em salas de bate-papo, vem causando reações adversas em vários setores da sociedade brasileira, tais como os da lingüística, filosofia, educação, psicologia, psiquiatria e do direito. Jornais e revistas, freqüentemente, divulgam a perplexidade de muitos diante dessa linguagem. Em virtude disso, abriu-se um campo fecundo de investigação científica na área de estudos da língua portuguesa. O objetivo desta dissertação é investigar não só os elementos gramaticais dos enunciados/discursos concernentes ao corpus, mas, além disso, extrapolar as fronteiras da morfossintaxe, que opera no plano da descrição da frase, em direção à análise de discurso, que opera no plano da interpretação, do modo como são construídos os discursos, da materialidade discursiva e das condições de produção deste. O corpus é constituído de textos do gênero chat, produzidos por jovens, entre treze e dezesseis anos, matriculados em uma escola particular do Rio de Janeiro. Para abordar um uso conversacional da língua portuguesa no chat, do ponto vista discursivo, optou-se pelo quadro teórico de Jacqueline Authier-Revuz, com o fito de interpretar questões, tais como: formas de heterogeneidade mostrada e marcada; interdiscurso; negação do enunciador estratégico; distinção entre o sujeito cartesiano (homogêneo e transparente) e o sujeito não-cartesiano (heterogêneo e opaco); discurso direto (em que a alteridade transparece no enunciado/discurso do locutor, que dá lugar ao discurso de um outro em seu próprio discurso); e conotação autonímica. A metodologia adotada parte do campo das ciências humanas como uma pesquisa de cunho qualitativo. Em suma, é possível encontrar, nesta dissertação, a reflexão diluída dos conteúdos teóricos que contemplam a Gramática da Língua Portuguesa e a Análise de Discurso
Resumo:
Esta tese propõe uma reflexão sobre o ensino da hipérbole na escola, adequada às exigências do ensino de língua materna, consoante ao papel que língua e linguagem exercem na interação verbal. Inicia-se com a investigação de disciplinas lingüísticas que entendem o texto como prática discursiva alternada entre interlocutores mutuamente influenciados, e se estende à análise produtiva da hipérbole na construção argumentativa do enunciador. Aproveita a (quase) consolidada presença do texto jornalístico em sala de aula, como veículo de informação, e acrescenta o estudo discursivo das hipérboles como estratégia do enunciador das colunas políticas e editoriais jornalísticos, no diálogo textual. Busca a identificação das pistas deixadas pelo enunciador, em marcas formais, com a intenção de (inter)agir sobre o leitor. Oferece possíveis leituras das palavras utilizadas pelo jornalista, considerando os vários elementos constitutivos da cena enunciativa; apresenta a possibilidade de aplicação de alguns conteúdos gramaticais em estrutura discursiva textual e sugere exercícios de compreensão e produção de texto
Resumo:
Neste estudo qualitativo, objetiva-se descrever os usos do conector mas em um corpus de mediação endoprocessual, à luz da Linguística Cognitiva, baseando-se, sobretudo, na Teoria da Metáfora Conceptual e nos conceitos de categorização, esquemas imagéticos e modelos cognitivos idealizados (MCIs). Investigam-se as bases cognitivas que fundamentam os sentidos do mas e a função argumentativa desse conector na mediação, a partir de duas hipóteses gerais, a saber: (i) defende-se que o conector mas funciona como um gatilho para a ativação do MCI de guerra, em termos do qual é conceptualizado o conceito de discussão, como afirmam Lakoff e Johnson (2002[1980]); e (ii) acredita-se que tal conector possa ser caracterizado como uma categoria radial, formada a partir dos diferentes esquemas imagéticos que fundamentam as ocorrências desse elemento na interação. Tendo em vista essas hipóteses, objetiva-se: (i) apontar as funções argumentativas do mas na mediação, sinalizadas pelos mapeamentos metafóricos ativados durante a discussão e (ii) descrever os sentidos evidenciados pelos usos do mas no gênero analisado, os quais são evocados pelos diferentes esquemas imagéticos em que se baseiam. Os resultados indicam que esse conector pode ser compreendido como uma categoria radial, formada a partir de esquemas de força distintos. Além disso, verifica-se que os três usos mais próximos ao centro da categoria relacionam-se fortemente a um confronto ou a uma disputa de posição entre os participantes da interação, enquanto os três mais periféricos são estreitamente ligados a uma estratégia de manutenção da posição argumentativa do falante. Considera-se que esta pesquisa possa colaborar para o estudo do conector mas, devido à observação do comportamento semântico-discursivo desse item em um gênero pouco contemplado, a mediação; e, devido à escolha do paradigma adotado, que permite analisar o conector em todas as suas ocorrências, não havendo necessidade de separar os usos chamados de interfrásticos daqueles denominados inícios acessórios ou pré-começos
Resumo:
O desenvolvimento de habilidades de comunicação em médicos tem sido apontado como uma necessidade e uma competência fundamental para o exercício da medicina. A empatia é uma habilidade interpessoal que pode ser descrita como a capacidade de compreender o ponto de vista e os sentimentos de uma outra pessoa sem julgá-los e de comunicar esse entendimento de modo que a pessoa que fala se sinta verdadeiramente compreendida pela pessoa que ouve. Essa habilidade promove um senso de validação na pessoa que fala, especialmente em situações de conflito, reduzindo a probabilidade de rompimento e fortalecendo os vínculos interpessoais. A empatia dos médicos é atribuída à sua educação pessoal, sendo raro o desenvolvimento dessa competência social durante o curso de formação médica. O desconhecimento sobre essa habilidade e sua função no exercício profissional motivou a realização deste estudo sobre a empatia em médicos que atuam em diferentes contextos de atenção à saúde no município do Rio de Janeiro. Participaram desta pesquisa 75 profissionais, dos quais 25 atuavam no nível da Atenção Primária, composto por equipes de saúde da família e por centros municipais de saúde; 12 pertenciam a unidades mais especializadas que correspondem ao nível de Atenção Secundária e 38 trabalhavam nos ambulatórios de hospitais universitários da Atenção Terciária. Foi aplicado o Inventário de Empatia (I.E.), que avalia os quatro fatores que compõem a habilidade empática: 1) Tomada de Perspectiva: capacidade de compreender o ponto de vista e os sentimentos da outra pessoa; 2) Flexibilidade Interpessoal: capacidade de aceitar perspectivas muito diferentes das próprias; 3) Altruísmo: capacidade de suspender temporariamente as próprias necessidades em função do outro; 4) Sensibilidade Afetiva: sentimento de compaixão e de preocupação com o outro. Os resultados mostraram que o grupo avaliado obteve médias semelhantes às apresentadas nos dados normativos do I.E. nos fatores Tomada de Perspectiva e Flexibilidade Interpessoal, enquanto superou a média no fator Altruísmo e ficou abaixo da média no fator Sensibilidade Afetiva. Esses dados indicam que a amostra de médicos avaliada possui uma capacidade mais acentuada de sacrificar suas próprias necessidades para atender ao outro, ainda que não associada necessariamente a um sentimento de compaixão equivalente. Isto pode estar relacionado com a reduzida importância dada ao aspecto emocional na formação médica. Em relação à avaliação da empatia por contexto de atenção em saúde, não foi encontrada diferença significativa entre os grupos com exceção do fator Tomada de Perspectiva. Neste componente, os médicos do Programa Saúde da Família destacaram-se significativamente do grupo de Atenção Secundária, o que parece estar relacionado com a proximidade do profissional com o contexto de vida do paciente e com a educação continuada que recebem através de treinamentos e capacitações onde são valorizadas as habilidades de comunicação desses profissionais. A partir desses resultados propõe-se que o desenvolvimento da empatia seja incluído nos cursos de formação médica e no planejamento das condições de trabalho nos diversos níveis de atenção à saúde.
Resumo:
Os textos de caráter instrucional apresentam como fator comum a estipulação de procedimentos, feitos por um locutor com vistas a levar os interlocutores a determinado objetivo relacionado ao seu uso. A execução de tarefas, por parte dos indivíduos, é fator condicional para o atingimento das finalidades de uso dos mesmos. Entretanto, ao predispor os procedimentos, na superfície textual, ocorrem discrepâncias acerca da forma como as tarefas são informadas, de modo a evidenciar uma maior ou menor rigidez quanto ao nível impositivo dos procedimentos. A fim de analisar como essas especificidades afetarão a produção dos sentidos na leitura, escolheram-se quatro gêneros de caráter instrucional, a saber: a receita, a bula, o manual técnico e o contrato para verificar como se dá a predisposição dos procedimentos feitos, essencialmente, por meio de frases imperativas e declarativas. A pesquisa se propõe a cotejar as marcas linguísticas de cada um dos textos, inerentes às frases de procedimentos com fatores interlocutivos pressupostos pela teoria dos atos de fala. Para tanto, verifica-se o enfoque teórico dado, sobretudo pelos seguintes autores: Austin (1962), Searle (2002), Said Ali(1964), Bechara (1977), Cunha (1978), Rocha Lima(1976) e Azeredo (2011), de modo a mostrar uma análise dos elementos textuais e interlocutivos na composição discursiva dos enunciados escolhidos. A pesquisa mostrou a existência da relação entre a forma como sentidos são assumidos e as atitudes de instruir e acatar dos indivíduos, a partir das frases usadas nos textos para instruir
Resumo:
[EN] This article presents a detailed study of the present-day use of the Basque discourse marker "erran/esan nahi baita" (‘that is to say’). This is an explanatory reformulator by means of which the speaker presents a reformulation of something said in the previous utterance (either a clause that forms part of the current sentence, or the preceding sentence) in order to express it more clearly or explain it. In the article I will examine the marker’s values; literary tradition; form and origin; present-day variants; equivalent expressions; position; punctuation; syntax; frequency, medium (written or spoken), register and text type; equivalents in other languages; and discourse value.