20 resultados para Reconhecimento : Fala

em Universidade Federal do Pará


Relevância:

40.00% 40.00%

Publicador:

Resumo:

O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.

Relevância:

40.00% 40.00%

Publicador:

Resumo:

Este trabalho visa propor uma solução contendo um sistema de reconhecimento de fala automático em nuvem. Dessa forma, não há necessidade de um reconhecedor sendo executado na própria máquina cliente, pois o mesmo estará disponível através da Internet. Além do reconhecimento automático de voz em nuvem, outra vertente deste trabalho é alta disponibilidade. A importância desse tópico se d´a porque o ambiente servidor onde se planeja executar o reconhecimento em nuvem não pode ficar indisponível ao usuário. Dos vários aspectos que requerem robustez, tal como a própria conexão de Internet, o escopo desse trabalho foi definido como os softwares livres que permitem a empresas aumentarem a disponibilidade de seus serviços. Dentre os resultados alcançados e para as condições simuladas, mostrou-se que o reconhecedor de voz em nuvem desenvolvido pelo grupo atingiu um desempenho próximo ao do Google.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Sistema Texto-Fala (TTS) é atualmente uma tecnologia madura que é utilizada em muitas aplicações. Alguns módulos de um sistema TTS são dependentes do idioma e, enquanto existem muitos recursos disponíveis para a língua inglesa, os recursos para alguns idiomas ainda são limitados. Este trabalho descreve o desenvolvimento de um sistema TTS completo para português brasileiro (PB), o qual também apresenta os recursos já disponíveis. O sistema usa a plataforma MARY e o processo de síntese da voz é baseado em cadeias escondidas de Markov (HMM). Algumas das contribuições deste trabalho consistem na implementação de silabação, determinação da sílaba tônica e conversão grafema-fonema (G2P). O trabalho também descreve as etapas para a organização dos recursos desenvolvidos e a criação de uma voz em PB junto ao MARY. Estes recursos estão disponíveis e facilita a pesquisa na normalização de texto e síntese baseada em HMM par o PB.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Para compor um sistema de Reconhecimento Automático de Voz, pode ser utilizada uma tarefa chamada Classificação Fonética, onde a partir de uma amostra de voz decide-se qual fonema foi emitido por um interlocutor. Para facilitar a classificação e realçar as características mais marcantes dos fonemas, normalmente, as amostras de voz são pré- processadas através de um fronl-en'L Um fron:-end, geralmente, extrai um conjunto de parâmetros para cada amostra de voz. Após este processamento, estes parâmetros são insendos em um algoritmo classificador que (já devidamente treinado) procurará decidir qual o fonema emitido. Existe uma tendência de que quanto maior a quantidade de parâmetros utilizados no sistema, melhor será a taxa de acertos na classificação. A contrapartida para esta tendência é o maior custo computacional envolvido. A técnica de Seleção de Parâmetros tem como função mostrar quais os parâmetros mais relevantes (ou mais utilizados) em uma tarefa de classificação, possibilitando, assim, descobrir quais os parâmetros redundantes, que trazem pouca (ou nenhuma) contribuição à tarefa de classificação. A proposta deste trabalho é aplicar o classificador SVM à classificação fonética, utilizando a base de dados TIMIT, e descobrir os parâmetros mais relevantes na classificação, aplicando a técnica Boosting de Seleção de Parâmetros.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho de pesquisa lingüística visa a analisar as realizações do sufixo flexional das formas verbais na terceira pessoa do plural do pretérito perfeito do modo indicativo na fala de paraenses residentes em Belém, sob a perspectiva da Sociolingüística Variacionista. Partindo do pressuposto de que a variação é motivada por fatores internos e externos à língua, acrescido ao fato de que a variação é passível de sistematização e análise, com o intuito de sistematizar a variação do fenômeno em estudo, foram arroladas 16 (dezesseis ) variáveis, sendo 13 (treze lingüísticas) e 3 (três) não lingüísticas. Os dados coletados da fala espontânea de moradores da cidade de Belém foram submetidos ao processo computacional Varbrul. Os resultados obtidos das análises estatísticas nos permitem observar a influência desse grupo de fatores na realização das variantes da variável dependente em estudo. Na análise, concernente à variável Conjugação Verbal, os dados indicaram a opção dos falantes pela forma padrão da língua portuguesa, exceto se o vocábulo seguinte à forma verbal for tônico. Notou-se também, a grande influência para a ocorrência obediente à norma culta , o contexto fonológico seguinte à forma verbal, acrescido da fato de que se a forma verbal analisada for precedida de verbo com ditongo nasal com sufixo flexional, haverá maior ocorrência da variável dependente. Analisando os fatores e considerando as variáveis sexo e faixa etária, analisadas separadamente, os resultados apontaram que mulheres e falantes com faixa etária de 15 a 25 anos mostramse obedientes à forma padrão na conjugação de verbos na terceira pessoa do pretérito perfeito do modo indicativo. Com base nos resultados obtidos, concluímos que as variantes da variável dependente analisada neste trabalho seguem regras que obedecem a uma sistematicidade e logicidade , fato este que torna possível sua sistematização e análise.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O artigo trata da questão do econhecimento dos saberes tradicionais no contexto de ambientalização dos movimentos sociais e de territorialização da ação pública que se acompanha habitualmente de uma reivindicação do território de pertencimento de grupos sociais. Esta reivindicação se manifesta como uma reivindicação global que abrange o estatuto das populações tradicionais, o uso da terra, as formas de producão que elas desenvolvem, seu modo de organização coletiva e o reconhecimento de sua identidade em referencia a uma cultura. Para isso é apresentada uma síntese dos debates que acompanham esta reivindicação de reconhecimento no âmbito da Amazônia brasileira e os desafios aos quais este reconhecimento deve responder, em particular sobre os laços entre o território de pertencimento e a cultura dessas populações, entre esta cultura e seus modos de ocupação e de exploração das terras e a eficácia econômica e social do modo de produção que elas têm conseguido conceber. Esta reivindicação interroga a capacidade dos saberes acadêmicos de re-interrogar a relação homem-natureza que lhes têm inspirado. Face a um tal desafio, o projeto de Edgar Morin tem pertinência e permite compreender tudo o que há de utópico em proposições como a das Reservas Extrativistas. Para concluir, voltamos às distinções entre ambientalização verde e ambientalização marrom considerando os recursos naturais enquanto recursos patrimoniais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A atual configuração do mundo do trabalho caracteriza-se pela complexidade e intensificação dos riscos à saúde do trabalhador. A presente tese aborda trabalho e saúde a partir do referencial da psicodinâmica de Dejours, privilegiando a categoria prazer-sofrimento, no contexto do trabalho com automação no Pólo Industrial de Manaus - PIM. Visando situar os aspectos macroeconômicos, apresenta-se a condição sócio-econômica dos operadores e o contexto da reestruturação produtiva do PIM, que se caracterizou por intensificação da automação. O objetivo dessa pesquisa foi analisar a organização de trabalho com automação e seus desdobramentos sobre a saúde dos operadores e das operadoras de máquina de inserção automática, focalizando o prazer-sofrimento e seus reflexos sobre o processo de saúde-adoecimento. Elegeu-se a abordagem qualitativa, em consonância com a fundamentação teórico-metodológica de Dejours. A pesquisa empírica foi realizada na área de inserção automática das duas empresas de origem japonesa, de grande porte, do segmento eletroeletrônico do PIM. Participaram como sujeitos 21 operadores de máquinas (dez de uma e onze de outra empresa). A principal fonte de dados foi a fala dos sujeitos, que responderam a uma entrevista individual semi-estruturada. Para a análise de dados foi realizada uma articulação da sistemática da Grounded Theory à base psicodinâmica, como opção de técnica qualitatativa adequada a entrevistas individuais. A preocupação com a “qualidade” se destacou como categoria central, mostrando-se presente em todas as esferas da organização de trabalho e modulando a vivência de prazer-sofrimento: dentre as principais fontes de prazer, realizar o trabalho com perfeição foi reiteradamente mencionado; em contrapartida, o medo de errar é uma das principais fontes de sofrimento, causa permanente de tensão, agravante do risco de adoecimento. O prazer provém da identificação com a tarefa de operar máquinas, de alta tecnologia, sem cometer erros; aprender mais e dominar a “tecnologia de ponta” é uma fonte de mobilização subjetiva. O sofrimento decorre da sobrecarga de trabalho, mal remunerado, sob intensa pressão por “qualidade”. Para suportar o sofrimento, os trabalhadores constroem estratégias coletivas de defesa: usam gracejos direcionados aos colegas que cometem erros, interpretados como recurso para reduzir o sofrimento originário do medo de falhar. Utilizam ainda grande diversidade de estratégias individuais de defesa, reflexo do individualismo. O reconhecimento, considerado na psicodinâmica como via privilegiada para a ressignificação do sofrimento, é pouco presente: menos de metade dos operadores se considera devidamente reconhecido por seu trabalho; mencionam os baixos salários como evidência da falta de reconhecimento. Em uma das empresas também falta o reconhecimento simbólico, agravando o sofrimento. O predomínio do sofrimento sobre o prazer no trabalho conduz a um desequilíbrio que resulta no uso exacerbado de defesas: manifestam-se as patologias sociais do trabalho, dentre as quais foi identificada a patologia da sobrecarga, relacionada à carga excessiva de trabalho que é importa aos operadores e às operadoras, pois à aquisição de máquinas corresponde a redução de pessoas. O sofrimento no trabalho, no PIM, está sendo intensificado com a automação, inserida no contexto de super-exploração do trabalho, integrante da organização flexível do capital.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta dissertação apresenta a implementação de navegação no ambiente virtual, reconhecimento de gestos e controle de interface, feitos através do dispositivo Kinect, no Sistema ITV: um sistema de treinamento de operadores e mantenedores de usinas hidrelétricas e subestações elétricas. São mostrados, também, determinados aperfeiçoamentos recentes, como conversão em vídeo, telas de alarmes sonoros e visuais, ambientação sonora em três dimensões e narração do processo. Além da apresentação do Sistema ITV, são expostos o dispositivo Kinect e o algoritmo utilizado na comparação dos padrões de movimento, o DTW. Em seguida, são abordados em detalhes o projeto e a implementação da navegação, do reconhecimento de gestos e do controle de interface. Como estudo de caso, é exibida uma Instrução Técnica Virtual (ITV), elaborada especialmente para testar e avaliar a nova interface proposta. Posteriormente, são apresentados os resultados, considerados satisfatórios, obtidos através da análise de questionários qualitativos aplicados a estudantes da Universidade Federal do Pará. Por fim, são realizadas as considerações referentes a este trabalho e expostas idéias de trabalhos futuros.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Comumente, as abordagens de Educação Ambiental (EA) são baseadas em discussões estabelecidas nos encontros que aconteceram fora do Pará. Levantar as experiências em nível local seria mais enriquecedor, uma vez que estaríamos tratando de assuntos pertinentes à nossa realidade e, portanto, mais atraente para os nossos alunos. Nesse contexto, levantei a minha questão de investigação: Como se deu a constituição da EA no Pará a partir do olhar dos seus pioneiros? Assim, tracei como objetivo desta dissertação: obter informações sobre o histórico da E A em nosso Estado, a partir da fala de seus pioneiros; caracterizar as concepções e as práxis presentes na estruturação de EA no Pará e verificar como é que os discursos de EA elaborados em escala mundial e nacional são compreendidos/entendidos pela fala dos pioneiros. Como instrumento investigativo, optei pela pesquisa qualitativa, baseada nas narrativas de cinco professores que se dedicaram/dedicam ao trabalho de implantação e de implementação da EA no estado do Pará e que estão ligados direta ou indiretamente à UFPA. Para coletados depoimentos, foram utilizadas entrevistas, com 12 questões semiestruturadas, gravadas em áudio, salvas em CD ROM e, posteriormente, transcritas. Além das entrevistas, lancei mão de meu diário de campo como fonte de informação, que foi construído ao longo da pesquisa por meio de percepções sobre os sujeitos e seus contextos, além dos registros de ocorrências diversas, no âmbito da pesquisa. Na busca da produção de novas compreensões das narrativas investigadas, apropriei-me da Análise Textual Discursiva para sistematizar as manifestações dos sujeitos, levando em consideração as peculiaridades e as singularidades de cada entrevistado, a qual deu forma a três eixos temáticos, que trato nesta investigação: i) O contexto dos educadores pioneiros em EA no Pará: constituição e práxis; ii) O cenário da criação da EA no estado do Pará e iii) Os paraenses com relação ao trato e ao relacionamento com o patrimônio ambiental: o resultado das bases fincadas. Na análise dos resultados foi possível constatar que eventos internacionais, associados à história da EA, ocorridos principalmente a partir da década de 1970, repercutiram intensamente nas formações dos entrevistados. Na mesma década, no estado do Pará, contatei várias ações de grupos pioneiros e iniciativas isoladas por parte do estado, o qual elaborou leis e programas, visando dar sistematicidade ao emprego de abordagens da EA. Neste contexto, considero que as estratégias historicamente utilizadas para a organização, implantação e difusão da EA em nosso estado - tanto em nível governamental como não governamental e no ensino formal e não formal -, foram elaboradas de forma desarticuladas e descontínuas. Considerei, como motivações para que os entrevistados iniciassem a jornada pelos caminhos da EA, os itens: relevância do meio ambiente para manutenção da vida no planeta e interesses pessoal e profissional. Por fim, percebi a grande contribuição que os entrevistados deram para a implantação e implementação da EA no Pará, quando em “seus agir” procuraram ressignificar os conhecimentos das determinações apregoadas nos documentos oficiais em EA, em nível mundial nacional e local, para lastrear as sua ações ambientalistas, na realidade paraense.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Um dos problemas enfrentados pelos médicos na assistência a doentes com câncer refere-se aos dilemas relacionados à comunicação sobre a doença, especialmente pela associação ainda presente no imaginário social à idéia de morte e sofrimento, conferindo ao diagnóstico uma importante dimensão simbólica. Interpretado como uma construção social, o tema do diagnóstico do câncer é analisado com base na experiência de médicos que atuam no Hospital Ophir Loyola (PA), referência estadual no tratamento do câncer, compreendendo um total de 20 informantes, que concordaram em participar de entrevistas cujo enfoque era a comunicação sobre o diagnóstico, incluindo o enunciado inicial da doença e as informações dele derivadas. Por meio de uma abordagem sócio-antropológica, são analisadas diferentes variáveis, do doente, do médico, da família e da doença, incluindo algumas particularidades referentes aos contextos público e privado. Os dados sugerem que a relação do médico com o doente é influenciada pela condição de classe, com determinantes sócio-históricos e culturais, que tornam a comunicação um fenômeno complexo, agravado pelo limitado acesso aos serviços de saúde, contribuindo para que grande parte dos doentes já cheguem ao Hospital sem possibilidade de cura. Os resultados obtidos evidenciaram que, na realidade pesquisada, a influência da família no processo de decisão foi relevante para determinar os limites entre o dizer e o não dizer sobre a doença, incluindo o enunciado do diagnóstico e do prognóstico. A perda da esperança foi freqüentemente citada como um requisito para a não divulgação de informações, especialmente nos casos em que a doença está em uma fase avançada, havendo um maior silenciamento à medida que a doença progride.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O trabalho apresenta o universo da linguagem jurídica sob o ponto de vista da semiótica do direito. Traz à análise as formulações argumentativas traduzidas pela retórica e visa mostrar como estas estabelecem tensões sociais a partir da relação que envolve os vários componentes do discurso do direito que se encontram nas funções de legitimação, neutralização, dominação, e delimitação da ordem idealizada pelo Estado. Faz uma análise do discurso e da retórica, à luz da racionalidade e da fundamentação que servem à legitimação exercida pela norma a partir do exame de material processual arquivado em sede de diversos órgãos da justiça na capital, Belém, e em alguns municípios no Pará, e em entrevistas. Tem como referência as contradições entre o sistema de racionalidade jurídica e a forma como o mesmo ganha vida no plano da concreção, identifica como a produção do direito remete à questão da democracia e do Estado de direito, concebidos pelo discurso, que pode aproximar ou afastar a justiça do cidadão.