858 resultados para Reconhecimento de Faces
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
Resumo:
Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.
Resumo:
A pesquisa tem como objetivo central investigar as propostas de formação do professor/pesquisador em Educação Física nos diferentes Programas de Pós- Graduações em Educação Física no Brasil: 1. Programa de Pós-Graduação em Ciências da Atividade Física da Universidade Salgado Filho - PGCAF/UNIVERSO; 2. Programa de Pós-Graduação em Ciências do Esporte da Universidade Federal de Minas Gerais - PPCE/UFMG: 3. Programa de Pós-Graduação em Ciências do Movimento Humano da Universidade Federal do Rio Grande do Sul - PPGMH/UFRGS; 4. Programa de Pós-Graduação em Motricidade Humana da Universidade Paulista - PPGCM/UNESP: 5. Programa de Pós-Graduação em Educação Física da Universidade de São Paulo PPGEF/USP. Pesquisa documental e bibliográfica teve como bases para investigação arquivos oferecidos pela CAPES acerca da classificação e denominações dos programas assim como o projeto pedagógico de cada instituição, conteúdo das revistas e sites dos programas e a bibliografia referente ao assunto. A pesquisa se insere dentro do paradigma de pesquisa critica assentada no materialismo histórico dialético, como mote cientifico, reflexão filosófica e posicionamento político. Com o resultado identificamos que as diferentes concepções de programas na área, variam de propostas que abrangem um amplo campo de pesquisas e atuação à aquelas que restringem o campo, variantes que remontam as inúmeras propostas de Educação física surgidas nas décadas de 1970 e 1980.
Resumo:
O objetivo a ser alcançado na dissertação Faces do Trágico na Personagem Miguel dos Santos Prazeres da Tetralogia Monteiriana é apontar, mediante estudo de três das quatro obras que compõem a tetralogia, as características que fazem da personagem Miguel um herói trágico. Para tal escopo, será feita uma análise bibliográfica em que se congregam várias áreas do saber. A filosofia, assim como a história, embasa o trabalho servindo de sustentáculo a análise realizada. A sociologia também auxilia essa pesquisa na medida em que a investigação se estende a uma personagem localizada no tempo e em um espaço social.Quanto à literatura e crítica literária são referências necessárias por se tratar de um trabalho estético. Dentre os teóricos que foram utilizados, estão Aristóteles, Immanuel Kant, Walter Benjamin, Herbert Marcuse, Friedrich Schiller e Friedrich Nietzsche, Antonio Candido, Georg Hegel, Luiz Costa Lima, Georg Lukács, Roberto Machado, Michel Maffesoli, Octávio Ianni, Benedito Nunes, Anthony Giddens, etc. Pretende-se ainda que essa exposição seja veiculada a partir da inserção das obras dentro do contexto histórico e político da Ditadura Militar ocorrida no Brasil entre os anos de 1964 e 1985. Destaque-se que, a condição do estado de exceção, vivenciada pelo país, não representa apenas uma questão metodológica, mas concorre decisivamente para a consequente tragicidade de Miguel dos Santos Prazeres.
Resumo:
O artigo trata da questão do econhecimento dos saberes tradicionais no contexto de ambientalização dos movimentos sociais e de territorialização da ação pública que se acompanha habitualmente de uma reivindicação do território de pertencimento de grupos sociais. Esta reivindicação se manifesta como uma reivindicação global que abrange o estatuto das populações tradicionais, o uso da terra, as formas de producão que elas desenvolvem, seu modo de organização coletiva e o reconhecimento de sua identidade em referencia a uma cultura. Para isso é apresentada uma síntese dos debates que acompanham esta reivindicação de reconhecimento no âmbito da Amazônia brasileira e os desafios aos quais este reconhecimento deve responder, em particular sobre os laços entre o território de pertencimento e a cultura dessas populações, entre esta cultura e seus modos de ocupação e de exploração das terras e a eficácia econômica e social do modo de produção que elas têm conseguido conceber. Esta reivindicação interroga a capacidade dos saberes acadêmicos de re-interrogar a relação homem-natureza que lhes têm inspirado. Face a um tal desafio, o projeto de Edgar Morin tem pertinência e permite compreender tudo o que há de utópico em proposições como a das Reservas Extrativistas. Para concluir, voltamos às distinções entre ambientalização verde e ambientalização marrom considerando os recursos naturais enquanto recursos patrimoniais.
Resumo:
A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.
Resumo:
Estudo sobre a relação universidade e sociedade na ótica da Extensão Universitária da UFPA, com análise de três dimensões: a política institucional, a formação e valorização acadêmica e a relação com a sociedade. Buscou-se, com isso, compreender como acontece a Extensão Universitária na instituição, bem como verificar qual a contribuição dessa atividade para os atores diretamente envolvidos em projetos extensionistas. A investigação foi realizada em três projetos em desenvolvimento na UFPA: Projeto Riacho Doce (PRD), Projeto Rádio-Ação (PRA) e Projeto Atenção Integral em Saúde Bucal na Creche Sorena (PAISB), que são representativos das áreas temáticas educação, cultura e saúde. Adotou-se na investigação a abordagem qualitativa e quantitativa e, como técnicas, a observação participante nos projetos, a realização de entrevistas e a aplicação de questionários com a gestora da extensão, docentes, discentes da UFPA, comunidades atendidas pelos projetos e parceiro do PRD. Verificou-se que a Extensão Universitária na UFPA está em processo de construção de sua validade institucional e foi fortalecida nesta última década pelo Fórum de Pró-Reitores de Extensão das Universidades Brasileiras, apontado como a principal referência no âmbito das concepções e formas de organização dos programas e projetos extensionistas na instituição. Prevalece, nos sujeitos pesquisados, uma concepção de Extensão muito arraigada aos modelos tradicionais, embora novos elementos tenham sido adicionados a ela, levando a compreensão dessa atividade como acadêmica e integradora. Observou-se, ainda, a emergência de modelos diferenciados de fazer Extensão, que se concretizam em estruturas organizacionais diversas, cujo objetivo principal é alongar seu ciclo de vida. Os docentes e discentes são unânimes em destacar a importância dessa atividade para a sua formação pessoal, acadêmica e profissional, embora muitos entraves sejam apontados nesse processo. Por fim, o estudo apontou que existem canais de comunicação da universidade com a sociedade que precisam ser ampliados para se constituírem em fóruns privilegiados de encaminhamentos das atividades extensionistas. Conclui-se que é possível vislumbrar o fortalecimento acadêmico e social da Extensão, ainda que vários fatores sejam necessários para o seu alcance no cenário educacional.
Resumo:
Pós-graduação em Letras - FCLAS
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
A monitorização ambulatorial do eletrocardiograma (ECG) permite seguir as atividades cotidianas do paciente durante períodos de 24 horas (ou ainda maiores) possibilitando o estudo de casos que pudessem ter episódios arrítmicos fatais. Entretanto, o maior desafio tecnológico que este tipo de monitorização enfrenta é a perda de informação pela presença de ruídos e artefatos quando o paciente se move. A análise do intervalo QT de despolarização e repolarização ventricular do eletrocardiograma superficial é uma técnica não invasiva com um grande valor para a diagnose e prognósticos de cardiopatias e neuropatias, assim como para a predição da morte cardíaca súbita. A análise do desvio padrão do intervalo QT proporciona informação sobre a dispersão (temporal ou espacial) da repolarização ventricular, entretanto a influencia do ruído provoca erros na detecção do final da onda T que são apreciáveis devido ao fato dos valores pequenos do desvio padrão do QT tanto para sujeitos patológicos e quanto para os sãos. O objetivo geral desta tese é melhorar os métodos de processamento do sinal de ECG ambulatorial usando inteligência computacional, especificamente os métodos relacionados com a detecção do final da onda T, e os de reconhecimento morfológico de batimentos que invalidam a análise da variabilidade do intervalo QT. É proposto e validado (em termos de exatidão e precisão) um novo método e algoritmo para estimar o final da onda T baseado no calculo de áreas de trapézios, empregando sinais da base de dados QT da Physionet. O desempenho do método proposto foi testado e comparado com um dos métodos mais usados para detectar o final da onda T: o método baseado no limiar na primeira derivada. O método de inteligência computacional sugerido combina a extração de características usando o método de análise de componentes principais não lineares e a rede neural de tipo perceptron multicamada. O método de áreas de trapézios teve um bom desempenho em condições ruidosas e não depende de nenhum limiar empírico, sendo adequado para situações com níveis de elevados de ruído de banda larga. O método de reconhecimento morfológico de batimentos foi avaliado com sinais ambulatoriais com e sem artefatos pertencentes a bases de dados de prestigio internacional, e mostrou um bom desempenho.
Resumo:
Esta dissertação tem por objetivo discutir parcela da trajetória do escritor Haroldo Maranhão (1927-2004), revelada à luz dos documentos pertencentes ao seu arquivo pessoal. O estudo se organiza tendo em vista três perspectivas: o Haroldo Maranhão leitor, possuidor de um acervo bibliográfico acumulado ao longo de anos, o Haroldo Maranhão jornalista, nascido e formado profissionalmente no seio de um clã que por meio século esteve à frente de um dos jornais mais influentes da capital paraense, a Folha do Norte, e o Haroldo Maranhão escritor, em seus freqüentes embates com as práticas que regem a lógica do mundo editorial.
Resumo:
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.
Resumo:
Esta dissertação apresenta a implementação de navegação no ambiente virtual, reconhecimento de gestos e controle de interface, feitos através do dispositivo Kinect, no Sistema ITV: um sistema de treinamento de operadores e mantenedores de usinas hidrelétricas e subestações elétricas. São mostrados, também, determinados aperfeiçoamentos recentes, como conversão em vídeo, telas de alarmes sonoros e visuais, ambientação sonora em três dimensões e narração do processo. Além da apresentação do Sistema ITV, são expostos o dispositivo Kinect e o algoritmo utilizado na comparação dos padrões de movimento, o DTW. Em seguida, são abordados em detalhes o projeto e a implementação da navegação, do reconhecimento de gestos e do controle de interface. Como estudo de caso, é exibida uma Instrução Técnica Virtual (ITV), elaborada especialmente para testar e avaliar a nova interface proposta. Posteriormente, são apresentados os resultados, considerados satisfatórios, obtidos através da análise de questionários qualitativos aplicados a estudantes da Universidade Federal do Pará. Por fim, são realizadas as considerações referentes a este trabalho e expostas idéias de trabalhos futuros.