19 resultados para RECONHECIMENTO DE IMAGEM

em Universidade Federal do Pará


Relevância:

20.00% 20.00%

Publicador:

Resumo:

O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho se apresenta como uma abordagem da palavra e da imagem e suas possibilidades de encontros em textos literários e cinematográficos a partir da noção de escritura. Sua construção se dá de modo a não seguir um percurso histórico destes encontros, no sentido de não fazer exatamente levantamentos cronológicos de termos ou correntes que abordassem o texto literário e cinematográfico enquanto escritura de imagens, mas sim pela perspectiva de sua inscrição como imagem mental. Neste aspecto, a leitura e escritura se dão como tradução, passagem e passeio de sentidos que o texto produz, não enclausurando uma sua percepção ancorada em uma compreensão fechada. Tomando a escritura como ponto de partida para a leitura da imagem e da palavra em textos literários e cinematográficos, parte-se para uma discussão de tópicos da teoria e crítica em amplas vertentes, privilegiando uma organização transversal deste material que parte de um conjunto de teoria de forte marcação transdisciplinar, promovendo também um encontro de campos da Teoria Literária com as Artes Visuais, Cinema, Vídeo, Pintura, Filosofia, História, entre outros. A noção de escritura adotada neste trabalho tornou importante tecer algumas considerações a partir de certas ideias de Roland Barthes e Jacques Derrida, entre outros estudiosos e comentadores do termo. Outro termo que atravessa o trabalho é a noção de tradução, aqui tomadas a partir da leitura de autores como Márcio Seligmann-Silva, Walter Benjamin, Jacques Derrida, Paul Valery, entre outros. As distinções destes termos não se devem a um esforço para delimitar os espaços dos campos de estudos, mas sim para afirmar justamente uma sua perspectiva de abertura, ou de aberturas, além do que há o entendimento de que a filiação a certos pensamentos, teorias e autores já configuram a marcação de um lugar do pensamento, lugar político, inclusive. A opção por estas concepções imprime nos corpos dos objetos de estudo, a escritura literária e a cinematográfica, uma diferença bem mais de acordo com o caráter dinâmico e movente destes objetos, produzindo um redimensionamento teórico de forte marcação política. Também interessa neste trabalho discutir tópicos dos estudos literários de maneira a permitir o atravessamento pelas outras disciplinas. A partir destas linhas gerais, o trabalho se completou com leituras de textos literários e cinematográficos, textos estes de forte caráter plural em que o encontro entre a imagem e a palavra é promovido pela escritura, constituindo também um encontro entre as teorias e as modalidades artísticas, primando por um atravessamento das teorias e pensamentos desenvolvidos ao longo da escritura do trabalho, em um tratamento ensaístico e de forte marcação intertextual, fazendo destas leituras um exercício de abertura dos textos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho trata de duas artes, Literatura e Cinema. Embora autônomas e específicas, traduzem-se em textos distintos, relações de identificação e ao mesmo tempo afastamento de uma obra em relação à outra. Nossa abordagem tem, como ponto de partida, o texto literário "O Leopardo", do escritor italiano Giuseppe Tomasi di Lampedusa e, como ponto de chegada, a obra cinematográfica homônima do cineasta, também italiano, Luchino Visconti. Lampedusa produziu uma obra que só ganharia reconhecimento postumamente. Nela, criou um discurso narrativo através do qual põe em destaque a História e a representação da sociedade. Apesar de ter nos legado uma obra pequena, caracteriza-se por apresentar um estilo próprio, marcado por requintes de liberdade e recriação da palavra. Luchino Visconti, o mais requintado criador da sétima arte de seu tempo, transpôs, com rigor, para a tela, importantes obras de renomados escritores. Seus filmes traduzem uma precisa visão histórica e aristocrática. A narrativa cinematográfica mescla ousadia e criatividade, desafiando a escritura ao arquitetá-la em magníficas imagens, cumprindo com o (quase) intuito da fidelidade a abstração da imagem literária.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Em Capanema, no nordeste do Pará, mulheres rezadeiras, motivadas por fotografias, tecem narrativas históricas desvelando trajetórias de migrantes nordestinos para o município, elaborando representações do conflituoso cotidiano da vida urbana. Por meio de sensibilidades urdidas em simbiose de corpo, voz e imagens, as narradoras produzem práticas de leitura que permitem questionar a escrita convencional da história local, consagrada nos jogos mentais de centenas de moradores. Este artigo, portanto, seguindo a metodologia da História Oral e dialogando com intelectuais dos Estudos Culturais e Antropologia da Religião, ao cruzar a leitura de imagens oficiais com a interpretação dada pelas rezadeiras sobre tramas e dramas da urbe, numa perspectiva "vista de baixo" e popular, esgarça imaginários cristalizados, trazendo para a escrita da história outras experiências e paisagens culturais comumente postas nas dobras de retratos emoldurados pelo discurso do poder hegemônico.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O artigo trata da questão do econhecimento dos saberes tradicionais no contexto de ambientalização dos movimentos sociais e de territorialização da ação pública que se acompanha habitualmente de uma reivindicação do território de pertencimento de grupos sociais. Esta reivindicação se manifesta como uma reivindicação global que abrange o estatuto das populações tradicionais, o uso da terra, as formas de producão que elas desenvolvem, seu modo de organização coletiva e o reconhecimento de sua identidade em referencia a uma cultura. Para isso é apresentada uma síntese dos debates que acompanham esta reivindicação de reconhecimento no âmbito da Amazônia brasileira e os desafios aos quais este reconhecimento deve responder, em particular sobre os laços entre o território de pertencimento e a cultura dessas populações, entre esta cultura e seus modos de ocupação e de exploração das terras e a eficácia econômica e social do modo de produção que elas têm conseguido conceber. Esta reivindicação interroga a capacidade dos saberes acadêmicos de re-interrogar a relação homem-natureza que lhes têm inspirado. Face a um tal desafio, o projeto de Edgar Morin tem pertinência e permite compreender tudo o que há de utópico em proposições como a das Reservas Extrativistas. Para concluir, voltamos às distinções entre ambientalização verde e ambientalização marrom considerando os recursos naturais enquanto recursos patrimoniais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta dissertação apresenta a implementação de navegação no ambiente virtual, reconhecimento de gestos e controle de interface, feitos através do dispositivo Kinect, no Sistema ITV: um sistema de treinamento de operadores e mantenedores de usinas hidrelétricas e subestações elétricas. São mostrados, também, determinados aperfeiçoamentos recentes, como conversão em vídeo, telas de alarmes sonoros e visuais, ambientação sonora em três dimensões e narração do processo. Além da apresentação do Sistema ITV, são expostos o dispositivo Kinect e o algoritmo utilizado na comparação dos padrões de movimento, o DTW. Em seguida, são abordados em detalhes o projeto e a implementação da navegação, do reconhecimento de gestos e do controle de interface. Como estudo de caso, é exibida uma Instrução Técnica Virtual (ITV), elaborada especialmente para testar e avaliar a nova interface proposta. Posteriormente, são apresentados os resultados, considerados satisfatórios, obtidos através da análise de questionários qualitativos aplicados a estudantes da Universidade Federal do Pará. Por fim, são realizadas as considerações referentes a este trabalho e expostas idéias de trabalhos futuros.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho consiste num exercício de leitura da narrativa literária do escritor brasileiro João Gilberto Noll, promovendo uma aproximação de sua obra ao conceito de imagem-tempo, do filósofo Gilles Deleuze, no tocante a aspectos narrativos e à tendência ao esvaziamento discursivo, ao silêncio, enquanto elemento significativo na produção artística e tendência na arte moderna. O conceito imagem-tempo foi engendrado pelo filósofo francês para pensar o cinema moderno, que se perfaz num regime de imagens que rompe com a narratividade clássica, com a percepção baseada no esquema sensório-motor. Neste trabalho, no entanto, o conceito é pensado em relação à obra literária de João Gilberto Noll, que guarda forte relação com o cinema moderno e se nos apresenta em fragmentada tessitura imagética, tendendo ao esvaziamento discursivo. Assim, tendo como ponto de reflexão a obra de Noll, buscamos discutir como a imagem-tempo e o silêncio compõem a obra do escritor. Após apresentação e discussão do conceito de imagem-tempo e de silêncio, procedemos a uma leitura de pontos significativos da obra ficcional de Noll, ensaiando uma relação entre cinema, literatura e outras artes no que concerne basicamente à produção de imagens numa determinada forma narrativa, bem como às implicações dessas formas para o pensamento. Por uma questão de economia estratégica, para a formação de um recorte de expressão significativa da produção do escritor, suas obras diretamente consideradas neste trabalho são Hotel Atlântico (1989) e O quieto animal da esquina (1991). Pretende-se com essa relação (1) propor alguns caminhos interpretativos para a obra de Noll e (2) investigar como a produção narrativa moderna, sobretudo a que se aproxima do conceito de imagem-tempo, constituída de forte apelo visual, que se perfaz na produção de imagens ambíguas, de narrativas descontínuas, de protagonistas errantes, tende a esse esvaziamento discursivo, ao silêncio.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta é uma pesquisa de caráter exploratório, cujo objetivo foi investigar os elementos que compõem a imagem conceitual de estudantes universitários sobre o conceito de limite de uma função de uma variável real. O estudo envolveu 25 estudantes do curso de licenciatura em matemática de duas universidades públicas no estado do Pará (Brasil) e constituiu-se de duas etapas. Primeiramente, aplicamos um questionário que continha tarefas relacionadas aos aspectos conceituais de limite de uma função de uma variável. A segunda etapa consistiu na realização de entrevistas com seis sujeitos que foram selecionados devido às imagens conceituais evocadas por eles na etapa anterior, e que por sua vez, encontravam-se em conformidade com os quatro Temas de Discussão (TD) que nortearam essas entrevistas. A análise dos resultados baseou-se, sobretudo, na teoria de Tall e Vinner (1981) e Vinner (1991), bem como nos estudos realizados por Cottril et al (1996), Jordaan (2005), Juter (2006), Nair (2009), dentre outros, que compuseram a fundamentação teórica do presente estudo. Dentre os resultados obtidos, ressaltamos que os estudantes relacionam o conceito de limite de uma função de uma variável real com interpretações estáticas e/ou dinâmicas que, em alguns momentos, constituíram-se como fatores de conflito potencial, conforme destacado por Vinner (1991). Além disso, evidenciamos que algumas das imagens conceituais evocadas pelos sujeitos investigados não se fizeram coerentes, fato que os influenciou a construir uma definição conceitual pessoal diferente da definição conceitual formal de limite de uma função de uma variável real.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente trabalho discute a construção/marcação de múltiplas identidades urbanas no contexto da cidade de Belém (PA), tendo em vista os trajetos de diferentes sujeitos sociais que se realizam através do Porto da Palha, localizado na porção sul da orla fluvial dessa cidade. Considera-se a identidade urbana como um processo contínuo em que são construídas múltiplas experiências de pertencimento à urbe, que ocorre ao lado da marcação de uma diferença material e simbólica na produção de uma imagem específica de cidade. O Porto da Palha se torna um locus expressivo para múltiplas construções identitárias e um espaço através do qual se torna possível visualizar uma imagem “marginal” de Belém. São enfatizados os aspectos territoriais e comunitários deste processo, pois o mesmo é sustentado por uma dinâmica subalternizada, responsável por envolver um conjunto de networks voltadas para o abastecimento de um consumo local, produtoras de um território precarizado. Além disso, as interações e trocas de experiências desenvolvidas entre diferentes grupos sociais como feirantes, moradores do porto, quilombolas e ribeirinhos configuram nesse espaço uma espécie de comunidade de sobrevivência. Desses laços territoriais e comunitários, assim como do uso material e simbólico do rio realizados com base nos trajetos urbanos definidos por estes grupos sociais, desponta uma outra imagem de cidade, uma cidade ribeirinha à margem.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

A agressividade na infância tem sido apresentada como queixa recorrente por pais e educadores, o que instaura um cenário preocupante na medida em que a identificação da criança e sua família como principais responsáveis ainda é acentuada. Neste estudo apresenta-se inicialmente uma compreensão da agressividade na infância a partir da Abordagem Centrada na Pessoa, assim como a proposta de educação neste referencial articulando com alguns princípios da teoria da complexidade. Considerando que a criança reconhecida como agressiva vem se constituído num processo de subjetivação no qual as pessoas socialmente significativas a ela estão implicadas, esta pesquisa por meio de uma investigação fenomenológica teve como objetivo verificar a configuração deste reconhecimento a partir da análise dos depoimentos dos participantes: a criança identificada como agressiva, um colega, a mãe e a professora. O estudo foi realizado numa escola selecionada a partir do mapeamento feito pelo Observatório de Violência nas Escolas Núcleo-Pa. Os resultados encontrados apontam para: uma visão de subjetividade linear subsidiando as forma de relacionar; o distanciamento docente utilizado como recurso para evitar o conflito; a agressividade manifestada denunciando as histórias pregressas do aluno e a vivência atual; uma relação entre a condição da criança reagir ao rótulo e a história familiar; as repercussões da forma como é reconhecida na escola em seu processo de aprendizagem. Os sentimentos vivenciados pelos participantes permitem alertar para a condição de implicabilidade que os envolve, reafirmando a necessidade de se buscar caminhos que promovam mudanças na forma de ver o aluno e a própria escola. Tais mudanças precisam ser instauradas a partir de uma visão de subjetividade humana interativa complexa, que possibilite entender a agressividade a partir de um cenário intersubjetivo que pode revelar múltiplos significados.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Os estudos ambientais necessitam de informações sobre a cobertura e o uso da terra. Este trabalho apresenta a aplicação de dados de sensores remotos orbitais (óticos e de radares) na validação de padrões de uso e cobertura do solo na planície costeira amapaense para fins de mapeamento e reconhecimento da dinâmica natural e antrópica. Esta costa é submetida a uma dinâmica intensa devido à magnitude dos processos costeiros (marés-pororoca), sua localização geográfica, influenciada pelo rio Amazonas e pela Zona de Convergência Intertropical, e processos antrópicos associados à bubalinocultura. A análise foi realizada aplicando-se dados de satélite (JERS-1, RADARSAT-1, Landsat 7 e DEM do SRTM) digitalmente processados em abordagem multisensor, multiescala e multitemporal, correlacionada com dados pretéritos e informações de campo. A análise dos produtos gerados e dados colaterais permitiu distinguir oito padrões de uso e cobertura do solo: florestas de mangue, florestas de várzeas, campos arbustivos, áreas de vegetação campestre, campo antrópico, zona de intermaré, canal estuarino e lagos, além de feições morfológicas lineares associadas a estes padrões. Estas informações são importantes para o mapeamento dos ambientes costeiros e fundamentais para o reconhecimento da dinâmica na região.