16 resultados para Reconhecimento : Caracteres
em Universidade Federal do Pará
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
Resumo:
Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Resumo:
Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.
Resumo:
O artigo trata da questão do econhecimento dos saberes tradicionais no contexto de ambientalização dos movimentos sociais e de territorialização da ação pública que se acompanha habitualmente de uma reivindicação do território de pertencimento de grupos sociais. Esta reivindicação se manifesta como uma reivindicação global que abrange o estatuto das populações tradicionais, o uso da terra, as formas de producão que elas desenvolvem, seu modo de organização coletiva e o reconhecimento de sua identidade em referencia a uma cultura. Para isso é apresentada uma síntese dos debates que acompanham esta reivindicação de reconhecimento no âmbito da Amazônia brasileira e os desafios aos quais este reconhecimento deve responder, em particular sobre os laços entre o território de pertencimento e a cultura dessas populações, entre esta cultura e seus modos de ocupação e de exploração das terras e a eficácia econômica e social do modo de produção que elas têm conseguido conceber. Esta reivindicação interroga a capacidade dos saberes acadêmicos de re-interrogar a relação homem-natureza que lhes têm inspirado. Face a um tal desafio, o projeto de Edgar Morin tem pertinência e permite compreender tudo o que há de utópico em proposições como a das Reservas Extrativistas. Para concluir, voltamos às distinções entre ambientalização verde e ambientalização marrom considerando os recursos naturais enquanto recursos patrimoniais.
Resumo:
A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java.
Resumo:
O gênero Ptychoglossus está incluído na família Gymnophthalmidae e abriga atualmente 15 espécies distribuídas principalmente na Amazônia ocidental. Ptychoglossus brevifrontalis, inicialmente considerada como tendo uma distribuição peri-amazônica, nos últimos anos foi registrada em diversos pontos do interior da Amazônia, indicando ampla distribuição na região. Contudo, há poucas informações acerca da variação morfológica ao longo da distribuição da espécie. Neste trabalho foi estudada a variação intra- e interpopulacional na morfologia externa de Ptychoglossus brevifrontalis, analisando-se também a ocorrência de dimorfismo sexual e variação ontogenética. Ptychoglossus nicefori foi incluída no estudo, tendo em vista sua grande semelhança com P. brevifrontalis e o histórico de sinonímia entre as duas espécies. Observou-se variação geográfica em alguns caracteres, sem contudo justificar o reconhecimento de mais de um taxon. A validade de P. nicefori é questionada, porém estudos adicionais são necessários antes da proposição de novas alterações na taxonomia.
Resumo:
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.
Resumo:
O gênero Hassar (Doradidae) é um grupo natural de Siluriformes Neotropical. No presente trabalho foi realizada revisão taxonômica do referido gênero com a descrição osteológica de Hassar orestis, espécie-tipo do gênero. Este estudo foi fundamentado no levantamento e análise de caracteres morfológicos, morfométricos, merísticos e de padrão de coloração para o reconhecimento das espécies válidas e conseqüentes diagnoses e redescrições. Foram analisados 727 exemplares, provenientes de instituições nacionais e estrangeiras, envolvendo indivíduos preservados em álcool, preparados para esqueleto seco, diafanizados, radiografados e fotografados. Os exemplares foram analisados diretamente ou com auxílio de microscópio-estereoscópico e câmara clara. Medidas foram feitas, preferencialmente, do lado esquerdo do indivíduo. A descrição osteológica de Hassar orestis foi fundamentada na análise de 23 exemplares de instituições nacionais e estrangeiras e foi dividida em grupos funcionais osteológicos que são: elementos do neurocrânio, arco mandibular, arco hióide, arcos branquiais, esqueleto axial, placas nucais e nadadeira dorsal, sistema látero-sensorial e esqueleto apendicular. Os dados foram digitalizados e armazenados em formato de planilhas. Os resultados mostraram que Hassar é formado por duas espécies válidas: H. orestis e H. affinis. Hassar orestis é a espécie-tipo, tendo como sinônimo H. ucayalensis. Hassar affinis tem como sinônimos H. wilderi, H. iheringi e H. woodi. Hassar orestis e H. affinis se diferenciam pela posição do 1° espinho medial (no escudo infranucal ou entre o 1° e 8° escudo lateral vs. entre o 9° e 16° escudo lateral), número de escudos laterais providos de espinho medial (24 a 33 vs. 18 a 23) e pelos divertículos marginais filiformes da bexiga natatória (distintamente maiores vs. reduzidos ou ausentes). Os adultos (> 14 cm) de H. orestis e H. affinis diferiram pela altura do pedúnculo caudal (4,11-5,71% SL vs. 5,73 -7,63% SL) e pelo tamanho da pálpebra adiposa (conspícua e alongada na borda anterior dos olhos vs. tênue na borda anterior dos olhos). Não houve diferenças morfológicas, morfométricas e merísticas entre jovens e adultos da mesma espécie. As espécies apresentaram o mesmo padrão de coloração. Exemplares de H. orestis (N=551) possuem mancha enegrecida subterminal nos primeiros raios da nadadeira dorsal, diferentemente de H. affinis (N=176) cuja mancha pode ser subterminal ou terminal. A presença de prolongamento cartilaginoso no primeiro raio da nadadeira dorsal, em alguns machos de H. orestis, corroborou o dimorfismo sexual para espécie. Exemplares de H. orestis, provenientes dos rios Amazonas, Solimões e Negro, diferem da população do rio Branco e das Bacias dos rios Essequibo e Orinoco pela presença ou não de espinhos nos escudos timpânicos e no escudo infranucal. Não há diferença quanto à bexiga natatória dessas populações. A distribuição de H. affinis foi ampliada para os rios Solimões, Tapajós, baixo e alto Xingu, Tocantins, Araguaia, Parnaíba e Sistema Pindaré-Mearim. Hassar affinis e H. orestis apresentam ampla distribuição, parcialmente disjunta, com uma área de simpatria. A descrição osteológica da espécie-tipo proporcionou um melhor conhecimento anatômico do grupo, que serve de dado básico para trabalhos como anatomia, ontogenia, ecomorfologia e futuros eventuais trabalhos de sistemática e taxonomia.
Resumo:
Os limites interespecíficos da espécie politípica Deconychura longicauda (Dendrocolaptidae) foram investigados por uma análise conjunta, incluindo caracteres moleculares, morfológicos e vocais. Um total de 1.108 pares de bases de genes mitocondriais Cit b e ND2 foram usados para construir hipóteses filogenéticas, ao passo que os caracteres morfológicos e vocais foram analisados com métodos estatísticos univariado e multivariado. Todas as árvores filogenéticas recuperadas indicam altos níveis de diferenciação genética e estrutura filogeográfica em Deconychura longicauda, com o reconhecimento de quatro grupos principais bem apoiados, geograficamente constituídos por aves (1) do centro de endemismo Guiana no nordeste da América do Sul (2), da bacia amazônica excluindo o escudo das Guianas (3), do sopé oriental dos Andes, e (4), trans-Andinas da América do Sul e América Central. O nível de divergência genética entre estes clados varia de 6-8% (entre as aves Guianenses, não-Guianenses, do sopé dos Andes e trans-Andinas). Embora os caracteres morfológicos contribuam pouco para a diagnose em Deconychura, o canto, por outro lado, consistetemente os distinguem. Nós recomendamos com base, principalmente, em sua diagnose molecular e vocal o desdobramento de D. longicauda nas seguintes espécies filogenéticas e biológicas: Deconychura longicauda, D. pallida, D. zimmeri, D. connectens, D. typica e um táxon ainda não nomeado, endêmico do sopé oriental dos Andes.
Resumo:
Esta dissertação apresenta a implementação de navegação no ambiente virtual, reconhecimento de gestos e controle de interface, feitos através do dispositivo Kinect, no Sistema ITV: um sistema de treinamento de operadores e mantenedores de usinas hidrelétricas e subestações elétricas. São mostrados, também, determinados aperfeiçoamentos recentes, como conversão em vídeo, telas de alarmes sonoros e visuais, ambientação sonora em três dimensões e narração do processo. Além da apresentação do Sistema ITV, são expostos o dispositivo Kinect e o algoritmo utilizado na comparação dos padrões de movimento, o DTW. Em seguida, são abordados em detalhes o projeto e a implementação da navegação, do reconhecimento de gestos e do controle de interface. Como estudo de caso, é exibida uma Instrução Técnica Virtual (ITV), elaborada especialmente para testar e avaliar a nova interface proposta. Posteriormente, são apresentados os resultados, considerados satisfatórios, obtidos através da análise de questionários qualitativos aplicados a estudantes da Universidade Federal do Pará. Por fim, são realizadas as considerações referentes a este trabalho e expostas idéias de trabalhos futuros.
Resumo:
A agressividade na infância tem sido apresentada como queixa recorrente por pais e educadores, o que instaura um cenário preocupante na medida em que a identificação da criança e sua família como principais responsáveis ainda é acentuada. Neste estudo apresenta-se inicialmente uma compreensão da agressividade na infância a partir da Abordagem Centrada na Pessoa, assim como a proposta de educação neste referencial articulando com alguns princípios da teoria da complexidade. Considerando que a criança reconhecida como agressiva vem se constituído num processo de subjetivação no qual as pessoas socialmente significativas a ela estão implicadas, esta pesquisa por meio de uma investigação fenomenológica teve como objetivo verificar a configuração deste reconhecimento a partir da análise dos depoimentos dos participantes: a criança identificada como agressiva, um colega, a mãe e a professora. O estudo foi realizado numa escola selecionada a partir do mapeamento feito pelo Observatório de Violência nas Escolas Núcleo-Pa. Os resultados encontrados apontam para: uma visão de subjetividade linear subsidiando as forma de relacionar; o distanciamento docente utilizado como recurso para evitar o conflito; a agressividade manifestada denunciando as histórias pregressas do aluno e a vivência atual; uma relação entre a condição da criança reagir ao rótulo e a história familiar; as repercussões da forma como é reconhecida na escola em seu processo de aprendizagem. Os sentimentos vivenciados pelos participantes permitem alertar para a condição de implicabilidade que os envolve, reafirmando a necessidade de se buscar caminhos que promovam mudanças na forma de ver o aluno e a própria escola. Tais mudanças precisam ser instauradas a partir de uma visão de subjetividade humana interativa complexa, que possibilite entender a agressividade a partir de um cenário intersubjetivo que pode revelar múltiplos significados.
Resumo:
O Curió Oryzoborus angolensis (Aves, Passeriformes, Oscines, Emberizinae) é uma espécie Neotropical muito conhecida e apreciada entre os criadores de pássaros no Brasil, por possuir canto melodioso e variado. O canto tem como função biológica o reconhecimento específico. A presença de repertórios vocais longos, variações populacionais e individuais pode ser um indicativo de aprendizagem vocal, que é o caso do Oryzoborus angolensis. O repertório representa os diferentes tipos de unidades que constituem o canto, as notas, emitidas durante a vocalização. No caso do canto do Curió a frase pode ser caracterizada como uma sequência de notas que se repetem. Analisamos as amostras de gravações de 26 indivíduos, sendo dezesseis de cativeiro e dez selvagens provenientes de diversas localidades do país. Identificamos e denominamos cada uma das 2414 notas gravadas com uma letra do alfabeto. As medidas dos parâmetros físicos das notas (duração, intervalo entre as notas, ritmo, frequência máxima e frequência mínima) apresentaram diferenças globais significativas, podendo ser um dos caracteres responsáveis pela função de reconhecimento específico. Observamos que as notas são constituídas principalmente por sons puros e amplamente moduladas, distribuídas de forma homogênea na amostra. Descrevemos a estrutura do canto, com a análise do repertório dos indivíduos de cativeiro e selvagem, apresentado diferenças estatisticamente significativas entre si. Considerando a distribuição dos diferentes tipos de notas emitidas por indivíduos,calculamos a entropia informacional, que forneceu um índice que correspondente à previsibilidade do canto individual.
Resumo:
Os estudos ambientais necessitam de informações sobre a cobertura e o uso da terra. Este trabalho apresenta a aplicação de dados de sensores remotos orbitais (óticos e de radares) na validação de padrões de uso e cobertura do solo na planície costeira amapaense para fins de mapeamento e reconhecimento da dinâmica natural e antrópica. Esta costa é submetida a uma dinâmica intensa devido à magnitude dos processos costeiros (marés-pororoca), sua localização geográfica, influenciada pelo rio Amazonas e pela Zona de Convergência Intertropical, e processos antrópicos associados à bubalinocultura. A análise foi realizada aplicando-se dados de satélite (JERS-1, RADARSAT-1, Landsat 7 e DEM do SRTM) digitalmente processados em abordagem multisensor, multiescala e multitemporal, correlacionada com dados pretéritos e informações de campo. A análise dos produtos gerados e dados colaterais permitiu distinguir oito padrões de uso e cobertura do solo: florestas de mangue, florestas de várzeas, campos arbustivos, áreas de vegetação campestre, campo antrópico, zona de intermaré, canal estuarino e lagos, além de feições morfológicas lineares associadas a estes padrões. Estas informações são importantes para o mapeamento dos ambientes costeiros e fundamentais para o reconhecimento da dinâmica na região.
Resumo:
Acidentes relacionados ao transporte de petróleo constituem uma ameaça às zonas costeiras de todo o mundo, pois se trata de um evento ecologicamente desastroso podendo causar sérios danos ao meio ambiente. Na costa nordeste do Pará ocorre intenso fluxo de navios e balsas transportando petróleo e derivados, daí a necessidade de estabelecer estratégias de prevenção e gestão dos impactos ambientais ao derrame de óleo para elaboração de planos de emergência. O objetivo deste trabalho é gerar o mapa dos ambientes costeiros e o mapa de índice de sensibilidade ambiental ao derrame de óleo dos ambientes costeiros de uma porção da costa nordeste do Pará. A metodologia consistiu no processamento digital de imagens Landsat ETM+7, associadas aos dados do MDE do SRTM (shuttle radar topography mission) e aos dados de campo, em ambiente de SIG (sistema de informação geográfica). Os resultados permitiram o reconhecimento e a descrição de cinco unidades geomorfológicas e de ambientes sedimentares; identificação e hierarquização de nove índices de sensibilidade ambiental (ISA); além da geração do mapa de índice de sensibilidade ambiental ao derramamento de óleo. As técnicas de sensoriamento remoto e SIG mostraram ser importantes ferramentas no reconhecimento dos ambientes costeiros e geração dos mapas propostos.
Resumo:
Este trabalho visa propor uma solução contendo um sistema de reconhecimento de fala automático em nuvem. Dessa forma, não há necessidade de um reconhecedor sendo executado na própria máquina cliente, pois o mesmo estará disponível através da Internet. Além do reconhecimento automático de voz em nuvem, outra vertente deste trabalho é alta disponibilidade. A importância desse tópico se d´a porque o ambiente servidor onde se planeja executar o reconhecimento em nuvem não pode ficar indisponível ao usuário. Dos vários aspectos que requerem robustez, tal como a própria conexão de Internet, o escopo desse trabalho foi definido como os softwares livres que permitem a empresas aumentarem a disponibilidade de seus serviços. Dentre os resultados alcançados e para as condições simuladas, mostrou-se que o reconhecedor de voz em nuvem desenvolvido pelo grupo atingiu um desempenho próximo ao do Google.