954 resultados para Traducció automàtica
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
Resumo:
Aborda a classificação automática de faltas do tipo curto-circuito em linhas de transmissão. A maioria dos sistemas de transmissão possuem três fases (A, B e C). Por exemplo, um curto-circuito entre as fases A e B pode ser identicado como uma falta\AB". Considerando a possibilidade de um curto-circuito com a fase terra (T), a tarefa ao longo desse trabalho de classificar uma série temporal em uma das 11 faltas possíveis: AT, BT, CT, AB, AC, BC, ABC, ABT, ACT, BCT, ABCT. Estas faltas são responsáveis pela maioria dos distúrbios no sistema elétrico. Cada curto-circuito é representado por uma seqüência (série temporal) e ambos os tipos de classificação, on-line (para cada curto segmento extraído do sinal) e off-line (leva em consideração toda a seqüência), são investigados. Para evitar a atual falta de dados rotulados, o simulador Alternative Transient Program (ATP) é usado para criar uma base de dados rotulada e disponibilizada em domínio público. Alguns trabalhos na literatura não fazem distinção entre as faltas ABC e ABCT. Assim, resultados distinguindo esse dois tipos de faltas adotando técnicas de pré-processamento, diferentes front ends (por exemplo wavelets) e algoritmos de aprendizado (árvores de decisão e redes neurais) são apresentados. O custo computacional estimado durante o estágio de teste de alguns classificadores é investigado e a escolha dos parâmetros dos classificadores é feita a partir de uma seleção automática de modelo. Os resultados obtidos indicam que as árvores de decisão e as redes neurais apresentam melhores resultados quando comparados aos outros classificadores.
Resumo:
Este trabalho apresenta uma nova abordagem para avaliação automática de consultas SQL. Essa abordagem propõe uma solução para o desafio de estimular o aprendiz a aperfeiçoar a sua solução: buscando, além de uma resposta que retorna o resultado correto, uma consulta com complexidade próxima da solução ótima. Essa proposta pode ser utilizada em ambientes de educação a distancia ou na educação presencial em atividades de laboratório, incluindo as avaliações. A solução proposta tem como vantagens: (1) o aprendiz recebe um feedback instantâneo durante a atividade prática de programação, o qual permite ao aprendiz refatorar a sua solução em direção a uma solução ótima; (2) completa integração entre o ensino de conceitos de programação com exemplo de fragmentos de programas executáveis on-line; (3) monitoramento das atividades do aprendiz (quantos exemplos foram executados; em cada exercício quantas tentativas de execução foram feitas, etc). Este trabalho é um primeiro passo na direção de construção de um ambiente totalmente assistido (por exemplo com avaliação automática) para ensino da linguagem de programação SQL, onde o professor é liberado do árduo trabalho de correção de comandos SQL podendo realizar tarefas pedagógicas mais relevantes. O método, fundamentado em estatística e métricas da Engenharia de Software, pode ser adaptado para outras linguagens tais como Java e Pascal. Além disso, o LabSQL serve com um laboratório para experimentação de duas novas técnicas, uma de avaliação e outra de acompanhamento, que estão sendo pesquisadas em trabalhos em paralelos: (a) avaliação automática de questões conceituais discursivas, além de permitir as tradicionais perguntas objetivas, (b) método de acompanhamento através de montagem de uma rubrica de avaliação.
Resumo:
Nesta dissertação foi desenvolvido um estudo sobre o comportamento de uma estrutura em concreto armado submetida a elevadas variações térmicas. A estrutura analisada consiste na parede externa de um forno de cozimento de anodo utilizado na produção de Alumínio, e está submetida a variações térmicas de cerca de 125C devido à própria operação do forno. As motivações principais para o estudo foram a ocorrência de grandes deformações e o surgimento de fissuras na estrutura, o que poderia provocar a inutilização do forno. O objetivo do trabalho foi a investigação das causas destas patologias, assim como o estabelecimento de propostas para reforço da estrutura. Para isso, foram realizados estudos experimentais e computacionais do comportamento da estrutura. Inicialmente, a estrutura foi monitorada utilizando-se transdutores de deslocamento e sensores de temperatura (termopares), conectados a um sistema de aquisição de dados para obtenção e armazenamento automática das amostras ao longo do tempo. Em seguida, foram desenvolvidos modelos computacionais em Elementos Finitos com auxilio do programa computacional Algor, para determinação da distribuição de temperatura e as correspondentes tensões e deformações de origem térmica na estrutura. Nestes estudos, foram realizadas análises estacionárias e transientes de condução de calor, seguidas de análises de tensões de origem térmica. Como conclusão do estudo, tem-se que a metodologia proposta para a solução do problema foi bastante satisfatória, solucionando o problema de forma precisa, porém econômica.
Resumo:
Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Resumo:
Foram estimados na raça Nelore a variabilidade genética e os valores de determinação de paternidade usando-se 11 marcadores microssatélites do painel ISAG/FAO. Estes foram organizados em quatro conjuntos de amplificação para genotipagem semi-automática por fluorescência. Todos os marcadores apresentaram-se altamente polimórficos, com média de 8,2 alelos por loco. A heterozigosidade observada, com média de 0,48, foi menor que a esperada em 10 locos. Foram observadas deficiências de heterozigotos em nove locos, o que resultou no desequilíbrio de Hardy-Weinberg para a população estudada. O conteúdo polimórfico informativo foi superior a 0,5 em 10 locos. O poder de discriminação foi >0,999 e as probabilidades de exclusão de paternidade quando são conhecidos os genótipos de um bezerro, sua mãe e um pai alegado, ou quando um ou outro genótipo parental não está disponível, para o conjunto de marcadores foram >0,999 e >0,989, respectivamente. O conjunto de 11 marcadores constitui método eficiente para a determinação de paternidade na raça Nelore.
Resumo:
Pós-graduação em Medicina Veterinária - FMVZ
Resumo:
Esta dissertação apresenta o projeto, desenvolvimento e implementação de um software para criação de animações, simulações e treinamentos de processos e instruções técnicas industriais, destacando também a arquitetura utilizada para sua implementação. O software apresentado permite a geração de animações, textos, sons e interações, fornecendo ferramentas de criação, visualização e supervisão da simulação com o uso de Realidade Virtual em três dimensões. A dissertação trata ainda do uso prático do software através de um estudo de caso com simulações 3D de processos industriais reais de uma usina de geração de energia elétrica. Este estudo também contribui para as áreas de treinamento em realidade virtual e sistemas de autoria 3D ao apresentar conceitos inovadores na área de supervisão automática, mostrando também uma possível estrutura de componentes de software para uso nas áreas citadas. Pode-se destacar ainda a revisão de tecnologias semelhantes à proposta neste trabalho, visando à identificação de influências, melhorias e inovações nas áreas de autoria 3D e treinamento.
Resumo:
A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.
Resumo:
Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.
Resumo:
O Município de Paragominas pertence à Mesorregião Sudeste Paraense (03° 00' 00” S e 47° 21' 30" W) onde há toda uma área já alterada por desmatamentos e pastagens apenas à espera de ser incorporada ao processo produtivo agrícola..A cultura da soja tem importância significativa para a economia nacional, sendo um dos principais produtos agrícolas de exportação e geração de divisas,, pertencente à família das leguminosas, se adapta em uma ampla faixa de climas, podendo ser cultivada em todos os tipos de solo. O objetivo deste estudo é avaliar as condições agrometeorológicas durante o ciclo vegetativo da soja em Paragominas - PA. Nesta área foi construída uma torre meteorológica automática de 4 metros de altura, sendo a fazenda Boi branco localizada a 03°02´15´´S e 47°17´56´´W e instalada uma estação com medidas a cada (5) cinco minutos das seguintes variáveis: temperatura do ar (Tar), umidade específica do ar (q), temperatura do solo (Tsolo), umidade do solo (Usolo), velocidade do vento (W), direção do vento (D), radiação solar incidente (Sin), radiação solar refletida (Sout), saldo de radiação (Rn) e fluxo de calor no solo (G) e precipitação. Variações microclimáticas têm efeitos bastante diretos no desenvolvimento da planta. As coletas realizadas entre fevereiro a início de junho de 2006 mostram que os dias 84, 98 e 126 foram os dias de maior precipitação e os dias 70 e 154 e 161 não houve chuva. De acordo com o desenvolvimento do plantio observamos que nos meses de fevereiro a início de abril a umidade específica máxima do ar se manteve elevada 21,0 g/Kg. A jornada da temperatura do ar máxima se manteve entre 23,5 ºC e 32,5 ºC acompanhando o desenvolvimento da cultura. A temperatura média do solo em três medidas (5, 10 e 20 cm), observou-se que as temperaturas estão entre 25 ºC a 35 ºC. No início do plantio a velocidade do vento estava por volta de 3 m/s decrescendo, e no final do cultivo encontrava-se 2,5 m/s. No período de floração a velocidade se manteve estável o que contribui para a dispersão de pólen e sementes. O vento vem de todas as direções, entretanto, o vento é predominante de nordeste. Quando o solo ainda se encontra completamente nu, o albedo é elevado, pois a radiação que entra no sistema é a mesma que sai. Quando o plantio começa a se desenvolver o albedo tende a diminuir, pois a quantidade de radiação solar que chega ao sistema parte é refletida e outra absorvida pela superfície. A umidade média do solo em três medidas (10, 20 e 30 cm), onde observamos que a umidade está entre 0,2 m⁄m³ a 0,45 m⁄m³. O fluxo de calor no solo a 10 cm apresentou picos em torno de -135 W/m2 e 55 W/m2 (7 as 18 h) e a 20 cm apresentou picos em torno de -25 W/m2 e 45 W/m2 (7 as 18 h). O sinal positivo representa transferência de calor do ar para o solo e o fluxo foi da superfície para as camadas mais internas do solo. Quando analisamos a evapotranspiração estimada notamos que foi inferior do que a evapotranspiração medida, sendo o pico da evapotranspiração estimada 4,0 mm⁄dia e a evapotranspiração medida 8,8 mm⁄dia. Quando analisamos a regressão linear a evapotranspiração estimada foi inferior a evapotranspiração medida.
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Várias das técnicas tradicionais de Mineração de Dados têm sido aplicadas com êxito e outras esbarram em limitações, tanto no desempenho como na qualidade do conhecimento gerado. Pesquisas recentes têm demonstrado que as técnicas na área de IA, tais como Algoritmo Genético (AG) e Lógica Difusa (LD), podem ser utilizadas com sucesso. Nesta pesquisa o interesse é revisar algumas abordagens que utilizam AG em combinação com LD de forma híbrida para realizar busca em espaços grandes e complexos. Este trabalho apresenta o Algoritmo Genético (AG), utilizando Lógica Difusa, para a codificação, avaliação e reprodução dos cromossomos, buscando classificar dados através de regras extraídas de maneira automática com a evolução dos cromossomos. A Lógica Difusa é utilizada para deixar as regras mais claras e próximas da linguagem humana, utilizando representações lingüísticas para identificar dados contínuos.
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Neste trabalho são apresentados o desenvolvimento e a implementação de estratégias de controle digital para regulação automática de tensão e para o amortecimento de oscilações eletromecânicas em um sistema de potência em escala reduzida de 10kVA, localizado no Laboratório de Controle de Sistemas de Potência (LACSPOT), da Universidade Federal do Pará (UFPA). O projeto dos dois controladores é baseado na técnica de alocação polinomial de polos. Para o projeto do Regulador Automático de Tensão (RAT) foi adotado um modelo simplificado, de primeira ordem, da máquina síncrona, cujos parâmetros foram levantados experimentalmente. Para o controlador amortecedor, por sua vez, também chamado de Estabilizador de Sistemas de Potência (ESP), foi utilizado um modelo discreto, do tipo auto regressivo com entrada exógena (ARX). Este modelo foi estimado por meio de técnicas de identificação paramétrica, considerando para tal, o conjunto motor-gerador interligado a um sistema de maior porte (concessionária de energia elétrica). As leis de controle foram embarcadas em um microcontrolador de alto desempenho e, para a medição dos sinais utilizados nos controladores, foi desenvolvida uma instrumentação eletrônica baseada em amplificadores operacionais para o condicionamento dos sinais dos sensores. O sinal de controle é baseado na técnica de modulação por largura de pulso (PWM) e comanda o valor médio da tensão de um conversor CC-CC, o qual é utilizado como circuito de excitação que energiza o enrolamento de campo do gerador. Além disso, o acionamento elétrico das máquinas que compõem o grupo gerador de 10kVA foi projetado e automatizado somando segurança aos operadores e ao componentes deste sistema de geração. Os resultados experimentais demonstraram o bom desempenho obtido pela estratégia proposta.