3 resultados para Transcrição fonética

em Portal do Conhecimento - Ministerio do Ensino Superior Ciencia e Inovacao, Cape Verde


Relevância:

60.00% 60.00%

Publicador:

Resumo:

Esta tese resume os trabalhos desenvolvidos na área de processamento automático de fala com o objetivo de incrementar a quantidade de recursos linguísticos disponíveis para o português europeu. O estágio de desenvolvimento e a aplicação das tecnologias de fala para uma língua estão relacionados com a quantidade e a qualidade de recursos disponíveis para esta língua. Poucas línguas apresentam, no domínio público e livre, todos os recursos necessários para desenvolver as tecnologias de fala. A língua portuguesa, como muitas outras, tem escassez de recursos públicos e livres, o que pode dificultar o desenvolvimento e a aplicação de tecnologias de fala que incorporam esta língua. Os trabalhos descritos nesta tese apresentam uma abordagem para criar bases de dados de fala, recorrendo apenas aos recursos do domínio público e livres, partindo de sinais multimédia sem transcrições ortográficas ou fonéticas. É apresentada uma solução para aproveitar a grande disponibilidade de material multimédia existente no domínio público (podcasts por exemplo) e selecionar segmentos de fala adequados para treinar modelos acústicos. Para isso, foram desenvolvidos vários sistemas para segmentar e classificar automaticamente os noticiários. Estes sistemas podem ser combinados para criar bases de dados de fala com transcrição fonética sem a intervenção humana. Foi desenvolvido um sistema de conversão automático de grafemas para fonemas que se apoia em regras fonológicas e modelos estatísticos. Esta abordagem híbrida é justificada pelos desenvolvimentos de algoritmos de aprendizagem automática aplicados a conversão de grafemas para fonemas e pelo fato do português apresentar uma razoável regularidade fonética e fonológica bem como uma ortografia de base fonológica. Com auxílio deste sistema, foi criado um dicionário de pronunciação com cerca de 40 mil entradas, que foram verificadas manualmente. Foram implementados sistemas de segmentação e de diarização de locutor para segmentar sinais de áudio. Estes sistemas utilizam várias técnicas como a impressão digital acústica, modelos com misturas de gaussianas e critério de informação bayesiana que normalmente são aplicadas noutras tarefas de processamento de fala. Para selecionar os segmentos adequados ou descartar os segmentos com fala não preparada que podem prejudicar o treino de modelos acústicos, foi desenvolvido um sistema de deteção de estilos de fala. A deteção de estilos de fala baseia-se na combinação de parâmetros acústicos e parâmetros prosódicos, na segmentação automática e em classificadores de máquinas de vetores de suporte. Ainda neste âmbito, fez-se um estudo com o intuito de caracterizar os eventos de hesitações presentes nos noticiários em português. A transcrição fonética da base de dados de fala é indispensável no processo de treino de modelos acústicos. É frequente recorrer a sistemas de reconhecimento de fala de grande vocabulário para fazer transcrição automática quando a base de dados não apresenta nenhuma transcrição. Nesta tese, é proposto um sistema de word-spotting para fazer a transcrição fonética dos segmentos de fala. Fez-se uma implementação preliminar de um sistema de word-spotting baseado em modelos de fonemas. Foi proposta uma estratégia para diminuir o tempo de resposta do sistema, criando, a priori, uma espécie de “assinatura acústica” para cada sinal de áudio com os valores de todos os cálculos que não dependem da palavra a pesquisar, como a verosimilhanças de todos os estados dos modelos de fonemas. A deteção de uma palavra utiliza medidas de similaridade entre as verosimilhanças do modelo da palavra e do modelo de enchimento, um detetor de picos e um limiar definido por forma a minimizar os erros de deteção. Foram publicados vários recursos para a língua portuguesa que resultaram da aplicação dos vários sistemas desenvolvidos ao longo da execução desta tese com especial destaque para o sistema de conversão de grafemas para fonemas a partir do qual se publicaram vários dicionários de pronunciação, dicionários com as palavras homógrafas heterofónicas, dicionário com estrangeirismos, modelos estatísticos para a conversão de grafemas para fonemas, o código fonte de todo sistema de treino e conversão e um demonstrador online.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Malária é uma doença parasitária infecciosa aguda ou crónica, causada pelo protozoário do género Plasmodium que é transmitido ao homem através de picada de mosquitos fêmeas do género Anopheles. Causa a morte a milhões de pessoas por ano, na sua maioria crianças até aos 5 anos de idade. A inexistência de estratégias eficazes, contra a transmissão da malária, deve-se sobretudo à falta de conhecimento de moléculas cruciais ao desenvolvimento do parasita no vector. Mecanismos de reconhecimento do parasita e a resposta imune do mosquito à infecção são claramente alvos de novas estratégias de controlo da malária. O ciclo natural de transmissão de Plasmodium requer a conclusão com sucesso, do ciclo esporogónico no intestino médio e nas glândulas salivares do mosquito Anopheles, um processo que demora cerca de duas semanas. Este processo de desenvolvimento pode ser bloqueado pelo sistema imune inato do mosquito, resultando assim na eliminação do parasita do vector. A resposta imunológica envolve vários mecanismos como a fagocitose, encapsulação, nodulação, síntese de péptidos antimicrobianos e coagulação, que são acompanhadas pela activação proteolítica da pró-fenoloxidase presente na hemolinfa.O sistema imune é um factor determinante da capacidade vectorial do mosquito, pelo que vários estudos têm sido feitos para melhor compreender as respostas do mosquito Anopheles, principal vector da malária, ao parasita Plasmodium. Uma das principais respostas desencadeadas pelo sistema imune do mosquito é a coagulação. Estudos recentes demonstram que a coagulação da hemolinfa de Anopheles requer actividade da fenoloxidase e difere de Drosophila s.p na formação, estrutura e composição. O objectivo deste trabalho é estudar o papel da coagulação na resposta do mosquito Anopheles gambiae ao parasita da malária Plasmodium berghei, através do estudo da transglutaminase. Para tal foi feita a caracterização dos genes que codificam para a transglutaminases em A. gambiae, através da sequenciação destes genes e dos seus transcritos, verificando-se alguns polimorfismos quando comparada com a sequência do genoma disponível na base de dados. Para caracterizar do papel desta enzima durante a infecção com P. berghei, foi feita a inibição da actividade enzimática dos genes AGAP009097 e AGAP009098 que codificam para a transglutaminases. Foi feita a descrição da dinâmica de transcrição durante a infecção e o silenciamento destes mesmos genes usando dsRNA. Observou-se um aumento da taxa de infecção e do número médio de oocistos por intestino médio nos mosquitos em que as transglutaminases foram inibidas quimicamente bem como naqueles que possuíam os genes silenciados, quando comparados com os grupos controlo. Com este trabalho espera-se ter contribuído para uma melhor compreensão do funcionamento da capacidade imunológica dos mosquitos na resposta ao parasita da malária e a possibilidade de manipular o sistema imune dos mesmos de modo a eliminar o parasita e contribuir para a diminuição/irradicação da malária, uma das principais doença e causa de morte a nível mundial.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O presente estudo tem como objectivo, analisar as “Práticas de avaliação das aprendizagens em escolas Secundárias de Cabo Verde. Um estudo exploratório na disciplina de Língua Portuguesa”. A pergunta de partida consiste em saber De que modo se caracterizam as práticas de avaliação das aprendizagens a Língua Portuguesa em escolas secundárias de Cabo Verde, nos 7º e 8º anos, em função do quadro normativo definido pelo Ministério da Educação e Desporto? Os objectivos que norteiam este estudo são: Enquadrar a noção de avaliação nos paradigmas dominantes; analisar práticas de avaliação das aprendizagens em função dos normativos cabo-verdianos para o ensino secundário; analisar as práticas de avaliação das aprendizagens, a Língua Portuguesa, nos 7 º e 8º anos, de acordo com o programa; e relacionar as práticas de avaliação das aprendizagens, definidas pelos normativos, com as práticas de avaliação das aprendizagens, utilizadas pelos professores, a Língua Portuguesa, nos 7º e 8º anos. Com vista a este estudo, optamos por três procedimentos de pesquisa, a saber: uma metodologia essencialmente qualitativa, em que utilizamos como método de investigação a observação de aulas de Língua Portuguesa, sendo duas de leitura e duas de escrita em que as aulas foram sujeitas a transcrição e comentários; uma entrevista semi-estruturada e análise de conteúdo, dirigida às quatro professoras observadas, para obter um maior conjunto de dados empíricos possíveis acerca do tema estudado; e uma análise da literatura disponível. A análise dos resultados revelou que as práticas avaliativas da maioria das entrevistadas, no tocante à escrita na sala de aula realçam uma avaliação que não propicia a reescrita dos textos e o diálogo nas correcções deixadas por elas nos textos. Os resultados apontam, também, que o caráter discursivo do gênero ainda não é considerado na prática de ensino e na avaliação. A análise dos dados comprova que, embora haja uma directriz que orienta o trabalho de leitura, a ineficácia no processo de ensino dessa habilidade não permite um desenvolvimento satisfatório. As respostas às entrevistas permitiram identificar um conjunto de práticas mais ou menos uniformizadas, no que concerne ao conceito de avaliação, modalidades e instrumentos de avaliação, orientações normativas sobre avaliação e os critérios de avaliação dos alunos.