911 resultados para vocabulary


Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

As universidades, além de suas atribuições constitucionalmente previstas de ensino, de pesquisa e de extensão, possuem um 'quarto elemento essencial e indissociável dos outros três, concretizado na intensa prática política desenvolvida no ambiente acadêmico. Dada a existência desse fator, a presente pesquisa examina o fenômeno da polêmica como elemento de interincompreensão nos confrontos da política acadêmica na Universidade Federal do Pará (UFPA), com base no suporte teórico principal de Maingueneau (2005), observando-se como se estabelece essa relação de interincompreensão, analisando os simulacros que cada sujeito constrói do seu interlocutor e de si mesmo. Constituem o corpus deste trabalho, de um lado, as notas das três entidades acadêmicas da UFPA, quais sejam o Diretório Central dos Estudantes - DCE, a Associação dos Docentes da UFP A - Adufpa e o Sindicato dos Trabalhadores da UFP A - Sintufpa, que representam, respectivamente, estudantes, docentes e servidores técnico-administrativos; e, de outro, as notas da Administração Superior. Essas notas referem-se à tomada da Reitoria, pelos estudantes, ocorrida em junho de 2007, motivada, segundo nota da entidade estudantil (Anexo 3A), por não terem sido atendidas suas reivindicações, relacionadas a problemas acadêmicos diversos. A pesquisa é desenvolvida em uma perspectiva discursiva, cuja metodologia compreende um objetivo geral, que é identificar os simulacros que se constroem na política acadêmica da UFP A. Para tanto, nos valemos de quatro frentes de pesquisa, materializadas em objetivos específicos, a saber: 1. Investigar o contexto dessa política; 2. Resgatar o vocabulário constitutivo da material idade discursiva, observando as ações, referidas por meio de verbos e nomes, e as caracterizações, efetuadas por meio de adjetivações e nomes; 3. Identificar as marcas da heterogeneidade mostrada; 4. Capturar os flagrantes de infração ao "código dogmático" da prática política. Ao longo das notas, no embate discursivo que se desenvolve, percebemos o chamado "diálogo de surdos", em que não se vislumbra a possibilidade de os adversários reverem seus posicionamentos.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Este trabalho esboça possibilidades de investigar fatores relacionados à transmissão da cultura do brinquedo. A brincadeira pressupõe uma aprendizagem social, aprendem-se as formas, o vocabulário típico, os tipos de interações condizentes, as regras, o momento de enunciá-las etc. A investigação de tais categorias e dos fatores envolvidos em sua produção é importante para uma melhor descrição da brincadeira e da ocorrência de aprendizagem em situação natural e também para criar indicadores para a compreensão das relações entre os membros dos grupos de crianças, da socialização, da constituição do sujeito e da transmissão da cultura.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Pós-graduação em Ciência da Informação - FFC

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Pós-graduação em Ciência da Informação - FFC

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)