555 resultados para Gramatical
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Direito - FCHS
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Estudos Linguísticos - IBILCE
Resumo:
Pós-graduação em Estudos Linguísticos - IBILCE
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
Pós-graduação em Estudos Linguísticos - IBILCE
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Pós-graduação em Letras - FCLAS
Resumo:
Apresenta aspectos semânticos, morfossintáticos e morfológicos das palavras descritivas da língua Apurinã (Aruák), isto é, palavras que comumente são traduzidas como adjetivos nas línguas européias. Algumas dessas palavras recebem a marca de sujeito pronominal (ex. unatxitapeka 'ela está com fome'); outras recebem a marca de objeto (ex. ere-ru 'ela é bonita'); e outras podem receber tanto uma como a outra (ex. ny-pĩkareta eu estou com medo vs. papĩkare-nu eu sou medroso). A primeira questão aqui tratada foi quanto ao lugar das palavras descritivas nas partes do discurso Apurinã (são nomes, são verbos ou formam uma classe independente?). Utilizando evidências internas da língua, inicialmente estabelecemos uma classificação gramatical para essas palavras a partir de suas propriedades morfológicas em comparação aos nomes e verbos na língua, de modo a nos permitir responder a essa questão. A segunda questão foi sobre os correlatos semânticos das palavras descritivas. Considerando a divisão interna das palavras descritivas em Apurinã (subjetivas vs. objetivas), apresentamos as propriedades semânticas associadas a cada grupo e, a partir disso, apresentamos uma tentativa de motivar o subagrupamento de conceitos descritivos na língua com base nas noções aspectuais de transitoriedade e permanência. Finalmente, o fenômeno gramatical descrito é contextualizado dentro da tipologia de sistemas de intransitividade cindida descrito para outras línguas (PAYNE: 1997), e a descrição de suas propriedades semânticas é situada em relação à tipologia de aspectos lexicais ou aktionsarten (COMRIE: 1976, FRAWLEY: 1992).
Resumo:
A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR