467 resultados para processamento automático de línguas naturais
em Repositório Institucional UNESP - Universidade Estadual Paulista "Julio de Mesquita Filho"
Resumo:
In this paper, we provide a brief description of the multidisciplinary domain of research called Natural Language Processing (NLP), which aims at enabling the computer to deal with natural languages. In accordance with this description, NLP is conceived as "human language engineering or technology". Therefore, NLP requires consistent description of linguistic facts on every linguistic level: morphological, syntactic, semantic, and even the level of pragmatics and discourse. In addition to the linguistically-motivated conception of NLP, we emphasize the origin of such research field, the place occupied by NLP inside a multidisciplinary scenario, their objectives and challenges. Finally, we provide some remarks on the automatic processing of Brazilian Portuguese language.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
No âmbito do Processamento Automático de Línguas Naturais (PLN), o desenvolvimento de recursos léxico-semânticos é premente. Ao conceber os sistemas de PLN como um exercício de engenharia da linguagem humana, acredita-se que o desenvolvimento de tais recursos pode ser beneficiado pelos modelos de representação do conhecimento, desenvolvidos pela Engenharia do Conhecimento. Esses modelos, em particular, fornecem simultaneamente o arcabouço teórico-metodológico e a metalinguagem formal para o tratamento computacional do significado das unidades lexicais. Neste artigo, após a apresentação da concepção linguístico-computacional de léxico, elucidam-se os principais paradigmas de representação do conhecimento, enfatizando a abordagem do significado e a metalinguagem formal vinculadas a cada um deles.
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Para os sistemas computacionais que processam línguas naturais, como os de tradução automática, os recursos léxico-conceituais bilíngues ou multilíngues são de extrema importância. Consequentemente, o desenvolvimento de tais recursos tem ocupado lugar de centralidade no Processamento Automático das Línguas Naturais (PLN). Para o português do Brasil (PB), os recursos desse tipo ainda são escassos. Neste trabalho, apresenta-se REBECA, uma base de dados léxico-conceitual bilíngue desenvolvida para o par de línguas “inglês americano-PB” (Ingl-PB). Na introdução, contextualiza-se o projeto de desenvolvimento dessa base. Na sequência, apresentam-se (i) o equacionamento metodológico do projeto, enfatizando as atividades de pesquisa realizadas em cada uma das etapas previstas pela metodologia, (ii) a construção da base com o auxílio do editor de ontologias Protégé-OWL, (iii) as principais características e potencialidades da base REBECA e, por fim, (iv) as possíveis extensões e algumas considerações finais.
Resumo:
Este trabalho discute o equacionamento lingüístico da construção de um Thesaurus Eletrônico para o Português do Brasil. Na introdução, contextualizamos esse equacionamento no domínio da pesquisa em processamento automático de línguas naturais. Na seqüência, apresentamos, na seção 2, a representação lingüístico-computacional da sinonímia e da antonímia e exemplificamos o processo de compilação dessas relações de sentido em dicionários do português do Brasil. Na seção 3, justificamos a seleção dos dicionários enquanto o corpus de referência e propomos uma tipologia dos problemas decorrentes da escolha desse tipo de corpus para a montagem do thesaurus. Na seção 4, complementamos a discussão com a descrição das principais caracteristicas.de uma ferramenta computacional de autoria, projetada para agilizar o processo de montagem da base de dados lexicais do thesaurus, o Editor do Thesaurus. Por fim, pontuamos as estatísticas atuais do thesaurus e futuros desdobramentos.
Resumo:
In the architecture of a natural language processing system based on linguistic knowledge, two types of component are important: the knowledge databases and the processing modules. One of the knowledge databases is the lexical database, which is responsible for providing the lexical unities and its properties to the processing modules. The systems that process two or more languages require bilingual and/or multilingual lexical databases. These databases can be constructed by aligning distinct monolingual databases. In this paper, we present the interlingua and the strategy of aligning the two monolingual databases in REBECA, which only stores concepts from the “wheeled vehicle” domain.
Resumo:
Pós-graduação em Linguística e Língua Portuguesa - FCLAR
Resumo:
No presente trabalho, apresentamos uma proposta de tratamento semântico de formas ambíguas do português do Brasil, no caso, lexias homógrafas, com o escopo de oferecermos estratégias lingüísticas para a sua implementação computacional em Sistemas de Processamento das Línguas Naturais (SPLN). O Léxico Gerativo de Pustejovsky foi usado como modelo teórico. Nesse modelo, a Estrutura Qualia - EQ (e os papéis Formal, Télico, Agentivo e Constitutivo) foi selecionada como um dos expedientes lingüístico-semânticos para a realização da desambiguação das formas homônimas. Para que os dados analisados e tratados pudessem ser manipulados, elaboramos uma Base de Conhecimento Lexical (BCL) cujo repertório lingüístico possui seus itens lexicais correlacionados e interligados por diferentes tipos de relações semânticas presentes na EQ.
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)