3 resultados para morfossintâtico
em Universidade Federal do Pará
Resumo:
Este trabalho, intitulado Revisitando os Verbos em Parkatêjê: questões relevantes para um estudo morfossintático, tem como principal objetivo apresentar algumas das principais características de verbos da língua parkatêjê. A comunidade Parkatêjê vive no Km 30 da BR-222, na reserva Mãe Maria, em Bom Jesus do Tocantins. O referido estudo constituiu-se a partir dos dados presentes em Ferreira (2003) e consulta ao material contido em seu acervo, o qual também contém dados de Araújo (em diferentes momentos de sua pesquisa com a língua parkatêjê), sendo esta dissertação constituída a partir de pesquisa bibliográfica. O tema foi escolhido por haver uma necessidade de se aprofundar os estudos nesta língua, já que são poucos os trabalhos lingüísticos descritivos feitos sobre o parkatêjê. Inicialmente, tentar-se-á definir o termo verbo, a partir da perspectiva de autores como Payne (1997), Lyons (1979), Schachter (1985), Lehmann (1981) e Givón (1984); em seguida, será mostrada uma visão panorâmica das principais características das línguas pertencentes ao tronco Macro-Jê, tronco lingüístico do qual faz parte a língua em estudo, com base em Rodrigues (1999) e Ribeiro (2006); as principais características da língua parkatêjê serão apresentadas em seguida, com base em Ferreira (2003); por fim, as principais características dos verbos nessa língua serão focalizadas, ainda com base em Ferreira (2003).
Resumo:
Este trabalho tem por objetivo apresentar os resultados de um estudo sobre a simplificação do ditongo decrescente /ej/ no português falado no Estado do Pará, localizado ao Norte do Brasil, com base nos pressupostos teórico-metodológicos da Sociolingüística Variacionista e da Geografia Linguística. Trata-se, portanto, de uma abordagem Geo-Sociolingüística, a qual relaciona fenômenos lingüísticos a comportamentos sociológicos e geográficos, que impõem e são impostos por normas específicas nas mais diversas manifestações da vida em sociedade. O corpus que se utilizou para a análise foi levantado a partir de questionários do Projeto Atlas Lingüístico do Brasil (ALiB), e está composto de entrevistas aplicadas a informantes previamente selecionados por meio de critérios também definidos a priori. Foram utilizados três questionários – QFF (Questionário Fonético-Fonológico), QSL (Questionário Semântico-Lexical) e QMS (Questionário Morfossintático) – além de perguntas sobre questões de pragmática, discurso semi-dirigido e texto reproduzido via leitura. Todo esse material foi elaborado pela equipe do projeto ALiB e aplicado por diretores científicos e suas respectivas equipes. Abrange a transcrição grafemática de todo o corpus e fonética do QSL e QFF, além da triagem dos itens lexicais continentes do ditongo supracitado que o corpus apresentou, para que estes pudessem ser submetidos à análise probabilística do programa computacional VARBRUL. Obtidos os resultados estatísticos, buscou-se interpretar os dados à luz das pesquisas já apresentadas sobre a variável no Brasil, além daquelas que serviram de base às problematizações acerca do fenômeno em língua portuguesa. Com base nessa interpretação, verificamos que, do ponto de vista lingüístico, o ditongo /ej/ apresenta restrições estruturais à sua realização plena; e que, do ponto de vista extralingüístico, há uma significativa distribuição dessas realizações no Estado ora pesquisado, que parece estar pautada em fatores dialetológicos, mas pouco relacionada a fatores sociais, exceto o fator escolaridade, que se mostrou relevante na aplicação da regra de monotongação ou na manutenção da semivogal do ditongo
Resumo:
A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.