927 resultados para Multilingual lexical


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Today 80 % of the content on the Web is in English, which is spoken by only 8% of the World population and 5% of Indian population. There is wealth of useful content in the various languages of the world other than English, which can be made available on the Internet. But, to date, for various reasons most of it is not yet available on the Internet. India itself has 18 officially recognized languages and scores of dialects. Although the medium of instruction for most of the higher education and research in India is English, substantial amount of literature by way of novels, textbooks, scholarly information are being generated in the other languages in the country. Many of the e-governance initiatives are in the respective state languages. In the past, support for different languages by the operating systems and the software packages were not very encouraging. However, with the advent of Unicode technology, operating systems and software packages are supporting almost all the major languages of the world that have scripts. In the work reported in this paper, we have explained the configuration changes that are needed for Eprints.org software to store multilingual content and to create a multilingual user interface.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper presents the preliminary analysis of Kannada WordNet and the set of relevant computational tools. Although the design has been inspired by the famous English WordNet, and to certain extent, by the Hindi WordNet, the unique features of Kannada WordNet are graded antonyms and meronymy relationships, nominal as well as verbal compoundings, complex verb constructions and efficient underlying database design (designed to handle storage and display of Kannada unicode characters). Kannada WordNet would not only add to the sparse collection of machine-readable Kannada dictionaries, but also will give new insights into the Kannada vocabulary. It provides sufficient interface for applications involved in Kannada machine translation, spell checker and semantic analyser.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Scatter/Gather systems are increasingly becoming useful in browsing document corpora. Usability of the present-day systems are restricted to monolingual corpora, and their methods for clustering and labeling do not easily extend to the multilingual setting, especially in the absence of dictionaries/machine translation. In this paper, we study the cluster labeling problem for multilingual corpora in the absence of machine translation, but using comparable corpora. Using a variational approach, we show that multilingual topic models can effectively handle the cluster labeling problem, which in turn allows us to design a novel Scatter/Gather system ShoBha. Experimental results on three datasets, namely the Canadian Hansards corpus, the entire overlapping Wikipedia of English, Hindi and Bengali articles, and a trilingual news corpus containing 41,000 articles, confirm the utility of the proposed system.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

clarify the multilingual problem of place and oceanographic names in the region of the Okhotsk Sea, especially in Southern Sakhalin (Minami Karafuto) and in the Kuril Islands (Chishima Islands) areas. (PDF contains 61 pages)

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Máster y Doctorado en Sistemas Informáticos Avanzados, Informatika Fakultatea - Facultad de Informática

Relevância:

20.00% 20.00%

Publicador:

Resumo:

El objetivo del proyecto es crear una aplicación Android usando la base de conocimiento multilingüe Multilingual Central Repository 3.0 (MCR 3.0).

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Trabalho de investigação das marcas de iconicidade em letras-de-música brasileira que representam os vários Brasis. Análise do córpus com fundamentação semântico-semiótica, endossada pela perspectiva sociolinguística, como ponto de partida para a caracterização dos itens lexicais como ícone, índice ou símbolo, à luz da Teoria da Iconicidade, como identificadores de um espaço sociocultural. A orientação sociolinguística sustenta nossas reflexões acerca da importância da inserção dos diversos usos linguísticos na prática de ensino de língua portuguesa, que precisa acompanhar a vida da linguagem na comunicação cotidiana, com vistas à valorização e à democratização da língua. Ademais, impõe-se reconhecer a heterogeneidade linguística como fator de riqueza da língua. O trabalho de análise consiste em uma metodologia que permite associar o texto a uma imagem com significado representativo das particularidades linguístico-discursivas de uma cultura regional. Os resultados esperados incluem a afirmação da potencialidade linguístico-semiótica da letra-de-música como gênero textual suficiente para a demonstração dos valores socioculturais impressos na língua e, possivelmente, como um gênero de importante valor literário que se pode aproveitar para dinamizar aulas de língua portuguesa

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Nesta dissertação, pretende-se estudar a dinamicidade lexical em textos de domínio político, veiculados pela imprensa escrita durante o período eleitoral de 2010. Para tal, selecionou-se um corpus adequado à pesquisa, fez-se o levantamento de neologismos lexicais nele ocorrentes e procedeu-se à sua descrição. Neste percurso, buscou-se demonstrar a riqueza e a vitalidade dos mecanismos de expansão lexical nos textos estudados, de modo a evidenciar que o léxico, como sistema dinâmico, configura-se como um dos subníveis linguísticos mais abertos à criatividade, revelando também crenças, valores, costumes e hábitos de uma comunidade linguística. Ademais, objetivou-se mostrar que a linguagem utilizada em contextos políticos, visto estar imersa em um ambiente de tensões e embates constantes, é marcadamente caracterizada pelo incessante nascer de novos signos, os quais, por motivações denominativas e/ou estilísticas, desvelam, não raras vezes, intenções e ideologias dos sujeitos-falantes que os criam. Por fim, elaborou-se um glossário com as novas formações encontradas, que oferece subsídios para a observação sistemática da neologia no âmbito do português brasileiro, além de traçar um perfil parcial das alterações político-culturais por que passamos no correr de 2010

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This chapter studies multilingual democratic societies with highly developed economies. These societies are assumed to have two languages with official status: language A, spoken by every individual, and language B, spoken by the bilingual minority. We emphasize that language rights are important, but the survival of the minority language B depends mainly on the actual use bilinguals make of B. The purpose of the present chapter is to study some of the factors affecting the bilingual speakers language choice behaviour. Our view is that languages with their speech communities compete for speakers just as fi rms compete for market share. Thus, the con ict among the minority languages in these societies does not take the rough expressions such as those studied in Desmet et al. (2012). Here the con flict is more subtle. We model highly plausible language choice situations by means of choice procedures and non-cooperative games, each with different types of information. We then study the determinants of the bilinguals ' strategic behaviour with regard to language. We observe that the bilinguals' use of B is shaped, essentially, by linguistic conventions and social norms that are developed in situations of language contact.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Nesta tese apresentamos um itinerário de ensino em que o conteúdo gramatical é um meio para o desenvolvimento da consciência linguística e da competência discursivo-textual. Partindo do repertório do falante, nossa investigação tomou o neologismo formado por amálgama lexical como objeto semiótico, realizou uma revisão dos estudos sobre a criação de novas palavras, sua motivação e seus efeitos na comunicação. O neologismo por amálgama lexical foi observado como produto da competência linguística do falante, resultado da exploração das possibilidades do sistema linguístico e emoldurado pela habilidade estilístico-discursiva dos sujeitos. Essa habilidade materializa-se em signos cujos valores icônicos e funcionais dão suporte a uma expressão o mais transparente possível, e as criações amálgamas são formas ricas porque trazem em si marcas dos falantes que as criam/usam, dos segmentos sociais a que estes pertencem e da inexorável evolução da língua em consonância com a evolução da sociedade. Estudos lexicológicos, repertório discente, neologismos inventados pela Turma do Casseta & Planeta e por sua criatura-ficcional -- o repórter Agamenon -- permitiram-nos descrever o fenômeno da neologia por amálgama lexical, sua natureza sistêmico-funcional, suas adaptações morfofonológicas, seus ganhos semânticos e seus aspectos expressivos e impressivos. Apresentamos um modelo de estudo que se quer mais atualizado e dinâmico e que foi testado e comprovado nas turmas do colégio estadual em que atuo como docente do ensino médio

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente estudo analisa as contribuições do uso da música e de pragmatemas na retenção lexical por parte de três turmas de inglês como língua adicional em uma escola estadual na cidade de São João de Meriti (RJ). Para tal, constituiu três condições de pesquisa das quais fizeram parte doze alunos na turma 1 (T1); doze alunos na turma 2 (T2); e nove alunos na turma 3 (T3). A turma 1 (T1) participou de práticas pedagógicas com foco na música e sem foco explícito nos pragmatemas presentes na letra; a turma 2 (T2) de práticas pedagógicas com foco na música e nos pragmatemas da letra; e a turma 3 (T3) de práticas pedagógicas voltadas somente para o ensino-aprendizagem dos pragmatemas presentes na letra, sem o suporte da música. Anteriormente à intervenção, foi aplicado um questionário sobre os hábitos sócio-culturais dos participantes visando conhecer suas preferências musicais e perfil de letramento. Para analisar a relação entre o uso da música e de pragmatemas na retenção lexical, foram aplicados um pré-teste antes da intervenção e dois pós-testes com intervalo de 1 mês entre eles. Além disso, o estudo contou com uma entrevista semi-estruturada com os participantes, visando entender a percepção dos mesmos sobre as práticas utilizadas na intervenção. Os achados apontam que houve uma retenção ligeiramente superior nas condições T2 (música e foco nos pragmatemas) e T3 (foco exclusivo nos pragmatemas), com ligeira superioridade para a condição 3. O pragmatema recuperado com maior frequência foi "What's up", fato que pode ser parcialmente explicado pelo fato de ser pronunciado como uma palavra só e pelo número de letras que o representa ortograficamente. Estudos futuros poderão esclarecer se há significância estatística entre as diferenças encontradas assim como melhor explorar como o ensino explícito de unidades lexicais complexas pode contribuir para a retenção desses itens lexicais e consequentemente para o ensino-aprendizagem de línguas adicionais. A intervenção permitiu que os aprendizes passassem a entender que as palavras não ocorrem de modo isolado, mas que sempre caminham junto a outras. Permitiu também que a rotina pedagógica contemplasse a coconstrução do conhecimento, levando os aprendizes a reagir positivamente às práticas utilizadas no ensino de inglês, conforme relatos durante as entrevistas semi-estruturadas. Isso per se já justifica a utilização de práticas semelhantes e ilustra a contribuição do presente estudo

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo principal deste trabalho é estudar estratégias de indeterminação de sentido em um corpus de conversas telefônicas interceptadas, considerando que a produção de sentido é um processo cognitivo dependente do contexto. Delimitamos a linguística cognitiva como a área na qual essa pesquisa se encontra inserida, para melhor compreender os fundamentos e os pressupostos norteadores da Teoria dos Modelos Cognitivos Idealizados (TMCI) e da Teoria da Mesclagem Conceptual (blending), tendo como base, principalmente, os estudos de Lakoff (1987), Fauconnier (1997) e Fauconnier e Turner (2002). No decorrer do trabalho propomo-nos responder às seguintes questões de pesquisa: a) que estratégias de indeterminação de sentido são mais frequentemente usadas nestas conversas? b) que elementos do contexto e do cotexto permitem a delimitação do sentido do item lexical em determinada conversa? c) como funcionam, no corpus, as estratégias de indeterminação de sentido e de que forma elas contribuem para sustentar determinado tipo de relação interpessoal? Para responder a estas questões de pesquisa, das 22 gravações de conversas telefônicas de atores sociais envolvidos com tráfico de armas e drogas, sequestro e extorsão, fornecidas pela Coordenadoria de Segurança e Inteligência do Ministério Público do Rio de Janeiro, selecionamos 10 conversas, em função da sua qualidade sonora, para serem transcritas e para proceder à análise qualitativa do uso da polissemia e da vagueza lexical. A partir das discussões teóricas e das análises desenvolvidas, concluímos que a polissemia representa a estratégia de indeterminação de sentido mais frequente no corpus desta pesquisa e que a mesma pode ser entendida como um processo de mesclagem conceptual, que sofre influências sociais e culturais: é a dinamicidade do pensamento e da linguagem que geram a polissemia. Concluímos também que a vagueza lexical é utilizada, no corpus, como um recurso linguístico para referência a assuntos ilícitos. Os itens lexicais analisados instanciam esquemas mentais abstratos que têm seus sentidos realizados a partir de pistas linguísticas e extralinguísticas que apontam para um processo interacional que pode ser entendido como um enquadre de transações comerciais (tráfico de drogas)

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This article has two main objectives. First, we offer an introduction to the subfield of generative third language (L3) acquisition. Concerned primarily with modeling initial stages transfer of morphosyntax, one goal of this program is to show how initial stages L3 data make significant contributions toward a better understanding of how the mind represents language and how (cognitive) economy constrains acquisition processes more generally. Our second objective is to argue for and demonstrate how this subfield will benefit from a neuro/psycholinguistic methodological approach, such as event-related potential experiments, to complement the claims currently made on the basis of exclusively behavioral experiments. Palabras clave

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Este trabalho tem por objetivo investigar as histórias de sair do armário sob seu aspecto organizacional, lexical e discursivo. Busca-se apontar que padrões organizacionais prevalecem nas histórias, que léxicos significativos predominam e como os léxicos predominantes são avaliados em termos de Afeto, Julgamento e Apreciação. Para o exame organizacional, a análise se apropria do quadro analítico de Labov e colaboradores (1967; 1972), por ser pioneiro nos estudos sobre narrativas orais de experiência pessoal; em seguida, lança mão dos elementos do Padrão Problema-Solução (PPS), proposto por Hoey (1983; 2001), por iluminar o aspecto cíclico das referidas histórias. Para a análise lexical, esse estudo se ampara nos preceitos e técnicas da investigação eletrônica de textos da Linguística de Corpus (TOGNINI BONELILI, 2001; SINCLAIR, 2004; BERBER-SARDINHA, 2004; McENERY e HARDIE, 2011), conjugado ao conjunto de programas WordSmith Tool 5.0 (SCOTT, 2010). Já sobre o aspecto discursivo, em especial sobre a linguagem da avaliação, a análise privilegiou a metafunção interpessoal da Linguística Sistêmico Funcional (Halliday, 2004) e lançou mão das categorias do subsistema da ATITUDE da Teoria da Avaliatividade, proposto por Martin (2000) e Martin e White (2005). O Corpus analisado consiste de sete narrativas, coletadas pelo método da Entrevista Narrativa, à qual se voluntariaram homossexuais do sexo masculino, entre (20) vinte a (30) anos de idade, oriundos da zona norte do Rio de Janeiro. Os resultados da análise da organização da narrativa mostraram que as histórias de sair do armário são episódicas, são contadas com muitos recursos avaliativos como descritos por Labov e se organizam por meio do Padrão Problema-Solução. Os resultados da análise lexical revelaram a predominância do item eu e mãe/ela nas sete histórias coletivamente. Por fim a análise discursiva, sob a ótica da linguagem atitudinal, aponta que os itens eu e mãe/ela, que apontam para o narrador e suas mães, são marcados por Afeto (emoções) e Julgamento (comportamento). A dissertação em seu final combina as três linhas de análise para fazer uma reflexão sobre o peso social do que significa sair do armário para o sujeito gay