173 resultados para Language, Linguistics

em Consorci de Serveis Universitaris de Catalunya (CSUC), Spain


Relevância:

30.00% 30.00%

Publicador:

Resumo:

Quantitative linguistics has provided us with a number of empirical laws that characterise the evolution of languages and competition amongst them. In terms of language usage, one of the most influential results is Zipf’s law of word frequencies. Zipf’s law appears to be universal, and may not even be unique to human language. However, there is ongoing controversy over whether Zipf’s law is a good indicator of complexity. Here we present an alternative approach that puts Zipf’s law in the context of critical phenomena (the cornerstone of complexity in physics) and establishes the presence of a large-scale “attraction” between successive repetitions of words. Moreover, this phenomenon is scale-invariant and universal – the pattern is independent of word frequency and is observed in texts by different authors and written in different languages. There is evidence, however, that the shape of the scaling relation changes for words that play a key role in the text, implying the existence of different “universality classes” in the repetition of words. These behaviours exhibit striking parallels with complex catastrophic phenomena.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

This document describes some of the technological aspects of a project devoted to the creation of a factory for language resources. The project’s objectives are explained, as well as the idea to create a distributed infrastructure of web services. This document focuses on two main topics of the factory: (1) the technological approaches chosen to develop the factory, i.e. software, protocols, servers, etc. (2) and Interoperability as the main challenge is to permit different NLP tools work together in the factory. This document explains why XCES and GrAF are chosen as the main formats used for the linguistic data exchange.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

This paper demonstrates a novel distributed architecture to facilitate the acquisition of Language Resources. We build a factory that automates the stages involved in the acquisition, production, updating and maintenance of these resources. The factory is designed as a platform where functionalities are deployed as web services, which can be combined in complex acquisition chains using workflows. We show a case study, which acquires a Translation Memory for a given pair of languages and a domain using web services for crawling, sentence alignment and conversion to TMX.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

This documents sums up a projectaimed at building a new web interfaceto the Apertium machine translationplatform, including pre-editing andpost-editing environments. It containsa description of the accomplished workon this project, as well as an overviewof possible evolutions.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

This paper presents an Italian to CatalanRBMT system automatically built bycombining the linguistic data of theexisting pairs Spanish-Catalan andSpanish-Italian. A lightweight manualpostprocessing is carried out in order tofix inconsistencies in the automaticallyderived dictionaries and to add very frequentwords that are missing accordingto a corpus analysis. The system isevaluated on the KDE4 corpus and outperformsGoogle Translate by approximatelyten absolute points in terms ofboth TER and GTM.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Durant els darrers anys, s’han publicat un gran nombre de materials multimèdia destinats a l’aprenentatge de llengües, la major part dels quals son CD-ROM dissenyats com a cursos per l’autoaprenentatge. Amb aquests materials, els alumnes poden treballar independentment sense l’assessorament d’un professor, i per aquest motiu s’ha afirmat que promouen i faciliten l’aprenentatge autònom. Aquesta relació, però, no es certa, com Phil Benson i Peter Voller 1997:10) han manifestat encertadament:(…) Such claims are often dubious, however, because of the limited range of options and roles offered to the learner. Nevertheless, technologies of education in the broadest sense can be considered to be either more or less supportive of autonomy. The question is what kind of criteria do we apply in evaluating them? En aquest article presentem una investigació conjunta on es defineixen els criteris que poden ser utilitzats per avaluar materials multimèdia en relació a la seva facilitat per permetre l’aprenentatge autònom. Aquests criteris son la base d’un qüestionari que s’ha emprat per avaluar una selecció de CD-ROM destinats a l’autoaprenentatge de llengües. La estructura d’aquest article és la següent: - Una introducció de l’estudi - Els criteris que s’han utilitzar per la creació del qüestionari - Els resultats generals de l’avaluació - Les conclusions que s’han extret i la seva importància pel disseny instructiu multimèdia

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La recerca efectuada sobre les estratègies d’aprenentatge de llengües ha demostrat que els aprenents que utilitzen estratègies metacognitives (planificació, revisió i avaluació) desenvolupen estratègies cognitives més eficaces (Anderson, 2002). Aquest article descriu les activitats que 43 estudiants de llengua estrangera de la Universitat de Vic van emprendre de forma independent i dedueix les estratègies metacognitives que van utilitzar sense cap formació prèvia en estratègies. Els estudiants van completar un dossier on expressaven les necessitats d’aprenentatge, la planificació i supervisió de les activitats i finalment l’avaluació de l’aprenentatge que havien portat a terme de manera independent fora de les hores lectives. La primera fase de l’anàlisi de les dades revela que, tot i que els estudiants foren capaços d’expressar les necessitats d’aprenentatge en general, la formulació d’objectius i la supervisió de les activitats fou escassa. La discussió gira entorn de la formació dels estudiants de llengües estrangeres en estratègies metacognitives i la integració de l’aprenentatge autònom dins el currículum docent.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Són molts els estudis que avui en dia incideixen en la necessitat d’oferir un suport metodològic i psicològic als aprenents que treballen de manera autònoma. L’objectiu d’aquest suport és ajudar-los a desenvolupar les destreses que necessiten per dirigir el seu aprenentatge així com una actitud positiva i una major conscienciació envers aquest aprenentatge. En definitiva, aquests dos tipus de preparació es consideren essencials per ajudar els aprenents a esdevenir més autònoms i més eficients en el seu propi aprenentatge. Malgrat això, si bé és freqüent trobar estudis que exemplifiquen aplicacions del suport metodològic dins els seus programes, principalment en la formació d’estratègies o ajudant els aprenents a desenvolupar un pla de treball, aquest no és el cas quan es tracta de la seva preparació psicològica. Amb rares excepcions, trobem estudis que documentin com s’incideix en les actituds i en les creences dels aprenents, també coneguts com a coneixement metacognitiu (CM), en programes que fomenten l’autonomia en l’aprenentatge. Els objectius d’aquest treball son dos: a) oferir una revisió d’estudis que han utilitzat diferents mitjans per incidir en el CM dels aprenents i b) descriure les febleses i avantatges dels procediments i instruments que utilitzen, tal com han estat valorats en estudis de recerca, ja que ens permetrà establir criteris objectius sobre com i quan utilitzar-los en programes que fomentin l’aprenentatge autodirigit.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Si tenim en compte que el procés de traducció és un procés complex, el procés de traducció d'un text audiovisual encara ho és més. A part dels problemes tècnics com per exemple la sincronització labial i temporal hi ha altres factors a tenir en compte com és l'ús d'estructures lingüístiques i textuals específiques d'aquest canal de comunicació. Moltes de les pel·lícules que sovint podem veure a la pantalla estan produïdes als Estats Units, i per tant estan en anglès, i hi ha una necessitat imperiosa de traduir-les al català i castellà. A part d'això, en algunes ocasions el text audiovisual original conté més d'una llengua; aquest és el cas de Raid on Rommel i Butch Cassidy and the Sundance Kid, entre d'altres. En aquests casos, ens trobem amb una nova dificultat: el traductor ha de traduir aquesta tercera llengua (o dialecte) a la corresponent cultura d'arribada. Aquest article vol presentar i exposar alguns exemples d'aquest tipus de dificultats així com també les diferents solucions que s'han aportat davant una "tercera" llengua.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Treball de recerca realitzat per un alumne d'ensenyament secundari i guardonat amb un Premi CIRIT per fomentar l'esperit científic del Jovent l'any 2009. En aquest treball es vol trobar un vincle entre les cultures més influents al llarg de la història d’Àsia i Europa, prenent com a element bàsic les seves llengües: el xinès, l’anglès i el llatí. Ara bé, la comparació lingüística entre elles només té veritable interès si es cerca allò comú sobretot semàntica i sintàcticament, posat que d'entrada, visual i fonèticament, qualsevol profà pot observar-ne prou diferències. Aquestes característiques comunes, doncs, tenen valor independentment del temps i l'espai, ja que el que hi ha en joc aquí és, en el fons, el llenguatge verbal com a nervi del fet de ser humà. Els continguts s'estructuren mitjançant l'ús d'un mètode inductiu com a regla d’anàlisi comparativa; no es pot, tanmateix, prescindir d'una introducció teòrica de lingüística, absolutament necessària per a un estudi comparatiu de gramàtica. Una vegada conclòs el treball, es veu que els conceptes que totes tres expressen són comuns i el canvi, quan es dóna, afecta la forma i està relacionat amb les regles de la lògica: aquests casos, doncs, no fan sinó confirmar la tesi, ja que esperar una equivalència total seria no només ingenu, sinó gens natural ni realista. L'anhel del traductor és arribar a expressar, precisament, aquest univers.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this paper we are aimed to investigate the relationship between Catalan knowledge and individual earnings in Catalonia. Using data from 2006, we find a positive earning return to Catalan proficiency; however, when accounting for self-selection into Catalan knowledge, we find a higher language return (20% of extra earnings), suggesting that individuals who are more prone to know Catalan are also less remunerated than others (negative selection effect). Moreover, we also find important complementarities between language knowledge and completed education, which means that only more educated individuals benefit from Catalan knowledge.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This paper investigates the economic value of Catalan knowledge for national and foreign first- and second-generation immigrants in Catalonia. Specifically, drawing on data from the “Survey on Living Conditions and Habits of the Catalan Population (2006)”, we want to quantify the expected earnings differential between individuals who are proficient in Catalan and those who are not, taking into account the potential endogeneity between knowledge of Catalan and earnings. The results indicate the existence of a positive return to knowledge of Catalan, with a 7.5% increase in earnings estimated by OLS; however, when we account for the presence of endogeneity, monthly earnings are around 18% higher for individuals who are able to speak and write Catalan. However, we also find that language and education are complementary inputs for generating earnings in Catalonia, given that knowledge of Catalan increases monthly earnings only for more educated individuals.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

This PhD project aims to study paraphrasing, initially understood as the different ways in which the same content is expressed linguistically. We will go into that concept in depth trying to define and delimit its scope more accurately. In that sense, we also aim to discover which kind of structures and phenomena it covers. Although there exist some paraphrasing typologies, the great majority of them only apply to English, and focus on lexical and syntactic transformations. Our intention is to go further into this subject and propose a paraphrasing typology for Spanish and Catalan combining lexical, syntactic, semantic and pragmatic knowledge. We apply a bottom-up methodology trying to collect evidence of this phenomenon from the data. For this purpose, we are initially using the Spanish Wikipedia as our corpus. The internal structure of this encyclopedia makes it a good resource for extracting paraphrasing examples for our investigation. This empirical approach will be complemented with the use of linguistic knowledge, and by comparing and contrasting our results to previously proposed paraphrasing typologies in order to enlarge the possible paraphrasing forms found in our corpus. The fact that the same content can be expressed in many different ways presents a major challenge for Natural Language Processing (NLP) applications. Thus, research on paraphrasing has recently been attracting increasing attention in the fields of NLP and Computational Linguistics. The results obtained in this investigation would be of great interest in many of these applications.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The study tested three analytic tools applied in SLA research (T-unit, AS-unit and Idea-unit) against FL learner monologic oral data. The objective was to analyse their effectiveness for the assessment of complexity of learners' academic production in English. The data were learners' individual productions gathered during the implementation of a CLIL teaching sequence on Natural Sciences in a Catalan state secondary school. The analysis showed that only AS-unit was easily applicable and highly effective in segmenting the data and taking complexity measures