960 resultados para Corpus acquisition
Resumo:
The objective of the PANACEA ICT-2007.2.2 EU project is to build a platform that automates the stages involved in the acquisition,production, updating and maintenance of the large language resources required by, among others, MT systems. The development of a Corpus Acquisition Component (CAC) for extracting monolingual and bilingual data from the web is one of the most innovative building blocks of PANACEA. The CAC, which is the first stage in the PANACEA pipeline for building Language Resources, adopts an efficient and distributed methodology to crawl for web documents with rich textual content in specific languages and predefined domains. The CAC includes modules that can acquire parallel data from sites with in-domain content available in more than one language. In order to extrinsically evaluate the CAC methodology, we have conducted several experiments that used crawled parallel corpora for the identification and extraction of parallel sentences using sentence alignment. The corpora were then successfully used for domain adaptation of Machine Translation Systems.
Resumo:
In this article we try to analyze the learning processes of health literacy skills in informal contexts. We intend to broaden the understanding of the learning process beyond the formal contexts, thus contributing to the elucidation of health professionals on how individuals acquire and manage their knowledge in health matters. Given our goal, we use an analytic corpus constituted by one hundred autobiographical narratives written between 2006 and 2011, in educational contexts but with recognized potential for use in different scientific fields, including health. The results reveal the existence of three different types of modes of learning health literacy skills in informal context: : i) learning that takes place in action, in achieving daily tasks; ii) learning processes that result from problem solving; iii) learning that occurs in an unplanned manner, resulting from accidental circumstances and, in some cases, devoid of intentionality.
Resumo:
En este trabajo se describe la naturaleza y secuencia de adquisición de las preguntas interrogativas parcialesen niños de habla catalana y/o castellana dentro de un marco de análisis según el cual la adquisición de lasestructuras lingüísticas se construye gradualmente desde estructuras concretas hasta estructuras más abstractas.La muestra utilizada se compone de 10 niños y niñas procedentes de corpus longitudinales cuyas edades van delos 17 meses a los 3 años. El análisis se ha realizado atendiendo a la estructura sintáctica de la oración, loserrores, los pronombres y adverbios interrogativos, y la tipología verbal. Los resultados muestran que la secuenciade adquisición pasa por un momento inicial caracterizado por producciones estereotipadas o fórmulas,durante el cual sólo aparecen algunas partículas interrogativas en estructuras muy concretas. Posteriormente lainterrogación aparece con otros pronombres y adverbios y se diversifica a otros verbos, además, no se observanerrores en la construcción sintáctica. Estos resultados suponen un hecho diferencial respecto de estudios previos enlengua inglesa
Resumo:
Ce travail porte sur la construction d’un corpus étalon pour l’évaluation automatisée des extracteurs de termes. Ces programmes informatiques, conçus pour extraire automatiquement les termes contenus dans un corpus, sont utilisés dans différentes applications, telles que la terminographie, la traduction, la recherche d’information, l’indexation, etc. Ainsi, leur évaluation doit être faite en fonction d’une application précise. Une façon d’évaluer les extracteurs consiste à annoter toutes les occurrences des termes dans un corpus, ce qui nécessite un protocole de repérage et de découpage des unités terminologiques. À notre connaissance, il n’existe pas de corpus annoté bien documenté pour l’évaluation des extracteurs. Ce travail vise à construire un tel corpus et à décrire les problèmes qui doivent être abordés pour y parvenir. Le corpus étalon que nous proposons est un corpus entièrement annoté, construit en fonction d’une application précise, à savoir la compilation d’un dictionnaire spécialisé de la mécanique automobile. Ce corpus rend compte de la variété des réalisations des termes en contexte. Les termes sont sélectionnés en fonction de critères précis liés à l’application, ainsi qu’à certaines propriétés formelles, linguistiques et conceptuelles des termes et des variantes terminologiques. Pour évaluer un extracteur au moyen de ce corpus, il suffit d’extraire toutes les unités terminologiques du corpus et de comparer, au moyen de métriques, cette liste à la sortie de l’extracteur. On peut aussi créer une liste de référence sur mesure en extrayant des sous-ensembles de termes en fonction de différents critères. Ce travail permet une évaluation automatique des extracteurs qui tient compte du rôle de l’application. Cette évaluation étant reproductible, elle peut servir non seulement à mesurer la qualité d’un extracteur, mais à comparer différents extracteurs et à améliorer les techniques d’extraction.
Resumo:
En este trabajo se describe la naturaleza y secuencia de adquisición de las preguntas interrogativas parciales en niños de habla catalana y/o castellana dentro de un marco de análisis según el cual la adquisición de las estructuras lingüísticas se construye gradualmente desde estructuras concretas hasta estructuras más abstractas. La muestra utilizada se compone de 10 niños y niñas procedentes de corpus longitudinales cuyas edades van de los 17 meses a los 3 años. El análisis se ha realizado atendiendo a la estructura sintáctica de la oración, los errores, los pronombres y adverbios interrogativos, y la tipología verbal. Los resultados muestran que la secuencia de adquisición pasa por un momento inicial caracterizado por producciones estereotipadas o fórmulas, durante el cual sólo aparecen algunas partículas interrogativas en estructuras muy concretas. Posteriormente la interrogación aparece con otros pronombres y adverbios y se diversifica a otros verbos, además, no se observan errores en la construcción sintáctica. Estos resultados suponen un hecho diferencial respecto de estudios previos en lengua inglesa
Resumo:
This paper describes the methodology used to compile a corpus called MorphoQuantics that contains a comprehensive set of 17,943 complex word types extracted from the spoken component of the British National Corpus (BNC). The categorisation of these complex words was derived primarily from the classification of Prefixes, Suffixes and Combining Forms proposed by Stein (2007). The MorphoQuantics corpus has been made available on a website of the same name; it lists 554 word-initial and 281 word-final morphemes in English, their etymology and meaning, and records the type and token frequencies of all the associated complex words containing these morphemes from the spoken element of the BNC, together with their Part of Speech. The results show that, although the number of word-initial affixes is nearly double that of word-final affixes, the relative number of each observed in the BNC is very similar; however, word-final affixes are more productive in that, on average, the frequency with which they attach to different bases is three times that of word-initial affixes. Finally, this paper considers how linguists, psycholinguists and psychologists may use MorphoQuantics to support their empirical work in first and second language acquisition, and clinical and educational research.
Resumo:
Contrary to expectations derived from preclinical studies of the effects of stress, and imaging studies of adults with posttraumatic stress disorder (PTSD), there is no evidence of hippocampus atrophy in children with PTSD. Multiple pediatric studies have reported reductions in the corpus callosum - the primary white matter tract in the brain. Consequently, in the present study, diffusion tensor imaging was used to assess white matter integrity in the corpus callosum in 17 maltreated children with PTSD and 15 demographically matched normal controls. Children with PTSD had reduced fractional anisotropy in the medial and posterior corpus, a region which contains interhemispheric projections from brain structures involved in circuits that mediate the processing of emotional stimuli and various memory functions - core disturbances associated with a history of trauma. Further exploration of the effects of stress on the corpus callosum and white matter development appears a promising strategy to better understand the pathophysiology of PTSD in children. (C) 2007 Elsevier Ireland Ltd. All rights reserved.
Resumo:
The concept of theory of mind (ToM), a hot topic in cognitive psychology for the past twenty-five years, has gained increasing importance in the fields of linguistics and pragmatics. However, even though the relationship between ToM and verbal communication is now recognized, the extent, causality and full implications of this connection remain mostly to be explored. This book presents a comprehensive discussion of the interface between language, communication, and theory of mind, and puts forward an innovative proposal regarding the role of discourse connectives for this interface. The proposed analysis of connectives is tested from the perspective of their acquisition, using empirical methods such as corpus analysis and controlled experiments, thus placing the study of connectives within the emerging framework of experimental pragmatics.
Resumo:
El punto de partida de la presente investigación sobre el significado y la función que la mimesis tiene en el pensamiento de Aristóteles está dado por la adopción de una perspectiva de estudio 'amplia', i.e. no restringida a la esfera de las artes miméticas y que atienda al vasto y diverso registro de usos del vocabulario mimético atestiguado en el Corpus Aristotelicum. La exégesis contemporánea -paradigmáticamente representada por Halliwell (2002)- acuerda en recortar la superficie textual de investigación al dominio de la Poética (especialmente, al de sus tres primeros capítulos) y en menor medida, al libro VIII de la Política. Aún cuando es innegable el valor que la Poética tiene en la reconstrucción de la significación aristotélica de mimesis, la consideración de otras obras y otros pasajes en los que el filósofo recurre al empleo de este vocabulario, v.gr. H.A., Mete., Phys., Met., permite comprender el lugar destacado que Aristóteles le otorga a la habilidad y a las artes miméticas en el marco general de su pensamiento. La reevaluación general del significado de esta familia de palabras en el Corpus se organiza en dos partes principales. La primera está dedicada al análisis de la habilidad y de las artes miméticas como formas de aprendizaje a partir de los empleos atestiguados en Poética y en Política VII-VIII. A pesar de no ofrecer en la Poética ni en ninguna otra parte del Corpus una definición del término, el análisis realizado en el primer capítulo de la tesis sobre los principales usos del vocabulario mimético en dicha obra, i.e. capítulos 1-3, 4, 9, 24 y 25, revela que la habilidad y las artes miméticas, en cuanto que derivan de ella, constituyen para Aristóteles formas más o menos complejas de aprendizaje por medio de la identificación de semejanzas. En el segundo capítulo se examina el valor pedagógico que en los dos últimos libros de la Política Aristóteles le reconoce a la mimesis, y la singularidad que le atribuye a la mimesis musical entre las artes miméticas. El carácter antropológico de la mimesis como habilidad primaria de adquisición de conocimientos, ligada al deseo humano de conocer, permite explicar la función ético-política que le otorga a la música y de manera plausible, a las restantes artes miméticas en el programa educativo utópico del Estado ideal. La segunda parte está consagrada a investigar el empleo del vocabulario mimético en el resto del Corpus, i.e. aquellos usos no referidos a las artes miméticas y que permiten esclarecer la significación general de este concepto, y comprender mejor su empleo en relación a ese grupo de artes. En el tercer capítulo se consideran diversos pasajes que revelan el valor didáctico y heurístico que dicho vocabulario tiene en el ámbito de la investigación natural. El cuarto capítulo responde a la exigencia metodológica según la cual, es preciso comprender la mimesis aristotélica a la luz de su historia efectual. El principio conforme al cual las artes imitan a la naturaleza ha sido el eje de la recepción de la mimesis aristotélica hasta el siglo XIX. Completamente ajeno al interés primariamente estético de la exégesis actual, el principio es visto como una amenaza que atenta contra la singularidad del arte. A pesar de esta actitud generalizada por parte de los estudios histórico-sistemáticos contemporáneos se rescata el valor de este principio pues, si bien es cierto que fue formulado por Aristóteles en relación a todas las artes (miméticas y no-miméticas), su aplicación al primer grupo permite elucidar cuál es la función de ellas respecto al fin que la naturaleza ha establecido para el hombre. Finalmente, el apéndice está dedicado a la consideración de la innegable actualidad que la mimesis aristotélica tiene en la reflexión filosófica sistemática sobre el arte.
Resumo:
El punto de partida de la presente investigación sobre el significado y la función que la mimesis tiene en el pensamiento de Aristóteles está dado por la adopción de una perspectiva de estudio 'amplia', i.e. no restringida a la esfera de las artes miméticas y que atienda al vasto y diverso registro de usos del vocabulario mimético atestiguado en el Corpus Aristotelicum. La exégesis contemporánea -paradigmáticamente representada por Halliwell (2002)- acuerda en recortar la superficie textual de investigación al dominio de la Poética (especialmente, al de sus tres primeros capítulos) y en menor medida, al libro VIII de la Política. Aún cuando es innegable el valor que la Poética tiene en la reconstrucción de la significación aristotélica de mimesis, la consideración de otras obras y otros pasajes en los que el filósofo recurre al empleo de este vocabulario, v.gr. H.A., Mete., Phys., Met., permite comprender el lugar destacado que Aristóteles le otorga a la habilidad y a las artes miméticas en el marco general de su pensamiento. La reevaluación general del significado de esta familia de palabras en el Corpus se organiza en dos partes principales. La primera está dedicada al análisis de la habilidad y de las artes miméticas como formas de aprendizaje a partir de los empleos atestiguados en Poética y en Política VII-VIII. A pesar de no ofrecer en la Poética ni en ninguna otra parte del Corpus una definición del término, el análisis realizado en el primer capítulo de la tesis sobre los principales usos del vocabulario mimético en dicha obra, i.e. capítulos 1-3, 4, 9, 24 y 25, revela que la habilidad y las artes miméticas, en cuanto que derivan de ella, constituyen para Aristóteles formas más o menos complejas de aprendizaje por medio de la identificación de semejanzas. En el segundo capítulo se examina el valor pedagógico que en los dos últimos libros de la Política Aristóteles le reconoce a la mimesis, y la singularidad que le atribuye a la mimesis musical entre las artes miméticas. El carácter antropológico de la mimesis como habilidad primaria de adquisición de conocimientos, ligada al deseo humano de conocer, permite explicar la función ético-política que le otorga a la música y de manera plausible, a las restantes artes miméticas en el programa educativo utópico del Estado ideal. La segunda parte está consagrada a investigar el empleo del vocabulario mimético en el resto del Corpus, i.e. aquellos usos no referidos a las artes miméticas y que permiten esclarecer la significación general de este concepto, y comprender mejor su empleo en relación a ese grupo de artes. En el tercer capítulo se consideran diversos pasajes que revelan el valor didáctico y heurístico que dicho vocabulario tiene en el ámbito de la investigación natural. El cuarto capítulo responde a la exigencia metodológica según la cual, es preciso comprender la mimesis aristotélica a la luz de su historia efectual. El principio conforme al cual las artes imitan a la naturaleza ha sido el eje de la recepción de la mimesis aristotélica hasta el siglo XIX. Completamente ajeno al interés primariamente estético de la exégesis actual, el principio es visto como una amenaza que atenta contra la singularidad del arte. A pesar de esta actitud generalizada por parte de los estudios histórico-sistemáticos contemporáneos se rescata el valor de este principio pues, si bien es cierto que fue formulado por Aristóteles en relación a todas las artes (miméticas y no-miméticas), su aplicación al primer grupo permite elucidar cuál es la función de ellas respecto al fin que la naturaleza ha establecido para el hombre. Finalmente, el apéndice está dedicado a la consideración de la innegable actualidad que la mimesis aristotélica tiene en la reflexión filosófica sistemática sobre el arte.
Resumo:
El punto de partida de la presente investigación sobre el significado y la función que la mimesis tiene en el pensamiento de Aristóteles está dado por la adopción de una perspectiva de estudio 'amplia', i.e. no restringida a la esfera de las artes miméticas y que atienda al vasto y diverso registro de usos del vocabulario mimético atestiguado en el Corpus Aristotelicum. La exégesis contemporánea -paradigmáticamente representada por Halliwell (2002)- acuerda en recortar la superficie textual de investigación al dominio de la Poética (especialmente, al de sus tres primeros capítulos) y en menor medida, al libro VIII de la Política. Aún cuando es innegable el valor que la Poética tiene en la reconstrucción de la significación aristotélica de mimesis, la consideración de otras obras y otros pasajes en los que el filósofo recurre al empleo de este vocabulario, v.gr. H.A., Mete., Phys., Met., permite comprender el lugar destacado que Aristóteles le otorga a la habilidad y a las artes miméticas en el marco general de su pensamiento. La reevaluación general del significado de esta familia de palabras en el Corpus se organiza en dos partes principales. La primera está dedicada al análisis de la habilidad y de las artes miméticas como formas de aprendizaje a partir de los empleos atestiguados en Poética y en Política VII-VIII. A pesar de no ofrecer en la Poética ni en ninguna otra parte del Corpus una definición del término, el análisis realizado en el primer capítulo de la tesis sobre los principales usos del vocabulario mimético en dicha obra, i.e. capítulos 1-3, 4, 9, 24 y 25, revela que la habilidad y las artes miméticas, en cuanto que derivan de ella, constituyen para Aristóteles formas más o menos complejas de aprendizaje por medio de la identificación de semejanzas. En el segundo capítulo se examina el valor pedagógico que en los dos últimos libros de la Política Aristóteles le reconoce a la mimesis, y la singularidad que le atribuye a la mimesis musical entre las artes miméticas. El carácter antropológico de la mimesis como habilidad primaria de adquisición de conocimientos, ligada al deseo humano de conocer, permite explicar la función ético-política que le otorga a la música y de manera plausible, a las restantes artes miméticas en el programa educativo utópico del Estado ideal. La segunda parte está consagrada a investigar el empleo del vocabulario mimético en el resto del Corpus, i.e. aquellos usos no referidos a las artes miméticas y que permiten esclarecer la significación general de este concepto, y comprender mejor su empleo en relación a ese grupo de artes. En el tercer capítulo se consideran diversos pasajes que revelan el valor didáctico y heurístico que dicho vocabulario tiene en el ámbito de la investigación natural. El cuarto capítulo responde a la exigencia metodológica según la cual, es preciso comprender la mimesis aristotélica a la luz de su historia efectual. El principio conforme al cual las artes imitan a la naturaleza ha sido el eje de la recepción de la mimesis aristotélica hasta el siglo XIX. Completamente ajeno al interés primariamente estético de la exégesis actual, el principio es visto como una amenaza que atenta contra la singularidad del arte. A pesar de esta actitud generalizada por parte de los estudios histórico-sistemáticos contemporáneos se rescata el valor de este principio pues, si bien es cierto que fue formulado por Aristóteles en relación a todas las artes (miméticas y no-miméticas), su aplicación al primer grupo permite elucidar cuál es la función de ellas respecto al fin que la naturaleza ha establecido para el hombre. Finalmente, el apéndice está dedicado a la consideración de la innegable actualidad que la mimesis aristotélica tiene en la reflexión filosófica sistemática sobre el arte.
Resumo:
This research aims to investigate knowledge acquisition and concept formation in the domain of economics and business studies through a foreign language, English, from the very initial to the very final stage of development in the context of Higher Education in Turkey. It traces both the processes as well as the product of acquisition in order to provide a detailed picture of how knowledge acquisition occurs. It aims to explore ways in which the acquisition process can be facilitated and promoted while prospective students of the Department of Economics and Business Administration receive a language training programme, following the completion of which they will join their academic community which offers part of its courses through the English language. The study draws upon (some) theories of mental representation of knowledge, such as schema, frame and script. The concept of discourse community with its characteristics is investigated, enculturation of prospective students to acquire knowledge of their domain through L2 is explored, and the crucial role of the constructivist theory in relation to knowledge acquisition is highlighted. The present study was conducted through a process of enculturation taking place partly at the language centre of Çukurova University and partly at the target discourse community. The data utilised for initiating knowledge acquisition was obtained by establishing a corpus of economics and business texts, which the learners are expected to read during their academic courses utilising computerised technology. The method of think aloud protocols was used to analyse processes taking place in knowledge acquisition, while the product of what was acquired was investigated by means of written recall protocols. It has been discovered that knowledge acquisition operates on the basis of analogical and to a certain extent metaphorical reasoning. The evidence obtained from the think aloud protocols showed that neophytes were able to acquire fundamental concepts of their future domain by reaching the level of shared understanding with the members of their target community of the faculty. Diaries and questionnaire analyses demonstrated that enculturation facilitated learners' transition from the language centre into the target community. Analyses of the written recall protocols and examinations from the post-enculturation stage of the research showed that neophytes' academic performances in their target community were much higher than those of their non-enculturated counterparts. Processes learners go through and strategies they spontaneously make use of, especially while acquiring knowledge of a specific domain through L2 have so far remained unexplored research areas. The present research makes a potential contribution to the language and knowledge acquisition theories by examining closely and systematically the language and the strategies they employ in acquiring such knowledge. The research findings offer useful implications to English language teaching at language schools. Language teachers are provided with useful guidelines as to how they can provide prospective students of a particular academic community with an experience of acquiring fundamental concepts of their discipline before they become members of their target community.
Resumo:
Following Andersen's (1986, 1991) study of untutored anglophone learners of Spanish, aspectual features have been at the centre of hypotheses on the development of past verbal morphology in language acquisition. The Primacy of Aspect Hypothesis claims that the association of any verb category (Aktionsart) with any aspect (perfective or imperfective) constitutes the endpoint of acquisition. However, its predictions rely on the observation of a limited number of untutored learners at the early stages of their acquisition, and have yet to be confirmed in other settings. The aim of the present thesis is to evaluate the explanatory power of the PAH in respect of the acquisition of French past tenses, an aspect of the language which constitutes a serious stumbling block for foreign learners, even those at the highest levels of proficiency (Coppieters 1987). The present research applies the PAH to the production of 61 anglophone 'advanced learners' (as defined in Bartning 1997) in a tutored environment. In so doing, it tests concurrent explanations, including the influence of the input, the influence of chunking, and the hypothesis of cyclic development. Finally, it discusses the cotextual and contextual factors that still provoke what Anderson (1991) terms "non-native glitches" at the final stage, as predicted by the PAH. The first part of the thesis provides the theoretical background to the corpus analysis. It opens with a diachronic presentation of the French past tense system focusing on present areas of competition and developments that emphasize the complexity of the system to be acquired. The concepts of time, grammatical aspect and lexical aspect (Aktionsart) are introduced and discussed in the second chapter, and a distinctive formal representation of the French past tenses is offered in the third chapter. The second part of the thesis is devoted to a corpus analysis. The data gathering procedures and the choice of tasks (oral and written film narratives based on Modern Times, cloze tests and acceptability judgement tests) are described and justified in the research methodology chapter. The research design was shaped by previous studies and consequently allows comparison with these. The second chapter is devoted to the narratives analysis and the third to the grammatical tasks. This section closes with a summary of discoveries and a comparison with previous results. The conclusion addresses the initial research questions in the light of both theory and practice. It shows that the PAH fails to account for the complex phenomenon of past tense development in the acquisitional settings under study, as it adopts a local (the verb phrase) and linear (steady progression towards native usage) approach. It is thus suggested that past tense acquisition rather follows a pendular development as learners reformulate their learning hypotheses and become increasingly able to shift from local to global cues and so to integrate the influence of cotext and context in their tense choice.