990 resultados para 200408 Linguistic Structures (incl. Grammar Phonology Lexicon Semantics)
Resumo:
This thesis concerns artificially intelligent natural language processing systems that are capable of learning the properties of lexical items (properties like verbal valency or inflectional class membership) autonomously while they are fulfilling their tasks for which they have been deployed in the first place. Many of these tasks require a deep analysis of language input, which can be characterized as a mapping of utterances in a given input C to a set S of linguistically motivated structures with the help of linguistic information encoded in a grammar G and a lexicon L: G + L + C → S (1) The idea that underlies intelligent lexical acquisition systems is to modify this schematic formula in such a way that the system is able to exploit the information encoded in S to create a new, improved version of the lexicon: G + L + S → L' (2) Moreover, the thesis claims that a system can only be considered intelligent if it does not just make maximum usage of the learning opportunities in C, but if it is also able to revise falsely acquired lexical knowledge. So, one of the central elements in this work is the formulation of a couple of criteria for intelligent lexical acquisition systems subsumed under one paradigm: the Learn-Alpha design rule. The thesis describes the design and quality of a prototype for such a system, whose acquisition components have been developed from scratch and built on top of one of the state-of-the-art Head-driven Phrase Structure Grammar (HPSG) processing systems. The quality of this prototype is investigated in a series of experiments, in which the system is fed with extracts of a large English corpus. While the idea of using machine-readable language input to automatically acquire lexical knowledge is not new, we are not aware of a system that fulfills Learn-Alpha and is able to deal with large corpora. To instance four major challenges of constructing such a system, it should be mentioned that a) the high number of possible structural descriptions caused by highly underspeci ed lexical entries demands for a parser with a very effective ambiguity management system, b) the automatic construction of concise lexical entries out of a bulk of observed lexical facts requires a special technique of data alignment, c) the reliability of these entries depends on the system's decision on whether it has seen 'enough' input and d) general properties of language might render some lexical features indeterminable if the system tries to acquire them with a too high precision. The cornerstone of this dissertation is the motivation and development of a general theory of automatic lexical acquisition that is applicable to every language and independent of any particular theory of grammar or lexicon. This work is divided into five chapters. The introductory chapter first contrasts three different and mutually incompatible approaches to (artificial) lexical acquisition: cue-based queries, head-lexicalized probabilistic context free grammars and learning by unification. Then the postulation of the Learn-Alpha design rule is presented. The second chapter outlines the theory that underlies Learn-Alpha and exposes all the related notions and concepts required for a proper understanding of artificial lexical acquisition. Chapter 3 develops the prototyped acquisition method, called ANALYZE-LEARN-REDUCE, a framework which implements Learn-Alpha. The fourth chapter presents the design and results of a bootstrapping experiment conducted on this prototype: lexeme detection, learning of verbal valency, categorization into nominal count/mass classes, selection of prepositions and sentential complements, among others. The thesis concludes with a review of the conclusions and motivation for further improvements as well as proposals for future research on the automatic induction of lexical features.
Resumo:
El espacio doméstico construido es un producto social que a su vez crea sociedad. La casa constituye un escenario privilegiado, un medio de expresión y transmisión de conductas y comportamientos. No obstante, resulta muy difícil comprender el espacio social a través de unas ruinas arqueológicas vacías y carentes de tercera dimensión, y se corre el riesgo de proyectar una imagen historiográfica previamente construida sobre las sociedades estudiadas. La comprensión del espacio social requiere formalizar y discutir los patrones formales de las estructuras domésticas y sus formas de agrupación. Este trabajo aborda el estudio de los espacios domésticos desde una perspectiva lingüística (una gramática de la casa), distinguiendo los elementos en sí y sus combinaciones. Se definen tres niveles distintos de análisis del hecho doméstico: el morfológico, que se ocupa de la forma de las unidades domésticas y de las transformaciones que experimentan; el sintáctico que enfatiza las relaciones entre las estructuras elementales en el marco de una estructura espacial organizada; y el semiótico, que las analiza como expresiones sociales, materialización e instrumento de significados culturales. De acuerdo a esta perspectiva se propone una reflexión metodológica sobre la caracterización de los espacios domésticos medievales e islámicos en la Península Ibérica; se plantean los problemas derivados del uso social del espacio, los modelos domésticos y su diacronía, y se discute acerca de la casa como indicador material de islamización.
Resumo:
Traditionally the basal ganglia have been implicated in motor behavior, as they are involved in both the execution of automatic actions and the modification of ongoing actions in novel contexts. Corresponding to cognition, the role of the basal ganglia has not been defined as explicitly. Relative to linguistic processes, contemporary theories of subcortical participation in language have endorsed a role for the globus pallidus internus (GPi) in the control of lexical-semantic operations. However, attempts to empirically validate these postulates have been largely limited to neuropsychological investigations of verbal fluency abilities subsequent to pallidotomy. We evaluated the impact of bilateral posteroventral pallidotomy (BPVP) on language function across a range of general and high-level linguistic abilities, and validated/extended working theories of pallidal participation in language. Comprehensive linguistic profiles were compiled up to 1 month before and 3 months after BPVP in 6 subjects with Parkinson's disease (PD). Commensurate linguistic profiles were also gathered over a 3-month period for a nonsurgical control cohort of 16 subjects with PD and a group of 16 non-neurologically impaired controls (NC). Nonparametric between-groups comparisons were conducted and reliable change indices calculated, relative to baseline/3-month follow-up difference scores. Group-wise statistical comparisons between the three groups failed to reveal significant postoperative changes in language performance. Case-by-case data analysis relative to clinically consequential change indices revealed reliable alterations in performance across several language variables as a consequence of BPVP. These findings lend support to models of subcortical participation in language, which promote a role for the GPi in lexical-semantic manipulation mechanisms. Concomitant improvements and decrements in postoperative performance were interpreted within the context of additive and subtractive postlesional effects. Relative to parkinsonian cohorts, clinically reliable versus statistically significant changes on a case by case basis may provide the most accurate method of characterizing the way in which pathophysiologically divergent basal ganglia linguistic circuits respond to BPVP.
Resumo:
Age-related changes in the adult language addressed to children aged 2;0-4;0 years in polyadic conditions were investigated in Australian childcare centres. The language that 21 staff members addressed to these children was coded for multiple variables in the broad social categories of prosody, context, speech act and gesture. The linguistic components were coded within the categories of phonology, lexicon, morphology, syntax and referential deixis. Minimal age-related differences were found. Explanations for the similarity of the adult language input across the age groups within the early childhood educational environment, will be discussed
Resumo:
There is now considerable evidence to suggest that non-demented people with Parkinson's disease (PD) experience difficulties using the morphosyntactic aspects of language. It remains unclear, however, at precisely which point in the processing of morphosyntax, these difficulties emerge. The major objective of the present study was to examine the impact of PD on the processes involved in accessing morphosyntactic information in the lexicon. Nineteen people with PD and 19 matched control subjects participated in the study which employed on-line word recognition tasks to examine morphosyntactic priming for local grammatical dependencies that occur both within (e.g. is going) and across (e.g. she gives) phrasal boundaries (Experiments 1 and 2, respectively). The control group evidenced robust morphosyntactic priming effects that were consistent with the involvement of both pre- (Experiment 1) and post-lexical (Experiment 2) processing routines. Whilst the participants with PD also recorded priming for dependencies within phrasal boundaries (Experiment 1), priming effects were observed over an abnormally brief time course. Further, in contrast to the controls, the PD group failed to record morphosyntactic priming for constructions that crossed phrasal boundaries (Experiment 2). The results demonstrate that attentionally mediated mechanisms operating at both the pre- and post-lexical stages of processing are able to contribute to morphosyntactic priming effects. In addition, the findings support the notion that, whilst people with PD are able to access morphosyntactic information in a normal manner, the time frame in which this information remains available for processing is altered. Deficits may also be experienced at the post-lexical integrational stage of processing.
Resumo:
[spa] Se presenta el operador de media ponderada ordenada generalizada lingüística de 2 tuplas inducida (2-TILGOWA). Es un nuevo operador de agregación que extiende los anteriores modelos a través de utilizar medias generalizadas, variables de ordenación inducidas e información lingüística representada mediante el modelo de las 2 tuplas lingüísticas. Su principal ventaja se encuentra en la posibilidad de incluir a un gran número de operadores de agregación lingüísticos como casos particulares. Por eso, el análisis puede ser visto desde diferentes perspectivas de forma que se obtiene una visión más completa del problema considerado y seleccionar la alternativa que parece estar en mayor concordancia con nuestros intereses o creencias. A continuación se desarrolla una generalización mayor a través de utilizar medias cuasi-aritméticas, obteniéndose el operador Quasi-2-TILOWA. El trabajo finaliza analizando la aplicabilidad del nuevo modelo en un problema de toma de decisiones sobre gestión de la producción.
Resumo:
[spa] Se presenta el operador de media ponderada ordenada generalizada lingüística de 2 tuplas inducida (2-TILGOWA). Es un nuevo operador de agregación que extiende los anteriores modelos a través de utilizar medias generalizadas, variables de ordenación inducidas e información lingüística representada mediante el modelo de las 2 tuplas lingüísticas. Su principal ventaja se encuentra en la posibilidad de incluir a un gran número de operadores de agregación lingüísticos como casos particulares. Por eso, el análisis puede ser visto desde diferentes perspectivas de forma que se obtiene una visión más completa del problema considerado y seleccionar la alternativa que parece estar en mayor concordancia con nuestros intereses o creencias. A continuación se desarrolla una generalización mayor a través de utilizar medias cuasi-aritméticas, obteniéndose el operador Quasi-2-TILOWA. El trabajo finaliza analizando la aplicabilidad del nuevo modelo en un problema de toma de decisiones sobre gestión de la producción.
Resumo:
En este trabajo se describe la naturaleza y secuencia de adquisición de las preguntas interrogativas parcialesen niños de habla catalana y/o castellana dentro de un marco de análisis según el cual la adquisición de lasestructuras lingüísticas se construye gradualmente desde estructuras concretas hasta estructuras más abstractas.La muestra utilizada se compone de 10 niños y niñas procedentes de corpus longitudinales cuyas edades van delos 17 meses a los 3 años. El análisis se ha realizado atendiendo a la estructura sintáctica de la oración, loserrores, los pronombres y adverbios interrogativos, y la tipología verbal. Los resultados muestran que la secuenciade adquisición pasa por un momento inicial caracterizado por producciones estereotipadas o fórmulas,durante el cual sólo aparecen algunas partículas interrogativas en estructuras muy concretas. Posteriormente lainterrogación aparece con otros pronombres y adverbios y se diversifica a otros verbos, además, no se observanerrores en la construcción sintáctica. Estos resultados suponen un hecho diferencial respecto de estudios previos enlengua inglesa
Resumo:
In the paper Busaniche and Cignoli (2009) we presented a quasivariety of commutative residuated lattices, called NPc-lattices, that serves as an algebraic semantics for paraconsistent Nelson's logic. In the present paper we show that NPc-lattices form a subvariety of the variety of commutative residuated lattices, we study congruences of NPc-lattices and some subvarieties of NPc-lattices.
Resumo:
Tämän tutkimuksen kohde on suomen kirjoitetun yleiskielen morfosyntaktisten yhdyssanarakenteiden produktiivisuus. Tutkimuksen tärkein päämäärä on selvittää, kuinka ahkerasti erilaisia suomen kielen suomia mahdollisuuksia käytetään uusien yhdyssanojen muodostuksessa. Käytännöllistä produktiivisuutta kartoittava tutkimus täydentää kielioppien ja sanastonkuvausten antamaa kuvaa kielestä. Tutkimuksen kohteena oleva kielimuoto on kaikille kielenkäyttäjille yhteinen kirjoitettu yleiskieli. Tutkimusaineisto koostuu 28 091 uudesta yhdyssanasta, jotka on kerätty painetun median kielestä vuosina 2000–2009. Aineiston pohjana on Kotimaisten kielten keskuksen Nykysuomen sanastotietokanta, johon poimitaan uusia ja uudella tavalla käytettyjä sanoja ensisijaisesti sanakirjatyön ja kielenhuollon tarpeisiin. Tutkimusaihetta lähestytään useiden yhdyssanan osien muotoa, sanaluokkaa, määrää ja pituutta koskevien alakysymysten kautta. Tutkimus etenee yksittäisten muut-tujien käsittelystä muuttujien keskinäisiä suhteita tarkasteleviin malleihin. Tutkimuksessa käytetään kaksivaiheista metodia: Metodin ensimmäinen askel on uudessa sanastossa havaittujen rakenteiden tyyppifrekvenssin tilastollinen analyysi. Toinen askel on varsinkin matalafrekvenssisten tai tilastollisessa analyysissa muuten poikkeavaksi osoittautuneiden rakenteiden kvalitatiivinen tarkastelu. Metodi on kehitetty tätä tutkimusta varten, sillä aiemmin produktiivisuuden mittaamisessa käytetyt menetelmät eivät sellaisenaan sovi suomen kielen yhdyssanarakenteiden tutkimukseen. Tutkimusmetodien kehittäminen on tutkimuksen keskeinen tavoite. Tutkimus osoittaa, että suomen kielen uudet yhdyssanat ovat rakenteeltaan homogeenisempiä, kuin aiempia kielenkuvauksia lukemalla voisi olettaa. Uusi suomen kielen yhdyssana on todennäköisimmin kahdesta substantiivista yhdistämällä muodostettu substantiivi, jonka alkuosa on nominatiivissa eikä kongruoi jälkiosan kanssa. Ennakko-oletusta huomattavasti yleisempiä ovat myös prefiksinkaltaisella alkuosalla alkavat yhdyssanat. Genetiivialkuiset yhdyssanat puolestaan ovat ennakko-oletusta harvinaisempia. Kaikki kieliopillisesti mahdolliset yhdyssanarakenteet eivät ole lainkaan produktiivisia kielenkäytön tasolla. Tutkimus on luonteeltaan kielen rakennetta kartoittavaa perustutkimusta. Tutkimustulosten tärkeimmät sovellusalat ovat kieliteknologia ja sananmuodostuksen opetus. Tutkimus avaa useita näkökulmia jatkotutkimukselle.
Resumo:
En este trabajo se describe la naturaleza y secuencia de adquisición de las preguntas interrogativas parciales en niños de habla catalana y/o castellana dentro de un marco de análisis según el cual la adquisición de las estructuras lingüísticas se construye gradualmente desde estructuras concretas hasta estructuras más abstractas. La muestra utilizada se compone de 10 niños y niñas procedentes de corpus longitudinales cuyas edades van de los 17 meses a los 3 años. El análisis se ha realizado atendiendo a la estructura sintáctica de la oración, los errores, los pronombres y adverbios interrogativos, y la tipología verbal. Los resultados muestran que la secuencia de adquisición pasa por un momento inicial caracterizado por producciones estereotipadas o fórmulas, durante el cual sólo aparecen algunas partículas interrogativas en estructuras muy concretas. Posteriormente la interrogación aparece con otros pronombres y adverbios y se diversifica a otros verbos, además, no se observan errores en la construcción sintáctica. Estos resultados suponen un hecho diferencial respecto de estudios previos en lengua inglesa