998 resultados para Principe de territorialité linguistique


Relevância:

20.00% 20.00%

Publicador:

Resumo:

RÉSUMÉ : L'article a pour but d'expliquer la théorie linguistique de D. N. Ovsjaniko ­Kulikovskij (Russie, 1853-1920) et de proposer une nouvelle vision de la conception de ce linguiste souvent présenté comme un simple élève de A. A. Potebnja (1835-1891). L'article veut montrer comment Ovsjaniko­ Kulikovskij réalise son projet de créer une « linguistique scientifique » par opposition à la « philologie ». Il permet de suivre la manière dont s'est développé l'emprunt à la physique des notions d'« écono­mie d'énergie » et de celle du « moindre effort » pour la psychologie et ensuite, la linguistique, notions qui étaient promises à un grand avenir dans la linguistique du XXe siècle.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

RÉSUMÉ Cette thèse porte sur le développement de méthodes algorithmiques pour découvrir automatiquement la structure morphologique des mots d'un corpus. On considère en particulier le cas des langues s'approchant du type introflexionnel, comme l'arabe ou l'hébreu. La tradition linguistique décrit la morphologie de ces langues en termes d'unités discontinues : les racines consonantiques et les schèmes vocaliques. Ce genre de structure constitue un défi pour les systèmes actuels d'apprentissage automatique, qui opèrent généralement avec des unités continues. La stratégie adoptée ici consiste à traiter le problème comme une séquence de deux sous-problèmes. Le premier est d'ordre phonologique : il s'agit de diviser les symboles (phonèmes, lettres) du corpus en deux groupes correspondant autant que possible aux consonnes et voyelles phonétiques. Le second est de nature morphologique et repose sur les résultats du premier : il s'agit d'établir l'inventaire des racines et schèmes du corpus et de déterminer leurs règles de combinaison. On examine la portée et les limites d'une approche basée sur deux hypothèses : (i) la distinction entre consonnes et voyelles peut être inférée sur la base de leur tendance à alterner dans la chaîne parlée; (ii) les racines et les schèmes peuvent être identifiés respectivement aux séquences de consonnes et voyelles découvertes précédemment. L'algorithme proposé utilise une méthode purement distributionnelle pour partitionner les symboles du corpus. Puis il applique des principes analogiques pour identifier un ensemble de candidats sérieux au titre de racine ou de schème, et pour élargir progressivement cet ensemble. Cette extension est soumise à une procédure d'évaluation basée sur le principe de la longueur de description minimale, dans- l'esprit de LINGUISTICA (Goldsmith, 2001). L'algorithme est implémenté sous la forme d'un programme informatique nommé ARABICA, et évalué sur un corpus de noms arabes, du point de vue de sa capacité à décrire le système du pluriel. Cette étude montre que des structures linguistiques complexes peuvent être découvertes en ne faisant qu'un minimum d'hypothèses a priori sur les phénomènes considérés. Elle illustre la synergie possible entre des mécanismes d'apprentissage portant sur des niveaux de description linguistique distincts, et cherche à déterminer quand et pourquoi cette coopération échoue. Elle conclut que la tension entre l'universalité de la distinction consonnes-voyelles et la spécificité de la structuration racine-schème est cruciale pour expliquer les forces et les faiblesses d'une telle approche. ABSTRACT This dissertation is concerned with the development of algorithmic methods for the unsupervised learning of natural language morphology, using a symbolically transcribed wordlist. It focuses on the case of languages approaching the introflectional type, such as Arabic or Hebrew. The morphology of such languages is traditionally described in terms of discontinuous units: consonantal roots and vocalic patterns. Inferring this kind of structure is a challenging task for current unsupervised learning systems, which generally operate with continuous units. In this study, the problem of learning root-and-pattern morphology is divided into a phonological and a morphological subproblem. The phonological component of the analysis seeks to partition the symbols of a corpus (phonemes, letters) into two subsets that correspond well with the phonetic definition of consonants and vowels; building around this result, the morphological component attempts to establish the list of roots and patterns in the corpus, and to infer the rules that govern their combinations. We assess the extent to which this can be done on the basis of two hypotheses: (i) the distinction between consonants and vowels can be learned by observing their tendency to alternate in speech; (ii) roots and patterns can be identified as sequences of the previously discovered consonants and vowels respectively. The proposed algorithm uses a purely distributional method for partitioning symbols. Then it applies analogical principles to identify a preliminary set of reliable roots and patterns, and gradually enlarge it. This extension process is guided by an evaluation procedure based on the minimum description length principle, in line with the approach to morphological learning embodied in LINGUISTICA (Goldsmith, 2001). The algorithm is implemented as a computer program named ARABICA; it is evaluated with regard to its ability to account for the system of plural formation in a corpus of Arabic nouns. This thesis shows that complex linguistic structures can be discovered without recourse to a rich set of a priori hypotheses about the phenomena under consideration. It illustrates the possible synergy between learning mechanisms operating at distinct levels of linguistic description, and attempts to determine where and why such a cooperation fails. It concludes that the tension between the universality of the consonant-vowel distinction and the specificity of root-and-pattern structure is crucial for understanding the advantages and weaknesses of this approach.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La recherche « Le sens des messages préventifs du sida » a été dirigée par une équipe de spécialistes relevant de domaines distincts - linguistique (Pr Pascal Singy), santé publique (Dre Brenda Spencer), médecine psychosociale (Pr Patrice Guex). Partant du constat que les langues naturelles n'existent que sous la forme de variétés, il a été postulé que le registre lexical du VIH/sida et de sa prévention n'échappe pas au principe de variabilité sémantique qui veut que, séparés par la multiplicité de leurs identités (sexe, appartenance socioculturelle, âge, etc.), les membres d'une « même » communauté linguistique tendent à associer à une unité lexicale donnée des significations différentes, voire antagonistes. Menée entre 2004 et 2006 en Suisse romande, la recherche « Le sens des messages préventifs du sida » s'appuie sur une approche sémantique de la prévention. Elle interroge les limites d'une communication préventive différée - par voie d'affiches et de brochures, en particulier - qui suppose que le destinataire ou récepteur d'un message en prend connaissance en l'absence de celui qui l'a émis. Les différents mécanismes conversationnels d'ajustement faisant à l'évidence défaut dans ce type de situation de communication, la variabilité sémantique peut dès lors apparaître problématique. S'agissant de l'objectif de cette recherche, il a essentiellement tenu dans la mise en évidence du degré de consensus que montrent les récepteurs (la population générale) ainsi que les émetteurs des messages préventifs à propos des significations attachées à des unités constitutives du lexique du VIH/sida et de sa prévention. Cette mise en évidence a par ailleurs permis d'évaluer la convergence des résultats obtenus pour les premiers et pour les seconds. Du point de vue méthodologique, un corpus de documents préventifs a été constitué - des brochures, principalement, publiées en français entre 1996 et 2004 - et analysé. Soixante et une unités lexicales, relevant du français commun ou spécialisé, ont alors été sélectionnées. L'ensemble de ces unités a été soumis à soixante représentants de la population générale vaudoise ainsi qu'à trente professionnels vaudois de la prévention dans le cadre d'entretiens en face à face. Ces entretiens ont permis de dégager les significations que ces deux populations attachent à une partie des unités lexicales (N=21) et le niveau d'intelligibilité/utilisation de l' autre partie des unités (N=40) - cf. infra *. Sur la base des résultats obtenus pour la population générale vaudoise, quinze unités lexicales apparues particulièrement problématiques ont été sélectionnées et soumises par le moyen d'une enquête téléphonique (CATI) à cinq cents Romands. Mêlant techniques qualitatives et quantitatives, la recherche « Le sens des messages préventifs du sida » apporte des résultats intéressant non plus seulement les agents de la prévention du VIH/sida, mais également les patients de celle-ci, c'est-à-dire la population générale. Des résultats qui se trouvent susceptibles de renforcer la portée de la prévention du VIH/sida en particulier dans la partie francophone de la Suisse. *Les unités lexicales sélectionnées sont les suivantes : abstinence, anus, caresses, coït anal, contact sexuel, contamination par voie sexuelle, coucher avec, cunnilingus, dépistage, « évitez le contact de la bouche avec du sperme ou du sang », faire l'amour, fellation, fidèle, gai, gay, immunisé, infection sexuellement transmissible, IST, liquides biologiques, maladies vénériennes, menstruation, MST, muqueuses, muqueuse buccale, muqueuses génitales, « pas de sperme dans la bouche », pathogène, pénétration, plaie ouverte, préservatif, préservatif féminin, prophylaxie de post-exposition [PEP], rapport bucco-génital, rapport sexuel, rapports sexuels non protégés, rapports sexuels oraux, rectum, relation anale, relation stable, relation vaginale, safer sex, sécrétions sexuelles, sécrétions vaginales, séronégatif, séropositif, sexe à moindre risque, sexe anal, sida, sperme, surcontamination, symptôme, système immunitaire, test d'anticorps VIH, test VIH, traitements antirétroviraux combinés, traitement combiné, trithérapies, urètre, vaginal, VIH, virus IH.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Con la perspectiva que se va abriendo del nuevo siglo tras el transcurso de su primera década, este volumen colectivo reúne un ramillete de contribuciones de distintos especialistas que muestran aspectos diversos de la lingüística románica, disciplina forjada en el xix y que, camino de dos centurias después, induce a los directores-coordinadores del libro en la página inicial de la Présentation a plantear las expectativas de su enseñanza futura en el marco de la ciencia y de la sociedad que vienen.