308 resultados para Linguistique soviétique - phonologie - alphabets - langues caucasiennes
Resumo:
Le manuscrit de Paris, BNF, fr. 818 renferme dans sa première partie (fol. 1-154) l'une des plus amples collections de miracles de Notre-Dame en langue vulgaire du xiiie siècle. Composée vers 1220 dans la région de Lyon, cette compilation anonyme compte parmi les rares textes littéraires produits au Moyen Âge dans l'espace francoprovençal, domaine géographiquement intermédiaire entre le domaine d'oïl et le domaine d'oc (et englobant notam- ment la plus grande partie de la Suisse romande), mais présentant des caracté- ristiques linguistiques qui lui sont propres. Malgré son grand intérêt linguistique et thématique, la collection de miracles du ms. fr. 818 demeure à ce jour partiellement inédite et n'a fait l'objet que d'études fragmentaires. Nous nous proposons donc d'apporter une contribution aux études francoprovençales en complétant l'édition de ce « Mariale en langue vulgaire » (selon l'expression de P. Meyer) et en ana- lysant la scripta très hétérogène de ce recueil, qui se présente comme un savant mélange de formes françaises et de formes lyonnaises. Grâce à l'exa- men systématique de tous les aspects remarquables de la langue du Mariale (phonétique, morphologie, lexique), nous souhaitons porter à la connais- sance des romanistes les riches matériaux francoprovençaux offerts par ce recueil, matériaux qui demeurent en partie méconnus et se trouvent parfois répertoriés dans les dictionnaires sous la fausse étiquette « française ».
Resumo:
RÉSUMÉ : L'article a pour but d'expliquer la théorie linguistique de D. N. Ovsjaniko Kulikovskij (Russie, 1853-1920) et de proposer une nouvelle vision de la conception de ce linguiste souvent présenté comme un simple élève de A. A. Potebnja (1835-1891). L'article veut montrer comment Ovsjaniko Kulikovskij réalise son projet de créer une « linguistique scientifique » par opposition à la « philologie ». Il permet de suivre la manière dont s'est développé l'emprunt à la physique des notions d'« économie d'énergie » et de celle du « moindre effort » pour la psychologie et ensuite, la linguistique, notions qui étaient promises à un grand avenir dans la linguistique du XXe siècle.
Resumo:
RÉSUMÉ Cette thèse porte sur le développement de méthodes algorithmiques pour découvrir automatiquement la structure morphologique des mots d'un corpus. On considère en particulier le cas des langues s'approchant du type introflexionnel, comme l'arabe ou l'hébreu. La tradition linguistique décrit la morphologie de ces langues en termes d'unités discontinues : les racines consonantiques et les schèmes vocaliques. Ce genre de structure constitue un défi pour les systèmes actuels d'apprentissage automatique, qui opèrent généralement avec des unités continues. La stratégie adoptée ici consiste à traiter le problème comme une séquence de deux sous-problèmes. Le premier est d'ordre phonologique : il s'agit de diviser les symboles (phonèmes, lettres) du corpus en deux groupes correspondant autant que possible aux consonnes et voyelles phonétiques. Le second est de nature morphologique et repose sur les résultats du premier : il s'agit d'établir l'inventaire des racines et schèmes du corpus et de déterminer leurs règles de combinaison. On examine la portée et les limites d'une approche basée sur deux hypothèses : (i) la distinction entre consonnes et voyelles peut être inférée sur la base de leur tendance à alterner dans la chaîne parlée; (ii) les racines et les schèmes peuvent être identifiés respectivement aux séquences de consonnes et voyelles découvertes précédemment. L'algorithme proposé utilise une méthode purement distributionnelle pour partitionner les symboles du corpus. Puis il applique des principes analogiques pour identifier un ensemble de candidats sérieux au titre de racine ou de schème, et pour élargir progressivement cet ensemble. Cette extension est soumise à une procédure d'évaluation basée sur le principe de la longueur de description minimale, dans- l'esprit de LINGUISTICA (Goldsmith, 2001). L'algorithme est implémenté sous la forme d'un programme informatique nommé ARABICA, et évalué sur un corpus de noms arabes, du point de vue de sa capacité à décrire le système du pluriel. Cette étude montre que des structures linguistiques complexes peuvent être découvertes en ne faisant qu'un minimum d'hypothèses a priori sur les phénomènes considérés. Elle illustre la synergie possible entre des mécanismes d'apprentissage portant sur des niveaux de description linguistique distincts, et cherche à déterminer quand et pourquoi cette coopération échoue. Elle conclut que la tension entre l'universalité de la distinction consonnes-voyelles et la spécificité de la structuration racine-schème est cruciale pour expliquer les forces et les faiblesses d'une telle approche. ABSTRACT This dissertation is concerned with the development of algorithmic methods for the unsupervised learning of natural language morphology, using a symbolically transcribed wordlist. It focuses on the case of languages approaching the introflectional type, such as Arabic or Hebrew. The morphology of such languages is traditionally described in terms of discontinuous units: consonantal roots and vocalic patterns. Inferring this kind of structure is a challenging task for current unsupervised learning systems, which generally operate with continuous units. In this study, the problem of learning root-and-pattern morphology is divided into a phonological and a morphological subproblem. The phonological component of the analysis seeks to partition the symbols of a corpus (phonemes, letters) into two subsets that correspond well with the phonetic definition of consonants and vowels; building around this result, the morphological component attempts to establish the list of roots and patterns in the corpus, and to infer the rules that govern their combinations. We assess the extent to which this can be done on the basis of two hypotheses: (i) the distinction between consonants and vowels can be learned by observing their tendency to alternate in speech; (ii) roots and patterns can be identified as sequences of the previously discovered consonants and vowels respectively. The proposed algorithm uses a purely distributional method for partitioning symbols. Then it applies analogical principles to identify a preliminary set of reliable roots and patterns, and gradually enlarge it. This extension process is guided by an evaluation procedure based on the minimum description length principle, in line with the approach to morphological learning embodied in LINGUISTICA (Goldsmith, 2001). The algorithm is implemented as a computer program named ARABICA; it is evaluated with regard to its ability to account for the system of plural formation in a corpus of Arabic nouns. This thesis shows that complex linguistic structures can be discovered without recourse to a rich set of a priori hypotheses about the phenomena under consideration. It illustrates the possible synergy between learning mechanisms operating at distinct levels of linguistic description, and attempts to determine where and why such a cooperation fails. It concludes that the tension between the universality of the consonant-vowel distinction and the specificity of root-and-pattern structure is crucial for understanding the advantages and weaknesses of this approach.
Resumo:
http://w3.u-grenoble3.fr/ellug/index.html/fileadmin/template/ellug/Telechargements/tdm_grammaire_et_lexique.pdf