991 resultados para Frame semantics (FS)


Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’annotation en rôles sémantiques est une tâche qui permet d’attribuer des étiquettes de rôles telles que Agent, Patient, Instrument, Lieu, Destination etc. aux différents participants actants ou circonstants (arguments ou adjoints) d’une lexie prédicative. Cette tâche nécessite des ressources lexicales riches ou des corpus importants contenant des phrases annotées manuellement par des linguistes sur lesquels peuvent s’appuyer certaines approches d’automatisation (statistiques ou apprentissage machine). Les travaux antérieurs dans ce domaine ont porté essentiellement sur la langue anglaise qui dispose de ressources riches, telles que PropBank, VerbNet et FrameNet, qui ont servi à alimenter les systèmes d’annotation automatisés. L’annotation dans d’autres langues, pour lesquelles on ne dispose pas d’un corpus annoté manuellement, repose souvent sur le FrameNet anglais. Une ressource telle que FrameNet de l’anglais est plus que nécessaire pour les systèmes d’annotation automatisé et l’annotation manuelle de milliers de phrases par des linguistes est une tâche fastidieuse et exigeante en temps. Nous avons proposé dans cette thèse un système automatique pour aider les linguistes dans cette tâche qui pourraient alors se limiter à la validation des annotations proposées par le système. Dans notre travail, nous ne considérons que les verbes qui sont plus susceptibles que les noms d’être accompagnés par des actants réalisés dans les phrases. Ces verbes concernent les termes de spécialité d’informatique et d’Internet (ex. accéder, configurer, naviguer, télécharger) dont la structure actancielle est enrichie manuellement par des rôles sémantiques. La structure actancielle des lexies verbales est décrite selon les principes de la Lexicologie Explicative et Combinatoire, LEC de Mel’čuk et fait appel partiellement (en ce qui concerne les rôles sémantiques) à la notion de Frame Element tel que décrit dans la théorie Frame Semantics (FS) de Fillmore. Ces deux théories ont ceci de commun qu’elles mènent toutes les deux à la construction de dictionnaires différents de ceux issus des approches traditionnelles. Les lexies verbales d’informatique et d’Internet qui ont été annotées manuellement dans plusieurs contextes constituent notre corpus spécialisé. Notre système qui attribue automatiquement des rôles sémantiques aux actants est basé sur des règles ou classificateurs entraînés sur plus de 2300 contextes. Nous sommes limités à une liste de rôles restreinte car certains rôles dans notre corpus n’ont pas assez d’exemples annotés manuellement. Dans notre système, nous n’avons traité que les rôles Patient, Agent et Destination dont le nombre d’exemple est supérieur à 300. Nous avons crée une classe que nous avons nommé Autre où nous avons rassemblé les autres rôles dont le nombre d’exemples annotés est inférieur à 100. Nous avons subdivisé la tâche d’annotation en sous-tâches : identifier les participants actants et circonstants et attribuer des rôles sémantiques uniquement aux actants qui contribuent au sens de la lexie verbale. Nous avons soumis les phrases de notre corpus à l’analyseur syntaxique Syntex afin d’extraire les informations syntaxiques qui décrivent les différents participants d’une lexie verbale dans une phrase. Ces informations ont servi de traits (features) dans notre modèle d’apprentissage. Nous avons proposé deux techniques pour l’identification des participants : une technique à base de règles où nous avons extrait une trentaine de règles et une autre technique basée sur l’apprentissage machine. Ces mêmes techniques ont été utilisées pour la tâche de distinguer les actants des circonstants. Nous avons proposé pour la tâche d’attribuer des rôles sémantiques aux actants, une méthode de partitionnement (clustering) semi supervisé des instances que nous avons comparée à la méthode de classification de rôles sémantiques. Nous avons utilisé CHAMÉLÉON, un algorithme hiérarchique ascendant.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Det har knappast undgått någon som är språkligt medveten att finlandssvenskan och sverigesvenskan skiljer sig åt till vissa delar. Olikheterna återfinns på olika språkliga nivåer. Mest kända och omskrivna är de lexikologiska skillnaderna, dvs. skillnaderna på ordplanet. Betydligt mindre uppmärksamhet har ägnats syntaktiska skillnader, dvs. skillnader i hur satser och meningar byggs upp. För att öka kunskapen om finlandssvensk syntax initierade Språkvetenskapliga nämnden vid Svenska litteratursällskapet i Finland projektet Svenskan i Finland – syntaktiska drag i ett jämförande perspektiv, som pågick åren 2004–2006. Min avhandling har kommit till inom ramen för det projektet. Prepositionerna (t.ex. av, i, på, för, till, åt osv.) är så kallade funktionsord som har till uppgift att binda samman de mer betydelsetunga orden till satser och meningar. Den finlandssvenska prepositionsanvändningen skiljer sig i viss mån från den sverigesvenska, och ”åt” är en av de prepositioner som ofta lyfts fram som exempel. Finlandssvenskarna säger t.ex. ”han gav en bok åt Lena” i stället för ”han gav en bok till Lena” eller ”han gav Lena en bok”. De säger ”berätta något åt någon” (i stället för ”för”) och de säger ”ringa åt någon” i stället för ”ringa någon”. Ett huvudsyfte med min undersökning är att ta reda på hur pass stora skillnaderna är om man ser till samtliga belägg på ”åt” i ett material och inte bara till sådana som man fäster sig vid för att man vet att de avviker i finlandssvenskan. Undersökningen är korpusbaserad. Det betyder att jag letat efter alla belägg på kombinationer av verb och prepositionen ”åt” i rätt stora textmassor som finns tillgängliga i elektronisk form. Materialet ligger i Språkbanken i Finland och omfattar huvudsakligen tidningstext och skönlitteratur. Jag har använt mig av en textmassa på sammanlagt ungefär 40 miljoner löpande ord, drygt 23 miljoner finlandssvenska och drygt 19 miljoner sverigesvenska. Det materialet gav ca 20 000 åt-belägg att studera, och det visade sig något oväntat att ”åt” inte alls är vanligare i finlandssvenskan än i sverigesvenskan när det gäller skriftspråk, åtminstone inte i professionella skribenters språk. Om man kompenserar för att den finlandssvenska och den sverigesvenska korpusen inte är helt lika i fråga om genrefördelning och ålder, kommer man fram till i stort sett samma frekvens för ”åt” i båda korpusarna. För den närmare analysen av vilka mönster åt-beläggen uppvisar har jag först och främst utnyttjat konstruktionsgrammatik men också ramsemantik och valensteori. Konstruktionsgrammatiken är ingen enhetlig teori, men tanken om grammatiska konstruktioner är gemensam. Konstruktioner representerar allt från generella syntaktiska mönster till specifika mönster för språkliga enskildheter. Uppfattningen om vad som ska inbegripas i begreppet varierar, men definitionen av ”konstruktion” som ”par (eller konstellationer) av form och betydelse” är gemensam. ”Konstruktion” avser aldrig konkreta belägg i texter eller yttranden utan alltid det abstrakta mönstret bakom dessa. Och varje yttrande är resultatet av att en stor mängd konstruktioner samverkar. I min analys har jag utgått ifrån att beläggen med ”åt” kan återföras på olika konstruktioner eller mönster utifrån vad som är gemensamt för grupper av belägg. Jag har sett på vad åt-frasen i samverkan med verbet har för funktion i beläggen. En åt-fras är syntaktiskt en prepositionsfras och består av en preposition och en rektion. Exempelvis utgör ordparet ”åt skogen” en prepositionsfras där ”skogen” är rektion. Ur mitt material har jag kunnat abstrahera fram fem övergripande mönster där referenten för rektionen har olika så kallade semantiska roller. Åt-frasen kan i kombination med verbet ange mål eller riktmärke, som i t.ex. svänga åt höger, dra åt helvete, ta sig åt hjärtat, luta åt en seger för IFK. Den kan för det andra ange mottagare (t.ex. ge varsin kaka åt hundarna, bygga en bastu åt sina svärföräldrar, skaffa biljetter åt en kompis). För det tredje kan åt-frasen avse en referent som har nytta (eller skada) av en aktion (t.ex. klippa häcken åt grannen, ställa in digitalboxen åt sin moster). Åt-frasen kan slutligen avse den eller det som är föremål antingen för en kommunikationsaktion (vinka åt sin son, skratta åt eländet) eller en attityd eller känsla (glädja sig åt framgången). Utöver dessa huvudmönster finns det ett antal smärre grupper av belägg som bildar egna mönster, men de utgör sammanlagt under 3 % i bägge korpusarna. Inom grupperna kan undermönster urskiljas. I t.ex. mottagargruppen representerar ”ge varsin kaka åt hundarna” överföringskonstruktion, ”bygga en bastu åt sina svärföräldrar” produktionskonstruktion och ”skaffa biljetter åt en kompis” ombesörjningskonstruktion. Alla typer är gemensamma för bägge materialen, men andelen belägg som representerar de olika typerna skiljer sig betydligt. I det sverigesvenska materialet står t.ex. det mönster där åt-frasen avser mål eller riktmärke för en mycket större andel av beläggen än i finlandssvenskan. Också andelen belägg där åt-frasen avser någon som har nytta (eller skada) av en aktion är mycket högre i det sverigesvenska materialet. I det finlandssvenska materialet står i gengäld mottagarbeläggen för över 50 % av beläggen medan andelen i det sverigesvenska materialet är bara 30 %. Inom gruppen utgör belägg av produktions- och ombesörjningstyp dessutom en mindre andel i det finlandssvenska materialet än i det sverigesvenska. Dessa står till sin funktion nära den typ som avser den som har nytta av aktionen. De konkreta beläggen på överföring (ge varsin kaka åt hundarna) utgör en större andel i det finlandssvenska materialet än i det sverigesvenska (ca 8 % mot 3 %), men typiskt för båda materialen är hög kollokationsgrad (”kollokation” avser par eller grupper av ord som uppträder oftare tillsammans än de statiskt sett skulle göra vid helt slumpmässig förekomst). Största delen av mottagarbeläggen utgörs av fraser av typen ”ge arbete åt någon, ge eftertryck åt något, ge liv åt något; ägna tid åt något, ägna sitt liv åt något, ägna uppmärksamhet åt något”. De här slutsatserna gäller alltså skriftspråk. I talspråk ser fördelningen annorlunda ut. Typiskt för prepositionen ”åt” är överhuvudtaget hög kollokationsgrad. Det förefaller som om språkanvändarna har tydliga, färdiga mallar för var ”åt” kan komma in. Det enda mönster som verkar helt produktivt, i den meningen att elementen är i stort sett fritt kombinerbara, är kombinationer av verb och åt-fras där åt-frasen avser den som har nytta av något. Att någon utför något för någons räkning verkar överlag kunna uttryckas med prepositionen ”åt”: t.ex. ”tvätta bilen åt pappa, ringa efter en taxi åt kunden”. Till och med belägg av typen ”hon drömde åt honom att bli ordinarie adjunkt” förekommer i någon mån. Konstruktionen är produktiv i båda språkvarieteterna men uppenbart är att konstruktion med mottagare har tolkningsföreträde i vissa fall i finlandssvenskan: ”Filip skrev ett brev åt sin syster” tolkas av sverigesvenskar som att Filip skrev brevet för systerns räkning, medan finlandssvenskar överlag uppenbarligen tolkar det som att Filip skrev till sin syster, att systern var mottagare av brevet. Ungefär 20 % av alla belägg i båda materialen representerar fall där ”åt” utgör partikel. Verb och ”åt” är närmare förbundna med varandra än när ”åt” utgör normal preposition. Exempel på partikelbelägg är ”han kom inte åt strömbrytaren, det gick åt mängder med saft, landet får dra åt svångremmen, de roffade åt sig de bästa platserna”. Också partikelmaterialet ser på ett generellt plan väldigt lika ut i båda språkvarieteterna. Den största skillnaden uppvisar den reflexiva typen ”roffa åt sig”. Medan typen är mycket homogen i det sverigesvenska materialet är variationen större i det finlandsvenska. Dels uppträder fler verb i kombinationen (han köpte åt sig ett par jeans), dels vacklar ordföljden (han nappade åt sig ett paraply ~ han nappade ett paraply åt sig). Att ”åt” används mer i vissa funktioner i finlandsvenskan brukar förklaras med påverkan från finskans allativ (ändelsen -lle: hän antoi kirjan Astalle > hon gav en bok åt Asta). Allt tyder dock på att den finlandssvenska åt-användningen delvis är en relikt. I äldre sverigesvenska källor träffar man på ”åt” i sådana kontexter som numera är typiska för finlandsvenskan. Det finlandssvenska språkområdet ligger ute i periferin i relation till det språkliga centrum som förändringar sprider sig från (för svenskans del främst Stockholmstrakten) och typiskt för perifera områden är att de uppvisar ålderdomliga drag också när inga kontaktfenomen spelar in. Allativen kan naturligtvis ha bidragit till att bevara användningen av ”åt” i finlandssvenskan. Att det är just ”åt” som används” beror antagligen på att prepositionen har flest funktioner gemensamt med allativen rent kognitivt om man jämför med de betydligt mer frekventa prepositionerna ”till” och ”för”. Uppenbart är också att åt-användningen därtill lever sitt eget liv i finlandssvenskan. I vissa varieteter av finlandssvenska kan man t.ex. höra yttranden av typ ”alla fiskarna dog åt dom”. Som språklig enskildhet har det ingen finsk förebild med allativ. Yttrandet är ett exempel på töjning av en svensk konstruktion. Modell finns dels i det mönster där åt avser den som har nytta eller skada av något, dels i relationell användning av ”åt”: han är hantlangare åt Eriksson ~ han är Erikssons hantlangare. Vid språkkontakt är det överlag konstruktioner som har förebild i det låntagande språket som lånas in från det långivande språket, medan konstruktioner som saknar förebild är betydligt mindre benägna att vinna insteg.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Multilingual terminological resources do not always include valid equivalents of legal terms for two main reasons. Firstly, legal systems can differ from one language community to another and even from one country to another because each has its own history and traditions. As a result, the non-isomorphism between legal and linguistic systems may render the identification of equivalents a particularly challenging task. Secondly, by focusing primarily on the definition of equivalence, a notion widely discussed in translation but not in terminology, the literature does not offer solid and systematic methodologies for assigning terminological equivalents. As a result, there is a lack of criteria to guide both terminologists and translators in the search and validation of equivalent terms. This problem is even more evident in the case of predicative units, such as verbs. Although some terminologists (L‘Homme 1998; Lerat 2002; Lorente 2007) have worked on specialized verbs, terminological equivalence between units that belong to this part of speech would benefit from a thorough study. By proposing a novel methodology to assign the equivalents of specialized verbs, this research aims at defining validation criteria for this kind of predicative units, so as to contribute to a better understanding of the phenomenon of terminological equivalence as well as to the development of multilingual terminography in general, and to the development of legal terminography, in particular. The study uses a Portuguese-English comparable corpus that consists of a single genre of texts, i.e. Supreme Court judgments, from which 100 Portuguese and 100 English specialized verbs were selected. The description of the verbs is based on the theory of Frame Semantics (Fillmore 1976, 1977, 1982, 1985; Fillmore and Atkins 1992), on the FrameNet methodology (Ruppenhofer et al. 2010), as well as on the methodology for compiling specialized lexical resources, such as DiCoInfo (L‘Homme 2008), developed in the Observatoire de linguistique Sens-Texte at the Université de Montréal. The research reviews contributions that have adopted the same theoretical and methodological framework to the compilation of lexical resources and proposes adaptations to the specific objectives of the project. In contrast to the top-down approach adopted by FrameNet lexicographers, the approach described here is bottom-up, i.e. verbs are first analyzed and then grouped into frames for each language separately. Specialized verbs are said to evoke a semantic frame, a sort of conceptual scenario in which a number of mandatory elements (core Frame Elements) play specific roles (e.g. ARGUER, JUDGE, LAW), but specialized verbs are often accompanied by other optional information (non-core Frame Elements), such as the criteria and reasons used by the judge to reach a decision (statutes, codes, previous decisions). The information concerning the semantic frame that each verb evokes was encoded in an xml editor and about twenty contexts illustrating the specific way each specialized verb evokes a given frame were semantically and syntactically annotated. The labels attributed to each semantic frame (e.g. [Compliance], [Verdict]) were used to group together certain synonyms, antonyms as well as equivalent terms. The research identified 165 pairs of candidate equivalents among the 200 Portuguese and English terms that were grouped together into 76 frames. 71% of the pairs of equivalents were considered full equivalents because not only do the verbs evoke the same conceptual scenario but their actantial structures, the linguistic realizations of the actants and their syntactic patterns were similar. 29% of the pairs of equivalents did not entirely meet these criteria and were considered partial equivalents. Reasons for partial equivalence are provided along with illustrative examples. Finally, the study describes the semasiological and onomasiological entry points that JuriDiCo, the bilingual lexical resource compiled during the project, offers to future users.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Dans la sémantique des cadres de Fillmore, les mots prennent leur sens par rapport au contexte événementiel ou situationnel dans lequel ils s’inscrivent. FrameNet, une ressource lexicale pour l’anglais, définit environ 1000 cadres conceptuels, couvrant l’essentiel des contextes possibles. Dans un cadre conceptuel, un prédicat appelle des arguments pour remplir les différents rôles sémantiques associés au cadre (par exemple : Victime, Manière, Receveur, Locuteur). Nous cherchons à annoter automatiquement ces rôles sémantiques, étant donné le cadre sémantique et le prédicat. Pour cela, nous entrainons un algorithme d’apprentissage machine sur des arguments dont le rôle est connu, pour généraliser aux arguments dont le rôle est inconnu. On utilisera notamment des propriétés lexicales de proximité sémantique des mots les plus représentatifs des arguments, en particulier en utilisant des représentations vectorielles des mots du lexique.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Pós-graduação em Linguística e Língua Portuguesa - FCLAR

Relevância:

80.00% 80.00%

Publicador:

Resumo:

La description des termes dans les ressources terminologiques traditionnelles se limite à certaines informations, comme le terme (principalement nominal), sa définition et son équivalent dans une langue étrangère. Cette description donne rarement d’autres informations qui peuvent être très utiles pour l’utilisateur, surtout s’il consulte les ressources dans le but d’approfondir ses connaissances dans un domaine de spécialité, maitriser la rédaction professionnelle ou trouver des contextes où le terme recherché est réalisé. Les informations pouvant être utiles dans ce sens comprennent la description de la structure actancielle des termes, des contextes provenant de sources authentiques et l’inclusion d’autres parties du discours comme les verbes. Les verbes et les noms déverbaux, ou les unités terminologiques prédicatives (UTP), souvent ignorés par la terminologie classique, revêtent une grande importance lorsqu’il s’agit d’exprimer une action, un processus ou un évènement. Or, la description de ces unités nécessite un modèle de description terminologique qui rend compte de leurs particularités. Un certain nombre de terminologues (Condamines 1993, Mathieu-Colas 2002, Gross et Mathieu-Colas 2001 et L’Homme 2012, 2015) ont d’ailleurs proposé des modèles de description basés sur différents cadres théoriques. Notre recherche consiste à proposer une méthodologie de description terminologique des UTP de la langue arabe, notamment l’arabe standard moderne (ASM), selon la théorie de la Sémantique des cadres (Frame Semantics) de Fillmore (1976, 1977, 1982, 1985) et son application, le projet FrameNet (Ruppenhofer et al. 2010). Le domaine de spécialité qui nous intéresse est l’informatique. Dans notre recherche, nous nous appuyons sur un corpus recueilli du web et nous nous inspirons d’une ressource terminologique existante, le DiCoInfo (L’Homme 2008), pour compiler notre propre ressource. Nos objectifs se résument comme suit. Premièrement, nous souhaitons jeter les premières bases d’une version en ASM de cette ressource. Cette version a ses propres particularités : 1) nous visons des unités bien spécifiques, à savoir les UTP verbales et déverbales; 2) la méthodologie développée pour la compilation du DiCoInfo original devra être adaptée pour prendre en compte une langue sémitique. Par la suite, nous souhaitons créer une version en cadres de cette ressource, où nous regroupons les UTP dans des cadres sémantiques, en nous inspirant du modèle de FrameNet. À cette ressource, nous ajoutons les UTP anglaises et françaises, puisque cette partie du travail a une portée multilingue. La méthodologie consiste à extraire automatiquement les unités terminologiques verbales et nominales (UTV et UTN), comme Ham~ala (حمل) (télécharger) et taHmiyl (تحميل) (téléchargement). Pour ce faire, nous avons adapté un extracteur automatique existant, TermoStat (Drouin 2004). Ensuite, à l’aide des critères de validation terminologique (L’Homme 2004), nous validons le statut terminologique d’une partie des candidats. Après la validation, nous procédons à la création de fiches terminologiques, à l’aide d’un éditeur XML, pour chaque UTV et UTN retenue. Ces fiches comprennent certains éléments comme la structure actancielle des UTP et jusqu’à vingt contextes annotés. La dernière étape consiste à créer des cadres sémantiques à partir des UTP de l’ASM. Nous associons également des UTP anglaises et françaises en fonction des cadres créés. Cette association a mené à la création d’une ressource terminologique appelée « DiCoInfo : A Framed Version ». Dans cette ressource, les UTP qui partagent les mêmes propriétés sémantiques et structures actancielles sont regroupées dans des cadres sémantiques. Par exemple, le cadre sémantique Product_development regroupe des UTP comme Taw~ara (طور) (développer), to develop et développer. À la suite de ces étapes, nous avons obtenu un total de 106 UTP ASM compilées dans la version en ASM du DiCoInfo et 57 cadres sémantiques associés à ces unités dans la version en cadres du DiCoInfo. Notre recherche montre que l’ASM peut être décrite avec la méthodologie que nous avons mise au point.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

La description des termes dans les ressources terminologiques traditionnelles se limite à certaines informations, comme le terme (principalement nominal), sa définition et son équivalent dans une langue étrangère. Cette description donne rarement d’autres informations qui peuvent être très utiles pour l’utilisateur, surtout s’il consulte les ressources dans le but d’approfondir ses connaissances dans un domaine de spécialité, maitriser la rédaction professionnelle ou trouver des contextes où le terme recherché est réalisé. Les informations pouvant être utiles dans ce sens comprennent la description de la structure actancielle des termes, des contextes provenant de sources authentiques et l’inclusion d’autres parties du discours comme les verbes. Les verbes et les noms déverbaux, ou les unités terminologiques prédicatives (UTP), souvent ignorés par la terminologie classique, revêtent une grande importance lorsqu’il s’agit d’exprimer une action, un processus ou un évènement. Or, la description de ces unités nécessite un modèle de description terminologique qui rend compte de leurs particularités. Un certain nombre de terminologues (Condamines 1993, Mathieu-Colas 2002, Gross et Mathieu-Colas 2001 et L’Homme 2012, 2015) ont d’ailleurs proposé des modèles de description basés sur différents cadres théoriques. Notre recherche consiste à proposer une méthodologie de description terminologique des UTP de la langue arabe, notamment l’arabe standard moderne (ASM), selon la théorie de la Sémantique des cadres (Frame Semantics) de Fillmore (1976, 1977, 1982, 1985) et son application, le projet FrameNet (Ruppenhofer et al. 2010). Le domaine de spécialité qui nous intéresse est l’informatique. Dans notre recherche, nous nous appuyons sur un corpus recueilli du web et nous nous inspirons d’une ressource terminologique existante, le DiCoInfo (L’Homme 2008), pour compiler notre propre ressource. Nos objectifs se résument comme suit. Premièrement, nous souhaitons jeter les premières bases d’une version en ASM de cette ressource. Cette version a ses propres particularités : 1) nous visons des unités bien spécifiques, à savoir les UTP verbales et déverbales; 2) la méthodologie développée pour la compilation du DiCoInfo original devra être adaptée pour prendre en compte une langue sémitique. Par la suite, nous souhaitons créer une version en cadres de cette ressource, où nous regroupons les UTP dans des cadres sémantiques, en nous inspirant du modèle de FrameNet. À cette ressource, nous ajoutons les UTP anglaises et françaises, puisque cette partie du travail a une portée multilingue. La méthodologie consiste à extraire automatiquement les unités terminologiques verbales et nominales (UTV et UTN), comme Ham~ala (حمل) (télécharger) et taHmiyl (تحميل) (téléchargement). Pour ce faire, nous avons adapté un extracteur automatique existant, TermoStat (Drouin 2004). Ensuite, à l’aide des critères de validation terminologique (L’Homme 2004), nous validons le statut terminologique d’une partie des candidats. Après la validation, nous procédons à la création de fiches terminologiques, à l’aide d’un éditeur XML, pour chaque UTV et UTN retenue. Ces fiches comprennent certains éléments comme la structure actancielle des UTP et jusqu’à vingt contextes annotés. La dernière étape consiste à créer des cadres sémantiques à partir des UTP de l’ASM. Nous associons également des UTP anglaises et françaises en fonction des cadres créés. Cette association a mené à la création d’une ressource terminologique appelée « DiCoInfo : A Framed Version ». Dans cette ressource, les UTP qui partagent les mêmes propriétés sémantiques et structures actancielles sont regroupées dans des cadres sémantiques. Par exemple, le cadre sémantique Product_development regroupe des UTP comme Taw~ara (طور) (développer), to develop et développer. À la suite de ces étapes, nous avons obtenu un total de 106 UTP ASM compilées dans la version en ASM du DiCoInfo et 57 cadres sémantiques associés à ces unités dans la version en cadres du DiCoInfo. Notre recherche montre que l’ASM peut être décrite avec la méthodologie que nous avons mise au point.