999 resultados para Structures secondaires de protéines


Relevância:

100.00% 100.00%

Publicador:

Resumo:

L'acide désoxyribonucléique (ADN) et l'acide ribonucléique (ARN) sont des polymères de nucléotides essentiels à la cellule. À l'inverse de l'ADN qui sert principalement à stocker l'information génétique, les ARN sont impliqués dans plusieurs processus métaboliques. Par exemple, ils transmettent l’information génétique codée dans l’ADN. Ils sont essentiels pour la maturation des autres ARN, la régulation de l’expression génétique, la prévention de la dégradation des chromosomes et le ciblage des protéines dans la cellule. La polyvalence fonctionnelle de l'ARN résulte de sa plus grande diversité structurale. Notre laboratoire a développé MC-Fold, un algorithme pour prédire la structure des ARN qu'on représente avec des graphes d'interactions inter-nucléotidiques. Les sommets de ces graphes représentent les nucléotides et les arêtes leurs interactions. Notre laboratoire a aussi observé qu'un petit ensemble de cycles d'interactions à lui seul définit la structure de n'importe quel motif d'ARN. La formation de ces cycles dépend de la séquence de nucléotides et MC-Fold détermine les cycles les plus probables étant donnée cette séquence. Mon projet de maîtrise a été, dans un premier temps, de définir une base de données des motifs structuraux et fonctionnels d'ARN, bdMotifs, en terme de ces cycles. Par la suite, j’ai implanté un algorithme, MC-Motifs, qui recherche ces motifs dans des graphes d'interactions et, entre autres, ceux générés par MC-Fold. Finalement, j’ai validé mon algorithme sur des ARN dont la structure est connue, tels que les ARN ribosomaux (ARNr) 5S, 16S et 23S, et l'ARN utilisé pour prédire la structure des riborégulateurs. Le mémoire est divisé en cinq chapitres. Le premier chapitre présente la structure chimique, les fonctions cellulaires de l'ARN et le repliement structural du polymère. Dans le deuxième chapitre, je décris la base de données bdMotifs. Dans le troisième chapitre, l’algorithme de recherche MC-Motifs est introduit. Le quatrième chapitre présente les résultats de la validation et des prédictions. Finalement, le dernier chapitre porte sur la discussion des résultats suivis d’une conclusion sur le travail.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’évolution des protéines est un domaine important de la recherche en bioinformatique et catalyse l'intérêt de trouver des outils d'alignement qui peuvent être utilisés de manière fiable et modéliser avec précision l'évolution d'une famille de protéines. TM-Align (Zhang and Skolnick, 2005) est considéré comme l'outil idéal pour une telle tâche, en termes de rapidité et de précision. Par conséquent, dans cette étude, TM-Align a été utilisé comme point de référence pour faciliter la détection des autres outils d'alignement qui sont en mesure de préciser l'évolution des protéines. En parallèle, nous avons élargi l'actuel outil d'exploration de structures secondaires de protéines, Helix Explorer (Marrakchi, 2006), afin qu'il puisse également être utilisé comme un outil pour la modélisation de l'évolution des protéines.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Thèse numérisée par la Division de la gestion de documents et des archives de l'Université de Montréal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La plupart des processus cellulaires et biologiques reposent, à un certain niveau, sur des interactions protéine-protéine (IPP). Leur manipulation avec des composés chimiques démontre un grand potentiel pour la découverte de nouveaux médicaments. Malgré la demande toujours croissante en molécules capables d’interrompre sélectivement des IPP, le développement d’inhibiteurs d’IPP est fortement limité par la grande taille de la surface d’interaction. En considérant la nature de cette surface, la capacité à mimer des structures secondaires de protéines est très importante pour lier une protéine et inhiber une IPP. Avec leurs grandes capacités peptidomimétiques et leurs propriétés pharmacologiques intéressan-tes, les peptides cycliques sont des prototypes moléculaires de choix pour découvrir des ligands de protéines et développer de nouveaux inhibiteurs d’IPP. Afin d’exploiter pleinement la grande diversité accessible avec les peptides cycliques, l’approche combinatoire «one-bead-one-compound» (OBOC) est l’approche la plus accessible et puissante. Cependant, l’utilisation des peptides cycliques dans les chimiothèques OBOC est limitée par les difficultés à séquencer les composés actifs après le criblage. Sans amine libre en N-terminal, la dégradation d’Edman et la spectrométrie de masse en tandem (MS/MS) ne peuvent pas être utilisées. À cet égard, nous avons développé de nouvelles approches par ouverture de cycle pour préparer et décoder des chimiothèques OBOC de peptides cycliques. Notre stratégie était d’introduire un résidu sensible dans le macrocycle et comme ancrage pour permettre la linéarisation des peptides et leur largage des billes pour le séquençage par MS/MS. Tout d’abord, des résidus sensibles aux nucléophiles, aux ultraviolets ou au bromure de cyanogène ont été introduits dans un peptide cyclique et leurs rendements de clivage évalués. Ensuite, les résidus les plus prometteurs ont été utilisés dans la conception et le développement d’approches en tandem ouverture de cycle / clivage pour le décodage de chimiothèques OBOC de peptides cycliques. Dans la première approche, une méthionine a été introduite dans le macrocycle comme ancrage pour simultanément permettre l’ouverture du cycle et le clivage des billes par traitement au bromure de cyanogène. Dans la seconde approche, un résidu photosensible a été utilisé dans le macrocycle comme ancrage pour permettre l’ouverture du cycle et le clivage suite à une irradiation aux ultraviolets. Le peptide linéaire généré par ces approches peut alors être efficacement séquencé par MS/MS. Enfin, une chimiothèque OBOC a été préparée et criblée la protéine HIV-1 Nef pour identifier des ligands sélectifs. Le développement de ces méthodologies permttra l’utilisation de composés macrocycliques dans les chimiothèques OBOC et constitue une contribution importante en chimie médicinale pour la découverte de ligands de protéines et le développement d’inhibiteurs d’IPP.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Le byssus est un amas de fibres que les moules produisent afin de s’ancrer aux surfaces immergées sous l’eau. Ces fibres sont pourvues de propriétés mécaniques impressionnantes combinant rigidité, élasticité et ténacité élevées. De plus, elles possèdent un comportement d’auto-guérison de leurs propriétés mécaniques en fonction du temps lorsque la contrainte initialement appliquée est retirée. Les propriétés mécaniques de ces fibres sont le résultat de l’agencement hiérarchique de protéines de type copolymère blocs riches en collagène et de la présence de métaux formant des liens sacrificiels réversibles avec certains acides aminés comme les DOPA et les histidines. Bien que cette fibre soit très intéressante pour la production de matériaux grâce à son contenu élevé en collagène potentiellement biocompatible, cette ressource naturelle est traitée comme un déchet par les mytiliculteurs. L’objectif de cette thèse était de valoriser cette fibre en extrayant les protéines pour générer une nouvelle classe de matériaux biomimétiques. Un hydrolysat de protéines de byssus (BPH) riche en acides aminés chargés, i.e. ~30 % mol, et permettant de former des films a pu être généré. Lorsque solubilisé à pH 10.5, le BPH forme un hydrogel contenant des structures en triple hélice de collagène et des feuillets β anti-parallèles intra- et inter-moléculaires. Suite à l’évaporation de l’eau, le film de BPH résultant est insoluble en milieu aqueux à cause des structures secondaires très stables agissant comme points de réticulation effectifs. Les propriétés mécaniques des films de BPH sont modulables en fonction du pH. Au point isoélectrique (pI = 4.5), les interactions électrostatiques entre les charges opposées agissent comme points de réticulation et augmentent la rigidité des films et leur contrainte à la rupture sans affecter la déformation à la rupture. À pH plus élevé ou plus bas que le pI, les performances mécaniques des films sont plus faibles à cause de la répulsion entre les groupements fonctionnels de même charge qui interagissent plutôt avec les molécules d’eau et causent le gonflement de la matrice protéique des films. Le BPH contenant un nombre élevé d’acides aminés chargés et réactifs, nous avons pu réticuler les films de manière covalente à l’aide d’EDC ou de glutaraldéhyde. Les propriétés mécaniques des films sont modulables en fonction de la concentration d’EDC utilisée lors de la réticulation ou en employant du glutaraldéhyde comme agent réticulant. Les films sont à la fois plus rigides et plus forts avec un degré de réticulation élevé, mais perdent leur extensibilité à mesure que les segments libres de s’étirer lors d’une traction deviennent entravés par les points de réticulation. La réticulation augmente également la résistance à la dégradation enzymatique par la collagénase, les films les plus fortement réticulés lui étant pratiquement insensibles. La spectroscopie infrarouge montre enfin que la réticulation entraîne une transition de feuillets β anti-parallèles inter-moléculaires vers des structures de type hélices de collagène/PPII hydratées. Des liens sacrificiels ont été formés dans les films de BPH par traitement au pI et/ou avec différents métaux, i.e. Na+, Ca2+, Fe3+, afin de moduler les propriétés mécaniques statiques et d’évaluer le rôle de ces traitements sur le comportement d’auto-guérison lors de tests mécaniques cycliques avec différents temps de repos. Plus la valence des ions métalliques ajoutés augmente, plus les propriétés mécaniques statiques affichent un module, une contrainte à la rupture et une ténacité élevés sans toutefois affecter la déformation à la rupture, confirmant la formation de liens sacrificiels. Les tests mécaniques cycliques montrent que les traitements au pI ou avec Ca2+ créent des liens sacrificiels ioniques réversibles qui mènent à un processus d’auto-guérison des performances mécaniques dépendant du pH. L’ajout de Fe3+ à différentes concentrations module les performances mécaniques sur un plus large intervalle et la nature plus covalente de son interaction avec les acides aminés permet d’atteindre des valeurs nettement plus élevées que les autres traitements étudiés. Le Fe3+ permet aussi la formation de liens sacrificiels réversibles menant à l’auto-guérison des propriétés mécaniques. Les spectroscopies Raman et infrarouge confirment que le fer crée des liaisons avec plusieurs acides aminés, dont les histidines et les DOPA. Les résultats dans leur ensemble démontrent que les films de BPH sont des hydrogels biomimétiques du byssus qui peuvent être traités ou réticulés de différentes façons afin de moduler leurs performances mécaniques. Ils pourraient ainsi servir de matrices pour des applications potentielles dans le domaine pharmaceutique ou en ingénierie tissulaire.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Le byssus est un amas de fibres que les moules produisent afin de s’ancrer aux surfaces immergées sous l’eau. Ces fibres sont pourvues de propriétés mécaniques impressionnantes combinant rigidité, élasticité et ténacité élevées. De plus, elles possèdent un comportement d’auto-guérison de leurs propriétés mécaniques en fonction du temps lorsque la contrainte initialement appliquée est retirée. Les propriétés mécaniques de ces fibres sont le résultat de l’agencement hiérarchique de protéines de type copolymère blocs riches en collagène et de la présence de métaux formant des liens sacrificiels réversibles avec certains acides aminés comme les DOPA et les histidines. Bien que cette fibre soit très intéressante pour la production de matériaux grâce à son contenu élevé en collagène potentiellement biocompatible, cette ressource naturelle est traitée comme un déchet par les mytiliculteurs. L’objectif de cette thèse était de valoriser cette fibre en extrayant les protéines pour générer une nouvelle classe de matériaux biomimétiques. Un hydrolysat de protéines de byssus (BPH) riche en acides aminés chargés, i.e. ~30 % mol, et permettant de former des films a pu être généré. Lorsque solubilisé à pH 10.5, le BPH forme un hydrogel contenant des structures en triple hélice de collagène et des feuillets β anti-parallèles intra- et inter-moléculaires. Suite à l’évaporation de l’eau, le film de BPH résultant est insoluble en milieu aqueux à cause des structures secondaires très stables agissant comme points de réticulation effectifs. Les propriétés mécaniques des films de BPH sont modulables en fonction du pH. Au point isoélectrique (pI = 4.5), les interactions électrostatiques entre les charges opposées agissent comme points de réticulation et augmentent la rigidité des films et leur contrainte à la rupture sans affecter la déformation à la rupture. À pH plus élevé ou plus bas que le pI, les performances mécaniques des films sont plus faibles à cause de la répulsion entre les groupements fonctionnels de même charge qui interagissent plutôt avec les molécules d’eau et causent le gonflement de la matrice protéique des films. Le BPH contenant un nombre élevé d’acides aminés chargés et réactifs, nous avons pu réticuler les films de manière covalente à l’aide d’EDC ou de glutaraldéhyde. Les propriétés mécaniques des films sont modulables en fonction de la concentration d’EDC utilisée lors de la réticulation ou en employant du glutaraldéhyde comme agent réticulant. Les films sont à la fois plus rigides et plus forts avec un degré de réticulation élevé, mais perdent leur extensibilité à mesure que les segments libres de s’étirer lors d’une traction deviennent entravés par les points de réticulation. La réticulation augmente également la résistance à la dégradation enzymatique par la collagénase, les films les plus fortement réticulés lui étant pratiquement insensibles. La spectroscopie infrarouge montre enfin que la réticulation entraîne une transition de feuillets β anti-parallèles inter-moléculaires vers des structures de type hélices de collagène/PPII hydratées. Des liens sacrificiels ont été formés dans les films de BPH par traitement au pI et/ou avec différents métaux, i.e. Na+, Ca2+, Fe3+, afin de moduler les propriétés mécaniques statiques et d’évaluer le rôle de ces traitements sur le comportement d’auto-guérison lors de tests mécaniques cycliques avec différents temps de repos. Plus la valence des ions métalliques ajoutés augmente, plus les propriétés mécaniques statiques affichent un module, une contrainte à la rupture et une ténacité élevés sans toutefois affecter la déformation à la rupture, confirmant la formation de liens sacrificiels. Les tests mécaniques cycliques montrent que les traitements au pI ou avec Ca2+ créent des liens sacrificiels ioniques réversibles qui mènent à un processus d’auto-guérison des performances mécaniques dépendant du pH. L’ajout de Fe3+ à différentes concentrations module les performances mécaniques sur un plus large intervalle et la nature plus covalente de son interaction avec les acides aminés permet d’atteindre des valeurs nettement plus élevées que les autres traitements étudiés. Le Fe3+ permet aussi la formation de liens sacrificiels réversibles menant à l’auto-guérison des propriétés mécaniques. Les spectroscopies Raman et infrarouge confirment que le fer crée des liaisons avec plusieurs acides aminés, dont les histidines et les DOPA. Les résultats dans leur ensemble démontrent que les films de BPH sont des hydrogels biomimétiques du byssus qui peuvent être traités ou réticulés de différentes façons afin de moduler leurs performances mécaniques. Ils pourraient ainsi servir de matrices pour des applications potentielles dans le domaine pharmaceutique ou en ingénierie tissulaire.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Résumé La Ribonucléase P (RNase P) est une enzyme principalement reconnue pour sa participation à la maturation en 5’des ARN de transfert (ARNt). Cependant, d’autres substrats sont reconnus par l’enzyme. En général, la RNase P est composée d’une sous-unité ARN (le P-ARN, codé par le gène rnpB) qui porte le centre actif de l’enzyme et d’une ou de plusieurs sous-unités protéiques (la P-protéine). Les P-ARN chez toutes les bactéries, la majorité des archéobactéries et dans le génome nucléaire de la plupart des eucaryotes, possèdent généralement une structure secondaire très conservée qui inclut le noyau (P1-P4); l’hélice P4 constitue le site catalytique de l’enzyme et l’hélice P1 apparie les extrémités du P-ARN en stabilisant sa structure globale. Les P-ARN mitochondriaux sont souvent moins conservés et difficiles à découvrir. Dans certains cas, les seules régions de structure primaire qui restent conservées sont celles qui définissent le P4 et le P1. Pour la détection des gènes rnpB, un outil de recherche bioinformatique, basé sur la séquence et le profil de structure secondaire, a été développé dans le laboratoire. Cet outil permet le dépistage de toutes les séquences eucaryotes (nucléaires et mitochondriales) du gène avec une très grande confiance (basée sur une valeur statistique, E-value). Chez les champignons, plusieurs ascomycètes encodent un gène rnpB dans leur génome mitochondrial y compris tous les membres du genre d’Aspergillus. Cependant, chez les espèces voisines, Neurospora crassa, Podospora anserina et Sordaria macrospora, une version mitochondriale de ce gène n’existe pas. Au lieu de cela, elles contiennent deux copies nucléaires du gène, légèrement différentes en taille et en contenu nucléotidique. Mon projet a été établi dans le but d’éclaircir l’évolution de la RNase P mitochondriale (mtRNase P) chez ces trois espèces voisines d’Aspergillus. En ce qui concerne les résultats, des modèles de structures secondaires pour les transcrits de ces gènes ont été construits en se basant sur la structure consensus universelle de la sous-unité ARN de la RNase P. Pour les trois espèces, par la comparaison de ces modèles, nous avons établi que les deux copies nucléaires du gène rnpB sont assez distinctes en séquence et en structure pour pouvoir y penser à une spécialisation de fonction de la RNase P. Chez N. crassa, les deux P-ARN sont modifiés probablement par une coiffe et les extrémités 5’, 3’ sont conformes à nos modèles, ayant un P1 allongé. Encore chez N. crassa, nous avons constaté que les deux copies sont transcrites au même niveau dans le cytoplasme et que la plus petite et la plus stable d’entre elles (Nc1) se retrouve dans l’extrait matriciel mitochondrial. Lors du suivi du P-ARN dans diverses sous-fractions provenant de la matrice mitochondriale soluble, Nc1 est associée avec l’activité de la RNase P. La caractérisation du complexe protéique, isolé à partir de la fraction active sur un gel non dénaturant, révèle qu’il contient au moins 87 protéines, 73 d’entre elles ayant déjà une localisation mitochondriale connue. Comme chez la levure, les protéines de ce complexe sont impliquées dans plusieurs fonctions cellulaires comme le processing de l’ADN/ARN, le métabolisme, dans la traduction et d’autres (par exemple : la protéolyse et le repliement des protéines, ainsi que la maintenance du génome mitochondrial). Pour trois protéines, leur fonction est non déterminée.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Les ARN non codants (ARNnc) sont des transcrits d'ARN qui ne sont pas traduits en protéines et qui pourtant ont des fonctions clés et variées dans la cellule telles que la régulation des gènes, la transcription et la traduction. Parmi les nombreuses catégories d'ARNnc qui ont été découvertes, on trouve des ARN bien connus tels que les ARN ribosomiques (ARNr), les ARN de transfert (ARNt), les snoARN et les microARN (miARN). Les fonctions des ARNnc sont étroitement liées à leurs structures d’où l’importance de développer des outils de prédiction de structure et des méthodes de recherche de nouveaux ARNnc. Les progrès technologiques ont mis à la disposition des chercheurs des informations abondantes sur les séquences d'ARN. Ces informations sont accessibles dans des bases de données telles que Rfam, qui fournit des alignements et des informations structurelles sur de nombreuses familles d'ARNnc. Dans ce travail, nous avons récupéré toutes les séquences des structures secondaires annotées dans Rfam, telles que les boucles en épingle à cheveux, les boucles internes, les renflements « bulge », etc. dans toutes les familles d'ARNnc. Une base de données locale, RNAstem, a été créée pour faciliter la manipulation et la compilation des données sur les motifs de structure secondaire. Nous avons analysé toutes les boucles terminales et internes ainsi que les « bulges » et nous avons calculé un score d’abondance qui nous a permis d’étudier la fréquence de ces motifs. Tout en minimisant le biais de la surreprésentation de certaines classes d’ARN telles que l’ARN ribosomal, l’analyse des scores a permis de caractériser les motifs rares pour chacune des catégories d’ARN en plus de confirmer des motifs communs comme les boucles de type GNRA ou UNCG. Nous avons identifié des motifs abondants qui n’ont pas été étudiés auparavant tels que la « tetraloop » UUUU. En analysant le contenu de ces motifs en nucléotides, nous avons remarqué que ces régions simples brins contiennent beaucoup plus de nucléotides A et U. Enfin, nous avons exploré la possibilité d’utiliser ces scores pour la conception d’un filtre qui permettrait d’accélérer la recherche de nouveaux ARN non-codants. Nous avons développé un système de scores, RNAscore, qui permet d’évaluer un ARN en se basant sur son contenu en motifs et nous avons testé son applicabilité avec différents types de contrôles.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Dans un premier temps, nous avons modélisé la structure d’une famille d’ARN avec une grammaire de graphes afin d’identifier les séquences qui en font partie. Plusieurs autres méthodes de modélisation ont été développées, telles que des grammaires stochastiques hors-contexte, des modèles de covariance, des profils de structures secondaires et des réseaux de contraintes. Ces méthodes de modélisation se basent sur la structure secondaire classique comparativement à nos grammaires de graphes qui se basent sur les motifs cycliques de nucléotides. Pour exemplifier notre modèle, nous avons utilisé la boucle E du ribosome qui contient le motif Sarcin-Ricin qui a été largement étudié depuis sa découverte par cristallographie aux rayons X au début des années 90. Nous avons construit une grammaire de graphes pour la structure du motif Sarcin-Ricin et avons dérivé toutes les séquences qui peuvent s’y replier. La pertinence biologique de ces séquences a été confirmée par une comparaison des séquences d’un alignement de plus de 800 séquences ribosomiques bactériennes. Cette comparaison a soulevée des alignements alternatifs pour quelques unes des séquences que nous avons supportés par des prédictions de structures secondaires et tertiaires. Les motifs cycliques de nucléotides ont été observés par les membres de notre laboratoire dans l'ARN dont la structure tertiaire a été résolue expérimentalement. Une étude des séquences et des structures tertiaires de chaque cycle composant la structure du Sarcin-Ricin a révélé que l'espace des séquences dépend grandement des interactions entre tous les nucléotides à proximité dans l’espace tridimensionnel, c’est-à-dire pas uniquement entre deux paires de bases adjacentes. Le nombre de séquences générées par la grammaire de graphes est plus petit que ceux des méthodes basées sur la structure secondaire classique. Cela suggère l’importance du contexte pour la relation entre la séquence et la structure, d’où l’utilisation d’une grammaire de graphes contextuelle plus expressive que les grammaires hors-contexte. Les grammaires de graphes que nous avons développées ne tiennent compte que de la structure tertiaire et négligent les interactions de groupes chimiques spécifiques avec des éléments extra-moléculaires, comme d’autres macromolécules ou ligands. Dans un deuxième temps et pour tenir compte de ces interactions, nous avons développé un modèle qui tient compte de la position des groupes chimiques à la surface des structures tertiaires. L’hypothèse étant que les groupes chimiques à des positions conservées dans des séquences prédéterminées actives, qui sont déplacés dans des séquences inactives pour une fonction précise, ont de plus grandes chances d’être impliqués dans des interactions avec des facteurs. En poursuivant avec l’exemple de la boucle E, nous avons cherché les groupes de cette boucle qui pourraient être impliqués dans des interactions avec des facteurs d'élongation. Une fois les groupes identifiés, on peut prédire par modélisation tridimensionnelle les séquences qui positionnent correctement ces groupes dans leurs structures tertiaires. Il existe quelques modèles pour adresser ce problème, telles que des descripteurs de molécules, des matrices d’adjacences de nucléotides et ceux basé sur la thermodynamique. Cependant, tous ces modèles utilisent une représentation trop simplifiée de la structure d’ARN, ce qui limite leur applicabilité. Nous avons appliqué notre modèle sur les structures tertiaires d’un ensemble de variants d’une séquence d’une instance du Sarcin-Ricin d’un ribosome bactérien. L’équipe de Wool à l’université de Chicago a déjà étudié cette instance expérimentalement en testant la viabilité de 12 variants. Ils ont déterminé 4 variants viables et 8 létaux. Nous avons utilisé cet ensemble de 12 séquences pour l’entraînement de notre modèle et nous avons déterminé un ensemble de propriétés essentielles à leur fonction biologique. Pour chaque variant de l’ensemble d’entraînement nous avons construit des modèles de structures tertiaires. Nous avons ensuite mesuré les charges partielles des atomes exposés sur la surface et encodé cette information dans des vecteurs. Nous avons utilisé l’analyse des composantes principales pour transformer les vecteurs en un ensemble de variables non corrélées, qu’on appelle les composantes principales. En utilisant la distance Euclidienne pondérée et l’algorithme du plus proche voisin, nous avons appliqué la technique du « Leave-One-Out Cross-Validation » pour choisir les meilleurs paramètres pour prédire l’activité d’une nouvelle séquence en la faisant correspondre à ces composantes principales. Finalement, nous avons confirmé le pouvoir prédictif du modèle à l’aide d’un nouvel ensemble de 8 variants dont la viabilité à été vérifiée expérimentalement dans notre laboratoire. En conclusion, les grammaires de graphes permettent de modéliser la relation entre la séquence et la structure d’un élément structural d’ARN, comme la boucle E contenant le motif Sarcin-Ricin du ribosome. Les applications vont de la correction à l’aide à l'alignement de séquences jusqu’au design de séquences ayant une structure prédéterminée. Nous avons également développé un modèle pour tenir compte des interactions spécifiques liées à une fonction biologique donnée, soit avec des facteurs environnants. Notre modèle est basé sur la conservation de l'exposition des groupes chimiques qui sont impliqués dans ces interactions. Ce modèle nous a permis de prédire l’activité biologique d’un ensemble de variants de la boucle E du ribosome qui se lie à des facteurs d'élongation.