741 resultados para Prédiction de cibles de microARN
Resumo:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.
Resumo:
La régulation de l’expression des gènes est ce qui permet à nos cellules de s’adapter à leur environnement, de combattre les infections ou, plus généralement, de produire la quantité exacte de protéine nécessaire pour répondre à un besoin spécifique. Parmi les joueurs les plus importants dans cette régulation de l’expression des gènes on retrouve les microARN (miARN). Ces petits ARN de 22 nucléotides sont présents chez la majorité des espèces multicellulaires et sont responsables du contrôle direct de plus de 30% des gènes exprimant des protéines chez les vertébrés. La famille de miARN lethal-7 (let-7) est composée de miARN parmi les plus connus et ayant des fonctions cruciales pour la cellule. La régulation du niveau des miARN let-7 est essentielle au bon développement cellulaire. La biogenèse de ces miARN, du transcrit primaire jusqu’à leur forme mature, est régulée principalement par Lin28, une protéine pluripotente très conservée. Cette protéine est composée d’un domaine cold shock (CSD) et de deux domaines de liaison au zinc. C’est grâce à ces domaines de liaison à l’ARN que Lin28 peut lier et inhiber la maturation des miARN let-7. L’objectif de cette thèse est de caractériser l’interaction entre Lin28 et le microARN précurseur let-7g afin de mieux comprendre le rôle de cette protéine dans l’inhibition de la biogenèse du miARN. À l’aide de techniques biochimiques et biophysiques, nous avons d’abord défini les principaux déterminants de l’interaction entre Lin28 et la boucle terminale du miARN précurseur let-7g (TL-let-7g). Nous avons conclu que le domaine C-terminal de Lin28, composé d’un motif riche en lysines et arginines ainsi que de deux motifs de liaison au zinc, permet à la protéine de lier spécifiquement et avec haute affinité un renflement riche en guanine conservé chez les précurseurs de la famille let-7. Aussi, parce que la séquence et la spécificité de liaison à l’ARN de ce domaine C-terminal sont semblables à celles de la protéine NCp7 du VIH, nous avons défini ce dernier comme le domaine NCp7-like de Lin28. Par la suite, nous avons caractérisé la multimérisation de trois protéines Lin28 sur la boucle terminale de pre-let-7g. Ceci a permis de réconcilier d’apparentes contradictions retrouvées dans la littérature actuelle concernant les sites de liaison de Lin28 lors de sa liaison aux miARN précurseurs. Nous avons identifié trois sites de liaison à haute affinité sur TL-let-7g qui sont liés dans un ordre précis par trois protéines Lin28. Lors de la formation du complexe multimérique, le CSD permet une déstabilisation de l’ARN, ce qui rend accessible plusieurs sites de liaison. Le domaine NCp7-like permet plutôt un assemblage ordonné de la protéine et facilite la liaison initiale de cette dernière. Ces nouveaux résultats rendent possible la mise au point d’un nouveau modèle de l’interaction entre Lin28 et le miARN précurseur let-7g. En conclusion, les études réalisées dans cette thèse apportent une meilleure compréhension des mécanismes moléculaires impliqués dans la régulation post-transcriptionnelle d’une importante famille de miARN et permettront de guider les futures études dans le domaine de recherche en pleine effervescence qu’est celui de la biogenèse des miARN.
Resumo:
Ce mémoire rapporte l’optimisation et l’évaluation d’une nouvelle version du test PAMPA (Parallel Artificial Membrane Permeability Assay) appelée Néo-PAMPA. Ce test qui permet la prédiction de l’absorption intestinale de médicaments consiste en l’utilisation d’une membrane modèle de la paroi intestinale composée d’une bicouche lipidique déposée sur un coussin de polydopamine recouvrant un filtre poreux. En effet, nous nous sommes intéressés lors de ce projet à la mise en place d’une membrane artificielle qui serait plus représentative de la paroi intestinale humaine. Nous avons pu déterminer, suite à une étude comparative des propriétés de huit médicaments ainsi que les coefficients de perméabilité obtenus, que les filtres en polycarbonate présentaient le meilleur choix de support solide pour la membrane. Nous avons également vérifié la déposition du coussin de polydopamine qui apporte le caractère fluide à la bicouche lipidique. Les résultats des tests de perméabilité ont démontré que le coussin de polymère n’obstrue pas les pores du filtre après un dépôt de 4h. Nous avons par la suite étudié la déposition de la bicouche lipidique sur le filtre recouvert de polydopamine. Pour ce faire, deux méthodes de préparation de liposomes ainsi que plusieurs tailles de liposomes ont été testées. Aussi, la composition en phospholipides a été sujette à plusieurs changements. Tous ces travaux d’optimisation ont permis d’aboutir à des liposomes préparés selon la méthode du « film lipidique » à partir d’un mélange de dioléoylphosphatidylcholine (DOPC) et de cholestérol. Une dernière étape d’optimisation de la déposition de la bicouche reste à améliorer. Enfin, le test standard Caco-2, qui consiste à évaluer la perméabilité des médicaments à travers une monocouche de cellules cancéreuses du colon humain, a été implémenté avec succès dans le but de comparer des données de perméabilité avec un test de référence.
Resumo:
La scoliose idiopathique de l’adolescent est une déformation 3D du rachis. La littérature comporte une multitude d’études sur la prédiction de l’évolution et l’identification de facteurs de risque de progression. Pour l’instant les facteurs de risque établis sont l’amplitude de la déformation, la maturité squelettique et le type de courbure. Plusieurs autres champs ont été explorés comme les aspects génétiques, biochimiques, mécaniques, posturaux et topographiques, sans vraiment apporter beaucoup de précision à la prédiction de l’évolution. L’avancement de la technologie permet maintenant de générer des reconstructions 3D du rachis à l’aide des radiographies standard et d’obtenir des mesures de paramètres 3D. L’intégration de ces paramètres 3D dans un modèle prédictif représente une avenue encore inexplorée qui est tout à fait logique dans le contexte de cette déformation 3D du rachis. L’objectif général de cette thèse est de développer un modèle de prédiction de l’angle de Cobb à maturité squelettique à partir de l’information disponible au moment de la première visite, soit l’angle de Cobb initial, le type de courbure, l’âge osseux et des paramètres 3D du rachis. Dans une première étude, un indice d’âge osseux a été développé basé sur l’ossification de l’apophyse iliaque et sur le statut du cartilage triradié. Cet indice comporte 3 stades et le second stade, qui est défini par un cartilage triradié fermé avec maximum 1/3 d’ossification de l’apophyse iliaque, représente le moment pendant lequel la progression de la scoliose idiopathique de l’adolescent est la plus rapide. Une seconde étude rétrospective a permis de mettre en évidence le potentiel des paramètres 3D pour améliorer la prédiction de l’évolution. Il a été démontré qu’à la première visite il existe des différences pour 5 paramètres 3D du rachis entre un groupe de patients qui sera éventuellement opéré et un groupe qui ne progressera pas. Ces paramètres sont : la moyenne da la cunéiformisation 3D des disques apicaux, la rotation intervertébrale à la jonction inférieure de la courbure, la torsion, le ratio hauteur/largeur du corps vertébral de T6 et de la colonne complète. Les deux dernières études sont basées sur une cohorte prospective de 133 patients avec une scoliose idiopathique de l’adolescent suivi dès leur première visite à l’hôpital jusqu’à maturité squelettique. Une première étude a permis de mettre en évidence les différences morphologiques à la première visite entre les patients ayant progresser de plus ou moins de 6°. Des différences ont été mise en évidence pour la cyphose, l’angle de plan de déformation maximal, la rotation ntervertébrale l’apex, la torsion et plusieurs paramètres de «slenderness». Ensuite une seconde étude a permis de développer un modèle prédictif basé sur un modèle linéaire général en incluant l’indice d’âge osseux développé dans la première étude, le type de courbure, l’amplitude de l’angle de Cobb à la première visite, l’angle de déformation du plan maximale, la cunéiformisation 3D des disques T3-T4, T8-T9, T11-T12 et la somme des cunéiformisation 3D de tous les disques thoraciques et lombaires. Le coefficient de détermination multiple pour cette modélisation est de 0.715. Le modèle prédictif développé renforce l’importance de considérer la scoliose idiopathique dans les trois dimensions et il permettra d’optimiser la prédiction de l’évolution au moment de la première visite.
Resumo:
L'outil développé dans le cadre de cette thèse est disponible à l'adresse suivante: www.astro.umontreal.ca/~malo/banyan.php
Resumo:
Avec la mise en place de la nouvelle limite maximale de 400 000 cellules somatiques par millilitres de lait (c/mL) au réservoir, le mois d’août 2012 a marqué une étape importante en termes de qualité du lait pour les producteurs de bovins laitiers du Canada. L’objectif de cette étude consistait en l’établissement d’un modèle de prédiction de la violation de cette limite au réservoir à l’aide des données individuelles et mensuelles de comptages en cellules somatiques (CCS) obtenues au contrôle laitier des mois précédents. Une banque de donnée DSA comprenant 924 troupeaux de laitiers québécois, en 2008, a été utilisée pour construire un modèle de régression logistique, adapté pour les mesures répétées, de la probabilité d’excéder 400 000 c/mL au réservoir. Le modèle final comprend 6 variables : le pointage linéaire moyen au test précédent, la proportion de CCS > 500 000 c/mL au test précédent, la production annuelle moyenne de lait par vache par jour, le nombre de jours en lait moyen (JEL) au test précédent ainsi que les proportions de vaches saines et de vaches infectées de manière chronique au test précédant. Le modèle montre une excellente discrimination entre les troupeaux qui excèdent ou n’excèdent pas la limite lors d’un test et pourrait être aisément utilisé comme outil supplémentaire de gestion de la santé mammaire à la ferme.
Resumo:
L’imagerie par spectrométrie de masse (IMS) est une technique en pleine expansion et utilisée dans beaucoup d’études effectuées sur des systèmes biologiques tels que la corrélation entre l’expression moléculaire et l’état de santé d’un tissu et pour étudier la biologie du développement. Cependant, plus particulièrement lors de l’analyse de protéines, seulement les molécules les plus abondantes et/ou les plus facilement ionisables seront détectées. L’une des approches utilisées pour éviter cette limitation est de transférer les protéines de manière sélective à partir d’une section tissulaire mince vers une surface fonctionnalisée tout en maintenant leur organisation spatiale. Dans ce cas, seulement les protéines possédant une affinité pour la surface seront alors retenues alors que les autres seront éliminées. Donc, la nature chimique de cette surface est critique. Les travaux de recherches présentés dans ce mémoire portent sur le développement d’une méthode de transfert des protéines d’une section tissulaire vers une surface composée de nitrocellulose. Cette méthode utilise un système permettant d’effectuer le transfert sans contact physique direct entre les surfaces. De plus, lors du transfert, une pression physique est appliquée. Dans une première approche, la méthode développée a été appliquée en utilisant une section de rein de souris comme échantillon modèle. Des sections sérielles ont été collectées, soit pour être colorées à l’aide d’hématoxyline et d’éosine (H&E) afin de démontrer la régiospécificité du transfert, soit pour être analysées directement par IMS afin de déterminer si les protéines détectées après transfert sont également détecter dans les sections analysées directement. Les résultats obtenus ont démontré qu’un sous-ensemble de protéines a été transféré tout en conservant leur position spatiale initiale dans les sections. Certains signaux observés pour les protéines transférées sont uniques et/ou sont nettement mieux détectés que lors de l’analyse directe d’une section.
Resumo:
La leucémie aiguë lymphoblastique (LAL) est le cancer pédiatrique le plus fréquent. Plusieurs réarrangements chromosomiques ont été associés à cette maladie, dont la translocation t(12;21), qui est observée dans 25% des cas de LAL de type pré-B. Cette translocation engendre l’expression de la protéine de fusion ETV6-AML1. Toutefois, celle-ci n’est pas suffisante pour initier seule une leucémie, ce qui suggère que des mutations additionnelles sont nécessaires à la transformation oncogénique. Or, on observe que l’allèle non-réarrangé d’ETV6 est perdu dans 75% des cas de t(12;21). Cette délétion entraîne l’inactivation complète du facteur de transcription ETV6 et l’abolition de sa fonction biologique. Puisqu’ETV6 semble jouer un rôle de suppresseur de tumeurs, nous croyons que son inactivation favoriserait le développement de la leucémie via la dérégulation de ses gènes cibles. Ce projet visait donc à identifier de nouvelles cibles transcriptionnelles d’ETV6, afin d’élucider son implication dans la leucémie. Une expérience de RNA-Seq a permis d’identifier plus de 200 gènes dont l’expression est corrélée avec celle d’ETV6 dans des cellules souches hématopoïétiques CD34+. Parmi ceux-ci, plusieurs gènes sont impliqués dans la réponse immunitaire et inflammatoire, la migration cellulaire, l’homéostasie ionique et la signalisation intracellulaire. Nous avons également mis en place une approche d’immunoprécipitation de la chromatine afin d’identifier les régions auxquelles le facteur de transcription ETV6 peut se lier. À l’aide de cette méthode, nous avons démontré une interaction entre ETV6 et SLCO2B1, un gène dont l’expression est également co-régulée avec ETV6. Finalement, notre étude suggère qu’ETV6 contribuerait à la leucémogenèse en dérégulant l’expression de certains gènes ayant des propriétés oncogéniques.
Resumo:
Des évidences expérimentales récentes indiquent que les ARN changent de structures au fil du temps, parfois très rapidement, et que ces changements sont nécessaires à leurs activités biochimiques. La structure de ces ARN est donc dynamique. Ces mêmes évidences notent également que les structures clés impliquées sont prédites par le logiciel de prédiction de structure secondaire MC-Fold. En comparant les prédictions de structures du logiciel MC-Fold, nous avons constaté un lien clair entre les structures presque optimales (en termes de stabilité prédites par ce logiciel) et les variations d’activités biochimiques conséquentes à des changements ponctuels dans la séquence. Nous avons comparé les séquences d’ARN du point de vue de leurs structures dynamiques afin d’investiguer la similarité de leurs fonctions biologiques. Ceci a nécessité une accélération notable du logiciel MC-Fold. L’approche algorithmique est décrite au chapitre 1. Au chapitre 2 nous classons les impacts de légères variations de séquences des microARN sur la fonction naturelle de ceux-ci. Au chapitre 3 nous identifions des fenêtres dans de longs ARN dont les structures dynamiques occupent possiblement des rôles dans les désordres du spectre autistique et dans la polarisation des œufs de certains batraciens (Xenopus spp.).
Resumo:
Réalisé sous la co-direction de Pierre Tremblay
Resumo:
L’hypertension essentielle étant un facteur majeur de morbidité, la compréhension de son l’étiologie est prépondérante. Ainsi, la découverte de nouvelles composantes ou mécanismes de régulation de la PA par l’identification de QTL et l’étude de leurs interactions s’avère une approche prometteuse. L’utilisation de souches congéniques de rats pour l’étude de l’hypertension est une stratégie payante puisqu’elle permet de masquer les effets de l’environnement, tout en gardant le caractère polygénique de la PA. Longtemps conçu comme un trait issu de l’accumulation des effets minimes des QTL, la PA est régulée par une architecture basée sur l’existence d’interactions épistatiques. L’analyse par paires de QTL individuels a permis d’établir une modularité dans l’organisation des QTL chez le rat Dahl Salt-sensitive en fonction de la présence ou de l’absence d’une interaction épistatique entre eux. Ainsi, deux modules épistatiques ont été établis; EM1 et EM2 où tous les QTL appartenant à EM1 sont épistatiques entre eux et agissent de façon additive avec les membres de EM2. Des hiérarchies dans la régulation peuvent alors être révélées si les QTL d’un même EM ont des effets opposés. L’identification de la nature moléculaire des candidats C18QTL4/Hdhd2 et C18QTL3/Tcof1, membres du EM1, et de l’interaction épistatique entre ces deux QTL, a permis, en plus, d’élucider une régulation séquentielle au sein du module. Hdhd2 pourrait agir en amont de Tcof1 et réguler ce dernier par une modification post-traductionnelle. Cette interaction est la première évidence expérimentale de la prédiction des relations entre QTL, phénomène établi par leur modularisation. Le dévoilement du fonctionnement de l’architecture génétique à la base du contrôle de la PA et la découverte des gènes responsables des QTL permettrait d’élargir les cibles thérapeutiques et donc de développer des traitements antihypertenseurs plus efficaces.
Resumo:
Les ARN non codants (ARNnc) sont des transcrits d'ARN qui ne sont pas traduits en protéines et qui pourtant ont des fonctions clés et variées dans la cellule telles que la régulation des gènes, la transcription et la traduction. Parmi les nombreuses catégories d'ARNnc qui ont été découvertes, on trouve des ARN bien connus tels que les ARN ribosomiques (ARNr), les ARN de transfert (ARNt), les snoARN et les microARN (miARN). Les fonctions des ARNnc sont étroitement liées à leurs structures d’où l’importance de développer des outils de prédiction de structure et des méthodes de recherche de nouveaux ARNnc. Les progrès technologiques ont mis à la disposition des chercheurs des informations abondantes sur les séquences d'ARN. Ces informations sont accessibles dans des bases de données telles que Rfam, qui fournit des alignements et des informations structurelles sur de nombreuses familles d'ARNnc. Dans ce travail, nous avons récupéré toutes les séquences des structures secondaires annotées dans Rfam, telles que les boucles en épingle à cheveux, les boucles internes, les renflements « bulge », etc. dans toutes les familles d'ARNnc. Une base de données locale, RNAstem, a été créée pour faciliter la manipulation et la compilation des données sur les motifs de structure secondaire. Nous avons analysé toutes les boucles terminales et internes ainsi que les « bulges » et nous avons calculé un score d’abondance qui nous a permis d’étudier la fréquence de ces motifs. Tout en minimisant le biais de la surreprésentation de certaines classes d’ARN telles que l’ARN ribosomal, l’analyse des scores a permis de caractériser les motifs rares pour chacune des catégories d’ARN en plus de confirmer des motifs communs comme les boucles de type GNRA ou UNCG. Nous avons identifié des motifs abondants qui n’ont pas été étudiés auparavant tels que la « tetraloop » UUUU. En analysant le contenu de ces motifs en nucléotides, nous avons remarqué que ces régions simples brins contiennent beaucoup plus de nucléotides A et U. Enfin, nous avons exploré la possibilité d’utiliser ces scores pour la conception d’un filtre qui permettrait d’accélérer la recherche de nouveaux ARN non-codants. Nous avons développé un système de scores, RNAscore, qui permet d’évaluer un ARN en se basant sur son contenu en motifs et nous avons testé son applicabilité avec différents types de contrôles.