920 resultados para MITOCHONDRIAL-DNA SEQUENCES
Resumo:
Gastric cancer is the forth most frequent malignancy and the second most common cause of cancer death worldwide. DNA methylation is the most studied epigenetic alteration, occurring through a methyl radical addition to the cytosine base adjacent to guanine. Many tumor genes are inactivated by DNA methylation in gastric cancer. We evaluated the DNA methylation status of ANAPC1, CDKN2A and TP53 by methylation-specific PCR in 20 diffuse- and 26 intestinal-type gastric cancer samples and 20 normal gastric mucosa in individuals from Northern Brazil. All gastric cancer samples were advanced stage adenocarcinomas. Gastric samples were surgically obtained at the João de Barros Barreto University Hospital, State of Pará, and were stored at -80°C before DNA extraction. Patients had never been submitted to chemotherapy or radiotherapy, nor did they have any other diagnosed cancer. None of the gastric cancer samples presented methylated DNA sequences for ANAPC1 and TP53. CDKN2A methylation was not detected in any normal gastric mucosa; however, the CDKN2A promoter was methylated in 30.4% of gastric cancer samples, with 35% methylation in diffuse-type and 26.9% in intestinal-type cancers. CDKN2A methylation was associated with the carcinogenesis process for ~30% diffuse-type and intestinal-type compared to non-neoplastic samples. Thus, ANAPC1 and TP53 methylation was probably not implicated in gastric carcinogenesis in our samples. CDKN2A can be implicated in the carcinogenesis process of only a subset of gastric neoplasias.
Resumo:
In this report, we have reanalyzed genotyping data in a collection of families from South America based on maternal origin. Genotyping analysis was performed at the Craniofacial Anomalies Research Center at the University of Iowa. These genotypes were derived from genomic DNA samples obtained from blood spots from children born with isolated orofacial clefts in 45 hospitals located in eight countries (Argentina, Bolivia, Brazil, Chile, Ecuador, Paraguay, Uruguay, and Venezuela) collaborating with ECLAMC (Latin American Collaborative Studies of Congenital Malformations) between January 1998 and December 1999. Dried blood samples were sent by regular mail to the Laboratory of Congenital Malformations, Federal University of Rio de Janeiro. Previous findings suggested that mitochondrial haplotype D is more commonly found among cleft cases born in South America. We hypothesized that association of certain genes may depend upon the ethnic origin, as defined by population-specific markers. Therefore, we tested if markers in MTHFR (5,10-methylenetetrahydrofolate reductase) and RFC1 (reduced folate carrier 1) were associated with oral clefts, depending on the maternal origin defined by the mitochondrial haplotype. Transmission distortion of alleles in MTHFR C677T and RFC1 G80A polymorphic variants was tested in 200 mother/affected child pairs taking into consideration maternal origin. RFC1 variation was over-transmitted to children born with cleft lip only (P = 0.017) carrying mitochondrial DNA haplotypes other than haplotype D. Our results provide a new indication that variation in RFC1 may contribute to cleft lip only. Future studies should investigate the association between oral clefts and RFC1 based on more discrete phenotypes.
Resumo:
Polychlorinated dibenzo-p-dioxins (PCDDs) and related halogenated aromatic hydrocarbons (e.g., PCDFs), often called "dioxins", are ubiquitously present environmental contaminants. Some of them, notably 2,3,7,8-tetrachlorodibenzo-p-dioxin (TCDD), are among the most toxic synthetic compounds known. The biological effects of dioxins are mediated via the aryl hydrocarbon receptor (AhR). Mutations in the AhR transactivation domain are linked to sensitivity to the acute lethality of TCDD. We present here a study of AhR gene polymorphism in normal and cancer human tissues affecting pre-mRNA splicing in the AhR gene-coding transactivation domain region (exon 10, intron 10, exon 11 region), previously shown to be associated with AhR dysfunction. We tested 126 pairs of normal and cancer tissue samples from liver, lung, stomach, kidney, mucous, breast, and pancreas of 49 males and 77 females (45-70 years of age). We used in vitro splicing assay, RT-PCR and sequencing methods. Our results showed that in an in vitro system it is possible to reconstitute cellular pre-mRNA splicing events. Tested cancer tissues did not contain mutations in the AhR transactivation domain region when the DNA sequences were compared with those from normal tissues. There were also no differences in AhR mRNA splice variants between normal and malignant breast tissues and no polymorphisms in the studied regions or cDNA.
Resumo:
The regenerating urodele limb is a useful model system in which to study, in vivo, the controls of cell proliferation and differentiation. Techniques are available which enable one to experimentally manipulate mitogenic influences upon the blastema, as well the morphogenesis of the regenerating 11mb. Although classical regeneration studies have generated a wealth of knowledge concerning tissue interactions, little 1s known about the process at the level of gene expression. The aim of this project was to clone potentially developmentally regulated genes from a newt genomic library for use in future studies of gene expression during limb regeneration. We decided to clone the cytoskeletal actin gene for the following reasons: 1. its expression reflects the proliferative and differentiatlve states of cells in other systems 2. the high copy number of cytoplasmic actin pseudogenes in other vertebrates and the high degree of evolutionary sequence conservation among actin genes increased the chance of cloning one of the newt cytoplasmic actin genes. 3. Preliminary experiments indicated that a newt actin could probably be identified using an available chick ~-actln gene for a molecular probe. Two independent recombinant phage clones, containing actin homologous inserts, were isolated from a newt genomic library by hybridization with the chick actin probe. Restriction mapping identified actin homologous sequences within the newt DNA inserts which were subcloned into the plasmid pTZ19R. The recombinant plasmids were transformed into the Escherichia coli strain, DHsa. Detailed restriction maps were produced of the 5.7Kb and 3.1Kb newt DNA inserts in the plasmids, designated pTNAl and pTNA2. The short «1.3 Kb) length of the actin homologous sequence in pTNA2 indicated that it was possibly a reverse transcript pseudogene. Problems associated with molecular cloning of DNA sequences from N. viridescens are discussed with respect to the large genome size and abundant highly repetitive DNA sequences.
Resumo:
The construction of adenovirus vectors for cloning and foreign gene expression requires packaging cell lines that can complement missing viral functions caused by sequence deletions and/or replacement with foreign DNA sequences. In this study, packaging cell lines were designed to provide in trans the missing bovine adenovirus functions, so that recombinant viruses could be generated. Fetal bovine kidney and lUng cells, acquired at the trimester term from a pregnant cow, were tranfected with both digested wild type BAV2 genomic DNA and pCMV-EI. The plasmid pCMV-EI was specifically constructed to express El of BAV2 under the control of the cytomegalovirus enhancer/promoter (CMV). Selection for "true" transformants by continuous passaging showed no success in isolating immortalised cells, since the cells underwent crisis resulting in complete cell death. Moreover, selection for G418 resistance, using the same cells, also did not result in the isolation of an immortalised cell line and the same culture-collapse event was observed. The lack of success in establishing an immortalised cell line from fetal tissue prompted us to transfect a pre-established cell line. We began by transfecting MDBK (Mardin-Dardy bovine kidney) cells with pCMV-El-neo, which contain the bacterial selectable marker neo gene. A series of MDBK-derived cell lines, that constitutively express bovine adenoviral (BAV) early region 1 (El), were then isolated. Cells selected for resistance to the drug G418 were isolated collectively for full characterisation to assess their suitability as packaging cell lines. Individual colonies were isolated by limiting dilution and further tested for El expression and efficiency of DNA uptake. Two cell lines, L-23 and L-24, out of 48 generated foci tested positive for £1 expression using Northern Blot analysis. DNA uptake studies, using both lipofectamine and calcium phosphate methods, were performed to compare these cells, their parental MDBK cells, 8 and the unrelated human 293 cells as a benchmark. The results revealed that the new MDBKderived clones were no more efficient than MDBK cells in the transient expression of transfected DNA and that they were inferior to 293 cells, when using lacZ as the reporter gene. In view of the inherently poor transfection efficiency of MDBK cells and their derivatives, a number of other bovine cells were investigated for their potential as packaging cells. The cell line CCL40 was chosen for its high efficiency in DNA uptake and subsequently transfected with the plasmid vector pCMV El-neo. By selection with the drug G418, two cell lines were isolated, ProCell 1 and ProCell 2. These cell lines were tested for El expression, permissivity to BAV2 and DNA uptake efficiency, revealing a DNA uptake efficiency of 37 % , comparable to that of CCL40. Attempts to rescue BAV2 mutants carrying the lacZ gene in place of £1 or £3 were carried out by co-transfecting wild type viral DNA with either the plasmid pdlElE-Z (which contains BAV2 sequences from 0% to 40.4% with the lacZ gene in place of the £1 region from 1.1% to 8.25%) or with the plasmid pdlE3-5-Z (which contains BAV2 sequences from 64.8% to 100% with the lacZ gene in place of the E3 region from 75.8% to 81.4%). These cotransfections did not result in the generation of a viral mutant. The lack of mutant generation was thought to be caused by the relative inefficiency ofDNA uptake. Consequently, cosBAV2, a cosmid vector carrying the BAV2 genome, was modified to carry the neo reporter gene in place of the £3 region from 75.8% to 81.4%. The use of a single cosmid vector earring the whole genome would eliminate the need for homologous recombination in order to generate a viral vector. Unfortunately, the transfection of cosBAV2- neo also did not result in the generation of a viral mutant. This may have been caused by the size of the £3 deletion, where excess sequences that are essential to the virus' survival might have been deleted. As an extension to this study, the spontaneous E3 deletion, accidently discovered in our viral stock, could be used as site of foreign gene insertion.
Resumo:
Adenoviruses are nonenveloped icosahedral shaped particles. The double stranded DNA viral genome is divided into 5 major early transcription units, designated E1 A, E1 B, and E2 to E4, which are expressed in a regulated manner soon after infection. The gene products of the early region 3 (E3), shown to be nonessential for viral replication in vitro, are believed to be involved in counteracting host immunosurveillance. In order to sequence the E3 region of Bovine adenovirus type 2 (BAV2) it was necessary to determine the restriction map for the plasmid pEA48. A physical restriction endonuclease map for BamHl, Clal, Eco RI, Hindlll, Kpnl, Pstt, Sail, and Xbal was constructed. The DNA insert in pEA48 was determined to be viral in origin using Southern hybridization. A human adenovirus type 5 recombinant plasmid, containing partial DNA fragments of the two transcription units L4 and L5 that lie just outside the E3, was used to localize this region. The recombinant plasmid pEA was subcloned to facilitate sequencing. The DNA sequences between 74.8 and 90.5 map units containing the E3, the hexon associated protein (pVIII), and the fibre gene were determined. Homology comparison revealed that the genes for the hexon associated pV11I and the fibre protein are conserved. The last 70 amino acids of the BAV2 pV11I were the most conserved, showing a similarity of 87 percent with Ad2 pV1I1. A comparison between the predicted amino acid sequences of BAV2 and Ad40, Ad41 , Ad2 and AdS, revealed that they have an identical secondary structure consisting of a tail, a shaft and a knob. The shaft is composed of 22, 15 amino acid motifs, with periodic glycines and hydrophobic residues. The E3 region was found to consist of about 2.3 Kbp and to encode four proteins that were greater than 60 amino acids. However, these four open reading frames did not show significant homology to any other known adenovirus DNA or protein sequence.
Resumo:
Adenoviruses are non-enveloped icosahedral-shaped particles which possess a double-stranded DNA genome. Currently, nearly 100 serotypes of adenoviruses have been identified, 48 of which are of human origin. Bovine adenoviruses (BAVs), causing both mild respiratory and/or enteral diseases in cattle, have been reported in many countries all over the world. Currently, nine serotypes of SAVs have been isolated which have been placed into two subgroups based on a number of characteristics which include complement fixation tests as well as the ability to replicate in various cell lines. Bovine adenovirus type 2 (BAV2), belonging to subgroup I, is able to cause pneumonia as well as pneumonic-like symptoms in calves. In this study, the genome of BAV2 (strain No. 19) was subcloned into the plasmid vector pUC19. In total, 16 plasmids were constructed; three carry internal San fragments (spanning 3.1 to 65.2% ), and 10 carry internal Pstl fragments (spanning 4.9 to 97.4%), of the viral genome. Each of these plasmids was analyzed using twelve restriction endonucleases; BamHI, CiaI, EcoRl, HiOOlll, Kpnl, Noll, NS(N, Ps~, Pvul, Saj, Xbal, and Xhol. Terminal end fragments were also cloned and analyzed, sUbsequent to the removal of the 5' terminal protein, in the form of 2 BamHI B fragments, cloned in opposite orientations (spanning 0 to 18.1°k), and one Pstll fragment (spanning 97.4 to 1000/0). These cloned fragments, along with two other plasmids previously constructed carrying internal EcoRI fragments (spanning 20.6 to 90.5%), were then used to construct a detailed physical restriction map using the twelve restriction endonucleases, as well as to estimate the size of the genome for BAV2(32.5 Kbp). The DNA sequences of the early region 1 (E1) and hexon-associated gene (protein IX) have also been determined. The amino acid sequences of four open reading frames (ORFs) have been compared to those of the E1 proteins and protein IX from other Ads.
Resumo:
Two cytoplasmic, glucosamine resistant mutants of Saccharomyces cerevisiae, GR6 and GR10, were examined to determine whether or not the lesions involved were located on mitochondrial DNA. Detailed investigation of crosses of GR6 and GR10 or their derivatives to strains bearing known mitochondrial markers demonstrated that: 1. the frequency of glucos~~ine resistance in diploids was independent of factors influencing mitochondrial marker output. 2. upon tetrad analysis a variety of tetrad ratios was observed for glucosamine resistance whereas mitochondrial markers segregated 4:0 or 0:4 (resistant:sensitive). 3. glucosamine resistance and mitochondrial markers segregated differentially with time. 4. glucosamine resistance persisted following treatment of a GRIO derivative with ethidium bromide at concentrations high enough to eliminate all mitochondrial DNA. 5. haploid spore clones displayed two degrees of glucosamine resistance, weak and strong, while growth due to mitochondrial mutations was generally thick and confluent. 6. a number of glucosamine resistant diploids and haploids, which also possessed a mithchondrial resistance mutation, were unable to grow on medium containing both glucosamine and the particular drug involved. 3 These observations 1~ 6 provided strong evidence that the cytoplasmic glucosamine resistant mutations present in GR6 and GRiO were not situated on mitochondrial DNA. Comparison of the glucosamine resistance mutations to some other known cytoplasmic determinants revealed that: 7. glucosamine resistance and the expression of the killer phenotype were separate phenomena. 8. unlike yeast carrying resistance conferring episomes GR6 and GR10 were not resistant to venturicidin or oligomycin and the GR factor exhibited genetic behaviour different from that of the episomal determinants. These results 7--+8 suggested that glucosamine resistance was not associated with the killer determinant nor with alleged yeast episomes. It is therefore proposed that a yeast plasmid(s), previously undescribed, is responsible for glucosamine resistance. The evidence to date is compatible with the hypothesis that GR6 and GR10 carry allelic mutations of the same plasmid which is tentatively designated (GGM).
Resumo:
"Mémoire présenté à la faculté des études supérieures en vue de l'obtention du grade de maîtrise en droit (LL.M.) option droit, biotechnologies et société"
Resumo:
Les molécules classiques du complexe majeur d’histocompatibilité de classe II (CMHII) sont des glycoprotéines de surface spécialisées dans la présentation de peptides, principalement dérivés de pathogènes extracellulaires, aux récepteurs des lymphocytes T CD4+ afin d’initier la réponse immunitaire adaptative. Elles sont encodées, avec celles du CMH de classe I, par les gènes les plus polymorphiques identifiés jusqu’à maintenant, avec plusieurs loci et une grande diversité allélique à chacun d’eux. De plus, le polymorphisme des gènes du CMHII n’est pas limité qu’aux séquences codantes. Il est également observé dans les promoteurs où on a démontré ses effets sur le niveau d’expression des gènes. La variation de la régulation d’un gène est considérée comme un facteur important et pour laquelle des modifications morphologiques, physiologiques et comportementales sont observées chez tous les organismes. Des séquences d’ADN répétées impliquées dans cette régulation ont été identifiées dans les régions non-codantes des génomes. D’un autre côté, la sélection par les pathogènes permettrait l’évolution et le maintien du polymorphisme des gènes du CMH chez les vertébrés. À ce sujet, plusieurs études ont montré l’implication de différents allèles du CMH dans la résistance ou la susceptibilité aux maladies. Cette étude avait pour objectifs de caractériser le polymorphisme du gène MHIIb chez l’omble de fontaine (Salvelinus fontinalis) et de documenter ses effets au niveau de la survie conférée par des allèles et/ou génotypes particuliers lors d’une infection, ainsi que sur la variation du niveau d’expression du gène dans différentes conditions. Dans une première partie, nous avons identifié un total de 6 allèles du gène MHIIb, désignés Safo-DAB*0101 à Safo-DAB*0601, qui montrent une grande similarité avec les séquences codantes provenant de poissons téléostéens et de l’humain. L’analyse des séquences du domaine b1 a permis de détecter l’effet d’une pression sélective positive pour maintenir le polymorphisme dans cette région de la molécule. Quatre de ces allèles ont été testés lors d’une expérience d’infection avec le pathogène Aeromonas salmonicida afin d’évaluer l’effet qu’ils pouvaient avoir sur la survie des poissons. Nous avons trouvé que l’allèle DAB*0101 était significativement associé à la résistance à la furonculose. En plus d’avoir été identifié chez les individus homozygotes pour cet allèle, l’effet a également été remarqué au niveau de la survie les poissons de génotype DAB*0101/*0201. À l’opposé, les facteurs de risque élevé obtenus pour les génotypes DAB*0201/*0301 et DAB*0301/*0401 suggèrent plutôt une association à la susceptibilité. Étant donné la faible fréquence à laquelle l’allèle DAB*0101 a été retrouvé dans la population, le modèle de la sélection dépendante de la fréquence pourrait expliquer l’avantage conféré par ce dernier et souligne l’importance de ce mécanisme pour le maintien du polymorphisme du gène MHIIb chez l’omble de fontaine. Dans une seconde partie, nous avons rapporté la présence d’un minisatellite polymorphique formé d’un motif de 32 nucléotides dans le second intron du gène MHIIb, et pour lequel un nombre exclusif de répétitions du motif a été associé à chaque allèle (69, 27, 20, 40, 19 et 25 répétitions pour les allèles DAB*0101 à DAB*0601 respectivement). L’expression relative de quatre allèles a été évaluée dans des poissons hétérozygotes aux températures de 6 ºC et 18 ºC. Les résultats indiquent que les allèles possédant un long minisatellite montrent une réduction de l’expression du gène d’un facteur 1,67 à 2,56 par rapport aux allèles qui en contiennent un court. De même, des allèles qui incluent des minisatellites de tailles similaires n’affichent pas de différence significative au niveau de l’abondance du transcrit aux deux températures. De plus, l’effet répressif associé aux longs minisatellites est amplifié à la température de 18 ºC dans des poissons de trois génotypes différents. Nous avons finalement observé une augmentation significative par un facteur 2,08 de l’expression totale du gène MHIIb à la température de 6 ºC. Ces résultats appuient l’implication des séquences d’ADN répétées dans la régulation de l’activité transcriptionnelle d’un gène et suggèrent qu’un minisatellite sensible aux différences de températures pourrait être soumis aux forces sélectives et jouer un rôle important dans l’expression de gènes et l’évolution des organismes poïkilothermes.
Resumo:
Comparativement au génome contenu dans le noyau de la cellule de plante, nos connaissances des génomes des deux organelles de cette cellule, soit le plastide et la mitochondrie, sont encore très limitées. En effet, un nombre très restreint de facteurs impliqués dans la réplication et la réparation de l’ADN de ces compartiments ont été identifiés à ce jour. Au cours de notre étude, nous avons démontré l’implication de la famille de protéines Whirly dans le maintien de la stabilité des génomes des organelles. Des plantes mutantes pour des gènes Whirly chez Arabidopsis thaliana et Zea mays montrent en effet une augmentation du nombre de molécules d’ADN réarrangées dans les plastides. Ces nouvelles molécules sont le résultat d’une forme de recombinaison illégitime nommée microhomology-mediated break-induced replication qui, en temps normal, se produit rarement dans le plastide. Chez un mutant d’Arabidopsis ne possédant plus de protéines Whirly dans les plastides, ces molécules d’ADN peuvent même être amplifiées jusqu’à cinquante fois par rapport au niveau de l’ADN sauvage et causer un phénotype de variégation. L’étude des mutants des gènes Whirly a mené à la mise au point d’un test de sensibilité à un antibiotique, la ciprofloxacine, qui cause des bris double brin spécifiquement au niveau de l’ADN des organelles. Le mutant d’Arabidopsis ne contenant plus de protéines Whirly dans les plastides est plus sensible à ce stress que la plante sauvage. L’agent chimique induit en effet une augmentation du nombre de réarrangements dans le génome du plastide. Bien qu’un autre mutant ne possédant plus de protéines Whirly dans les mitochondries ne soit pas plus sensible à la ciprofloxacine, on retrouve néanmoins plus de réarrangements dans son ADN mitochondrial que dans celui de la plante sauvage. Ces résultats suggèrent donc une implication pour les protéines Whirly dans la réparation des bris double brin de l’ADN des organelles de plantes. Notre étude de la stabilité des génomes des organelles a ensuite conduit à la famille des protéines homologues des polymérases de l’ADN de type I bactérienne. Plusieurs groupes ont en effet suggéré que ces enzymes étaient responsables de la synthèse de l’ADN dans les plastides et les mitochondries. Nous avons apporté la preuve génétique de ce lien grâce à des mutants des deux gènes PolI d’Arabidopsis, qui encodent des protéines hautement similaires. La mutation simultanée des deux gènes est létale et les simples mutants possèdent moins d’ADN dans les organelles des plantes en bas âge, confirmant leur implication dans la réplication de l’ADN. De plus, les mutants du gène PolIB, mais non ceux de PolIA, sont hypersensibles à la ciprofloxacine, suggérant une fonction dans la réparation des bris de l’ADN. En accord avec ce résultat, la mutation combinée du gène PolIB et des gènes des protéines Whirly du plastide produit des plantes avec un phénotype très sévère. En définitive, l’identification de deux nouveaux facteurs impliqués dans le métabolisme de l’ADN des organelles nous permet de proposer un modèle simple pour le maintien de ces deux génomes.
Resumo:
La thrombasthénie de Glanzmann (TG) est une maladie caractérisée par un défaut d’agrégation plaquettaire. C’est une maladie génétique autosomale récessive causée par une anomalie du récepteur plaquettaire pour le fibrinogène. Ce récepteur est une intégrine localisée à la surface plasmatique qui est formée par un complexe composé des sous‐unités αIIb et β3. Nous avons identifié un cheval démontrant les caractéristiques clinicopathologiques de la TG. Des études par cytométrie de flux ont révélé une déficience au niveau de la portion αIIb du récepteur. Ces résultats suggèrent une ou plusieurs mutations au niveau du gène codant pour cette portion αIIb du récepteur. L’objectif de notre étude était de caractériser l’ADNc et l’ADN génomique codant pour les gènes ITGA2B et ITGB3 codant respectivement pour les deux sous‐unités αIIb et β3 chez un cheval atteint de la TG. L’ADNc a été synthétisé par RT‐PCR en utilisant l’ARN total récolté à partir des plaquettes. L’ADN génomique a été extrait à partir des globules blancs. Des amorces spécifiques ont été utilisées pour l’amplification par PCR d’ITGA2B et d’ITGB3. Les séquences d’ADNc et d’ADN génomique de notre patient ont été caractérisées par séquençage et comparées par l’analyse BLAST (GenBank). Une substitution d’une guanine par une cytosine a été mise en évidence au niveau de l’exon 2 d’ITGA2B amenant à la substitution d’une arginine (Arg72) par une proline (Pro72). Ce changement d’acide aminé pourrait résulter en une conformation structurelle anormale qui amènerait à une sous‐unité αIIb inactive. L’analyse de l’ADN génomique a démontré que ce cheval était homozygote pour cette mutation. Le séquençage de l’ADN génomique des parents et de la grand‐mère du patient a démontré que ces individus étaient hétérozygotes pour cette mutation. Le séquençage d’ITGB3 n’a démontré aucune anomalie.
Resumo:
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal
Resumo:
Please find the referenced videos attached
Resumo:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.