Study of influence of regulatory polymorphisms of expression in development of breast cancer


Autoria(s): Lopes, Joana Margarida Teixeira
Contribuinte(s)

Maia, Ana Teresa

Data(s)

28/04/2015

28/04/2015

2013

2013

Resumo

The human genome has millions of genetics variants that can affect gene expression. These variants are known as cis-regulatory variants and are responsible for intra-species phenotypic differences and individual susceptibility to disease. One of the diseases affected by cis-regulatory variants is breast cancer. Breast cancer is one of the most common cancers, with approximately 4500 new cases each year in Portugal. Breast cancer has many genes mutated and TP53 has been shown to be relevant for this disease. TP53 is one of the most commonly mutated genes in human cancer and it is involved in cell cycle regulation and apoptosis. Previous work by Maia et al has shown that TP53 has differential allelic expression (DAE), which suggests that this gene may be under the influence of cis-regulatory variants. Also, its DAE pattern is totally altered in breast tumours with normal copy number. We hypothesized that cis-regulatory variants affecting TP53 may have a role in breast cancer development and treatment. The present work aims to identify the cis-regulatory variants playing a role in TP53 expression, using in silico, in vitro and in vivo approaches. By bioinformatic tools we have identified candidate cis-regulatory variants and predicted the possible transcription factor binding sites that they affect. By EMSA we studied DNA-protein interactions in this region of TP53. The in silico analysis allowed us to identified three candidate cis-regulatory SNPs which may affect the binding of seven transcription factors. However, the EMSA experiments have not been conclusive and we have not yet confirmed whether any of the identified SNPs are associated with gene expression control of TP53. We will carry out further experiments to validate our findings.

As células normalmente crescem, dividem-se e morrem de uma forma controlada mas ao longo da vida surgem alguns danos no ADN. De forma a manter a função normal do organismo estes danos são reparados ou a célula entra em apoptose. Quando estes mecanismos falham pode ocorrer acumulação de mutações, o que leva à formação do cancro. O cancro não é uma doença única e homogénea, há sim uma grande variedade de cancros. O cancro da mama é um dos cancros mais comuns e em 2012, foi o quarto cancro com maior incidência em Portugal. Em cada ano existem 4500 novos casos e 1500 mulheres morrem com esta doença. No mundo, o cancro da mama representa cerca de 16% de todos os cancros femininos e 22.9% dos cancros invasivos na mulher. Esta doença é caraterizada por alterações nas células da mama que se tornam anormais e multiplicam-se descontroladamente levando à formação de um tumor. Estas alterações podem ser devido a fatores de risco, embora estes não sejam ainda bem compreendidos. Estes fatores incluem: idade, sexo, genética, história familiar, hormonas, contraceptivos, tumores benignos, entre outros. Existem muitos genes cujas mutações contribuem para a susceptibilidade do cancro da mama. Os genes frequentemente mutados são: BRCA1, BRCA2, ATM, TP53, CHECK2, PTEN, CDH1, STK11, entre outros. Mutações da linha germinal raras nos genes BRCA1 e BRCA2 estão associadas a um alto risco e são responsáveis por aproximadamente 20% dos casos familiares. Mutações da linha germinal no gene TP53 são mais raras mas têm um risco muito elevado. Mutações somáticas no gene TP53 são encontradas também no cancro da mama em cerca de 15-20% dos tumores. O TP53 é um gene supressor de tumores que codifica uma proteína designada p53. A proteína p53 é um fator de transcrição e responde a vários stresses celulares através da regulação da expressão dos seus genes alvo. Esta proteína pode induzir paragem do ciclo celular, apoptose, senescência, reparação do DNA, ou alterações no metabolismo. O gene TP53 é um dos genes mais frequentemente mutado nos cancros. É um importante regulador homeostático, atuando na reparação do DNA, no controlo negativo do crescimento, em diversas vias de regulação do ciclo celular e apoptose. O TP53 tem muitos transcritos e isoformas que resultam do splicing alternativo e da utilização de promotores e/ou codões de iniciação da tradução alternados. Este gene localiza-se no braço pequeno do cromossoma 17 na posição 13.1 e é constituído por 11 exões. Frequentemente as mutações somáticas no TP53 são acompanhadas por perda de heterozigotia, indicando que o alelo normal residual é perdido em tumores. Milhões de variantes genéticas ocorrem no genoma humano e são designadas por polimorfismos. Estas variantes genéticas representam aproximadamente 1% do genoma. Existem algumas variantes que levam a numerosas diferenças fenotípicas e são responsáveis pela variabilidade intra-espécies. Os polimorfismos mais frequentes são os polimorfismos de um nucleótido (SNP) e constituem cerca de 90% de todas as variações conhecidas. Os SNPs localizados na região codificante de um gene podem levar a alterações de aminoácidos. Isto pode induzir a mudança de polaridade da proteína, alteração da configuração secundária e terciária da proteína, fosforilação inadequada, entre outras consequências funcionais. Os SNPs localizados na região não codificante são na maior parte considerados não funcionais. Todavia, este tipo de alterações pode afetar os elementos reguladores dos genes tais como promotores, amplificadores ou silenciadores, que podem estar próximo do gene, mas podem também estar à distância de centenas de kilobases do gene que regulam. Estes elementos reguladores podem coletivamente modular o tempo, magnitude e especificidade celular da expressão de um gene. SNPs cis-regulatórios são as variantes genéticas que afectam a expressão de um gene. Podem atuar através de diferentes mecanismos afetando por exemplo os sítios de ligação dos factores de transcrição (TFBS), modicações de histonas e metilação do DNA. O mecanismo mais comum é a modificação dos TFBSs. Uma área importante da pesquisa médica é a compreensão do papel dos SNPs cis-regulatórios na doença. Como os SNPs cis-regulatórios originam um desiquilíbrio na expressão dos alelos de um gene, a análise da expressão alélica diferencial (DAE) é o método de excelência para estudá-los. Para estudar DAE compara-se a expressão relativa de dois alelos num indivíduo heterozigótico. A DAE é responsável pela variabilidade intra-espécie e pode levar ao aparecimento da susceptibilidade para doenças complexas. A variação nos elementos cis-regulatórios é comum no genoma humano e a DAE foi estimado a afetar 20-50% dos genes, dependendo do método usado. Para identificar DAE, recentes estudos de genómicos de associação (GWAS) têm se focado na interpretação de SNPs codificantes ou outros SNPs em regiões transcritas. O nosso grupo está principalmente interessado em estudar DAE na susceptibilidade do cancro da mama. Anteriormente, foi observado que o TP53 apresenta DAE e todos os indivíduos heterozigóticos expressam mais do mesmo alelo, no sangue e no tecido de mama. Isto indica que o SNP utilizado neste estudo está em completo linkage disequilibrium (LD) com a(s) variante(s) cis-regulatória(s). Como o sangue e o tecido de mama normais expressam o mesmo alelo, nós podemos concluir que o TP53 tem variantes cis-regulatórias. O objetivo deste estudo foi o de investigar se SNPs cis-regulatórios do TP53 têm algum efeito no cancro da mama. Para isso, nós propusemos mapear os SNPs cis-regulatórios que afetam a expressão do gene TP53 e prever TFBSs nesta região. Inicialmente, selecionámos o SNP (rs1042522) que previamente demonstrou expressão alélica diferencial no sangue e tecido de mama normais. As nossas análises in silico mostraram que rs1042522 está em completo LD com outro SNP (rs1642785). Isto levou-nos a investigar a região entre estes dois SNPs para modificações de histonas, zonas de hipersensibilidade à DNaseI e sítios de ligação de factores de transcrição. Descobrimos que neste intervalo há uma região muito ativa, com a possibilidade de existência de elementos reguladores. Outros quatro SNPs sobrepõem-se a este elementos e são candidatos para ser SNPs cis-regulatórios. Então analisámos os TFBSs para seis SNPs cis-regulatórios. Cada um destes SNPs tem dois alelos diferentes que são analisados individualmente para diferentes ligações de factores de transcrição (TF). Desses, três foram identificados como possíveis TFBSs que são expressos em tecido de mama, com diferenças para os dois alelos correspondentes. Para estudar se na sequência à volta destes SNPs cis-regulatórios candidatos pode realmente ligar-se algum TF, analisámos interações proteína-DNA através da técnica EMSA, usando oligonucleótidos contendo os SNPs de interesse. Realizámos várias experiências mas não detetámos nenhuma alteração, correspondendo a uma interação proteína-DNA positiva. No entanto, admitimos que o nosso extrato nuclear possa não estar funcional, dado que controlo positivo (FGFR2-13) usado para avaliar a qualidade dos extratos não mostrou uma alteração como era esperado. Existem duas possíveis explicações: (1) não existir realmente interação entre os TFs e os nossos oligonucleótidos, assim sendo estes SNPs não são cis-regulatórios, e (2) o TF pode ligar aos nossos oligonucleótidos mas os extratos estão em boas condições. Iremos realizar mais experiências para resolver esta questão. Se a segunda hipótese for confirmada, vamos confirmar se estes SNPs são ocupados in vivo pelos TFs respectivos através da técnica de imunoprecipitação da cromatina (ChIP). O objectivo central deste trabalho era estudar as variações cis-regulatórias do gene TP53 em cancro da mama. Não nos foi possível ainda confirmar se os SNPs existentes na região candidata são realmente cis-regulatórios e regulam a expressão do TP53 originando DAE. Como tal prosseguiremos os nossos estudos para clarificar a sua existência e função. Para confirmar o sue envolvimento em cancro da mama iremos também comparar os resultados finais entre tecido da mama normal e tumoral.

Universidade do Algarve, Departamento de Ciências Biomédicas e Medicina

Identificador

http://hdl.handle.net/10400.1/5970

Idioma(s)

eng

Direitos

openAccess

Palavras-Chave #Ciências biomédicas #Cancro da mama #Células #Mutações #Proteínas #Metabolismo
Tipo

masterThesis