Molecular structure and functional analysis of runx3 in zebrafish


Autoria(s): Rodrigues, Brigite Sandra Nunes Simões
Contribuinte(s)

Cancela, Leonor

Kelsh, Robert

Conceição, Natércia

Data(s)

30/09/2015

2014

2014

31/12/2017

Resumo

Tese de doutoramento, Ciências Biomédicas, Universidade do Algarve, Departamento de Ciências Biomédicas e Medicina, 2014

In mammals, runt-related family of transcription factors is encoded by the three distinct genes, RUNX1, RUNX2 and RUNX3 that share an evolutionarily conserved 128 amino acid Runt domain, which is responsible for the dual function of DNA binding and hetero-dimerization with the co-factor CBFβ. Gene ablation and gain of function experiments established all three proteins as key regulators of lineage-specific gene expression in major developmental pathways. Mutations in RUNX genes have been frequently associated with human diseases. Despite many studies to unveil mechanisms of RUNX3 action, available data is insufficient to fully understand its physiological role, particularly the importance of each isoform. We cloned for the first time a variety of transcript variants for both zebrafish runx3 and cbfβ genes, identified their temporal expression by qPCR and localized runx3 sites of expression by in situ hybridization in adult tissues and during early embryonic development. As runx3-P1 and runx3-P2 transcripts were found to be differentially expressed, we used a promoter in silico comparative approach for both P1 and P2 runx3 gene promoter regions and in vitro and in vivo promoter analysis to identify regulatory regions and conserved transcription factor binding sites, allowing us to select, from an extensive list of putative transcription binding sites, the best candidates to regulate runx3 promoter regions. Furthermore, through in vitro analysis, we have examined the possible cross- and auto-regulation of runx3 promoters by Runx2 and Runx3 isoforms, respectively. In conclusion, we have used computational and molecular approaches to improve our understanding of the complexity of Runx and Cbfβ variants and their implication for function, using zebrafish as a model. Altogether, our structural and functional data provide further support to the assumption that the expression of runx3 variants is tightly regulated, leading to a highly specific spatial-temporal expression pattern.

O termo CBF (“core binding factor”) corresponde a um complexo heterodimérico de factores de transcrição, composto por duas subunidades, designadas de subunidade α e β. A subunidade α é caracterizada por possuir uma região de 128 aminoácidos no seu N-terminal, designada de domínio Runt, que se manteve bastante conservada ao longo da evolução. O domínio Runt possui uma dupla função, sendo essencial não só para a ligação da subunidade α ao ADN, que reconhece a sequência específica PyGPyGGT (sendo Py uma pirimidina), mas também para a heterodimerização com a subunidade β. A subunidade β não possui capacidade de ligação ao ADN, mas actua como um co-factor que se liga à subunidade α, sendo essencial para aumentar a sua afinidade na ligação às regiões promotoras dos genes alvo, e também para a regulação do seu “turnover”, protegendo o complexo da degradação mediada por proteossomas via proteínas ubiquitinadas. A subunidade α do complex CBF pode ser qualquer uma das três proteínas da família RUNX. Os genes RUNX surgiram muito cedo na evolução e mantiveram um elevado grau de semelhança nos vertebrados. Os metazoários primitivos, tais como o ouriço-do-mar e C. elegans parecem conter apenas um gene da família RUNX, enquanto que, até à data, foram já descritos três genes RUNX em mamíferos, quatro em insectos, no fugu e no peixe zebra, embora neste último caso seja por possuir dois genes runx2, runx2a e runx2b, para além do runx1 e runx3. Os diversos genes runx sugerem a necessidade de uma rigorosa e elaborada regulação da actividade das proteínas RUNX ao especificar eventos complexos de desenvolvimento em organismos superiores. No entanto, a subunidade β, designada CBFβ, parece ser codificada apenas por um gene, excepto no caso dos insectos, em que até à data foram descritos dois genes. Os factores de transcrição RUNX têm sido comprovados por vários estudos como sendo determinantes na regulação de vários processos biológicos, de modo a orquestrar a correcta diferenciação celular durante o desenvolvimento embrionário, e são ainda responsáveis por uma diversidade de patologias. Todos os membros da família RUNX possuem semelhanças estruturais, no entanto têm sido implicados em actividades biológicas distintas. A existência de uma variedade de transcritos para todos os membros da família RUNX foi anteriormente descrita. Esta diversidade de transcritos deve-se em parte ao facto dos genes Runx serem transcritos através de dois promotores alternativos (P1 e P2), que se encontram separados por vários milhares de pares de bases (pb), mas sendo essa diversidade aumentada pelo grande número de “splicing” alternativo verificado nesses transcritos, assim como a presença de locais de poliadenilação alternativos. Cada gene Runx codifica para duas isoformas proteicas principais, que diferem na sua sequência N-terminal, dependendo se são codificadas a partir de transcritos derivados do promotor P1 ou do promotor P2. As proteínas que são geradas a partir de transcritos derivados do promotor P2 contêm uma sequência de cinco aminoácidos específicos no seu N-terminal – o pentapeptídeo M(R/H)IPV. Por sua vez, as proteínas que são geradas a partir de transcritos derivados do promotor P1 contêm uma sequência de 19 aminoácidos específicos no seu N-terminal, originados por “splicing” alternativo do exão 1 para um local the “splicing” conservado no exão 2, localizado 16 pb a montante do codão de iniciação (ATG) do transcrito P2. Estas duas isoformas são geralmente designadas como isoforma RUNX3-MA(S/D)NS e isoforma RUNX3-M(R/H)IPV, dependendo se são traduzidas de transcritos derivados do promotor P1 ou P2, respectivamente. Em termos de estrutura proteica, todos os membros da família RUNX possuem os mesmos domínios e motivos característicos: domínio Runt (RD), domínio de transactivação (TAD), domínio de inibição (ID), sinal de localização nuclear (NLS), motivo PY (ou PPxY) e o motivo VWRPY, que corresponde aos últimos cinco aminoácidos do C-terminal. A proteína RUNX2 apresenta ainda um domínio extra, apenas observado neste membro da família, o domínio QA, que é composto por um fragmento de resíduos Q e A. Embora as proteínas RUNX sejam tradicionalmente descritas como sendo factores de transcrição, que podem actuar como homodímeros ou heterodímeros na ligação ao promotor dos genes alvo, foram reconhecidas mais recentemente como sendo moléculas multifacetadas que se podem associar com uma extensa variedade de proteínas, dependente do contexto celular. O resultado final da regulação da transcrição de determinado gene alvo parece ser afectado pela interação entre as proteínas RUNX e co-factores específicos de cada ambiente celular, dependendo da aproximação do local de ligação entre os factores ou da sua disponibilidade no núcleo. É evidente que cada uma das três proteínas RUNX tem funções diferentes, mas o facto de por vezes serem co-expressas no mesmo tecido indica que algumas dessas funções poderão actuar sinergisticamente ou corresponder a funções complementares que actuam em diferentes etapas temporais. Enquanto o RUNX1 tem sido repetidamente comprovado como sendo um dos alvos mais frequentes de alterações genéticas associadas à leucemia, o RUNX2 é descrito como indispensável na formação normal do osso e na diferenciação de osteoblastos, sendo fundamental no desenvolvimento do esqueleto em mamíferos. O RUNX3, por sua vez, é essencial para a regulação de um tipo celular específico de neurónios proprioceptivos TrkC+ nos gânglios das raízes nervosas dorsais (“dorsal root ganglia”, DRGs) e para a maturação dos condrócitos durante a esqueletogénese. Está ainda envolvido na regulação da proliferação e da sobrevivência de vários tipos celulares, incluindo células epiteliais gástricas, desenvolvimento das células T e diferenciação de células imunes, incluindo as células “natural killer”, células dendríticas e células B. Dos três genes que pertencem à família dos factores de transcrição RUNX, o RUNX3 é o mais pequeno em termos de sequência nucleotídica e o que apresenta menor número de exões. No entando, a proteína apresenta todos os domínios característicos dos membros desta família. Estudos filogenéticos usando sequências dos vários Runxs de uma diversidade de espécies indicam que a evolução destes genes foi possivelmente originada a partir de um gene runx3 em invertebrados progredindo para a existência de múltiplos genes em espécies superiores. Embora o RUNX3 esteja predominantemente localizado no núcleo, onde exerce a sua função como factor de transcrição, a sua localização foi também observada no citoplasma em diferentes células cancerígenas, evidenciando a importância da localização celular das proteínas RUNX no exercício da sua função. O RUNX3 é expresso numa variedade de tecidos, incluindo tecidos moles e cartilagíneos. A análise da expressão em termos de cada variante mostrou que diferentes transcritos do RUNX3 são expressos de modo distinto nos vários tecidos; os mesmos autores mostraram ainda que os transcritos do RUNX3 são co-expressos em alguns tecidos, juntamente com os transcritos dos outros membros da família RUNX. Apesar de nos últimos anos ter sido publicado um grande número de artigos focando o estudo do RUNX3 em diferentes aspectos da sua função, a informação recolhida continua a não ser suficiente para descrever exactamente quais os seus mecanismos de acção e qual a sua importância para o desenvolvimento, nomeadamente no que diz respeito à função de cada uma das múltiplas isoformas existentes para todas as proteínas desta família. O peixe zebra foi escolhido como modelo de estudo para a realização deste projecto. Considera-se que os peixes teleósteos, grupo ao qual pertence o peixe zebra, tenham sido o primeiro grupo a desenvolver um esqueleto ósseo e, simultaneamente, toda a maquinaria necessária para a sua formação e manutenção. A combinação da genética e da embriologia estabeleceu o peixe zebra como sendo um organismo modelo importante para análises de desenvolvimento, fisiologia e comportamento em vertebrados. O desenvolvimento de técnicas especiais de clonagem, mutagénese e transgénese permitiu a identificação de um número importante de mutantes nesta espécie. A compreensão da inter-relação entre os genomas do peixe zebra e humano poderá ajudar na identificação da função de genes humanos a partir de mutações existentes nos genes correspondentes (ortólogos) do peixe zebra, tornando-o um bom modelo de estudo para certas doenças bem como para testes que resultem na identificação de novos agentes terapêuticos. Outras das vantagens da utilização deste modelo são, por exemplo, o seu desenvolvimento externo, a possibilidade de análise in vivo do desenvolvimento devido à transparência dos embriões, uma prole numerosa (200-300 ovos por fêmea) e um desenvolvimento rápido (em 48 a 72 horas evolui do estado de zigótico para larva e torna-se adulto aos 3 meses de vida) são atributos que favorecem a utilização deste modelo na investigação de inúmeras doenças humanas. Para melhor conhecer e caracterizar as funções do gene runx3, a primeira etapa deste trabalho foi a clonagem, em peixe zebra, dos diferentes transcritos derivados de cada um dos promotores, P1 e P2, e a utilização dessas sequências para a realização de uma análise genómica comparativa. O resultado do alinhamento múltiplo entre as proteínas RUNX3 de várias espécies revelou que o domínio Runt, constituído por 128 aminoácidos, descrito como essencial para a dupla função de ligação ao ADN nas regiões reguladoras dos genes alvo e de heterodimerização com o co-factor CBFβ, evidencia um elevado grau de conservação ao longo da evolução das espécies. Verificou-se também que os restantes domínios da proteína são igualmente conservados entre as várias espécies analisadas. Durante a clonagem dos diferentes transcritos, derivados do promotor P1 e do promotor P2 do gene runx3, foram obtidas dez novas variantes, aqui descritas pela primeira vez, estando de acordo com o previamente descrito para os outros genes desta família, para os quais diversas variantes foram também identificadas, algumas com um papel fundamental na sua regulação. O padrão de expressão do gene runx3 foi determinado pela análise da expressão temporal específica dos transcritos derivados dos promotores P1 e P2, por hibridação in situ e por PCR quantitativo (qPCR), ao longo dos estadios de desenvolvimento embrionário e larvar e em tecidos do animal adulto. Os resultados da análise de qPCR demonstram que, embora os transcritos do runx3 derivados dos promotores P1 e P2 sejam expressos numa variedade de tecidos, incluindo tecidos moles e tecidos mineralizados, e também nos diversos estadios embrionários e larvares testados, estes apresentam um padrão de expressão diferente. Enquanto os transcritos derivados do promotor P2 foram detectados em todos os tecidos estudados, no caso dos transcritos derivados do promotor P1 não se detectou expressão, ou a expressão relativa foi muito baixa em alguns tecidos não cartilagíneos. No entanto, para ambos os transcritos, os valores relativos de expressão foram mais acentuados nos tecídos cartilagíneos. É Interessante notar que os transcritos derivados do promotor P1 são expressos em estadios anteriores ao início da expressão zigótica, indicando a sua herança maternal, contrariamente aos derivados do promotor P2 que não foram detectados nestes estadios. Pela análise dos resultados da hibridação in situ usando uma sonda de ARN que reconhece uma região comum a ambos os transcritos, a expressão do runx3 foi determinada nos gânglios trigerminais, neurónios sensoriais designados “Rohon-Beards” e em tecidos cartilagíneos craniofaciais. Usando uma sonda específica para os transcriptos do promotor P2, observou-se que a expressão coincide com a expressão observada quando uma sonda que detecta a região comum do runx3 foi utilizada. No entanto, utilizando uma sonda específica para os transcritos derivados do promotor P1 não foi possível identificar qualquer sinal específico, provavelmente devido à sensibilidade do método utilizado. As regiões reguladoras P1 e P2 do runx3 permanecem até ao momento pouco estudadas, e portanto a regulação deste gene constitui ainda um tema de estudo em aberto e de importante significado. Fragmentos das regiões promotoras P1 e P2 do runx3 de peixe zebra foram identificados e clonados, sendo depois sujeitos a uma análise comparativa in silico para identificação de possíveis motivos de ligação a factores de transcrição reguladores. Ambos os fragmentos dos promotores P1 e P2 analisados foram capazes de mediar a transcrição da luciferase, usada como gene repórter, tanto in vitro em linhas celulares ósseas e não-ósseas, como in vivo em embriões de peixe zebra, verificando-se que ambos os promotores são activos nas condições testadas. Posteriormente, delecções de ambos os fragmentos foram testadas nas diferentes linhas celulares, permitindo a identificação de regiões reguladoras positivas e negativas em ambos os promotores do runx3, assim como a identificação de potenciais motivos de ligação a factores de transcrição reguladores nessas regiões, anteriormente determinados na nossa análise in silico. Sabendo que o CBFβ é um co-factor que se liga ao domínio Runt de todos os membros da família RUNX, formando um heterodímero com maior afinidade de ligação ao ADN, decidimos amplificar o transcrito que codifica para esta proteína, para posteriormente introduzir num vector de expressão, de modo a testar a sua actividade em ensaios de transfecção. No decorrer dessa tarefa, 10 novas variantes, geradas por “splicing” alternativo, foram obtidas e analisadas em termos da sequência por comparação com variantes do CBFβ descritas noutras espécies. Após a análise de todas as variantes, quatro destas isoformas (isoformas 1-4) foram escolhidas como potencialmente interessantes para a análise da sua actividade in vitro. As isoformas 1 e 3 possuem uma região C-terminal distinta enquanto as isoformas 2 e 4 correspondem a variantes das isoformas 1 e 3, respectivamente. Para testar a capacidade de ligação e indução de cada uma dessas isoformas, foi usado um fragmento do ColXα1 previamente descrito como sendo regulado pela isoforma MASN-Runx2. Os resultados obtidos mostram que as isoformas 1 e 2 do Cbfβ possuem uma maior capacidade de indução do promotor do ColXα1 pela isoforma MASN-Runx2, comparado com o efeito observado pelas isoformas 3 e 4. Foi ainda testada a hipótese do runx3 ser regulado pelo Runx2 ou por si próprio (auto-regulação). Para isso, analisou-ses o efeito das isoformas do Runx2 e do Runx3, na presença ou ausência do CBFβ, na regulação dos promotores P1 e P2 do gene runx3. Os resultados preliminares obtidos indicam a existência de um efeito na regulação dos promotores do runx3 pelas isoformas do Runx2 e do Runx3, na presença e na ausência da isoforma do Cbfβ testada, dependendo do promotor e das isoformas co-transfectadas. No entanto estes resultados precisam ainda de ser confirmados. Por fim, foi testada a capacidade de cada um dos fragmentos dos promotores P1 e P2 do runx3 reproduzir a expressão endógena em linhas trangénicas de peixe zebra. Para isso, foram construídos dois plasmídeos (Runx3-P1:GFP e Runx3-P2:GFP) contendo a sequência que codifica para a GFP (“green fluorescent protein”) sob o controlo de cada um dos fragmentos do promotor do runx3 a analisar. Estas construções foram injectadas em embriões de peixe zebra no estadio embrionário de 1 célula e a expressão da GFP analisada in vivo durante os estadios iniciais do desenvolvimento. Embora apenas se tenham analisado estes resultados transientemente, uma vez que no decorrer deste trabalho não se chegou a identificar nenhum portador do transgene, observou-se que nos peixes injectados com a contrução Runx3-P1:GFP a expressão da GFP foi muito reduzida, em contraste com a expressão observada nos embriões injectados com a contrução Runx3-P2:GFP, em que parte da expressão endógena do runx3 obtida por análise de hibridação in situ foi reproduzida. Com este trabalho pretendeu-se estudar a regulação do gene runx3 de peixe zebra e a importância das suas diferentes isoformas para a respectiva função. Foram determinados padrões de expressão das isoformas do runx3 tanto nos estadios iniciais de desenvolvimento, como em vários tecidos adultos, observando-se que as isoformas são diferencialmente expressas dependendo se derivam do promotor P1 ou promotor P2. Foi ainda realizada uma extensa análise das regiões reguladores dos promotores P1 e P2 do runx3, in silico, in vitro and in vivo, permitindo a identificação das regiões reponsáveis pela sua actividade basal, assim como a identificação de potenciais regiões reguladoras deste gene, tanto positivas como negativas, e a identificação de potenciais motivos de ligação de factores de transcrição que possam ser responsáveis pela regulação dessas regiões.

Fundação para a Ciência e Tecnologia: bolsa de doutoramento SFRH/BD/38083/2007

Universidade do Algarve, Departamento de Ciências Biomédicas e Medicina

Identificador

http://hdl.handle.net/10400.1/6851

101246668

Idioma(s)

eng

Direitos

embargoedAccess

http://creativecommons.org/licenses/by/4.0/

Palavras-Chave #Ciências biomédicas #Peixe zebra #Aminoácidos #Genes #Proteínas #Ciências Biomédicas
Tipo

doctoralThesis

Relação

info:eu-repo/grantAgreement/FCT/SFRH/BD/38083/2007