MARITZA QUEIROZ SALAS MOSELLA -...
Transcript of MARITZA QUEIROZ SALAS MOSELLA -...
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE MEDICINA DE RIBEIRÃO PRETO
PROGRAMA DE PÓS-GRADUAÇÃO EM IMUNOLOGIA BÁSICA E APLICADA
MARITZA QUEIROZ SALAS MOSELLA
Efeito do gene Autoimmune regulator (Aire) sobre a expressão de
RNAs longos não codificadores em células tímicas epiteliais
medulares
Ribeirão Preto - SP
2015
MARITZA QUEIROZ SALAS MOSELLA
Efeito do gene Autoimmune regulator (Aire) sobre a expressão de
RNAs longos não codificadores em células tímicas epiteliais
medulares
Ribeirão Preto - SP
2015
Dissertação apresentada ao Programa
de Pós-graduação em Imunologia
Básica e Aplicada da Faculdade de
Medicina de Ribeirão Preto, da
Universidade de São Paulo, para
obtenção do título de Mestre em
Ciências.
Área de Concentração: Imunologia
Básica e Aplicada
Orientador: Prof. Dr. Geraldo Aleixo
da Silva Passos Júnior
AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.
FICHA CATALOGRÁFICA
Mosella, Maritza Queiroz Salas Efeito do gene Autoimmune regulator (Aire) sobre a expressão de RNAs longos não codificadores em células tímicas epiteliais medulares. Ribeirão Preto, 2015 103p.; Il.;30cm Dissertação de Mestrado, apresentada à Faculdade de Medicina de Ribeirão Preto/USP. Área de concentração: Imunologia Básica e Aplicada. Orientador: Passos, Geraldo Aleixo.
1.Timo 2. Células tímicas epiteliais medulares (mTECs) 3. gene Autoimmune regulator (Aire) 4. RNAs longos não codificadores (lncRNAs) 5. Expressão gênica.
Trabalho realizado no Laboratório de Imunogenética Molecular, localizado no
Departamento de Genética da Faculdade de Medicina de Ribeirão Preto da
Universidade de São Paulo, com auxílio Financeiro da Capes, CNPq e FAPESP.
FOLHA DE APROVAÇÃO
MARITZA QUEIROZ SALAS MOSELLA
Efeito do gene Autoimmune regulator (Aire) sobre a expressão de
RNAs longos não codificadores em células tímicas epiteliais
medulares
Aprovada em: ___ / ___ / ___
Banca Examinadora
Dissertação apresentada ao Programa de
Pós-graduação em Imunologia Básica e
Aplicada da Faculdade de Medicina de
Ribeirão Preto, da Universidade de São
Paulo, para obtenção do título de Mestre em
Ciências.
Área de Concentração: Imunologia Básica e
Aplicada
Dedico este trabalho aos meus pais, Enrique e Maria de Fátima pela confiança,
estímulo e amor incondicionais a mim conferidos.
À minha irmã, Walkiria, exemplo de perseverança e hombridade.
AGRADECIMENTOS
Agradeço primeiramente aos meus pais, Enrique e Maria de Fátima pelo esforço,
dedicação e carinho dedicados a mim, todos estes anos, pelo incentivo ao estudo e
busca pelo conhecimento. Sem vocês nada disso seria possível.
Meus sinceros agradecimentos a todas as pessoas que colaboraram e participaram
direta ou indiretamente da realização deste trabalho, e contribuíram para a minha
formação profissional.
Agradeço imensamente ao Prof. Dr. Geraldo Aleixo da Silva Passos, pela orientação
e dedicação durante o desenvolvimento deste trabalho. Agradeço pela confiança a
mim depositada e pela paciência e incentivo constantes. Sem dúvidas foi um período
de intenso aprendizado, tanto sob o ponto de vista acadêmico/profissional, quanto
pessoal.
Ao professor Dr. Denis Puthier da Université Aix-Marseille, França, pelos
ensinamentos intensivos e colaboração direta neste trabalho quando de sua visita
em nosso laboratório.
Ao Programa de Pós-Graduação em Imunologia Básica e Aplicada, da Faculdade de
Medicina de Ribeirão Preto, especialmente ao coordenador Prof. Dr. João Santana
da Silva. Agradeço também os docentes pelo conhecimento repassado e
contribuições para minha formação. E em especial, à secretária Ana Cristine
Ferreira, sempre muito solícita, pelo apoio e paciência dispensados durante o
mestrado.
À FAPESP pelo apoio financeiro necessário para a realização deste trabalho e ao
CNPq pela bolsa concedida.
Aos colegas do Grupo de Imunogenética Molecular do Departamento de Genética
da FMRP-USP, agradeço pela convivência agradável e colaboração profissional. Em
especial às amigas Nicole Pezzi e Rafaela Felício, por tornarem a jornada mais leve.
Às minhas grandes amigas de infância Mariana Telles, Amanda, Louise, Renata,
Fabiana, Tauany e Mariana Terron, agradeço pela amizade incondicional, união e
estímulo em todos os momentos; mesmo que à distância, por sempre acreditar em
mim e me dar força para enfrentar os obstáculos.
Aos amigos que a pós-graduação me proporcionou, Gabriela, Diana e Mikhael pelo
apoio diário e pela agradável convivência.
Aos membros da banca examinadora pela disponibilidade e contribuições.
A todos aqueles que, mesmo não tendo sido mencionados, contribuíram para a
realização deste trabalho, durante esta jornada educacional.
Muito obrigada!
Maritza Queiroz Salas Mosella.
“O estudo em geral, a busca da verdade e da beleza são domínios em que nos é
consentido ficar crianças toda a vida”.
Albert Einstein
SUMARIO LISTA DE FIGURAS ................................................................................................ 13
LISTA DE TABELAS ............................................................................................... 15
LISTA DE ABREVIATURAS .................................................................................... 16
RESUMO ................................................................................................................. 19
ABSTRACT ............................................................................................................. 20
1. INTRODUÇÃO ..................................................................................................... 22
1.1 Estrutura do timo ............................................................................................. 22
1.2 Função tímica ................................................................................................. 24
1.3 Expressão gênica promíscua (PGE) em células epiteliais medulares tímicas . 25
1.4 Regulação da expressão gênica promíscua no timo ....................................... 28
1.5 A descoberta do gene Autoimmune regulator (Aire) ........................................ 29
1.6 Mecanismo de ação de Aire ............................................................................ 30
1.7 Aire e autoimunidade ...................................................................................... 33
1.8 A descoberta dos RNAs longos não codificadores .......................................... 34
1.9 Definição e classificação dos RNAs longos não codificadores ........................ 34
1.10 Características dos RNAs longos não codificadores ..................................... 36
1.11 Função dos RNAs longos não codificadores ................................................. 37
2. HIPÓTESE ........................................................................................................... 40
3. OBJETIVOS ......................................................................................................... 42
3.1 Objetivo Geral ................................................................................................. 42
3.2 Objetivos específicos ...................................................................................... 42
4. DELINEAMENTO EXPERIMENTAL .................................................................... 44
5. MATERIAL E MÉTODOS .................................................................................... 47
5.1 Linhagem celular ............................................................................................. 47
5.2 Silenciamento de Aire em mTEC 3.10 por RNA interferente (siRNA) .............. 47
5.3 Extração de RNA total ..................................................................................... 48
5.4 Quantificação e avaliação da pureza das preparações de RNA total .............. 50
5.5 Avaliação da integridade das preparações de RNA total ................................. 50
5.6 Reação de transcrição reversa dos mRNAs .................................................... 52
5.7 Reação de polimerização em cadeia quantitativa e em tempo real (qRT-PCR) ............................................................................................................................. 52
5.8 Extração protéica ............................................................................................ 53
5.9 Eletroforese em Gel de Poliacrilamida na Presença de SDS (SDS-PAGE) .... 54
5.10 Western Blot ................................................................................................. 54
5.11 Oligomicroarrays ........................................................................................... 55
5.12 Aquisição de imagens de hibridação ............................................................. 56
5.13 Quantificação dos dados de microarrays ...................................................... 56
5.14 Análise dos dados de microarrays ................................................................ 57
5.14.1 Correção do background ............................................................................... 57
5.14.2 Normalização dos dados de microarrays ....................................................... 57
5.14.3 Correlação de Pearson .................................................................................. 57
5.14.4 Análise estatística dos dados para obtenção dos transcritos diferencialmente expressos ................................................................................................................. 58
5.14.5 Agrupamento hierárquico dos transcritos diferencialmente expressos .......... 58
5.15 Identificação das sequências dos RNAs longos não codificadores ............... 59
5.16 Classificação dos RNAs longos não codificadores ........................................ 59
5.17 Identificação e posicionamento dos genes codificadores mais próximos de loci de lncRNAs ..................................................................................................... 59
5.18 Análise do potencial codificador dos RNA longos não codificadores ............. 60
5.18.1 Análise do potencial codificador dos RNAs longos não codificadores por Coding-Potential Assesment Tool (CPAT) ................................................................ 60
5.18.2 Análise do potencial codificador pelo software Coding Potential Calculator (CPC) ....................................................................................................................... 61
5.19 Avaliação da presença da cauda poli A ......................................................... 61
6. RESULTADOS .................................................................................................... 63
6.1 Silenciamento de Aire na linhagem mTEC 3.10 .............................................. 63
6.2 Western Blot da proteína AIRE ....................................................................... 63
6.3 Normalização dos dados de microarray .......................................................... 64
6.4 Correlação de Pearson ................................................................................... 65
6.5 Transcritos diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 ............................................................................................................ 66
6.6 LncRNAs diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 ............................................................................................................ 68
6.7 Caracterização dos lncRNAs modulados por Aire ........................................... 69
6.7.1 Classificação dos lncRNAs .............................................................................. 69
6.7.2 Localização cromossômica dos lncRNAs modulados por Aire......................... 70
6.7.3 Identificação e posicionamento dos genes codificadores mais próximos ......... 71
6.7.4 Avaliação do potencial codificador dos lncRNAs ............................................. 73
6.7.5 Contagem de lncRNAs poliadenilados (lncRNAs poli A+) ................................ 76
7. DISCUSSÃO ........................................................................................................ 78
8. CONCLUSÕES .................................................................................................... 88
9. REFERÊNCIAS BIBLIOGRÁFICAS .................................................................... 90
LISTA DE FIGURAS
Figura 1 Composição celular do timo ...................................................................... 23
Figura 2 Diversos tecidos são representados em células tímicas epiteliais medulares (mTECs) através da expressão gênica promíscua...................................................27
Figura 3 Representação esquemática da proteína AIRE humana............................31
Figura 4 Mecanismo proposto para a ativação gênica mediada por AIRE...............32
Figura 5 Classificação dos RNAs longos não codificadores.....................................35
Figura 6 Sequência do RNA interferente para o transcrito do gene Aire.....................48
Figura 7 Eletroforese microfluídica das preparações de RNA total..........................51
Figura 8 Densitometria da eletrofese microfluídica das preparações de RNA total........................................................................................................................... .51
Figura 9 Histograma mostrando a expressão transcricional relativa do gene Aire determinada por qRT-PCR em células mTEC 3.10 controles (Ctrl) ou transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA)..................................................63
Figura 10 Westen blot da proteína AIRE em células mTECs 3.10 controles (Ctrl) e transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA)........................................................................................................................64
Figura 11 Gráfico boxplot das amostras controle (em verde) e tratadas com siRNA-anti Aire (em rosa) após a normalização pelo método quantile .................................. 65
Figura 12 Agrupamento hierárquico da expressão transcricional global de mRNAs e de lncRNAs resultante da aplicação do coeficiente de correlação de Pearson......................................................................................................................66
Figura 13 Heat map dos transcritos modulados (mRNA e lincRNAs) entre as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE).................................................................................................... ..................67
Figura 14 Heat map dos lncRNAs modulados por Aire entre as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE)......................................................................................................................68
Figura 15 Distribuição dos lncRNAs modulados por Aire segundo o tipo.................69
Figura 16 Distribuição dos lncRNAs de acordo à sua distância em relação ao gene codificador de proteína mais próximo no genoma.......................................................72
Figura 17 Diagrama de Venn resultante da análise do potencial codificador de lncRNAs modulados por Aire pelos softwares Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT).................................................................74
Figura 18 Porcentagem de lncRNAs poli A+ e lncRNAs poli A-.................................76
LISTA DE TABELAS
Tabela 1: Localização cromossômica dos lncRNAs modulados por Aire em células mTEC 3.10 e sua respectiva modulação, em log de fold change....................................................................................................................... 70
Tabela 2 Distância entre os genes codificadores de proteínas mais próximos e os lncRNAs modulados por Aire.....................................................................................72
Tabela 3 Potencial codificador dos lncRNAs modulados por Aire, segundo análise por Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT), e seus respectivos escores...........................................................................................75
LISTA DE ABREVIATURAS
AChR: receptor de acetilcolina
AIRE: Autoimmune regulator
APC: célula apresentadora de antígeno
APECED: síndrome de distrofia ectodérmica com poliendocrinopatia e candidíase
autoimune
APS1: síndrome autoimune poliglandular do tipo 1
ATTGGTTA: sítio G-box
CARD: domínio recrutar de caspase
Cauda poli A: poli adenilação da porção 3’
CBP: proteína ligadora de CREB
CCL19: Chemokine (C-C motif) ligand 19
CCL25: Chemokine (C-C motif) ligand 25
CCL21: Chemokine (C-C motif) ligand 21
cDNA: DNA complementar
CPAT: ferramenta de acesso ao potencial codificador
CPC: calculador de potencial codificador
CpG: sítios CG
CREB: AMPcíclico reponsivo a elementos ligadores de proteína.
cRNA: RNA complementar
CRP: proteína C reativa
cTEC: célula tímica epitelial cortical
Cy3: cianina 3 verde
DM1: Diabetes Mellitus tipo 1
DNA: ácido desoxirribonucléico
DNA-PK: proteína quinase DNA-dependente
EAE: encefalomielite autoimune experimental
FDR: razão de falsa descoberta
GAD1: glutamato descarboxilase 1
GAD67: glutamato descarboxilase 67
H3K4me3: trimetilação da lisina 4 da histona H3
Ins: insulina
Ins1: insulina I
Ins2: insulina II
kb: kilobase
KO: knockout
lncRNA: RNA longo não codificador
MBP: proteína básica da mielina
MeV: Visualizador experimental múltiplo
MHC: complexo maior de histocompatibilidade
miRNA: microRNA
MOG: glicoproteína associada a oligodendrócitos e mielina
mRNA: RNA mensageiro
mTEC 3.10: linhagem de células tímicas epiteliais medulares imortalizada
mTEC: célula tímica epitelial medular
MYC: oncoproteína mielocitomatose-homóloga
Nanog: nanog homeobox
NF-kB: fator nuclear kappa B
N-TEF: fator alongador negativo da transcrição
Oct4: fator de transcrição 4 ligador de octâmero
ORF: matriz aberta de leitura
p53: supressor tumoral
PCR: reação em cadeia de polimerase
PGE: expressão gênica promíscua
PHD1: domínio tipo dedo de zinco primeiro
PHD2: domínio tipo dedo de zinco segundo
PLP: lipoproteína da mielina
PTA: antígenos de tecidos periféricos
P-TEFb: fator b alongador positivo da transcrição
qRT-PCR: reação de polimerização em cadeia quantitativa e em tempo real
RIN: número de integridade do RNA
RNA pol II: RNA polimerase II
RNA pol III: RNA polimerase III
RNA: ácido ribonucleico
rRNA: RNA ribossômico
SAND: domínio denominado SP100, AIRE1, nucP41/P75 and DEAF1
SFB: soro fetal bovino
siRNA: pequeno RNA interferente
Sox2: box 2 da região Y determinante do sexo
STAT3: sinal transdutor e ativador da transcrição 3
SVM: máquina de suporte de vetores
TCR: receptor de célula T
TEC: célula tímica epitelial
TRA: antígeno tecido-específico
Treg: célula T reguladora
tRNA: RNA transportador
TTATTA: sítio TATA-box
UCSC: Universidade da Califórnia, Santa Cruz
V(D)J: v=variável, d=diversidade, j=junção.
RESUMO
O timo é um órgão linfoide primário envolvido na discriminação entre o próprio e não-próprio durante o processo de tolerância central. Neste órgão, células tímicas epiteliais medulares (mTECs) facilitam a eliminação de células T auto-reativas por expressarem e apresentarem um repertório diverso de antígenos dos tecidos periféricos (PTAs), um processo que depende, em grande parte, da expressão do gene regulador autoimune, do inglês, Autoimmune regulator (Aire). O gene Aire é um regulador transcricional que pode atuar de maneira dual, ou seja, ora ativando a transcrição, ora reprimindo-a. A proteína AIRE, modula a expressão ectópica de muitos PTAs e a transcrição de muitos miRNAs em células mTECs por influir no desencadeamento da liberação da RNA Pol II ancorada nas regiões promotoras ao longo da cromatina. No entanto, a associação entre o gene/proteína Aire e a expressão de RNAs longos não codificadores (lncRNAs) ainda permanece desconhecida. Por isto, investigamos se Aire exerce função moduladora sobre a expressão desta espécie de RNA em células mTECs. Através do silenciamento de Aire nestas células por meio de RNA interferente e posterior análise do transcriptoma murino por microarrays, nossos resultados demonstram que Aire exerce, de fato, uma função moduladora sobre a expressão de lncRNAs reprimindo a maioria deles. Além disso, a maioria consiste de lncRNAs intergênicos, sem cauda poli A sendo que no genoma estão situados até 10 kb do gene codificador mais próximo. Esta é a primeira evidência de que células mTECs expressam lncRNAs e que o gene Aire pode controlar a expressão dos mesmos.
Palavras-chave: Timo, células tímicas epiteliais medulares (mTECs), gene
Autoimmune regulator (Aire), RNAs longos não codificadores (lncRNAs), expressão
gênica.
ABSTRACT
The thymus is a primary lymphoid organ involved in the discrimination between self
and non-self for the central tolerance process. In this organ, medullary thymic
epithelial cells (mTECs) facilitate the elimination of self-reactive T cells by expressing
and presenting a diverse repertoire of antigens from peripheral tissues (PTA), a
process that depends largely on the expression of the autoimmune regulator gene
(Aire). Aire gene is a transcriptional regulator that can operate in dual manner,
namely, either activating or repressing transcription. The AIRE protein modulates the
ectopic expression of many PTAs and the transcription of many miRNAs in mTEC
cells triggering the release of RNA Pol II anchored in the promoter regions along the
chromatin. However, the association between the Aire gene/protein and long non-
coding RNAs (lncRNAs) remains unknown. Therefore, we investigated whether Aire
exert modulatory effect on the expression lncRNAs in mTECs cells. Our results of
Aire knockdown in these cells by RNA interference and subsequent analysis of the
murine transcriptome with microarrays demonstrate that Aire exert, in fact, a
modulating effect on lncRNAs expression, suppressing most of them. Moreover, the
majority of these consists of intergenic non-polyadenylated (poly A-) lncRNAs, which
are located in the genome no more than 10kb from the closest encoding gene. This
is the first evidence that mTEC cells express lncRNAs and that Aire can control their
expression.
Keywords: Thymus, medullary thymic epithelial cells (mTECs), Autoimmune regulator
(Aire) gene, long non-coding RNAs (lncRNAs), gene expression.
21
Introdução
22
1. INTRODUÇÃO
1.1 Estrutura do timo
O timo é um órgão linfóide primário envolvido no desenvolvimento de
linfócitos T e desempenha papel crucial no estabelecimento da tolerância
imunológica (GALLEGOS; BEVAN, 2006; HU; LANCASTER; EHRLICH, 2015).
Durante o desenvolvimento embrionário, o timo se origina da endoderme
da terceira bolsa faríngea e migra inferiormente até alcançar o mediastino
anterior, acima do coração (FARLEY et al., 2013; GORDON; MANLEY, 2011). É
o primeiro órgão linfóide a ser formado, atinge seu auge durante a maturidade
sexual e gradualmente involui ao longo da vida (GRAY et al., 2006; LINTON;
DORSHKIND, 2004; MONTECINO-RODRIQUEZ; MIN; DORSHKIND, 2005).
Este órgão é formado por dois lobos (o direito e o esquerdo) unidos por
um istmo. É circundado de uma cápsula de tecido conectivo que origina
trabéculas fibrosas, as quais contém os vasos sanguíneos e subdividem o órgão
em lóbulos interconectados. Cada lóbulo é formado por um córtex, mais externo,
que abriga da grande maioria de linfócitos T em processo de maturação
(chamados de timócitos); uma junção córtico-medular vascularizada,
intermediária, e uma medula, interna, que abriga menor quantidade células T, já
mais avançados em sua maturação (BOYD et al., 1993; GORDON; MANLEY,
2011; PEARSE, 2006).
O córtex e a medula são formados por um epitélio altamente
especializado contendo dois grupos de células epiteliais tímicas (TECs): as
células tímicas epiteliais corticais (cTECs) e as células tímicas epiteliais
medulares (mTECs) (ANDERSON; TAKAHAMA, 2012; GUERDER et al., 2012;
KLEIN et al., 2014).
Os progenitores de linfócitos T chegam ao timo, vindos da medula óssea,
pelas veias na junção córtico-medular e ao fim de sua maturação são enviados à
circulação pelas vênulas pós-capilares. Eferentes linfáticos também drenam o
timo para o linfonodo adjacente; sendo que inexistem os linfáticos afarentes
(PEARSE, 2006; ZHANG; BHANDOOLA, 2014). Além de timócitos, que
23
constituem 95% da celularidade tímica, o timo também apresenta células
dendríticas, macrófagos e linfócitos B (Figura 1) (KLEIN et al., 2014).
Dentre as células dendríticas, 2/3 são as chamadas residentes, cuja
diferenciação é intratímica e se localizam preferencialmente na medula do órgão.
O restante são células dendríticas migratórias, oriundas da periferia e podem ser
encontradas tanto na junção córtico-medular (regiões perivasculares) quanto no
interior da medula. Além desses dois tipos de células dentríticas habitam
também o timo as células dendríticas plasmocitóides, que como as migratórias,
também provem da periferia, carregam autoantígenos periféricos além de
conferir proteção tímica contra infecções virais, uma vez que são grandes
produtoras de interferon tipo I (KLEIN et al., 2014; LI et al., 2009; WU;
SHORTMAN, 2005).
Células B também são encontradas no timo, mas não existe consenso
quanto à origem das mesmas, ou seja, se são fruto da linfopoiese tímica ou da
migração periférica. Evidências recentes indicam que essas células B tem
função na indução da tolerância (CARNINCI et al., 2005; LEAVY, 2015;
PERERA et al., 2013; WALTERS et al., 2014; YAMANO; STEINERT; KLEIN,
2015; YAMANO et al., 2015).
Através do ambiente tímico que é altamente dinâmico os timócitos migram
e entram em contato com os diversos tipos celulares para ter seu processo de
maturação completado (KLEIN et al., 2014; TAKAHAMA, 2006).
Figura 1 Composição celular do timo. A interação célula-célula ao longo da migração dos
timócitos é destacada pelas setas. As células apresentadoras de antígenos aparecem em cor. Extraído e adaptado de (KYEWSKI; KLEIN, 2006).
24
1.2 Função tímica
O papel biológico do timo é garantir a geração de uma população
diversificada de linfócitos T periféricos hábeis a responder a antígenos não
próprios, mas, contudo, tolerante a antígenos próprios. Neste contexto, é
denominada de “tolerância central” todos os mecanismos intratímicos pelos
quais o reconhecimento de antígenos próprios por células T contribuem para a
tolerância ao próprio, o que inclui a morte das células autorreativas por
apoptose, além da indução de células T reguladoras (Tregs), mesmo que seu
sítio de ação seja a periferia (GALLEGOS; BEVAN, 2006; KLEIN et al., 2014;
MOUCHESS; ANDERSON, 2014; STARR; JAMESON; HOGQUIST, 2003)
Os progenitores linfoides de células T entram no timo no dia embrionário
11.5 em camundongos Mus musculus e na sétima semana de gestação na
espécie humana (FARLEY et al., 2013; HAYNES; HEINLY, 1995; PEARSE,
2006) e passam por grande expansão inicial, mediada por IL-7, produzida pelas
células epiteliais tímicas (BOUDIL et al., 2015; HARA et al., 2012; SEDDON,
2015). Neste estágio, as células T imaturas são duplo negativas (CD4-, CD8-) e
começam a rearranjar os loci das cadeias formadoras do receptor de antígenos
de células T (T cell receptor ou simplesmente TCR), por meio do processo
denominado de recombinação V(D)J (MORRIS; ALLEN, 2012). Após a correta
formação do TCR, os timócitos passam ao estágio de duplos positivos (CD4+,
CD8+) e são atraídos, por meio das quimiocinas CCL21 e CCL25, para contato
com as cTECs (MISSLITZ et al., 2004; PETRIE; ZÚÑIGA-PFLÜCKER, 2007;
ZLOTOFF et al., 2010). É através desse contato com cTECs que expressam
autoantígenos que os timócitos são selecionados favorecendo aqueles clones
que expressam TCRs úteis, ou seja, capazes de reconhecer o complexo
peptídeo-MHC (Major Histocompatibility Complex) próprio com baixa afinidade,
recebendo sinais de sobrevivência. Esse fenômeno é conhecido como “seleção
positiva” (MOUCHESS; ANDERSON, 2014; TAKADA et al., 2014).
Aqueles timócitos selecionados positivamente no córtex passam a ser
simples positivos (TCD4+CD8- ou TCD8+CD4-), se comprometendo com a
linhagem de células T auxiliares ou as T citotóxicas, respectivamente. São
atraídos à medula do timo pelas quimiocinas CCL25, CCL19 e CCL21
(MISSLITZ et al., 2004; PETRIE; ZÚÑIGA-PFLÜCKER, 2007; ZLOTOFF et al.,
25
2010), onde interagem com as mTECs que, juntamente com as demais células
apresentadoras de antígenos (APCs), lhes apresentam uma vasta gama de
autoantígenos. Aqueles que se ligarem ao complexo peptídeo-MHC com alta
afinidade serão deletados por apoptose ou convertidos em células Tregs,
processo esse denominado “seleção negativa” (ANDERSON et al., 2014;
MOUCHESS; ANDERSON, 2014).
Somente 5% dos timócitos resultam em linfócitos T maduros que, ao final
de sua jornada pelo timo, reconhecem o MHC próprio mas são tolerantes aos
autoantígenos (PALMER, 2003). O impedimento da deleção clonal ou da
indução de Tregs pode levar à quebra da tolerância central e o desenvolvimento
de doenças autoimunes (AKIYAMA et al., 2013).
Na seleção negativa participam os diversos tipos de células dendríticas
presentes no timo. As células dentríticas migratórias transportam antígenos
próprios adquiridos na periferia e provenientes do sangue e os apresentam para
os timócitos (JOFFRE et al., 2012; OH; SHIN, 2015). Estudos indicam que as
células B também são capazes de apresentar antígenos, contribuindo com o
processo de tolerância central (PERERA et al., 2013; YAMANO; STEINERT;
KLEIN, 2015; YAMANO et al., 2015).
Na seleção negativa, porém, um fator de grande relevância é a
colaboração entre as células epiteliais medulares tímicas e as células dentríticas.
Estudos demonstram que as células mTECs produzem linfopoietina, quimiocina
responsável por atrair e manter as células dendríticas residente próximas a elas.
Tal proximidade seria coerente com o fato de que as células mTECs
compartilham diversos autoantígenos periféricos expressos por elas com as
células dentríticas, promovendo uma apresentação indireta, que amplia o
alcance e eficácia da apresentação deles aos timócitos, para promoção da
seleção negativa (GALLEGOS; BEVAN, 2004; HUBERT et al., 2011; KLEIN et
al., 2011; KOBLE; KYEWSKI, 2009; OH; SHIN, 2015)
1.3 Expressão gênica promíscua (PGE) em células epiteliais medulares
tímicas
A primeira evidência de que autoantígenos periféricos podiam ser
expressos de maneira ectópica no timo foi a descoberta da expressão do
26
receptor de acetilcolina (AChR) e de componentes da mielina em timo humano
(KIRCHNER et al., 1988; LEVINSON et al., 2003; SMITH et al., 1997).
Posteriormente encontraram insulina (Ins), além da proteína C-reativa (CRP) do
fígado sendo expressos no timo humano e de camundongos (DERBINSKI et al.,
2001; JOLICOEUR; HANAHAN; SMITH, 1994; KLEIN et al., 1998; SOSPEDRA
et al., 1998).
Além de antígenos de tecidos periféricos (PTAs do inglês peripheral tissue
antigens) ou antígenos tecido-específicos (TRA do inglês tissue restricted
antigens) antígenos tumorais também foram encontrados no timo normal
(CLOOSEN et al., 2007). Essa expressão foi atribuída às células mTEC e foi
denominada expressão gênica promíscua (PGE) (DERBINSKI et al., 2001, 2005;
MAGALHÃES et al., ) A PGE é definida, operacionalmente, como a expressão
no timo de genes ectópicos, ou seja, que não fazem parte do programa de
expressão gênica fisiológica destas células. O conceito de antígenos TRAs por
sua vez, engloba antígenos que são expressos em menos de cinco tecidos
diferentes (DERBINSKI et al., 2005)
As células mTEC expressam enorme diversidade de genes (chegando a
mais de 19.000 genes) e isto faz com que elas façam a representação
imunológica de virtualmente todos os antígenos de todos os tecidos do corpo
(Figura 2)(SANSOM et al., 2014). Esta característica é diretamente relacionada
com o seu processo de maturação, isto é, com a maior expressão de MHC
classe II e a molécula co-estimulatória CD80 em sua membrana além da
expressão do gene regulador autoimune, do inglês Autoimmune regulator (Aire)
(MHCII+, CD80hi , Aire+), estágio em que se tornam competentes na
apresentação de antígenos (DERBINSKI et al., 2005).
Desbinski e colaboradores (2005), descreveram uma maior gama de
antígenos tecido-específicos expressos nas células mTECs, em modelos
murinos autoimune e não autoimune. Os antígenos tecido-específicos se
apresentaram fracamente expressos quanto a sua transcrição (RNAs
mensageiros ou mRNAs), porém capazes de ser detectados por meio das
respectivas proteínas.
Entretanto, somente cerca de 1-5% das células mTEC se mostraram com
esta capacidade transcricional as quais estiveram presentes durante a ontogenia
27
tímica, se mantendo no período pós-natal e coincidindo com o processo de
maturação dos linfócitos T (DERBINSKI et al., 2001).
Figura 2 Diversos tecidos são representados em células tímicas epiteliais medulares (mTECs) através da expressão gênica promíscua. Extraído e adaptado de(KYEWSKI; DERBINSKI, 2004).
Muitos desses antígenos estão associados com doenças autoimunes
como o diabetes mellitus do tipo 1 (DM1) (Ins1, Ins2, Gad1) esclerose múltipla
(MBP, MOG, PLP) e miastenia gravis (AchR). Logo os pesquisadores
correlacionaram a PGE com a tolerância central mediada pelo timo e
especificamente com a seleção negativa, na qual a medula tímica tem papel
fundamental (SMITH et al., 1997; SOSPEDRA et al., 1998).
Os timócitos permanecem na medula tímica cerca de quatro a cinco dias,
tempo necessário e suficiente para serem expostos às células do estroma e
serem apresentados aos autoantígenos (KLEIN, 2009), sendo que essa
apresentação é otimizada com o auxílio das células dendríticas (HUBERT et al.,
2011; KLEIN et al., 2011; KYEWSKI; FEUERER, 2014; MA; BAJIC; ZHANG,
2013; OH; SHIN, 2015).
28
1.4 Regulação da expressão gênica promíscua no timo
A PGE parece ser controlada em múltiplos níveis. Ela tem início nas
mTECs imaturas e progride juntamente com sua maturação. Nas mTECs
maduras que expressam Aire (mTECs Aire+), uma vasta gama de autoantígenos
periféricos controlados por Aire passam a ser expressos e são denominados
Aire-dependentes como por exemplo insulina 2 (Ins2) e caseína α. Estes
autoantígenos são expressos concomitantemente com outros antígenos Aire-
independentes (como CRP e GAD67), o que indica a presença de outros
controladores da PGE, ainda desconhecidos (ANDERSON et al., 2002). Até o
momento o gene Aire é considerado o principal controlador transcricional da
PGE apesar de atuar em conjunto com outras moléculas (proteínas) acessórias
chamadas de parceiras de Aire (ABRAMSON et al., 2010; KYEWSKI;
PETERSON, 2010; LAAN; PETERSON, 2013b; MEREDITH et al., 2015;
PETERSON; ORG; REBANE, 2008; ST-PIERRE et al., 2015).
Variações alélicas também refletem em variações na expressão
intratímica de certos PTAS e são correlacionadas com a suscetibilidade a
doenças autoimunes. Este é o caso da DM1 na qual uma variação alélica no
gene da insulina promove sua maior expressão no timo, resultando em um efeito
protetor (PUGLIESE et al., 1997; VAFIADIS et al., 1997). O background genético
em modelos murinos de esclerose múltipla, a encefalomielite autoimune
experimental (EAE), também obedece ao mesmo princípio, uma vez que a maior
expressão da proteína básica da mielina (MBP), no timo, está associada com a
resistência à doença (LIU et al., 2001).
.Um estudo focado no lócus da caseína, cujos genes são expressos
durante a PGE demonstrou ainda o controle epigenético sobre a expressão
promíscua. A demetilação do promotor do gene da caseína β no estágio imaturo
da mTEC foi seguida da acetilação da histona H4 e trimetilação da lisina 4 da
histona H3 (H3K4me3), um marcador de ativação transcricional, resultando em
descontração do lócus e consequente expressão de outros membros da família
gênica da caseína. Os mesmos marcadores epigenéticos permissivos foram
encontrados no promotor de um outro antígeno-tecido específico tipicamente
expresso durante a PGE, como é o GAD67 (TYKOCINSKI et al., 2010).
29
O controle pós transcricional da PGE também tem sido evidenciado.
Quando animais deficientes de Dicer – uma enzima essencial na maturação dos
microRNAs (miRNAs) – foram analisados quanto a expressão de autoantígenos,
observou-se que sua expressão era diminuída na ausência dos miRNAs
maduros. A ausência do miR-29a, em especial, afetou a expressão dos
antígenos tecido-específicos Aire-dependentes (UCAR; RATTAY, 2015; UCAR
et al., 2013)
Até o momento não se sabe se a PGE também pode ser modulada por
outros tipos de RNAs não codificadores, como os RNAs longos não
codificadores (lncRNAs).
1.5 A descoberta do gene Autoimmune regulator (Aire)
Um gene essencial na indução da tolerância central é o autoimmune
regulator (Aire), expresso nas células mTECs altamente diferenciadas (MHC IIhi,
CD80hi) (LAAN; PETERSON, 2013a). O gene Aire humano se localiza no
cromossomo 21q22.3 (AALTONEN et al., 1997; NAGAMINE et al., 1997) e
apresenta 71% de identidade de sequência com o seu correspondente murino
(Mus musculus) localizado no cromossomo 10 citobanda 39.72.(SOURCE Data
Base http://source-search.princeton.edu/).
Este gene foi caracterizado pela primeira vez em 1997, quando
observaram que determinadas mutações estavam associadas a uma doença
autoimune sistêmica denominada autoimmune polyendocrinpathy-candidiasis-
ectodermal-dystrophy (APECED)(AALTONEN et al., 1997; NAGAMINE et al.,
1997).
Dentre diversos tecidos endócrinos humanos analisados, o gene que foi
chamado de Aire, apareceu expresso principalmente no timo, pâncreas e córtex
da adrenal e por predição postulou-se que codificava uma proteína de 545
aminoácidos, cujo peso molecular era 57.7 kDa. Por sequenciamento,
determinou-se que o novo gene apresentava duas regiões ricas em cisteína que
formavam motivos PHD tipo dedos de zinco, e que, pelo alto conteúdo de prolina
deveria ter uma estrutural espiral, com pequena probabilidade de formar
estruturas alfa hélice ou folha B pregueada. Sem porção transmembrana,
30
apresentava um sinal de localização nuclear. A mutação neste gene
provavelmente levaria a formação de uma proteína truncada, com perda de pelo
menos um dos motivos tipo dedos de zinco. Tais motivos dedos de zinco seriam
importantes para interação com outras macromoléculas, como ácidos nucléicos
e proteínas e estavam presentes em proteínas nucleares que regulavam ou
mediavam a transcrição. Os indícios apontavam para a descoberta de um novo e
importante fator de transcrição (AALTONEN et al., 1997; NAGAMINE et al.,
1997).
Dois anos depois, Heino e colaboradores (HEINO et al., 1999)
investigaram a expressão de Aire por hibridação in situ de mRNA,
imunohistoquímica e imunofluorescência em diversos tecidos humanos. O que
chamou a atenção foi a sua expressão acentuada em células epiteliais da
medula tímica e também em células dendríticas (tanto no timo quanto nos
linfonodos); isto é, em duas populações de células APCs. Tal fato trouxe à luz a
possibilidade do gene Aire atuar na seleção negativa uma vez que ambas as
APCs participam desses eventos. Se isto fosse confirmado, esse gene teria um
papel primordial no estabelecimento da tolerância central e quando mutado,
como no caso da APECED, provocaria a quebra da tolerância órgão específica.
Além disso, já era sabido que vários autoantígenos relacionados com o DM1
eram expressos no timo e poderiam participar da indução da tolerância central,
corroborando novamente com a ideia de que a proteína Aire poderia estar
regulando a expressão e/ou apresentação de autoantígenos específicos
(FORNARI et al., 2010; SMITH et al., 1997; SOSPEDRA et al., 1998)
1.6 Mecanismo de ação de Aire
O gene Aire codifica uma proteína que compreende uma combinação de
domínios típicos de reguladores transcricionais e de proteínas ligadoras da
cromatina. Além disso, apresenta um sinal de importação e um de exportação
nuclear. Sua porção N-terminal apresenta um domínio de recrutamento de
caspase, do inglês, caspase recruitment domain (CARD), ao qual sua
oligomerização tem sido atribuída. Um domínio SAND (SP100, AIRE1,
31
nucP41/P75 and DEAF1), envolvido com sua ligação ao DNA e domínios tipo
dedos de zinco (PHD1 e PHD2). PHD 1 é responsável por sua ligação à histona
H3 e à subunidade catalítica das proteínas quinases DNA-dependentes (DNA-
PKs) e o domínio PHD2 característico de proteínas ligadoras de cromatina
(Figura 3 )(CHAKRAVARTY; ZENG; ZHOU, 2009; KOH et al., 2010).
Figura 3 Representação esquemática da proteína AIRE humana. Os domínios e elementos
funcionais da proteína reguladora autoimune (AIRE) são mostradas em diferentes cores. CARD= domínio recrutador de caspase; NLS= sinal de localização nuclear; SAND=(SP100, AIRE1, nucP41/P75 and DEAF1); PHD= domínios tipo dedos de zinco. Extraído de (PETERSON; ORG; REBANE, 2008).
Observou-se que a proteína AIRE se liga ao DNA em regiões TATA-box
(TTATTA) e repetições de ATTGGTTA (G-box) (KUMAR et al., 2001), mas mais
do que um fator de transcrição clássico, AIRE atualmente é tida como uma
proteína moduladora da transcrição (KEANE; CEREDIG; SEOIGHE, 2015;
KYEWSKI; PETERSON, 2010; MEREDITH et al., 2015; PETERSON; ORG;
REBANE, 2008; SATO et al., 2004; ST-PIERRE et al., 2015).
Ela é capaz de promover, através da interação com outras proteínas
consideradas “parceiros transcricionais”, um maior acesso da maquinaria de
transcrição em determinados loci gênicos, culminando em sua ativação
transcricional, exemplo; os PTAs nas mTECs. Para tanto, AIRE se liga, através
de seus domínios PHD a promotores hipometilados ou não metilados na lisina 4
da histona 3 (H3K4) e é fosforilado por DNA-PKs em dois resíduos N-terminais
(treonina -68 e serina – 156), tornando-se ativado. Ativo, recruta a proteína
ligadora de CREB (CBP) um importante co-ativador transcricional. CBP atua na
iniciação da transcrição, promovendo a acetilação das histonas e recrutando
remodeladores da cromatina (PETERSON; ORG; REBANE, 2008; PITKÄNEN et
al., 2000). A seguir, é recrutado o fator alongador positivo da transcrição (P-
TEFb, do inglês, positive transcription elongation factor b), que remove o fator
alongador negativo da transcrição (N-TEF, negative elongation factor), fosforila a
RNA polimerase II (RNA Pol II), permitindo assim a progressão da transcrição
32
para a fase de alongamento (OVEN et al., 2007; PETERSON; ORG; REBANE,
2008). Sua função consiste, em suma, em promover a liberação de moléculas de
RNA pol II travadas nas regiões promotoras de genes ao longo da cromatina,
contribuindo assim com a promoção da transcrição (Figura 4) (GIRAUD et al.,
2012).
E foi considerando a interação de AIRE com RNA Pol II que nosso grupo
de pesquisa em um trabalho recente demonstrou, pela primeira vez, que este
gene também pode controlar a transcrição de miRNAs em células mTECs
(MACEDO et al., 2013).
AIRE, no entanto, pode apresentar um papel duplo na regulação da
expressão gênica, funcionando como um ativador transcricional e também como
um repressor de vários genes, por meio do fenômeno de transrepressão
(ILMARINEN et al., 2008; JOHNNIDIS et al., 2005; SATO et al., 2004; TAO et al.,
2006).
Figura 4 Mecanismo proposto para a ativação gênica mediada por AIRE. O autoimune regulator (AIRE) é preferencialmente recrutado para promotores com baixos níveis de trimetilação da lisina 4 da histona H3. Em adição a ligação às histonas, uma interação direta com o DNA é necessária para guiar AIRE a regiões específicas. Nas regiões regulatórias alvo, AIRE recruta o fator alongador positivo da transcrição (P_TEFb), responsável por fosforilar a RNA pol II, o que a converte de uma forma pausada para uma forma de alongamento. AIRE também interage com a proteína ligadora de CREB (CBP), a qual acetila histonas, permitindo maior acesso da maquinaria de transcrição ao DNA. A interação de AIRE com proteínas quinases DNA-dependentes (DNA-PKs) e com a proteína inibidora de STAT1 (PIAS1) também aumentam a ativação transcricional. DNA-PKs fosforilam AIRE e, através de interação com a matrix nuclear colaboram com AIRE para a formação de loops na cromatina. Extraído e modificado de (PETERSON; ORG; REBANE, 2008)
33
1.7 Aire e autoimunidade
Humanos deficientes em Aire, isto é, aqueles indivíduos portadores de
mutações que ocasionam perda de função deste gene, desenvolvem APECED
também conhecida como Síndrome Autoimune Poliglandular Tipo 1 (APS 1) uma
doença autoimune hereditária autossômica recessiva. Essa doença é debilitante
e é caracterizada por insuficiência da glândula adrenal, hipoparatireoidismo e
candidíase mucocutânea (NAGAMINE et al., 1997; PERHEENTUPA, 2002);
sendo que a ocorrência de duas das três manifestações já é suficiente para
diagnóstico clínico da doença (BUZI et al., 2003).
Além dessas características clínicas, os pacientes de APECED
apresentam anticorpos séricos anti-citocinas, principalmente anti-interferon (IFN)
e anti-IL-17 (KISAND et al., 2010; MEAGER et al., 2006) e anticorpos anti-
enzimas estereidogênicas (UIBO et al., 1994). Pacientes com APECED também
apresentaram menor quantidade de células Tregs (RYAN et al., 2005).
Existem mais 60 mutações associadas à APS1 já identificadas, que
variam entre mutações sem sentido, onde a troca de bases origina um stop
codon, mutações de sentido trocado, deleções que mudam a matriz de leitura;
substituições e mutações de ponto não sinônimas (AKIRAV; RUDDLE;
HEROLD, 2011). Tais mutações originam proteínas truncadas com domínios
comprometidos (ISHII et al., 2000).
Assim como pacientes com APS1, camundongos Aire knockout (Aire KO)
também desenvolvem quadro de doença autoimune e nestes animais observou-
se diminuição da expressão de PTAs no timo (ANDERSON et al., 2002;
DERBINSKI et al., 2005). Isso pode influir na seleção negativa permitindo que
células T auto reativas escapem para a periferia (RAMSEY et al., 2002).
Resultados recentes de nosso laboratório demonstram que não apenas as
mutações de Aire, mas também alterações na sua expressão transcricional
podem ocasionar alterações na expressão downstream de genes que codificam
PTAs (OLIVEIRA et al., 2013).
34
Até o momento, não houve relato na literatura associando Aire com a
expressão de outros tipos de RNAs diferentes de mRNAs e de miRNAs, como
por exemplo os lncRNAs.
1.8 A descoberta dos RNAs longos não codificadores
Análises aprofundadas do transcriptoma de mamíferos demonstraram que
90% de toda a transcrição realizada pela RNA Pol II não corresponde a “genes-
padrão”. A hipótese levantada para explicar tal fato era que a RNA Pol II iniciaria
uma transcrição inespecífica a partir de sítios “incorretos”, gerando um ruído
transcricional sem relevância biológica (STRUHL, 2007).
Rastreamentos genômicos demonstraram que a RNA Pol II se associa
com a maior parte do genoma, incluindo regiões que eram consideradas
transcricionalmente inertes. Observou-se que grande parte dessa transcrição
tinha início em regiões intergênicas e que encontravam-se preferencialmente
acessíveis à maquinaria transcricional e originavam transcritos antisense e
RNAs não codificadores em eucariotos (STRUHL, 2007; WILLINGHAM;
GINGERAS, 2006). Muitos dos RNAs não codificadores foram justificados, mais
tarde, como componentes da maquinaria de splicing de mRNAs e RNAs da
maquinaria de tradução e sua regulação, ou seja, o RNA ribossômico (rRNA), o
RNA transportador (tRNA), RNAse P. Porém, muitos permaneciam como
transcritos longos com pouco ou nenhum potencial codificador cuja função não
era conhecida. A esta nova espécie RNAs denominou-se “RNAs longos não
codificadores” ou lncRNA (MATTICK; RINN, 2015a; RINN; CHANG, 2012).
1.9 Definição e classificação dos RNAs longos não codificadores
Os lncRNAs são definidos como RNAs maiores que 200 bases, sem
poder codificador (RINN; CHANG, 2012). São classificados de acordo com a
localização de seu lócus em relação a genes codificadores de proteínas), ou
35
seja, são classificados da seguinte forma (HARROW et al., 2012; MA; BAJIC;
ZHANG, 2013) (Figura 5):
Figura 5 Classificação dos RNAs longos não codificadores. Genes codificadores de proteína e seus exons são representados em azul; em vermelho estão os lncRNAs e seus exons. Extraído e adaptado de (MA; BAJIC; ZHANG, 2013).
LincRNAs: são RNAs não codificadores intergênicos, isto é, têm sua unidade
transcricional separada da unidade transcricional de genes codificadores de
proteínas. Uma definição de lincRNAs determina, ainda, que estejam a 5
kilobases (kb) de distância a partir de genes codificadores de proteínas
(GUTTMAN et al., 2009).
36
LncRNAs intrônicos: sua unidade transcricional se encontra inserida no íntron de
um gene codificador, mas não intersecta com nenhum éxon do mesmo.
LncRNAs antisense: apresentam em seus lócus pelo menos um produto de
transcrição que intersecta qualquer éxon de um lócus codificador e que sejam
transcritos no sentido oposto ou, ainda, que tenham evidência publicada de
regulação antisense de um gene codificador.
LncRNAs sense: aqueles RNAs cujas unidades transcricionais contém éxons de
um gene codificador, transcritos na mesma fita sense.
1.10 Características dos RNAs longos não codificadores
Apesar de pertencerem a uma classe distinta, os lncRNAs compartilham
semelhanças com os mRNAs: alguns deles também têm sua regulação
transcricional mediada por fatores de transcrição-chave como p53, NF-kB, Sox2,
Oct4 e Nanog (cujos genes se situam próximos a eles) e muitos deles
apresentam domínios K4-K36 (trimetilação da lisina 4 da histona H3 - H3K4me3
no seu promotor e trimetilação da lisina 36 da histona H3 – H3K36me3- ao longo
da unidade transcrita), marcadores de genes ativamente transcritos pela RNA
Pol II (GUTTMAN et al., 2009; KHALIL et al., 2009). Seus promotores, assim
como o de genes codificadores, possuem forte enriquecimento na ligação à RNA
Pol II (GUTTMAN et al., 2009; STRUHL, 2007) e sua expressão pode também
ser regulada por miRNAs, assim como a expressão de mRNAs (LEUCCI et al.,
2013; YOON; ABDELMOHSEN; GOROSPE, 2014).
Alguns lncRNAs compartilham como os mRNAs o processamento com 5’
cap, o splicing alternativo, a poli adenilação na sua porção 3’ (cauda poli A)
(GUTTMAN et al., 2009; HARROW et al., 2012; STRUHL, 2007; WU et al.,
2008). Diferentemente dos mRNAs, são pouco conservados e, como
demonstrado por Cabili e colaboradores, que investigaram a expressão dos
mesmos em 24 tecidos humanos, são altamente tecido específicos, fato
confirmado também em murinos (CABILI et al., 2011; RAVASI et al., 2006).
37
Função biológica importante não significa apresentar altos níveis de
expressão transcricional. Os lncRNAs são pouco expressos, podendo ser até
dez vezes menos expressos que os genes codificadores de proteínas
(GUTTMAN et al., 2009; RAVASI et al., 2006; ULITSKY; BARTEL, 2013). Eles
são regulados nas células pelo estado da cromatina, ou seja, padrões de
metilação e acetilação das histonas, sendo que muitos são transcritos a partir de
promotores com poucas ilhas CpG e promotores bidirecionais, cujo início da
transcrição se dá a menos de 1000 bases do sítio de início da transcrição de um
gene codificador (WU et al., 2014).
1.11 Função dos RNAs longos não codificadores
Os lncRNAs consistem em uma classe altamente heterogênea de RNAs,
têm papel crucial no controle da expressão gênica e seu número (diversidade)
aumenta acompanhando o nível de complexidade dos organismos (FATICA;
BOZZONI, 2014). Tem sido associados com diversos processos celulares como
a pluripotência, resposta imune e regulação do ciclo celular (GUTTMAN et al.,
2009; HU et al., 2011; HUARTE et al., 2010; LOEWER et al., 2010).
Podem atuar de diversas maneiras na célula. Existem aqueles que podem
mediar modificações epigenéticas por recrutar e guiar remodeladores da
cromatina a determinados loci gênicos, definindo assim os domínios de
metilação diferencial de histonas e interferindo na acessibilidade da RNA Pol II a
estes loci (FATICA; BOZZONI, 2014; MERCER; DINGER; MATTICK, 2009).
Sabe-se que o imprinting genômico também é um fenômeno controlado
por lncRNAs, sendo que um complexo remodelador da cromatina pode ser
convocado para silenciar um dos cromossomos X na espécie humana, ou ainda,
proporcionar a origem a um pequeno RNA interferente na célula, no momento de
seu processamento (OGAWA; SUN; LEE, 2008; ZHAO et al., 2008).
Alguns servem de “iscas moleculares” a proteínas ligadoras de RNA que
atuam como repressores transcricionais e agem como mediadores de sua ação
em promotores gênicos, causando a repressão de determinados genes (WANG
38
et al., 2008). Podem, ainda, se ligar do DNA, em regiões promotoras, formando
uma tripla hélice, o que impede a ligação de co-fatores transcricionais nestes
sítios (MARTIANOV et al., 2007; VANCE; PONTING, 2014).
Eles não são, no entanto, somente repressores da transcrição, pois
podem atuar como enhancers, sendo neste caso, co-ativadores da transcrição
(FENG, 2006; VANCE; PONTING, 2014).
lncRNAs podem também podem afetar a transcrição de modo mais global
por interagir com componentes básicos da maquinaria de transcrição da qual
depende a RNA Pol II. Neste caso são transcritos pela RNA polimerase III (RNA
pol III) (Amaral & Mattick, 2008; Silva, Boczek, Berres, Ma, & Smith, 2011).
Outros lncRNAs atuam na regulação pós transcricional. LncRNAs do tipo
antisense podem se ligar à porção 5’ de alguns mRNAs, complicando o acesso
da maquinaria de splicing e causando retenção de íntrons. Alguns íntrons podem
conter sítios que sinalizam para a entrada de ribossomos, sendo requeridos à
tradução e expressão de determinada proteína (BELTRAN et al., 2008).
Alguns lncRNAs podem atuar como RNAs endógenos competidores ou
“esponjas” de miRNAs, sequestrando-os e, consequentemente possibilitando
meia-vida mais longa aos mRNAs, que ficam livres para serem traduzidos
(EBERT; SHARP, 2010; JOHNSSON et al., 2013; WANG et al., 2013b).
lncRNAs atuam também sobre proteínas. Podem se ligar diretamente a
elas impedindo ou contribuindo com o processo de fosforilação. No caso de
impedir, pode diminuir sua degradação mediada por fosforilação, como acontece
com a oncoproteína mielocitomatose-homóloga (MYC), regulando seus níveis
celulares. Já no caso de contribuir com a fosforilação, pode torná-la ativa, como
acontece com o fator de transcrição STAT3 (JOHNSSON; MORRIS, 2014;
WANG et al., 2014).
39
Hipótese
40
2. HIPÓTESE
RNAs longos não codificadores (lncRNAs) são controlados por fatores de
transcrição e transcritos pela RNA Pol II, a qual pode ser liberada por AIRE nas
regiões promotoras. De acordo com essas informações, formulamos a hipótese
de que o gene Aire pode exercer efeito modulador sobre a expressão de
lncRNAs em células tímicas epiteliais medulares.
41
Objetivos
42
3. OBJETIVOS
3.1 Objetivo Geral
Avaliar o efeito do gene autoimune regulator (Aire) sobre a expressão de
RNAs longos não codificadores (lncRNAs) em células tímicas epiteliais
medulares murinas imortalizadas (mTECs 3.10).
3.2 Objetivos específicos
Avaliar a expressão do gene Aire em células mTECs linhagem 3.10
Avaliar a expressão de lncRNAs em células mTEC 3.10.
Silenciamento de Aire em mTEC 3.10 por meio de RNA interferente
(siRNA).
Avaliar o transcriptoma identificando os mRNAs e os lncRNAs
diferencialmente expressos entre células mTEC 3.10 controle e Aire
silenciadas.
Caracterizar os lncRNAs Aire-dependentes expressos pelas células
mTECs 3.10.
43
Delineamento experimental
44
4. DELINEAMENTO EXPERIMENTAL
Obtenção das imagens de hibridação (Agilent Microarray Scanner)
Quantificação dos dados numéricos e controle de qualidade
(Programa Feature Extraction)
Células mTECs 3.10 (controle e Aire silenciadas por meio de siRNA)
Avaliação dos níveis transcricionais e protéicos de Aire (qRT-PCR e Wertern Blot)
Extração de RNA total e avaliação de sua integridade (Agilent RNA Nano Chips)
Amplificação e marcação das amostras de RNA total com Cy3 (controle e Aire silenciadas)
Hibridação com lâminas de microarray Agilent 8 x 60 K (genoma murino completo)
Correção do background (plataforma R)
Normalização dos dados (plataforma R)
45
Aplicação do coeficiente de correlação de Pearson (plataforma R)
Análise estatística dos dados (LIMMA) (plataforma R)
Identificação e agrupamento hierárquico dos mRNAs e dos lncRNAs diferencialmente expressos (Multiple Experiment Viewer - MeV)
Identificação das sequências dos lncRNAs modulados por Aire (UCSC Genome Browser)
Caracterização dos lncRNAs modulados por Aire
Avaliação da presença da cauda poli A
Identificação e posicionamento do gene codificador mais próximo
(Bed Tools - Linux)
Análise do potencial codificador (Coding-Potential Assesment Tool)
(Coding Potential Calculator)
Classificação dos lncRNAs
(UCSC Genome Browser)
46
Material e métodos
47
5. MATERIAL E MÉTODOS
5.1 Linhagem celular
Utilizamos a linhagem de células tímicas epiteliais medulares primárias
(Mus musculus, linhagem mTEC 3.10, MHC II + CD80
+) gentilmente cedida pelo
Prof. Dr. W. Savino, do Laboratório de Pesquisas sobre o Timo da Fundação
Instituto Oswaldo Cruz, Rio de Janeiro, Brasil.
As células mTEC 3.10 foram estabelecidas a partir do timo de
camundongos da linhagem C57BL/6 e o fenótipo de células medulares foi
determinado por imunofenotipagem com o anticorpo Th-3 e Th-4 (HIROKAWA et
al., 1986; MIZUOCHI et al., 1992). Elas foram avaliadas utilizando-se um painel
de anticorpos monoclonais anti-citoqueratina, confirmando o fenótipo medular
distinto (NIHEI et al., 2003). Além disso, confirmou-se por citometria (FACS) que
essas células são MHCII+, CD80+.
As células mTEC 3.10 são aderentes ao plástico e foram cultivadas em
garrafas de 75 cm2 contendo 15 mL de meio RPMI 1640 Cultilab (Campinas, SP,
Brasil) suplementado com 10% de soro fetal bovino (SFB) Cultilab Campinas,
SP, Brasil) a 370 C, em estufa com atmosfera de 5% de CO2.
5.2 Silenciamento de Aire em mTEC 3.10 por RNA interferente (siRNA)
Ao atingirem semi-confluência, as células mTEC 3.10 foram destacadas
das garrafas de cultura utilizando-se 10 ml de solução de tripsina 1x (2,5 g de
tripsina suína + 0.5 ml de EDTA pH 8.0 por cinco minutos a temperatura
ambiente). As células foram quantificadas em um contador automatizado
(Cellometer Auto T4 Cell Viability Counter Nexcelom Bioscience, Lawrence, MA,
USA). As células foram então colhidas por centrifugação a 1000 x g durante
cinco minutos. Aproximadamente 5 x 105 células foram semeadas em garrafas
de cultura de 25 cm2 contendo 5 ml de meio RPMI 1640 e 10% SFB e colocadas
em cultura.
A preparação dos complexos RNAi-lipofectamina se deu da seguinte
forma: Cinco (5) nanomoles de siRNA anti-Aire (Figura 6) foram dissolvidos em
48
100 μl de Opti-MEM® I Reduced Serum Medium Gibco (Paisley, Scotland, UK)
com 6 μl de HiperFect Transfection Reagent Qiagen® (Germantown, MD, USA).
A mistura foi vigorosamente agitada durante 10 segundos e em seguida
incubada por 10 minutos a temperatura ambiente para a formação dos
complexos de transfecção siRNA-lipofectamina (lipossomos).
Figura 6 Sequência do RNA interferente para o transcrito do gene Aire.
Os complexos foram adicionados à cultura das células mTEC 3.10 na
proporção de 5nM de siRNA/5x106 células, e a cultura foi incubada por 24 horas,
a 37°C em atmosfera com 5% de CO2. As amostras foram divididas em dois
grupos: (1) células mTEC 3.10 cultivadas apenas na presença de lipofectamina
(grupo controle) e (2) células mTEC 3.10 cultivadas na presença do complexo
siRNA anti-Aire + lipofectamina (grupo Aire silenciado).
5.3 Extração de RNA total
A fim de prevenir a contaminação por ribonucleases durante a extração e
manuseio dos RNAs, toda a vidraria, tubos plásticos, espátulas e pinças
utilizadas foram previamente autoclavados, sendo que os materiais plásticos
(tubos e ponteiras) foram novos e descartáveis. Todo o procedimento foi
realizado usando luvas de látex novas sem talco e também descartáveis, que
foram trocadas durante o decorrer do procedimento da extração de RNA.
As células mTEC 3.10 após 24 horas do início do silenciamento com
siRNA anti-Aire foram destacadas das garrafas de cultura de 25 cm2 por
tratamento com 5 ml de solução de tripsina 1x por cinco minutos. A tripsina foi
inativada por adição de excesso de meio de cultura RPMI + SFB e as células
foram colhidas por centrifugação a 1000 x g durante cinco minutos. A seguir,
49
elas foram lavadas duas vezes com PBS 1 x e centrifugadas a 1000 x g durante
cinco minutos.
Para a extração de RNA total utilizamos o kit mirVanaTM miRNA Isolation
Kit Ambion ® (Grand Island, NY, USA), o qual permite a separação simultânea
de RNAs de alto peso molecular (≥ 200 nucleotídeos, incluindo os mRNAs e os
lncRNAs) e de RNAs de baixo peso molecular (≤ 200 nucleotídeos, incluindo os
miRNAs).
Para iniciar a extração, foram acrescidos 1000 μl de solução de lise à
suspensão de células. Agitou-se vigorosamente (pipetagens sucessivas e 10
segundos no vórtex) para lise completa das células formando um lisado
homogêneo. Adicionou-se 100 μl de miRNA Homogenate Additive e misturou-se
bem (vórtex por 15 segundos).
A mistura foi deixada em banho de gelo picado por 10 minutos e depois
juntamos mais 1000 μl de solução de fenol:clorofórmio (1:1, solução ácida), a
qual foi agitada vigorosamente em vórtex por 60 segundos. O lisado então foi
centrifugado a 10.000 x g por cinco minutos à temperatura ambiente. A fase
aquosa foi cuidadosamente recolhida e transferida para um novo tubo ao qual
adicionamos etanol absoluto na proporção de 1,25 x em relação ao volume do
lisado recuperado após a centrifugação. Agora a mistura foi passada numa
coluna de sílica que acompanha o kit de extração. Para cada amostra foi
montada uma coluna em um tubo coletor e 700 μl da mistura foram pipetados na
superfície desta coluna que fora centrifugada por 15 segundos a 10.000 x g. O
líquido (void volume) foi descartado e o procedimento repetido até que toda a
mistura lisado/etanol tivesse sido filtrada. O RNA total que ficou adsorvido na
sílica da coluna precisou ser liberado e coletado. Para isto, passamos nesta
coluna 700 μl de miRNA Wash Solution 1 por centrifugação (10 segundos a
10.000 x g). O líquido (void) foi descartado e 500 μl de miRNA Wash Solution 2/3
foi aplicado na coluna e centrifugado por 10 segundos a 10.000xg. O último
passo foi repetido e, após o descarte do líquido, o tubo foi centrifugado por 1
minuto para remoção dos resíduos líquidos. A coluna foi transferida para um
novo tubo coletor e a ela foram adicionados 100 μl de água DEPC pré-aquecida
(95°C). O tubo foi centrifugado por 30 segundos para a recuperação da solução
de RNA total que foi armazenada em freezer a -80°C.
50
5.4 Quantificação e avaliação da pureza das preparações de RNA total
A quantificação das amostras de RNA total foi feita por espectrofotometria
UV no aparelho NanoDrop ND-1000 (NanoDrop Products, Wilmington, DE,
USA). Uma unidade (1U) de absorbância A260 corresponde a 40µg de RNA/ml.
Também avaliamos pureza das preparações por meio de cálculo das razões
absorbância em diferentes comprimentos de onde de UV. Amostras livres de
fenol apresentaram razão A260/A230 entre 1.8 a 2.0 e livres de contaminação com
proteínas razão A260/A280 entre 1.8 e 2.2.
5.5 Avaliação da integridade das preparações de RNA total
A integridade das preparações de RNA total extraído das células controle
e transfectadas com RNA de interferência anti-Aire, em triplicatas, foi avaliada
por meio de eletroforese microfluídica utilizando um aparelho Agilent 2100
Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA), segundo o protocolo
do fabricante. A técnica permite a separação eletroforética das frações de RNA
em um chip (RNA Nano Chip 6000 Agilent) a partir de 200 ng de RNA total. O
aparelho calcula o índice de integridade (RNA Integrity Number ou RIN), com
escala de qualidade variando de 0 a 10 (sendo 10 a melhor) baseada na razão
entre as áreas dos picos correspondentes aos RNAs ribossômicos 28S e 18S,
além de exibir o perfil eletroforético das amostras.
A integridade dos RNAs utilizados pode ser observada em imagens do gel
virtual (Figura 7) e da densitometria (Figura 8). No gel, o perfil eletroforético das
amostras demonstra a ausência de produtos de degradação. Na imagem da
densitometria podem ser visualizados os picos das frações de RNAr 28S, RNAr
18S e RNAr 5S + RNAt 4S. As amostras exibiram um perfil de excelente
integridade, com RIN superior a 9.0.
51
Figura 7 Eletroforese microfluídica das preparações de RNA total. mTECs 3.10. controle (C) e
Aire silenciadas (A).
Figura 8 Densitometria da eletroforese microfluídica das amostras de RNA total. mTECs 3.10
controle (C) e Aire silenciadas (A).
52
5.6 Reação de transcrição reversa dos mRNAs
As reações de transcrição reversa foram realizadas com 2 μg de RNA
total, 1 μl de oligo (dT) e 1 μl de dNTP mix a 10 nM, em um volume final de 12 μl,
segundo instruções do fabricante (Invitrogen Corporation, Carlsbad, CA, USA).
As amostras permaneceram a 65°C durante cinco minutos em um termociclador
e, em seguida, foram colocadas em banho de gelo picado e foram adicionados 4
μl de Buffer 5x first-strand, 2 μl de dTT e 1 μL de RNasin® Ribonuclease
Inhibitors Promega (Sydney, Australia), antes de incubar a amostra por 2
minutos a 42 °C. Finalmente, 1 μl da enzima transcriptase reversa SuperScript
II® Invitrogen (Carlsbad, CA, USA) foi adicionado, resultando em um volume
final de 20 μl.. A reação permaneceu a 42°C por 50 minutos seguindo a 70°C por
15 minutos.
5.7 Reação de polimerização em cadeia quantitativa e em tempo real (qRT-
PCR)
A PCR quantitativa e em tempo real (qRT-PCR) foi utilizada para a
confirmação do silenciamento do gene Aire, por meio da quantificação relativa
da expressão do seu mRNA (DNA complementar ou cDNA).
As sequências do par de primers forward (F) e reverse (R) utilizada para o
cDNA de Aire de Mus musculus (GenBank acc NM_009646.1) foram as
seguintes:
F: 5’ GCAACTCTGGCCTCAAAGAG 3’
R: 5’ GGTCTGAATTCCGTTTCCAA 3’
O nível de expressão de Aire foi normalizado pela expressão do gene
constitutivo HPRT de Mus musculus (GenBank acc NM_013556.2), o qual é
comumente utilizado para este fim. As sequências do par de primers F e R
utilizadas para amplificar o mRNA (cDNA) de HPRT foram:
F: 5’ GCCCCAAAATGGTTAAGGTT 3’
R: 5’ CAAGGGCATATCCAACAACA 3’
As reações de qRT-PCR foram realizadas utilizando-se o reagente
SYBR® Green PCR Master Mix Applied Biosystems (Life Technologies
Corporation, Carlsbad, CA, USA), em placas de 48 poços, com ciclagem padrão
53
de aproximadamente duas horas no aparelho StepOne® Real-Time PCR
System Applied Biosystems (Life Technologies Corporation, Carlsbad, CA, USA)
e software de leitura StepOne® Real-Time PCR System Software (versão 2.1).
Na reação final foram utilizados 10 μl de SYBR Green PCR Master Mix,
7,4 μl de água livre de nucleases, 0,8 μl de cada primer e 1 μl de cDNA,
resultando em um volume final de 20 μl. O protocolo de ciclagem térmica foi: 1 x
95°C durante 10 minutos (holding stage); 40 x desnaturação a 95°C por 15
segundos e anelamento a 60°C por um minuto (cycling stage); obtenção da
curva de melting (melting curve stage). A curva é obtida após três passos, sendo
o primeiro de 15 segundos a 95°C, o segundo de um minuto a 60°C e o terceiro
de 15 segundos a 95°C.
A avaliação da expressão dos transcritos do gene Aire por meio da qRT-
PCR foi realizada pela da comparação dos valores de quantificação relativa
deste com os valores de quantificação relativa do gene constitutivo (HPRT), Para
a análise estatística dos dados utilizamos o teste t-student por meio do software
estatístico GraphPad Prism 6.0 (http://www.graphpad.com/prism/Prism.htm),
sendo considerados significativos valores de p ≤ 0.05.
5.8 Extração protéica
Ainda com a finalidade de avaliar possíveis variações na quantidade da
proteína AIRE, foi realizado o western blot das amostras tratadas com RNAi anti-
Aire e das amostras controle. Após 24 horas de silenciamento de Aire, as
proteínas totais das mTEC 3.10 de cada cultura foram extraídas. As células
(aproximadamente 5x105 células) foram destacadas das garrafas de cultura de
25 cm2 utilizando-se Cell Scraper (Techno Plastic Products AG, Switzerland) e
colhidas por centrifugação a 1000 x g durante cinco minutos. As células foram
lavadas três vezes com PBS 1x, e centrifugadas a 1000 x g durante cinco
minutos. Após, 400 µl do tampão RIPA com inibidores de protease foi adicionado
e as células foram lisadas com o auxílio de um sonicador. O homogeneizado foi
então centrifugado a 12.000 rpm por 15 minutos a 4°C. O sobrenadante/lisado
foi armazenado em freezer -80°C. A diluição das amostras foi 1:10, e a curva de
concentração de proteína nas amostras foi comparada com uma curva padrão
(padrão=BSA 2mg/ml) aos quais foram adicionados solução de Bradford, o qual,
54
na presença de proteína reage, resultando em coloração azul. A dosagem foi
realizada em espectrofotômetro Ultrospec 2100 (Amershan Pharmacia Biotech,
Uppsala, Sweden).
5.9 Eletroforese em Gel de Poliacrilamida na Presença de SDS (SDS-PAGE)
Foi realizada eletroforese em gel desnaturante (SDS-PAGE) utilizando-se
o sistema de tampão descontínuo descrito por (LAEMMLI, 1970). Nesta
eletroforese as proteínas são separadas de acordo com seu peso molecular. Foi
utilizado gel de poliacrilamida, com gel de empilhamento de 4% e gel de
separação a 10% As amostras para eletroforese foram preparadas obedecendo-
se a proporção em volume 3:1, respectivamente, de amostra e Tampão de
Amostra concentrado 4x (240 mM Tris-HCl pH 6,8; 8% SDS; 40% glicerol;
bromofenol blue e betamercaptoetanol). As amostras foram aquecidas por cinco
minutos a 95°C em banho seco. O Tampão de Corrida continha 25 mM Tris-HCl,
pH 8,3; 190 mM glicina; 0,1% SDS e o padrão de peso molecular utilizado foi:
Precision Plus Protein™ Dual Color Standards Biorad (250 kDa, 150 kDa, 100
kDa, 75 kDa, 50 kDa, 37 kDa, 25 kDa, 20 kDa, 15 kDa e 10 kDa) (Hercules, CA,
USA), em corrida a 20 mA por aproximadamente duas horas.
5.10 Western Blot
Após a corrida, as proteínas do gel foram transferidas para membrana
de nitrocelulose: as proteínas foram eletrotransferidas a 70 volts por duas horas,
utilizando-se como Tampão de Transferência 25 mM Tris-HCl, 190 mM glicina,
20% metanol e 0,1% SDS (TOWBIN; STAEHELIN; GORDON, 1979). Após a
transferência, a membrana foi corada com 0,5% Ponceau por cinco minutos,
para visualização das bandas. Em seguida, a membrana foi lavada com água
miliQ e bloqueada por duas horas em leite desnatado 5% preparado em PBS-
Tween (50 mM Tris-HCl, pH 8,0; 150 mM NaCl; 0,1% Tween-20), sob agitação
constante a 23°C. Após o bloqueio, a membrana foi incubada com o anticorpo
primário Anti-Aire D17 Santa Cruz Biotechnology®, inc (Dallas, Texas, USA)
55
diluído 1:500 overnight, sob agitação, a 23°C. Após, foram realizadas lavagens
com PBS-T por cinco vezes de cinco minutos, também sob agitação. Em
seguida, a membrana foi incubada com o anticorpo secundário conjugado com
peroxidase (diluído 1:10000 em PBS-T) por 50 minutos. Após incubação fez-se a
lavagem da membrana em PBS-T por cinco vezes de cinco minutos e a
revelação foi feita através do aparelho ImageQuant™ LAS 500 Ge Life Sciences
(Piscataway, NJ, USA), utilizando-se o substrato apropriado para a peroxidase
(Luminata™ Forte Merck Millipore). A reação foi conduzida protegida da luz em
diferentes intervalos de exposição.
Após a revelação a membrana foi lavada cinco vezes de cinco minutos e
o processo anteriormente descrito foi repetido a partir do bloqueio com o
anticorpo primário anti-GAPDH (14C10) Cell Signaling Technology (Danvers,
Massachusetts, USA) diluído 1:10000 e secundário conjugado com peroxidase
(a 1:10000).
A intensidade das bandas foi convertida em valores numéricos pelo
software Image J e analisados estatisticamente por meio do software estatístico
GraphPad Prism 6.0 com o teste t-student
5.11 Oligomicroarrays
Para análise do transcriptoma das células mTEC 3.10 controle e Aire
silenciadas utilizamos a tecnologia de oligomicroarrays da Agilent, do tipo
SurePrint G3 Mouse GE 8 x 60K Microarray Kit (Agilent Technologies, Santa
Clara, CA, USA) (AMADID:- 028005). Os microarrays continham o genoma
funcional murino completo. Os arrays continham 60.000 oligos-sondas de 60
mer preparados pelo processo SurePrint (sistema de impressão) em lâminas de
vidro (2,5 x 7,5 cm), incluindo sondas de mRNA e de lncRNAs (genoma do
camundongo anotado em julho de 2007 = NCBI37/mm9).
Utilizamos a metodologia monocolor cianina 3, verde (Cy3) e os
procedimentos de amplificação e marcação dos RNAs foram feitos com o Quick
56
Amp Labeling Kit One-Color (Agilent Technologies, Santa Clara, CA, USA) a
partir de 100 ng de RNA total.
Foram misturadas as amostras de RNA controle (spike-in) com 100 ng de
RNA total para realização da etapa de transcrição reversa com a enzima
transcriptase reversa Monoley Murine Leukemia Virus – Reverse Transcriptase
(MMLV-RT). Além disso, foram utilizados primers adaptados com timinas (T)
consecutivas acopladas a um promotor T7 para síntese de cDNAs de dupla fita.
Após essa reação, a enzima T7 RNA polimerase foi adicionada juntamente com
nucleotídeos marcados com Cy3 (síntese de RNA complementar, cRNAs) e sua
posterior amplificação.
As amostras de cRNAs foram purificadas e hibridadas em lâminas de
microarrays em câmaras de hibridação Agilent Microarray Hibridization
Chambers (Agilent Technologies, Santa Clara, CA, USA) a 65°C por 17 horas
em um forno rotativo (Agilent Technologies). As lâminas foram lavadas com os
tampões GE Wash Buffer 1 e GE Wash Buffer 2.
5.12 Aquisição de imagens de hibridação
As imagens de hibridação foram obtidas com auxilio de um Microarray
Scanner de alta resolução Surescan (Agilent) a 550 nm.
5.13 Quantificação dos dados de microarrays
A quantificação dos dados foi realizada com auxílio do software Feature
Extraction, versão 12.0.1.1 (Agilent Technologies, Santa Clara, CA, USA), que
realiza o posicionamento automático de grids por reconhecimento de regiões
marginais, além de fornecer diversos parâmetros para análise do controle de
qualidade das hibridações.
57
5.14 Análise dos dados de microarrays
Após o escaneamento das lâminas, os dados numéricos foram analisados
no ambiente R (versão 3.1.2 - R Development Core Team, 2011 disponível em R
Project for Statistical Computing ( https://www.r-project.org/), que consiste em
um ambiente estatístico-matemático que permite a execução de múltiplas
funções, sendo amplamente empregado em análise de dados de microarray,
permitindo ainda execução de cálculos e visualização gráfica dos resultados.
5.14.1 Correção do background
Os dados de expressão foram introduzidos no ambiente estatístico-
matemático R, versão 3.2.1 e tiveram seus controles internos positivos e
negativos retirados. Foram eliminados os dados cujos valores sobrepuseram os
valores de background (correção do background ou signal-background).
5.14.2 Normalização dos dados de microarrays
A fim de remover as variações não biológicas capazes de afetar as
medições dos níveis de expressão gênica para tornar os dados comparáveis
realizamos a normalização dos mesmos. A normalização foi realizada pela
metodologia quantile, método considerado robusto que corrige as diferenças nas
densidades de probabilidade de todas as amostras (BOLSTAD et al., 2003).
Para a visualização e conferência dos dados normalizados foi gerado gráfico em
formato boxplot (Figura 11).
5.14.3 Correlação de Pearson
O cálculo da correlação de Pearson e a montagem do agrupamento
hierárquico dos coeficientes de correlação foram executados no ambiente R.
Este coeficiente reflete o grau de correlação entre variáveis de escala métrica. É
obtido pela divisão entre a covariância de cada uma das variáveis e o produto
58
dos desvios padrão amostrais destas variáveis. Indica a relação entre dois
conjuntos numéricos ordenados. Varia de -1.0 a 1.0, sendo -1.0 uma correlação
negativa perfeita, isto é; por exemplo, se a expressão de um gene A aumentar
ao longo do tempo, a do gene B deve diminuir proporcionalmente. Em contraste,
se os genes A e B aumentam proporcionalmente ao longo do tempo apresentam
uma correlação perfeita positiva e tem um coeficiente de correlação igual a 1.0.
Se não apresentarem absolutamente nenhuma relação um com o outro seu
coeficiente será de 0 (BEN-DOR; SHAMIR; YAKHINI, ; MÅNSSON et al., 2004).
Além disso, para melhor visualização do resultado, realizou-se o
agrupamento hierárquico das amostras, a fim de agrupá-las segundo a
semelhança do perfil de expressão (Figura 12)(EISEN et al., 1998). As análises
foram realizadas utilizando o pacote gplots (disponível no Bioconductor Latin
America: https://cran.r-project.org/web/packages/gplots/).
5.14.4 Análise estatística dos dados para obtenção dos transcritos
diferencialmente expressos
Para análise dos transcritos diferencialmente expressos utilizamos as
funções do pacote Limma (Linear Models for Microarray Data) (SMYTH, 2005)
(disponível em: http://bioconductor.org/packages/release/bioc/html/limma.html),
o qual aplica um modelo linear na análise estatística e reajusta os erros padrão
segundo um modelo Bayesiano (Empirical Bayes e outros métodos), usado para
pedir informações através de genes que fazem as análises estáveis mesmo para
experimentos com pequeno número de matrizes. O método de Benjamini-
Hochberg foi aplicado para a correção para múltiplos testes (BENJAMINI;
HOCHBERG, 1995).
5.14.5 Agrupamento hierárquico dos transcritos diferencialmente
expressos
Foram considerados diferencialmente expressos aqueles transcritos com
valor de p < 0.05 no teste t moderado e corrigido por false discovery rate (FDR)
59
(Benjamini Hochberg) e que apresentaram fold change ≥ 1.5. A seguir, foram
submetidos ao agrupamento hierárquico não supervisionado (Hierarchical
Clustering – HCL) (Figuras 13 e 14), que consiste em um método aglomerativo
no qual os perfis de expressão semelhantes são agrupados. A distância métrica
utilizada foi a correlação de Pearson e o método de agrupamento foi average
linkage. As semelhanças e diferenças de expressão estão apresentadas como
heat maps. O agrupamento hierárquico e os heat maps foram montados
utilizando-se a função Multiple Array Viewer do Multiple Experiment Viewer
(MeV) , versão 4.9.0, (disponível em www.tm4.org/mev.html).
5.15 Identificação das sequências dos RNAs longos não codificadores
A identificação das sequências dos lncRNAs foi feita através do University
of California, Santa Cruz Genome Browser (UCSC Genome Browser),
(disponível em https://genome.ucsc.edu/) de acordo com a montagem do
genoma murino de julho de 2007 (NCBI37/mm9), levando-se em conta as
posições cromossômicas e o blast das sondas, cujas sequências foram
fornecidas pela Agilent (Tabela 1).
5.16 Classificação dos RNAs longos não codificadores
A classificação dos lncRNAs foi realizada de acordo com a anotação de
cada um deles no UCSC Genome Browser e anotação fornecida pela Agilent
junto às lâminas de array (Figura 15).
5.17 Identificação e posicionamento dos genes codificadores mais
próximos de loci de lncRNAs
Um arquivo com todo o genoma murino foi obtido através do GENCODE
(http://gencodegenes.org) e por meio da plataforma Linux, pacote Bed Tools
(Closest) (http://bedtools.readthedocs.org/en/latest/content/tools/closest.html) foi
60
realizada a busca e posicionamento ao longo do genoma dos genes
codificadores mais próximos aos lncRNAs (somente daqueles diferencialmente
expressos e modulados por Aire) (Figura 16 e Tabela 2).
5.18 Análise do potencial codificador dos RNA longos não codificadores
A análise do potencial codificador dos lncRNAs diferencialmente
expressos foi realizada através de dois softwares (Tabela 3) que utilizam
abordagens diferentes. Como controle e comparação foram utilizados além dos
lncRNAs, 50 genes codificadores randomicamente escolhidos e cujas
sequências dos respectivos mRNAs foram obtidas no UCSC Genome Browser.
Os resultados obtidos por cada software foram comparados e são mostrados na
forma de Diagrama de Venn (Figura 17).
5.18.1 Análise do potencial codificador dos RNAs longos não codificadores
por Coding-Potential Assesment Tool (CPAT)
Utilizamos a ferramenta Coding-Potential Assesment Toll (CPAT)
(disponível em: code.google.com/p/cpat/) que permite a detecção do potencial
codificador de transcritos por meio de uma técnica livre de alinhamentos. Este
software utiliza um modelo de regressão logística baseado em quatro
características: 1) O tamanho da Open Reading Frame (ORF, ou matriz aberta
de leitura), uma vez que ORFs longas dificilmente são observadas em
sequências não codificadoras; 2) A cobertura da ORF, isto é, a razão entre os
comprimentos da ORF e do transcrito; 3) O Fickett TESTCODE score, que
reflete o efeito combinatório possível da composição de nucleotídeos e a
tendenciosidade ao uso de determinado códon; e por fim o 4) hexâmero score,
que determina o grau relativo de viés no uso de um hexâmero em determinada
sequência (WANG et al., 2013a).
Cada uma dessas características são mostradas ao final da análise, e
resultam em um score que indica a probabilidade de codificação daquela
sequência. Os valores desse score variam de 0 a 1. Valores próximos a 0
61
indicam menor potencial codificador, sendo que à medida que se aproximam de
1 indicam maior potencial codificador. O cutoff, portanto, fica em 0.5 (WANG et
al., 2013a).
A vantagem desta técnica consiste na independência de alinhamentos,
uma vez os RNAs longos não codificadores não são, em sua maioria,
conservados entre as espécies(WANG et al., 2013a).
5.18.2 Análise do potencial codificador pelo software Coding Potential
Calculator (CPC)
A análise do potencial codificador de um transcrito realizada pelo software
CPC (disponível em: cpc.cbi.pku.edu.cn/) se baseia em dois conceitos: 1) ORFs
– seu tamanho, sua qualidade, sua cobertura e sua integridade (se ela começa
com um códon de início e termina com um stop códon). 2) Alinhamento do tipo
BLASTX, ou seja, é realizada a “tradução” do lncRNA o e o resultado é
comparado com os dados dos bancos de dados de proteínas. Dessa forma,
transcritos não codificadores tendem a ter ORFs menores, com baixa cobertura
e integridade, além de não alinhar com proteínas. Em caso de alinhamento com
sequencias codificadoras de proteínas, pode se dispersar por qualquer uma das
três frames. Cada uma dessas classes fornece um score, que são incorporados
por uma máquina de vetores de suporte (SVM – support vector machine), um
classificador linear binário não probabilístico, que fornece um score final.
Escores negativos indicam transcritos não codificadores e positivos indicam os
codificadores. O SVM padrão toma como entrada um conjunto de dados e
prediz, para cada entrada dada, qual de duas possíveis classes a entrada faz
parte (KONG et al., 2007).
5.19 Avaliação da presença da cauda poli A
A presença da cauda poli A foi realizada avalindo-se as sequências
obtidas através do UCSC Genome Browser após identificação das mesmas.
62
Resultados
63
6. RESULTADOS
6.1 Silenciamento de Aire na linhagem mTEC 3.10
Visando avaliar o nível de sileciamento do gene Aire em células mTECs
transfectadas in vitro com RNA interferente anti-Aire após período de 24 horas
da transfecção, nós avaliamos a expressão relativa deste gene por qRT-PCR. O
histograma (Figura 9) demonstra que a transfecção com RNA interferente foi
eficaz em diminuir os níveis transcricionais de Aire, promovendo o silenciamento
parcial (70%) deste gene.
Figura 9 Histograma mostrando a expressão transcricional relativa do gene Aire determinada por
qRT-PCR em células mTEC 3.10 controles (Ctrl) ou transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA). Teste t de Student *p ≤ 0,0193.
6.2 Western Blot da proteína AIRE
Com o objetivo de verificar o efeito do silenciamento de Aire a nível
proteico foi realizado o western blot das proteínas totais das amostras controles
e tratadas com RNAi anti-Aire, após 24 horas da transfecção. Pode-se observar
que o silenciamento de Aire foi capaz de promover uma redução nos níveis da
proteína AIRE nas células mTECs 3.10. (Figura 10).
64
Figura 10 Westen blot da proteína AIRE em células mTECs 3.10 controles (Ctrl) e transfectadas
com RNA interferente siRNA anti-Aire (Aire-siRNA). (a) membrana de nitrocelulose. (b)
histograma da intensidade das bandas convertidas em valores numéricos, teste t de Student *p ≤
0,0215. Dados representativos de três experimentos .
6.3 Normalização dos dados de microarray
O primeiro passo no tratamento dos dados obtidos nas as hibridizações
com os microarrays foi a retirada dos controles positivos e negativos existentes
nas lâminas e a correção do backgroud, além da conversão dos dados
numéricos em escala logaritmica.
Depois dessa etapa procedemos a normalização dos dados, com o intuito
de remover aqueles valores oriundos de variações não biológicas que poderiam
afetar as medições dos níveis de expressão gênica entre as condições
experimentais. Os métodos de normalização visam compensar as variações
técnicas sistemáticas entre as lâminas de microarrays afim de aprimorar a
análise das diferenças biológicas entre as amostras. A normalização utilizada foi
a do tipo quantile a qual tornou as amostras comparáveis, reduzindo ao máximo
os artefatos experimentais (BOLSTAD et al., 2003). O resultado da normalização
pode ser visto na Figura 11, por meio do gráfico boxplot, onde cada um dos
boxes representa uma amostra. É possível observar que todos possuem o
mesmo comprimento e estão dispostos de maneira uniforme, indicando que os
valores foram normalizados.
a b
Ctrl Aire-siRNA
65
Figura 11 Gráfico boxplot das amostras controle (em verde) e tratadas com siRNA-anti Aire (em
rosa) após a normalização pelo método quantile.
6.4 Correlação de Pearson
A primeira abordagem utilizada após a normalização dos dados foi a
comparação do padrão de expressão global entre as células controle e Aire
silenciadas dos dois tipos de transcritos cujas sondas estavam presentes nos
microarrays (mRNA e lncRNAs). Para tanto, utilizou-se a coeficiente de
correlação de Pearson como medida da correlação entre a expressão gênica de
ambas as condições e o agrupamento hierárquico dos dados de expressão pré-
processados, para melhor visualização do resultado (Figura 12).
No agrupamento hierárquico resultante da aplicação do coeficiente de
correlação de Pearson é possível observar, segundo a escala de cor e seu
respectivo valor numérico, que houve baixa correlação entre as amostras
controle e silenciadas para o gene Aire, indicando baixa similaridade entre elas.
O dendrograma, que apresenta a relação hierárquica entre as amostras, também
permite notar a distinção entre os dois grupos (Figura 12).
66
Figura 12 Agrupamento hierárquico da expressão transcricional global de mRNAs e de lncRNAs
resultante da aplicação do coeficiente de correlação de Pearson. Neste tipo de análise foram comparadas as expressões transcricionais de células mTEC 3.10 (controle) com as de células mTEC 3.10 Aire silenciadas (Aire si-RNA).
6.5 Transcritos diferencialmente expressos após silenciamento de Aire em
células mTEC 3.10
Após normalização e análise da similaridade transcricional entre as
amostras procedeu-se com a análise estatística dos perfis transcricionais nas
duas condições (mTECs controle e mTEC 3.10 Aire silenciadas) através da
definição da expressão gênica diferencial por meio dos recursos de modelagem
linear do pacote limma.
Foram identificados 480 transcritos modulados após o silenciamento de
Aire, dentre os quais 65 são lncRNAs. Para isto, utilizamos como cuttoff um valor
de p ajustado ≤ 0.05 (Benjamini-Hochberg FDR) e fold change ≥ 1.5, conforme
mostrado nos heat map da Figura 13. Pode-se observar a diferença
transcricional entre as duas condições.
67
Figura 13 Heat map dos transcritos modulados (mRNAs e lncRNAs) comparando as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE) (fold change ≥. 1.5, p value ≤ 0.05).
68
6.6 LncRNAs diferencialmente expressos após silenciamento de Aire em
células mTEC 3.10
O heat map e agrupamento hierárquico não supervisionado dos lncRNAs
diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 é
mostrado na Figura 14. Este tipo de análise permitiu a identificação dos lncRNAs
modulados, ou seja, aqueles induzidos e os reprimidos indicando o papel
modulador de Aire sobre esta espécie de RNAs. Dentre os lncRNAs
significativamente modulados por Aire, a maioria teve sua expressão aumentada
após o silenciamento de Aire.
Figura 14 Heat map dos lncRNAs modulados por Aire comparando as amostras de mTEC 3.10
controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE) (fold change ≥. 1.5, p value ≤ 0.05).
69
6.7 Caracterização dos lncRNAs modulados por Aire
6.7.1 Classificação dos lncRNAs
Os lncRNAs modulados por Aire também foram distribuídos segundo seus
tipos (lincRNAs, intronicos, sense RNAs ou antisense RNAs) (HARROW et al.,
2012; MA; BAJIC; ZHANG, 2013) (Figura 15), segundo suas posições
genômicas em relação aos genes codificadores de proteína mais próximos.
O primeiro passo para realizar essa distribuição foi a identificação das
sequências dos lncRNAs utilizando o UCSC Genome Browser A busca foi
baseada no identificador (ID) de cada lncRNA presente nos microarrays
fornecido pela Agilent. Para alguns lncRNAs esse ID correspondia a designação
da própria posição genômica dos mesmos e para aqueles já anotados já havia a
atribuição de um “símbolo”. A maioria dos lncRNAs foi do tipo intergênica e os
outros do tipo sense ou antisense. Alguns não puderam ser classificados por
serem expressed sequence tags (ESTs) ou por ainda não terem sido anotados.
Figura 15 Distribuição dos lncRNAs modulados por Aire segundo o tipo.
70
6.7.2 Localização cromossômica dos lncRNAs modulados por Aire
Os 56 lncRNAs modulados por Aire apresentaram ampla distribuição
genômica, pois dos 19 cromossomos do camundongo 16 abrigam genes que
codificam esses RNAs. Os únicos cromossomos que, segundo nossas análises,
não abrigam genes de lncRNAs modulados são o 7, 11 e 14.
A localização cromossômica e a respectiva modulação dos lncRNAs
modulados está disponível na Tabela 1.
Tabela 1 Localização cromossômica dos lncRNAs modulados por Aire em células mTEC 3.10 e sua respectiva modulação, em log de fold change.
Transcrito Localização cromossômica
Modulação
chr1:166985480-166986024 1q H2.3 -0.624141
chr1:173353316-173367449 1q H3 0.619478
chr1:23340097-23340552 1q A5 -0.608960
chr1:42972297-42972716 1q B -1.145429
chr1:51753968-51803787 1q C1.1 -0.653655
chr2:132079092-132087069 2q F2 -1.318858
chr2:168136389-168136560 2q H3 0.719833
chr2:50917152-50917519 2q C1.1 -0.631880
chr3:41158056-41173053 3q B -0.754731
chr4:131905739-131910814 4q D2.3 0.892929
chr4:56013597-56020622 4q B3 0.958476
chr5:109154386-109154906 5q F 0.676600
chr5:113771679-113771745 5q F 1.8350136
chr5:20457725-20477550 5q A3 -0.607812
chr6:120613889-120648725 6q F1 -2.977375
chr6:128389484-128403407 6q F3 -0.679612
chr6:140904129-140992655 6q G2 1.346274
chr6:148163559-148164253 6q G3 0.949989
chr8:124569775-124639500 8q E2 0.9020438
chr8:124648600-124731250 8q E2 -0.706082
chr8:40072950-40088400 8q A4 -0.697459
chr8:48480224-48480698 8q B1.2 0.633400
chr10:93819821-93976621 10q C2 0.619878
chr12:17438940-17439119 12q A1.1 -0.833077
chr12:76765238-76765739 12q C3 -1.265034
chr16:30200995-30205965 16q B2 2.606374
chr16:40096026-40097242 16q B4 -0.822622
chr16:40312038-40315564 16q B4 -0.640034
chr16:40470294-40470935 16q B4 -0.749837
chr17:26679595-26688270 17q A3.3 -0.947260
chr17:56687541-56694616 17q D -0.716584
71
chr18:82862340-82875566 18q E3 -0.746198
chr19:55715078-55776694 19q D2 -1.008789
chr19:60261340-60273465 19q D3 -0.678625
chrX:138969489-138969953 Xq F1 -0.611557
AA545190 (chr6:10921468-10924378) 6q A1 -2.190374
Gldnos (chr9:54116387-54149377) 9q A5.3 -0.899747
Gm10649 (ch8:79272986-79424072) 8q C1 1.237955
Gm12603 (ch4:88696211-88730514) 4q C4 -0.986532
Gm2109 (chr9:83585082-83586854) 9q E2 -0.625288
Gm5083 (chr13:44216536-44220548) 13q A4 -0.609658
Gm839 (chr6:89162191-89166173) 6q D1 -0.756991
0610012G03Rik (chr16:31947137-31948607) 16q B2 -0.679947
1700028E10Rik (chr5:152171250-152198739) 5q G3 -0.805611
1700081H04Rik (chr5:119558245-119564552) 5q F 0.971099
2210409D07Rik (chr18:57791733-57798239) 18q D3 1.004202
2310002D06Rik (chr12:81608193-81618941) 12q C3 -0.726975
2700046A07Rik (chr18:62911328-62916001) 18q E1 -1.240995
4921515E04Rik (chr15:18007892-18299382) 15q A2 -1.425627
4930478P22Rik (chr5:35704202-35710326) 5q B2 0.913002
4930543E12Rik (chr7:120243750-120285529) 7q F1 0.816987
8430426J06Rik (chr15:81073084-81078401) 15q E1 0.918343
9330178D15Rik (chr3:155639318-155671556) 3q H4 -0.818355
E130018N17Rik (chr2:167978103-67980013) 2q H3 0.682404 Scarletltr (chr9:63928568-63935852) 9q C -1.087578
Wbscr25 (chr5:135463303-135477220) 5q G2 0.744069
6.7.3 Identificação e posicionamento dos genes codificadores mais
próximos
Procedeu-se a identificação e posicionamento genômico do gene
codificador mais próximo de cada um dos lncRNAs, abordagem é muito utilizada
no estudo dos lncRNAs. Através do pacote Bed Tools, ferramenta Closest. Foi
possível posicionarmos ao longo do genoma os genes codificadores mais
próximos de cada um dos lncRNAs (Figura 16 e Tabela 2).
Notamos que a maioria dos lncRNAs estão localizados até 10 kb de um
gene codificador de proteína. Alguns lncRNAs se mostraram sobrepostos a
esses genes (distância 0 kb) podendo ser do tipo intrônico, sense ou antisense.
72
Figura 16 Distribuição dos lncRNAs de acordo à sua distância em relação ao gene codificador
de proteína mais próximo no genoma. Em virtude do tamanho, as distâncias, em pares de base são apresentadas em escala logarítmica de base 10.
Tabela 2 Distância entre os genes codificadores de proteínas mais próximos e os lncRNAs modulados por Aire.
lncRNA Gene mais próximo Distância (pb)
chr1:166985480-166986024_R Tbx19 81960
chr1:173353316-173367449_F F11r 243
chr1:23340097-23340552_F Ogfrl1 32711
chr1:42972297-42972716_R Mrps9 9770
chr1:51753968-51803787_R Myo1b 2815
chr2:132079092-132087069_F Pcna 177
chr2:168136389-168136560_R Kcng1 41559
chr2:50917152-50917519_F Rnd3 68440
chr3:41158056-41173053_F Jade1 186603
chr4:131905739-131910814_R Phactr4 1025
chr4:56013597-56020622_R Klf4 468251
chr5:109154386-109154906_F Fgfrl1 18418
chr5:113771679-113771745_F Aym1 14569
chr5:20457725-20477550_R Rsbn1l 86
chr6:120613889-120648725_R Cecr2 0
chr6:128389484-128403407_R Fkbp4 836
chr6:140904129-140992655_F Pde3a 205135
chr6:148163559-148164253_F Ergic2 2664
chr8:124569775-124639500_R Banp 16616
chr8:124648600-124731250_R Zfpm1 74791
chr8:40072950-40088400_R Tusc3 0
chr8:48480224-48480698_R Stox2 42523
73
chr10:93819821-93976621_F Tmcc3 981
chr12:17438940-17439119_F Nol10 2040
chr12:76765238-76765739_R Wdr89 0
chr16:30200995-30205965_R Cpn2 50500
chr16:40096026-40097242_F Igsf11 1068757
chr16:40312038-40315564_F Lsamp 1217891
chr16:40470294-40470935_F Lsamp 1062520
chr17:26679595-26688270_R Ergic1 10187
chr17:56687541-56694616_F Safb2 7749
chr18:82862340-82875566_F Zfp236 215
chr19:55715078-55776694_R Vti1a 13128
chr19:60261340-60273465_R Fam204a 1024
chrX:138969489-138969953_R Acsl4 144412
AA545190 Ndufa4 875995
Gldnos Gldn 0
Gm10649 Nr3c2 2335
Gm12603 Mtap 52760
Gm2109 Elovl4 85445
Gm5083 Cd83 318035
Gm839 Etv6 0
0610012G03Rik Ncbp2 25
1700028E10Rik Vmn2r18 165497
1700081H04Rik Med13l 342800
2210409D07Rik 1700011I03Rik 0
2310002D06Rik Galnt16 1036
2700046A07Rik Spink13 10288
4921515E04Rik Cdh10 450702
4930478P22Rik Hmx1 21440
4930543E12Rik Arntl 65450
8430426J06Rik Mchr1 3691
9330178D15Rik Negr1 553202
E130018N17Rik Adnp 26452
Scarletltr Lctl
29102 Wbscr25 Cldn3
0
6.7.4 Avaliação do potencial codificador dos lncRNAs
Com o intuito de avaliar o potencial codificador dos lncRNAs modulados
por Aire, os respectivos transcritos foram analisados por meio de dois softwares:
Coding Potential Calculator (CPC) e Coding-Potential Assesment Tool (CPAT),
cujos resultados são mostrados na Tabela 3. Como controle e comparação foram
utilizados além dos lncRNAs, 50 genes codificadores randomicamente escolhidos
cujas sequências foram obtidas através do UCSC Genome Browser.
74
Dos 56 lncRNAs modulados por Aire, dez deles não tiveram suas
sequências identificadas apesar de procedermos buscas extensivas. Portanto,
esses RNAs não foram incluídos nesta análise.
Dentre os 46 RNAs analisados, 36 foram considerados lncRNAs sem
potencial codificador de acordo com as duas análises mencionadas (Figura 17).
Como os softwares CPC e CPAT utilizam abordagens diferentes, eles
também apresentam escores diferentes. Segundo a análise realizada pelo CPC,
os escores negativos indicam transcritos não codificadores e os positivos indicam
os codificadores, sendo que a escala é gradual, isto é, quanto menor o valor
(negativo), menor o potencial codificador, e quanto maior o valor, positivo, maior o
potencial codificador. Já a análise pelo CPAT define que valores próximos de 0
indicam RNAs com menor potencial codificador, os valores que se aproximam de
1 indicam RNAs com maior potencial codificador (cutoff = 0.5).
Figura 17 Diagrama de Venn resultante da análise do potencial codificador de lncRNAs
modulados por Aire pelos softwares Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT).
75
Tabela 3 Potencial codificador dos lncRNAs modulados por Aire, segundo análise por Coding
Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT), e seus respectivos escores. PC= potencial codificador; NC= não codificador; C= codificador.
LncRNA
CPC CPAT Score PC Score PC
chr1:23340097-23340552_F
-1.1174 NC 0.524117 0.052411663618296
NC chr1:42972297-42972716_R
-0.868686 NC/fraco 0.031137
NC chr1:51753968-51803787_R
-1.16527 NC 0.074099
NC chr2:132079092-132087069_F
-0.952192 NC/fraco 0.026809
NC chr2:168136389-168136560_R
-1.51765 NC 0.001501
NC chr2:168136389-168136560_R
-1.0431 NC 0.010904
NC chr3:41158056-41173053_F
-0.998832 NC/fraco
0.020401
NC chr4:131905739-131910814_R
-1.08338 NC 0.066420
NC chr5:109154386-109154906_F
-1.07826 NC 0.034967
NC chr6:128389484-128403407_R
0.474943 C/fraco 0.071964
NC chr6:140904129-140992655_F
-1.1484 NC 0.057108
NC chr6:148163559-148164253_F
-1.3231 NC 0.019348
NC chr8:48480224-48480698_R
-0.974074 NC/fraco
0.006676
NC chr10:93819821-93976621_F
0.652656 C/fraco 0.563927
C chr12:17438940-17439119_F
-1.21435 NC 0.010353
NC chr12:76765238-76765739_R
-1.17462 NC 0.001280
0012805
NC chr16:30200995-30205965_R
-0.0449321 NC/fraco 0.076222
NC chr16:40096026-40097242_F
-1.11308 NC 0.018454
NC chr16:40312038-40315564_F
-1.29536 NC 0.009491
NC chr16:40470294-40470935_F
-1.0287 NC 0.027202
NC chr17:26679595-26688270_R
-1.0473 NC 0.035964
NC chr17:56687541-56694616_F
-1.11562 NC 0.040293
NC chr18:82862340-82875566_F
3.05171 C 0.137073
NC chr19:55715078-55776694_R
-0.982277 NC/fraco
0.078869
NC chrX:138969489-138969953_R
-1.33506 NC 0.018988
NC AA545190
-1.02647 NC 0.065524
NC Gldnos
4.09424 C 0.280901
NC Gm10649 0.719603 C/fraco 0.021866
NC Gm12603
-1.04526 NC 0.062977
NC Gm2109
-1.24438 NC 0.076009
NC Gm5083
-0.801628 NC/fraco 0.112012
NC Gm839
2.60907 C 0.410533
NC 0610012G03Rik
1.2344 C 0.758213
C 1700028E10Rik
0.23414 C/fraco 0.021682
NC 1700081H04Rik
0.889214 NC/fraco 0.049884
NC 2210409D07Rik
1.04089 C 0.200118
NC 2310002D06Rik
1.83068 C 0.179129
NC 2700046A07Rik
0.719603 C/fraco 0.217934
NC 4921515E04Rik
0.424853 C/fraco 0.014455
NC 4930478P22Rik
-0.823472 NC/fraco 0.294145
NC 4930543E12Rik
-1.0177 NC 0.032313
NC 8430426J06Rik
-1.20454 NC 0.051467
NC 9330178D15Rik
-0.970053 NC/fraco 0.155912
NC E130018N17Rik
-1.09724 NC 0.081384
NC Scarletltr
1.34505 C 0.061401
NC Wbscr25
0.512386 C/fraco
0.885803
C
76
6.7.5 Contagem de lncRNAs poliadenilados (lncRNAs poli A+)
A análise da sequência dos transcritos dos lncRNAs mostrou que a
maioria deles (41) não apresenta cauda poli A na extremidade 3’. Os poucos
RNAs poli A+ (5), apresentaram caudas variando de 10 a 30 resíduos de adenina
(Figura 18).
Figura 18 Porcentagem de lncRNAs poli A+ e lncRNAs poli A
-.
77
Discussão
78
7. DISCUSSÃO
Os timócitos em desenvolvimento, ainda no interior do timo, interagem
sequencialmente com duas estruturas desse órgão: a região cortical e a região
medular, entrando em contato íntimo com o estroma tímico composto, além de
outras células, pelas células tímicas epiteliais corticais (cTECs) e pelas epiteliais
medulares (mTECs). Esse contato timócitos-células estromais contribui com o
processo de maturação dos linfócitos T (GRIESEMER; SORENSON; HARDY,
2010; GUERDER et al., 2012; KLEIN, 2009; KLEIN et al., 2014; LAAN;
PETERSON, 2013a; LOPES et al., 2015).
Neste ambiente, as células cTECs estão envolvidas com a seleção
positiva dos timócitos e as mTECs com a seleção negativa (ANDERSON;
TAKAHAMA, 2012; MOUCHESS; ANDERSON, 2014; STARR; JAMESON;
HOGQUIST, 2003; TAKADA et al., 2014; TAKAHAMA, 2006).
As células mTECs exibem expressão ectópica de grande diversidade de
PTAs, um fenômeno denominado “expressão gênica promíscua” ou
simplesmente PGE. A expressão dos PTAs é de suma importância durante o
processo de seleção negativa de clones de linfócitos T (timócitos) autorreativos
antes que migrem para a periferia, contribuindo assim com a manutenção da
tolerância central (AKIYAMA et al., 2013; KYEWSKI; DERBINSKI, 2004; UCAR;
RATTAY, 2015).
Células mTECs expressam o gene regulador autoimune (Aire) cuja
proteína (AIRE) controla a expressão de um conjunto grande de PTAs e
consequentemente grande parte da PGE (ANDERSON; SU, 2011; GIRAUD et
al., 2012; LAAN; PETERSON, 2013b). Além de PTAs, Aire também controla a
expressão de diversos miRNAs nestas células (MACEDO et al., 2013; PASSOS;
MENDES-DA-CRUZ; OLIVEIRA, 2015; UCAR et al., 2013).
O gene Aire atua como um regulador transcricional e seu mecanismo de
ação está relacionado com a promoção da transcrição através da liberação da
RNA Pol II travada nas regiões promotoras de genes ao longo da cromatina
(GIRAUD et al., 2012; PETERSON, 2015). Segundo as observações mais
recentes, este seria o modo com que Aire contribui com a promoção da
transcrição de genes codificadores de PTAs em células mTECs.
79
Além de mRNAs, é sabido que a RNA Pol II também transcreve
microRNAs (miRNAs) em células de mamíferos (CORCORAN et al., 2009; LEE
et al., 2004). Baseados nesta propriedade, pesquisadores de nosso laboratório
demonstraram recentemente, e pela primeira vez, que Aire também pode
controlar a expressão de miRNAs em células mTECs murinas (MACEDO et al.,
2013).
Considerando que a RNA Pol II também promove a transcrição de lncRNAs
(GUTTMAN et al., 2009), desenvolvemos então, o raciocínio de que se RNA Pol II
transcreve lncRNAs e se Aire atua em conjunto com essa enzima em células
mTECs, nos pareceu plausível levantar a hipótese que Aire poderia controlar a
expressão deste tipo de RNA. Surgiu, então, o interesse de se realizar uma
investigação sobre a eventual relação entre a expressão de Aire e a expressão de
lncRNAs em células mTECs murinas.
A técnica de microarray foi a escolhida para testarmos esta idéia. Em
especial as lâminas de microarrays da Agilent seriam as mais adequadas, pois
apresentam um formato com o qual poderíamos explorar a expressão tanto dos
mRNAs como dos lncRNAs. Além disso, nosso Laboratório tem a expertise nesta
tecnologia há mais de dez anos, com a qual explora-se o transcriptoma de células
do sistema imune, incluindo as mTECs (FORNARI et al., 2010; MACEDO et al.,
2009, 2013; MAGALHÃES et al., 2005; OLIVEIRA et al., 2013b; SOUSA
CARDOSO et al., 2006).
Para avaliar o efeito dos níveis de expressão do gene Aire sobre os
lncRNAs (o que consistiu no sistema-modelo principal deste trabalho) empregou-
se a técnica de silenciamento gênico de Aire por RNA interferente (siRNA). Este
procedimento também é executado com sucesso em nosso laboratório há mais de
dois anos, manipulando células mTEC in vitro (MACEDO et al., 2013) ou o timo
de camundongos in vivo (OLIVEIRA et al., 2013).
Nossos resultados mostraram que o silenciamento in vitro de Aire em
células mTEC 3.10 foi obtido rapidamente, ou seja, atingindo o máximo da
eficiência após 24 horas da transfecção (Figura 9).
80
O silenciamento de Aire foi capaz de promover um perfil transcricional
(perfil do transcriptoma incluindo mRNAs e lncRNAs) distinto nas células mTECs
transfectadas com siRNA em relação às células controle. Isto foi visualizado com
a aplicação do coeficiente de correlação de Pearson (Figura 12). Com o
agrupamento de amostras (controle e Aire silenciadas) estabelecendo a
correlação de Pearson, ficou claro que o silenciamento de Aire perturbou a
expressão global de mRNAs, como esperado, mas também dos lncRNAs, os
quais representam o foco principal deste trabalho.
Com o intuito de identificar aqueles RNAs diferencialmente expressos entre
os dois tipos de amostras (controle e Aire silenciada) consideramos aqueles
transcritos cujo valor p ≤ 0.05 no teste t moderado e corrigido por FDR (Benjamini
Hochberg) com fold change ≥ 1.5 (Figura 13). O valor de fold change ≥ 1.5 foi
considerado adequado uma vez que os lncRNAs apresentam fraca expressão,
que pode ser até dez vezes menor do que a expressão de mRNAs (CABILI et al.,
2011; DERRIEN et al., 2012; GUTTMAN et al., 2009; PAULI et al., 2012; RAVASI
et al., 2006; SIGOVA et al., 2013; ULITSKY; BARTEL, 2013; ULITSKY et al.,
2011).
O agrupamento hierárquico e o heat-map representados na Figura 14 nos
possibilitou observar que Aire exerceu efeito modulador sobre a expressão de
lncRNAs nas células mTEC 3.10. Dentre os lncRNAs significativamente
modulados por Aire, a maioria teve sua expressão aumentada após o
silenciamento.
Este resultado sugere que sob condições fisiológicas Aire poderia exercer
um efeito modulador negativo, já que quando induzimos artificialmente sua
repressão, muitos lncRNAs apresentam sua expressão aumentada. Entretanto,
esta presunção não se encaixa bem no modelo no qual Aire atuaria em conjunto
com a RNA Pol II.
Este resultado corrobora com diversos estudos que demonstraram que Aire
não atua somente como indutor, mas pode também exercer efeito repressor na
transcrição (ILMARINEN et al., 2008; JOHNNIDIS et al., 2005; SATO et al., 2004;
TAO et al., 2006).
81
Na realidade a proteína AIRE atua em conjunto com diversas proteínas
parceiras durante a modulação transcricional. Uma delas, e a primeira a ser
recrutada é a proteína CBP, um importante co-ativador transcricional, responsável
por promover a acetilação das histonas, gerando uma cromatina
transcricionalmente ativa (ABRAMSON et al., 2010; PETERSON; ORG; REBANE,
2008; PITKÄNEN et al., 2000).
Estudos indicam que é através da interação com a proteína CBP que Aire
exerce efeito dual sobre a expressão gênica, seja ativando a expressão de
determinados genes, seja reprimindo-os. O primeiro registro do mecanismo
através do qual Aire pode atuar reprimindo a expressão gênica surgiu em 2004,
quando Sato e colaboradores (SATO et al., 2004) transfectaram macrófagos
murinos com vetores de expressão de Aire, estimularam estas células com
lipopolissacarídeo LPS, ligante de TLR4 (Toll- like receptor 4) e analisaram a
expressão de diversas citocinas e quimiocinas. Observaram que a citocina
antagonista do receptor alfa de IL-1 (IL-1Ra) teve sua expressão reduzida nas
células transfectadas com o vetor de Aire, mesmo após estimulação. Sabendo-se
que acima (upstream) da região 5’ do gene IL-1Ra encontraram sítios de ligação
da proteína CBP, parceira de AIRE, foi demonstrado que AIRE reprime a
expressão desse gene por competir pela ligação à CBP, isto é, a ligação de AIRE
a CBP resulta na ausência da ligação desse co-ativador transcricional no
promotor do gene da IL-1Ra. O mesmo aconteceu com a expressão das
moléculas de MHC de classe II nestas células.
Este mecanismo é denominado transrepressão, ou seja, o processo pelo
qual uma proteína reprime ou inibe a atividade de uma segunda proteína através
de interação física entre elas (proteína-proteína). A proteína reprimida é
geralmente um fator de transcrição que regula positivamente a expressão gênica,
sendo assim, o efeito da transrepressão é a atenuação da transcrição gênica
(TAO et al., 2006).
De acordo com isto, supomos que este poderá ser o mecanismo utilizado
por AIRE para reprimir a maioria dos lncRNAs Aire-dependentes em células
mTECs, como observado neste trabalho.
82
Johnnidis et al (2005) relataram a repressão de genes exercida por Aire a
partir de análises de microarrays provenientes de células mTEC Aire KO. Os
autores observaram que 93 genes tiveram sua expressão aumentada nas células
Aire KO (JOHNNIDIS et al., 2005). Isto faz supor que o mesmo possa ter atuado
como um repressor desses genes. De acordo com isto, também supomos que
Aire esteja atuando como um repressor dos lncRNAs nas células mTEC 3.10.
Quando investigado se a repressão exercida por Aire envolve outras
proteínas nucleares além da CBP, observou-se que o mesmo também é capaz de
transreprimir também, através de seu domínio PHD1, os fatores de transcrição
NF-kB e p53. (TAO et al., 2006). Este domínio tem sido associado tanto com a
ativação transcricional quanto com a transrepressão exercida por Aire
(PITKÄNEN et al., 2000; TAO et al., 2006).
Em 2009, lncRNAs dependentes da sinalização intracelular mediada por
NF-kB foram descritos em células dendríticas (GUTTMAN et al., 2009). Supondo
que ocorra transrepressão de NF-kB exercida por Aire em células mTECs, essa
poderia pode ser uma via que o mesmo utiliza para reprimir alguns lncRNAs NF-
kB dependentes. Procuramos evidencia disto levantando os lncRNAs NF-kB
dependentes, os mesmos repertoriados por Guttman et al (2009), os quais seriam
reprimidos por Aire nas células mTEC, mas não encontramos nenhum lncRNA em
comum. Isso se deve, provavelmente, ao fato de se tratar de uma comparação
envolvendo dados provenientes de células diferentes uma vez sabe-se que os
lncRNAs são altamente tecido-específicos (CABILI et al., 2011; RAVASI et al.,
2006). Esta é uma via interessante que necessita ser melhor estudada em células
mTECs.
Considerando a possibilidade de que o mecanismo de liberação da RNA
Pol II na cromatina mediada por Aire poderá não se aplicar à transcrição da
maioria dos lncRNAs nas mTECs, uma outra hipótese terá que ser levantada,
talvez considerando a participação da RNA Pol III (SILVA et al., 2011).
Seja como for, o presente trabalho proporciona uma contribuição original
no sentido de que é o primeiro relato sobre a expressão de lncRNAs em células
tímicas e também por tentar associar o efeito do gene Aire nesta classe de RNA.
Isto contribui com o preenchimento de uma lacuna que ainda existe sobre dados
83
de expressão de lncRNAs em tecidos outros além de células tronco embrionárias
ou tecido canceroso, como aparece na maioria das publicações (GUTSCHNER et
al., 2013; GUTTMAN et al., 2009; SILVA et al., 2011; YILDIRIM et al., 2013).
Aqueles lncRNAs os quais observamos sua expressão nas células mTEC,
foram também caracterizados. Iniciamos com a classificação dos lncRNAs
modulados por Aire. O tipo predominante foi o dos lncRNAs intergênico
(lincRNAs) (Figura 15). Esses RNAs têm sido alvo de diversos estudos por serem
abundantes; terem sido os primeiros lncRNAs descritos e devido ao fato que seus
loci não coincidem com o de nenhum gene codificador. Como classe de RNAs,
eles participam de diversas funções celulares, desde imprinting genômico do
cromossomo X na espécie humana, como também com o sequestro de miRNAs,
funcionando como “esponjas de miRNAs” e ainda regulando os níveis
transcricionais de mRNAs, dentre outras funções (GUTTMAN et al., 2009, 2011;
ULITSKY et al., 2011; WANG et al., 2013b; WUTZ; RASMUSSEN; JAENISCH,
2002; YOON et al., 2012).
Devido a amplitude de mecanismos nos quais os lncRNAs em geral
podem estar envolvidos, o papel específico dos lincRNAs nas células mTEC é
ainda difícil prever. No entanto podem, de alguma maneira, estar relacionados
com a PGE.
Guttman (2009) relatou que mais 90% dos transcritos analisados em
células tronco-embrionárias murinas, fibroblastos pulmonares e células
precursoras neuronais puderam ser enquadrados como lincRNAs. Esse valor foi
maior que a proporção encontrada no presente trabalho com células mTECs
(64%), mas concebemos que esta estimativa pode estar subestimada já que ela
foi determinada apenas na tabela de sondas presentes nos microarrays
utilizados neste trabalho cuja atualização data de julho de 2007.
A seguir, realizamos a identificação e análise da distância do gene
codificador mais próximo ao longo do genoma, uma abordagem muito utilizada no
estudo dos lncRNAs. O interesse nesta vizinhança genômica está no
conhecimento da co-modulação, ou seja, muitos lncRNAs podem ser co-
modulados ou co-expressos com os genes codificadores mais próximos, ou até
84
apresentar uma interação funcional com os mesmos (CABILI et al., 2011;
DINGER et al., 2008; GUTTMAN et al., 2009; RAVASI et al., 2006)
A maioria dos lncRNAs modulados por Aire localizaram-se a até 10 kb de
genes codificadores de proteínas (Figura 16). Tal resultado corrobora com o fato
destes lncRNAs serem intergêncios. Guttman (2009) define que os lincRNAs
devem estar a no mínimo 5 kb de distância de algum gene codificador. Corrobora
também com Cabili (2011) que encontrou a mesma distância em vários dos mais
de 8.000 lincRNAs humanos avaliados.
A distância de até 10 kb de algum gene codificador parece ser uma
característica que se se aplica no geral a diversos lincRNAs, uma vez que os
8.000 lincRNAs estudados por Cabili (2011) eram de 24 tecidos diferentes. Assim,
as distâncias genômicas dos lncRNAs (lincRNAs) das células mTECs
encontradas neste trabalho (poucos pb até cerca de 1 Mb, estiveram dentro do
descrito por estes pesquisadores, cujo limiar abrangeu desde poucas bases até 3
Mb de distância. Mas diferiu do encontrado por Ravasi (2006), estudando 20
tecidos humanos diferentes, e cujos lncRNAs estiveram a cerca de 74 kb do gene
codificador mais próximo.
Com o intuito de verificar o potencial codificador das sondas presentes em
nossas lâminas de array, reavaliamos o potencial codificador de cada um dos
lncRNAs Aire dependentes e diferencialmente expressos, sendo que cerca de
23% foram reclassificados como RNAs codificadores.
Sequências codificadoras são comumente caracterizadas por
apresentarem longas open reading frames (ORFs), porém, lncRNAs também
podem apresentar longas ORFs e, portanto, ser classificados como RNAs
codificadores. Por esse motivo, a classificação de RNAs codificadores baseada
somente no tamanho das ORFs não é indicada. Ambos os softwares utilizados
neste trabalho, CPC e CPAT consideram outros parâmetros além do tamanho
das ORFs e, portanto, representam ferramentas confiáveis para tal classificação
(KONG et al., 2007; WANG et al., 2013a).
O conceito de RNA codificador, porém, ainda é controverso, pois existem
mRNAs que não codificam proteínas e lncRNAs que o fazem, codificando
85
pequenas proteínas menores que 100 aa, por meio de suas ORFs, geralmente
curtas. (BAZZINI et al., 2014; DINGER et al., 2008; INGOLIA; LAREAU;
WEISSMAN, 2011; KONDO et al., 2007; MERCER; DINGER; MATTICK, 2009).
Apesar disso, quando comparados os escores obtidos para os lncRNAs com
aqueles obtidos para os 50 genes codificadores conhecidos, utilizados como
controle, fica evidente que o potencial codificador daqueles 23% é muito fraco.
Isto é, o escores obtidos pelo CPC para os genes codificadores foram, em sua
maioria, valores positivos altos, que alcançaram até mesmo 15. Para o software
CPAT, cujo cut off se situa em 0.5, todos os codificadores apresentaram-se
muito próximos de 1, ao contrário dos lncRNAs considerados codificadores em
ambas análises (Tabela 3). O real significado biológico neste caso é difícil
prever, mas não se pode descartar a possibilidade de serem capazes de originar
pequenas proteínas.
Finalmente, analisamos a presença da cauda poli A. Observamos que a
maioria dos lncRNAs não apresentavam poliadenilação em sua porção 3’,
lembrando que a poliadenilação é uma característica de transcritos oriundos da
RNA Pol II (FATICA; BOZZONI, 2014; ZHANG; YANG; CHEN, 2014). Entretanto,
a ausência de poliadenilação em RNAs tem sido amplamente descrita na
literatura, tanto para lncRNAs quanto para transcritos típicos como mRNAs
(CHENG et al., 2005; GU; DAS GUPTA; SCHOENBERG, 1999; SNIDER;
MORRISON-BOGORAD, ; WU et al., 2008; ZHANG; YANG; CHEN, 2014).
Além dos RNAs (lncRNAs ou mRNAs) sem cauda poli A, também foram
relatados alguns com cauda poli A de tamanho reduzido, contendo cerca de 30
resíduos de adeninas (A), embora o reflexo biológico desta característica ainda
não tenha sido elucidado (CHENG et al., 2005; GU; DAS GUPTA;
SCHOENBERG, 1999; WU et al., 2008; YANG et al., 2011)
As caudas poli A dos lncRNAs modulados por Aire observados no
presente trabalho apresentaram-se reduzidas, ou seja, com 10 a 30 resíduos de
A. Esta característica já foi observada no lincRNA MALAT1 expresso em células
epiteliais e em mRNAs de albumina e transferrina em rãs (GU; DAS GUPTA;
SCHOENBERG, 1999; WILUSZ; FREIER; SPECTOR, 2008; ZHANG; YANG;
CHEN, 2014).
86
Inicialmente os lncRNAs sem cauda poli A foram descritos como oriundos
de pre-mRNAs (RAVASI et al., 2006b), porém atualmente se sabe que eles são
transcritos próprios com a capacidade de se manterem estáveis, mesmo na
ausência de longas caudas poli A. Neste caso eles utilizam outros meios para se
manterem estáveis como por exemplo a clivagem pela RNAse P, que origina
transcritos maduros (BROWN et al., 2014; WILUSZ et al., 2012), ou se
complexam com pequenos RNAs nucleolares (small nucleolar RNAs ou
snoRNAs) (YIN et al., 2012) ou ainda, formam estruturas circulares (HANSEN et
al., 2013; MEMCZAK et al., 2013; ZHANG et al., 2013).
Dentre tantas características peculiares, os lncRNAs se fortalecem cada
vez mais com uma classe única dentre os RNAs não codificadores, sendo
importantes determinadores da expressão gênica (JOHNSSON; MORRIS, 2014;
MATTICK; RINN, 2015b; MERCER; DINGER; MATTICK, 2009).
Mas estudos posteriores ainda são necessários para elucidar efeito
repressor de Aire sobre a maioria dos lncRNAs em células mTECs e a
consequência disto sobre a PGE e seu significado sobre a seleção negativa e a
indução da tolerância central.
De qualquer forma, os resultados obtidos neste trabalho evidenciaram, pela
primeira vez, a ação moduladora de Aire sobre a expressão de lncRNAs em
células mTECs além de promover o primeiro relato da expressão desta espécie
de RNAs nestas células, lembrando que eles são altamente tecido específicos e
foram pouco explorados no timo.
87
Conclusões
88
8. CONCLUSÕES
Este é o primeiro relato sobre a expressão de lncRNAs em células mTECs
de camundongos Mus musculus.
Neste trabalho foi possível colher evidências que Aire pode exercer efeito
modulador sobre a expressão de lncRNAs em células mTEC.
A maioria dos lncRNAs modulados por Aire têm disposição genômica do
tipo intergênica, não apresentaram cauda poli A e se localizaram a até 10kb do
gene codificador mais próximo.
89
Referências bibliográficas
90
9. REFERÊNCIAS BIBLIOGRÁFICAS
AALTONEN, J. et al. An autoimmune disease, APECED, caused by mutations in a novel gene featuring two PHD-type zinc-finger domains. Nature genetics, v. 17, n. 4, p. 399–403, dez. 1997.
ABRAMSON, J. et al. Aire’s partners in the molecular control of immunological tolerance. Cell, v. 140, n. 1, p. 123–35, 8 jan. 2010a.
ABRAMSON, J. et al. Aire’s partners in the molecular control of immunological tolerance. Cell, v. 140, n. 1, p. 123–35, 8 jan. 2010b.
AKIRAV, E. M.; RUDDLE, N. H.; HEROLD, K. C. The role of AIRE in human autoimmune disease. Nature reviews. Endocrinology, v. 7, n. 1, p. 25–33, jan. 2011.
AKIYAMA, T. et al. Regulations of gene expression in medullary thymic epithelial cells required for preventing the onset of autoimmune diseases. Frontiers in immunology, v. 4, p. 249, jan. 2013.
AMARAL, P. P.; MATTICK, J. S. Noncoding RNA in development. Mammalian genome : official journal of the International Mammalian Genome Society, v. 19, n. 7-8, p. 454–92, ago. 2008.
ANDERSON, G. et al. Mechanisms of thymus medulla development and function. Current topics in microbiology and immunology, v. 373, p. 19–47, jan. 2014.
ANDERSON, G.; TAKAHAMA, Y. Thymic epithelial cells: working class heroes for T cell development and repertoire selection. Trends in immunology, v. 33, n. 6, p. 256–63, jun. 2012.
ANDERSON, M. S. et al. Projection of an immunological self shadow within the thymus by the aire protein. Science (New York, N.Y.), v. 298, n. 5597, p. 1395–401, 15 nov. 2002.
ANDERSON, M. S.; SU, M. A. Aire and T cell development. Current opinion in immunology, v. 23, n. 2, p. 198–206, abr. 2011.
BAZZINI, A. A. et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO journal, v. 33, n. 9, p. 981–93, 2 maio 2014.
BELTRAN, M. et al. A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition. Genes & development, v. 22, n. 6, p. 756–69, 15 mar. 2008.
BEN-DOR, A.; SHAMIR, R.; YAKHINI, Z. Clustering gene expression patterns. Journal of computational biology : a journal of computational molecular cell biology, v. 6, n. 3-4, p. 281–97, jan. .
91
BENJAMINI, Y.; HOCHBERG, Y. Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society. Series B (Methodological), v. 57, n. 1, p. 289 – 300, 1995.
BOLSTAD, B. M. et al. A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics (Oxford, England), v. 19, n. 2, p. 185–93, 22 jan. 2003.
BOUDIL, A. et al. IL-7 coordinates proliferation, differentiation and Tcra recombination during thymocyte β-selection. Nature immunology, v. 16, n. 4, p. 397–405, abr. 2015.
BOYD, R. L. et al. The thymic microenvironment. Immunology today, v. 14, n. 9, p. 445–59, set. 1993.
BROWN, J. A. et al. Structural insights into the stabilization of MALAT1 noncoding RNA by a bipartite triple helix. Nature structural & molecular biology, v. 21, n. 7, p. 633–40, jul. 2014.
BUZI, F. et al. Autoimmune polyendocrinopathy-candidiasis-ectodermal dystrophy syndrome: time to review diagnostic criteria? The Journal of clinical endocrinology and metabolism, v. 88, n. 7, p. 3146–8, jul. 2003.
CABILI, M. N. et al. Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes & development, v. 25, n. 18, p. 1915–27, 15 set. 2011.
CARNINCI, P. et al. The transcriptional landscape of the mammalian genome. Science (New York, N.Y.), v. 309, n. 5740, p. 1559–63, 2 set. 2005.
CHAKRAVARTY, S.; ZENG, L.; ZHOU, M.-M. Structure and site-specific recognition of histone H3 by the PHD finger of human autoimmune regulator. Structure (London, England : 1993), v. 17, n. 5, p. 670–9, 13 maio 2009.
CHENG, J. et al. Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution. Science (New York, N.Y.), v. 308, n. 5725, p. 1149–54, 20 maio 2005.
CLOOSEN, S. et al. Expression of tumor-associated differentiation antigens, MUC1 glycoforms and CEA, in human thymic epithelial cells: implications for self-tolerance and tumor therapy. Cancer research, v. 67, n. 8, p. 3919–26, 15 abr. 2007.
CORCORAN, D. L. et al. Features of Mammalian microRNA Promoters Emerge from Polymerase II Chromatin Immunoprecipitation Data. PLoS ONE, v. 4, n. 4, p. e5279, 23 abr. 2009.
DERBINSKI, J. et al. Promiscuous gene expression in medullary thymic epithelial cells mirrors the peripheral self. Nature immunology, v. 2, n. 11, p. 1032–9, nov. 2001.
92
DERBINSKI, J. et al. Promiscuous gene expression in thymic epithelial cells is regulated at multiple levels. The Journal of experimental medicine, v. 202, n. 1, p. 33–45, 4 jul. 2005.
DERRIEN, T. et al. The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression. Genome research, v. 22, n. 9, p. 1775–89, 1 set. 2012.
DINGER, M. E. et al. Differentiating protein-coding and noncoding RNA: challenges and ambiguities. PLoS computational biology, v. 4, n. 11, p. e1000176, nov. 2008.
EBERT, M. S.; SHARP, P. A. Emerging roles for natural microRNA sponges. Current biology : CB, v. 20, n. 19, p. R858–61, 12 out. 2010.
EISEN, M. B. et al. Cluster analysis and display of genome-wide expression patterns. Proceedings of the National Academy of Sciences, v. 95, n. 25, p. 14863–14868, 8 dez. 1998.
FARLEY, A. M. et al. Dynamics of thymus organogenesis and colonization in early human development. Development (Cambridge, England), v. 140, n. 9, p. 2015–26, 1 maio 2013.
FATICA, A.; BOZZONI, I. Long non-coding RNAs: new players in cell differentiation and development. Nature reviews. Genetics, v. 15, n. 1, p. 7–21, jan. 2014.
FENG, J. The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator. Genes & Development, v. 20, n. 11, p. 1470–1484, 1 jun. 2006.
FORNARI, T. A. et al. Age-related deregulation of Aire and peripheral tissue antigen genes in the thymic stroma of non-obese diabetic (NOD) mice is associated with autoimmune type 1 diabetes mellitus (DM-1). Molecular and Cellular Biochemistry, v. 342, n. 1-2, p. 21–28, 23 abr. 2010.
GALLEGOS, A. M.; BEVAN, M. J. Central tolerance to tissue-specific antigens mediated by direct and indirect antigen presentation. The Journal of experimental medicine, v. 200, n. 8, p. 1039–49, 18 out. 2004.
GALLEGOS, A. M.; BEVAN, M. J. Central tolerance: good but imperfect. Immunological reviews, v. 209, p. 290–6, fev. 2006.
GIRAUD, M. et al. Aire unleashes stalled RNA polymerase to induce ectopic gene expression in thymic epithelial cells. Proceedings of the National Academy of Sciences of the United States of America, v. 109, n. 2, p. 535–40, 10 jan. 2012.
93
GORDON, J.; MANLEY, N. R. Mechanisms of thymus organogenesis and morphogenesis. Development (Cambridge, England), v. 138, n. 18, p. 3865–78, set. 2011.
GRAY, D. H. D. et al. Developmental kinetics, turnover, and stimulatory capacity of thymic epithelial cells. Blood, v. 108, n. 12, p. 3777–85, 1 dez. 2006.
GRIESEMER, A. D.; SORENSON, E. C.; HARDY, M. A. The role of the thymus in tolerance. Transplantation, v. 90, n. 5, p. 465–74, 15 set. 2010.
GU, H.; DAS GUPTA, J.; SCHOENBERG, D. R. The poly(A)-limiting element is a conserved cis-acting sequence that regulates poly(A) tail length on nuclear pre-mRNAs. Proceedings of the National Academy of Sciences of the United States of America, v. 96, n. 16, p. 8943–8, 3 ago. 1999.
GUERDER, S. et al. Differential processing of self-antigens by subsets of thymic stromal cells. Current opinion in immunology, v. 24, n. 1, p. 99–104, fev. 2012.
GUTSCHNER, T. et al. The noncoding RNA MALAT1 is a critical regulator of the metastasis phenotype of lung cancer cells. Cancer research, v. 73, n. 3, p. 1180–9, 1 fev. 2013.
GUTTMAN, M. et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals. Nature, v. 458, n. 7235, p. 223–227, 2009.
GUTTMAN, M. et al. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature, v. 477, n. 7364, p. 295–300, 28 ago. 2011.
HANSEN, T. B. et al. Natural RNA circles function as efficient microRNA sponges. Nature, v. 495, n. 7441, p. 384–8, 21 mar. 2013.
HARA, T. et al. Identification of IL-7-producing cells in primary and secondary lymphoid organs using IL-7-GFP knock-in mice. Journal of immunology (Baltimore, Md. : 1950), v. 189, n. 4, p. 1577–84, 15 ago. 2012.
HARROW, J. et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome research, v. 22, n. 9, p. 1760–74, set. 2012.
HAYNES, B. F.; HEINLY, C. S. Early human T cell development: analysis of the human thymus at the time of initial entry of hematopoietic stem cells into the fetal thymic microenvironment. The Journal of experimental medicine, v. 181, n. 4, p. 1445–58, 1 abr. 1995.
HEINO, M. et al. Autoimmune regulator is expressed in the cells regulating immune tolerance in thymus medulla. Biochemical and biophysical research communications, v. 257, n. 3, p. 821–5, 21 abr. 1999.
94
HIROKAWA, K. et al. Analysis of the thymic microenvironment by monoclonal antibodies with special reference to thymic nurse cells. Thymus, v. 8, n. 6, p. 349–60, jan. 1986.
HU, W. et al. Long noncoding RNA-mediated anti-apoptotic activity in murine erythroid terminal differentiation. Genes & development, v. 25, n. 24, p. 2573–8, 15 dez. 2011.
HU, Z.; LANCASTER, J. N.; EHRLICH, L. I. R. The Contribution of Chemokines and Migration to the Induction of Central Tolerance in the Thymus. Frontiers in immunology, v. 6, p. 398, 7 jan. 2015.
HUARTE, M. et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response. Cell, v. 142, n. 3, p. 409–19, 6 ago. 2010.
HUBERT, F.-X. et al. Aire regulates the transfer of antigen from mTECs to dendritic cells for induction of thymic tolerance. Blood, v. 118, n. 9, p. 2462–72, 1 set. 2011.
ILMARINEN, T. et al. Functional interaction of AIRE with PIAS1 in transcriptional regulation. Molecular immunology, v. 45, n. 7, p. 1847–62, abr. 2008.
INGOLIA, N. T.; LAREAU, L. F.; WEISSMAN, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell, v. 147, n. 4, p. 789–802, 11 nov. 2011.
ISHII, T. et al. Novel mutations of the autoimmune regulator gene in two siblings with autoimmune polyendocrinopathy-candidiasis-ectodermal dystrophy. The Journal of clinical endocrinology and metabolism, v. 85, n. 8, p. 2922–6, ago. 2000.
JOFFRE, O. P. et al. Cross-presentation by dendritic cells. Nature reviews. Immunology, v. 12, n. 8, p. 557–69, ago. 2012.
JOHNNIDIS, J. B. et al. Chromosomal clustering of genes controlled by the aire transcription factor. Proceedings of the National Academy of Sciences of the United States of America, v. 102, n. 20, p. 7233–8, 17 maio 2005.
JOHNSSON, P. et al. A pseudogene long-noncoding-RNA network regulates PTEN transcription and translation in human cells. Nature structural & molecular biology, v. 20, n. 4, p. 440–6, abr. 2013.
JOHNSSON, P.; MORRIS, K. V. Expanding the functional role of long noncoding RNAs. Cell research, v. 24, n. 11, p. 1284–5, nov. 2014.
JOLICOEUR, C.; HANAHAN, D.; SMITH, K. M. T-cell tolerance toward a transgenic beta-cell antigen and transcription of endogenous pancreatic genes in thymus. Proceedings of the National Academy of Sciences, v. 91, n. 14, p. 6707–6711, 5 jul. 1994.
95
KEANE, P.; CEREDIG, R.; SEOIGHE, C. Promiscuous mRNA splicing under the control of AIRE in medullary thymic epithelial cells. Bioinformatics (Oxford, England), v. 31, n. 7, p. 986–90, 1 abr. 2015.
KHALIL, A. M. et al. Many human large intergenic noncoding RNAs associate with chromatin-modifying complexes and affect gene expression. Proceedings of the National Academy of Sciences of the United States of America, v. 106, n. 28, p. 11667–72, 14 jul. 2009.
KIRCHNER, T. et al. Pathogenesis of myasthenia gravis. Acetylcholine receptor-related antigenic determinants in tumor-free thymuses and thymic epithelial tumors. The American journal of pathology, v. 130, n. 2, p. 268–80, fev. 1988.
KISAND, K. et al. Chronic mucocutaneous candidiasis in APECED or thymoma patients correlates with autoimmunity to Th17-associated cytokines. The Journal of experimental medicine, v. 207, n. 2, p. 299–308, 15 fev. 2010.
KLEIN, L. et al. CD4 T cell tolerance to human C-reactive protein, an inducible serum protein, is mediated by medullary thymic epithelium. The Journal of experimental medicine, v. 188, n. 1, p. 5–16, 6 jul. 1998.
KLEIN, L. Dead man walking: how thymocytes scan the medulla. Nature immunology, v. 10, n. 8, p. 809–11, ago. 2009.
KLEIN, L. et al. Autonomous versus dendritic cell-dependent contributions of medullary thymic epithelial cells to central tolerance. Trends in immunology, v. 32, n. 5, p. 188–93, maio 2011.
KLEIN, L. et al. Positive and negative selection of the T cell repertoire: what thymocytes see (and don’t see). Nature reviews. Immunology, v. 14, n. 6, p. 377–91, jun. 2014.
KOBLE, C.; KYEWSKI, B. The thymic medulla: a unique microenvironment for intercellular self-antigen transfer. The Journal of experimental medicine, v. 206, n. 7, p. 1505–13, 6 jul. 2009.
KOH, A. S. et al. Global relevance of Aire binding to hypomethylated lysine-4 of histone-3. Proceedings of the National Academy of Sciences of the United States of America, v. 107, n. 29, p. 13016–21, 20 jul. 2010.
KONDO, T. et al. Small peptide regulators of actin-based cell morphogenesis encoded by a polycistronic mRNA. Nature cell biology, v. 9, n. 6, p. 660–5, jun. 2007.
KONG, L. et al. CPC: assess the protein-coding potential of transcripts using sequence features and support vector machine. Nucleic acids research, v. 35, n. Web Server issue, p. W345–9, jul. 2007.
KUMAR, P. G. et al. The autoimmune regulator (AIRE) is a DNA-binding protein. The Journal of biological chemistry, v. 276, n. 44, p. 41357–64, 2 nov. 2001.
96
KYEWSKI, B.; DERBINSKI, J. Self-representation in the thymus: an extended view. Nature reviews. Immunology, v. 4, n. 9, p. 688–98, set. 2004.
KYEWSKI, B.; FEUERER, M. Love is in the Aire: mTECs share their assets. Immunity, v. 41, n. 3, p. 343–5, 18 set. 2014.
KYEWSKI, B.; KLEIN, L. A central role for central tolerance. Annual review of immunology, v. 24, p. 571–606, jan. 2006.
KYEWSKI, B.; PETERSON, P. Aire, master of many trades. Cell, v. 140, n. 1, p. 24–6, 8 jan. 2010.
LAAN, M.; PETERSON, P. The many faces of aire in central tolerance. Frontiers in immunology, v. 4, p. 326, jan. 2013a.
LAAN, M.; PETERSON, P. The many faces of aire in central tolerance. Frontiers in immunology, v. 4, p. 326, 11 jan. 2013b.
LAEMMLI, U. K. Cleavage of structural proteins during the assembly of the head of bacteriophage T4. Nature, v. 227, n. 5259, p. 680–5, 15 ago. 1970.
LEAVY, O. B cells: Mediators of central tolerance. Nature reviews. Immunology, v. 15, n. 7, p. 404, 25 jun. 2015.
LEE, Y. et al. MicroRNA genes are transcribed by RNA polymerase II. The EMBO journal, v. 23, n. 20, p. 4051–60, 13 out. 2004.
LEUCCI, E. et al. microRNA-9 targets the long non-coding RNA MALAT1 for degradation in the nucleus. Scientific reports, v. 3, p. 2535, jan. 2013.
LEVINSON, A. I. et al. Intrathymic expression of neuromuscular acetylcholine receptors and the immunpathogenesis of myasthenia gravis. Immunologic research, v. 27, n. 2-3, p. 399–408, jan. 2003.
LI, J. et al. Thymus-homing peripheral dendritic cells constitute two of the three major subsets of dendritic cells in the steady-state thymus. The Journal of experimental medicine, v. 206, n. 3, p. 607–22, 16 mar. 2009.
LINTON, P. J.; DORSHKIND, K. Age-related changes in lymphocyte development and function. Nature immunology, v. 5, n. 2, p. 133–9, fev. 2004.
LIU, H. et al. Mice resistant to experimental autoimmune encephalomyelitis have increased thymic expression of myelin basic protein and increased MBP specific T cell tolerance. Journal of Neuroimmunology, v. 115, n. 1-2, p. 118–126, 2 abr. 2001.
LOEWER, S. et al. Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells. Nature genetics, v. 42, n. 12, p. 1113–7, dez. 2010.
97
LOPES, N. et al. Thymic Crosstalk Coordinates Medulla Organization and T-Cell Tolerance Induction. Frontiers in immunology, v. 6, p. 365, jan. 2015.
MA, L.; BAJIC, V. B.; ZHANG, Z. On the classification of long non-coding RNAs. RNA biology, v. 10, n. 6, p. 925–33, jun. 2013.
MACEDO, C. et al. Evidence for a network transcriptional control of promiscuous gene expression in medullary thymic epithelial cells. Molecular immunology, v. 46, n. 16, p. 3240–4, out. 2009.
MACEDO, C. et al. Autoimmune regulator (Aire) controls the expression of microRNAs in medullary thymic epithelial cells. Immunobiology, v. 218, n. 4, p. 554–60, abr. 2013.
MAGALHÃES, D. A. R. et al. Promiscuous gene expression in the thymus: the root of central tolerance. Clinical & developmental immunology, v. 13, n. 2-4, p. 81–99, jan. .
MAGALHÃES, D. A. R. et al. Hybridization signatures during thymus ontogeny reveals modulation of genes coding for T-cell signaling proteins. Molecular immunology, v. 42, n. 9, p. 1043–8, maio 2005.
MÅNSSON, R. et al. Pearson correlation analysis of microarray data allows for the identification of genetic targets for early B-cell factor. The Journal of biological chemistry, v. 279, n. 17, p. 17905–13, 23 abr. 2004.
MARTIANOV, I. et al. Repression of the human dihydrofolate reductase gene by a non-coding interfering transcript. Nature, v. 445, n. 7128, p. 666–70, 8 fev. 2007.
MATTICK, J. S.; RINN, J. L. Discovery and annotation of long noncoding RNAs. Nature structural & molecular biology, v. 22, n. 1, p. 5–7, jan. 2015a.
MATTICK, J. S.; RINN, J. L. Discovery and annotation of long noncoding RNAs. Nature structural & molecular biology, v. 22, n. 1, p. 5–7, jan. 2015b.
MEAGER, A. et al. Anti-Interferon Autoantibodies in Autoimmune Polyendocrinopathy Syndrome Type 1. PLoS Medicine, v. 3, n. 7, p. e289, 2006.
MEMCZAK, S. et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature, v. 495, n. 7441, p. 333–8, 21 mar. 2013.
MERCER, T. R.; DINGER, M. E.; MATTICK, J. S. Long non-coding RNAs: insights into functions. Nature reviews. Genetics, v. 10, n. 3, p. 155–9, mar. 2009.
MEREDITH, M. et al. Aire controls gene expression in the thymic epithelium with ordered stochasticity. Nature immunology, v. 16, n. 9, p. 942–949, set. 2015.
98
MISSLITZ, A. et al. Thymic T cell development and progenitor localization depend on CCR7. The Journal of experimental medicine, v. 200, n. 4, p. 481–91, 16 ago. 2004.
MIZUOCHI, T. et al. Medullary but not cortical thymic epithelial cells present soluble antigens to helper T cells. The Journal of experimental medicine, v. 175, n. 6, p. 1601–5, 1 jun. 1992.
MONTECINO-RODRIQUEZ, E.; MIN, H.; DORSHKIND, K. Reevaluating current models of thymic involution. Seminars in immunology, v. 17, n. 5, p. 356–61, out. 2005.
MORRIS, G. P.; ALLEN, P. M. How the TCR balances sensitivity and specificity for the recognition of self and pathogens. Nature immunology, v. 13, n. 2, p. 121–8, fev. 2012.
MOUCHESS, M. L.; ANDERSON, M. Central tolerance induction. Current topics in microbiology and immunology, v. 373, p. 69–86, jan. 2014.
NAGAMINE, K. et al. Positional cloning of the APECED gene. Nature genetics, v. 17, n. 4, p. 393–8, dez. 1997.
NIHEI, O. K. et al. A novel form of cellular communication among thymic epithelial cells: intercellular calcium wave propagation. AJP: Cell Physiology, v. 285, n. 5, p. C1304–C1313, 23 jul. 2003.
OGAWA, Y.; SUN, B. K.; LEE, J. T. Intersection of the RNA interference and X-inactivation pathways. Science (New York, N.Y.), v. 320, n. 5881, p. 1336–41, 6 jun. 2008.
OH, J.; SHIN, J.-S. The Role of Dendritic Cells in Central Tolerance. Immune network, v. 15, n. 3, p. 111–20, jun. 2015.
OLIVEIRA, E. H. et al. Expression profile of peripheral tissue antigen genes in medullary thymic epithelial cells (mTECs) is dependent on mRNA levels of autoimmune regulator (Aire). Immunobiology, v. 218, n. 1, p. 96–104, jan. 2013a.
OLIVEIRA, E. H. et al. Expression profile of peripheral tissue antigen genes in medullary thymic epithelial cells (mTECs) is dependent on mRNA levels of autoimmune regulator (Aire). Immunobiology, v. 218, n. 1, p. 96–104, jan. 2013b.
OVEN, I. et al. AIRE recruits P-TEFb for transcriptional elongation of target genes in medullary thymic epithelial cells. Molecular and cellular biology, v. 27, n. 24, p. 8815–23, dez. 2007.
PALMER, E. Negative selection--clearing out the bad apples from the T-cell repertoire. Nature reviews. Immunology, v. 3, n. 5, p. 383–91, maio 2003.
99
PASSOS, G. A.; MENDES-DA-CRUZ, D. A.; OLIVEIRA, E. H. The Thymic Orchestration Involving Aire, miRNAs, and Cell-Cell Interactions during the Induction of Central Tolerance. Frontiers in immunology, v. 6, p. 352, 14 jan. 2015.
PAULI, A. et al. Systematic identification of long noncoding RNAs expressed during zebrafish embryogenesis. Genome research, v. 22, n. 3, p. 577–91, mar. 2012.
PEARSE, G. Normal structure, function and histology of the thymus. Toxicologic pathology, v. 34, n. 5, p. 504–14, jan. 2006.
PERERA, J. et al. Autoreactive thymic B cells are efficient antigen-presenting cells of cognate self-antigens for T cell negative selection. Proceedings of the National Academy of Sciences of the United States of America, v. 110, n. 42, p. 17011–6, 15 out. 2013.
PERHEENTUPA, J. APS-I/APECED: the clinical disease and therapy. Endocrinology and metabolism clinics of North America, v. 31, n. 2, p. 295–320, vi, jun. 2002.
PETERSON, P. Sirt-ainly Aire. Nature immunology, v. 16, n. 7, p. 680–1, jul. 2015.
PETERSON, P.; ORG, T.; REBANE, A. Transcriptional regulation by AIRE: molecular mechanisms of central tolerance. Nature reviews. Immunology, v. 8, n. 12, p. 948–57, dez. 2008.
PETRIE, H. T.; ZÚÑIGA-PFLÜCKER, J. C. Zoned out: functional mapping of stromal signaling microenvironments in the thymus. Annual review of immunology, v. 25, p. 649–79, jan. 2007.
PITKÄNEN, J. et al. The autoimmune regulator protein has transcriptional transactivating properties and interacts with the common coactivator CREB-binding protein. The Journal of biological chemistry, v. 275, n. 22, p. 16802–9, 2 jun. 2000.
PUGLIESE, A. et al. The insulin gene is transcribed in the human thymus and transcription levels correlated with allelic variation at the INS VNTR-IDDM2 susceptibility locus for type 1 diabetes. Nature genetics, v. 15, n. 3, p. 293–7, mar. 1997.
RAMSEY, C. et al. Aire deficient mice develop multiple features of APECED phenotype and show altered immune response. Human molecular genetics, v. 11, n. 4, p. 397–409, 15 fev. 2002.
RAVASI, T. et al. Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome. Genome research, v. 16, n. 1, p. 11–9, jan. 2006a.
100
RAVASI, T. et al. Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome. Genome research, v. 16, n. 1, p. 11–9, jan. 2006b.
RINN, J. L.; CHANG, H. Y. Genome regulation by long noncoding RNAs. Annual review of biochemistry, v. 81, p. 145–66, jan. 2012.
RYAN, K. R. et al. CD4+CD25+ T-regulatory cells are decreased in patients with autoimmune polyendocrinopathy candidiasis ectodermal dystrophy. The Journal of allergy and clinical immunology, v. 116, n. 5, p. 1158–9, nov. 2005.
SANSOM, S. N. et al. Population and single-cell genomics reveal the Aire dependency, relief from Polycomb silencing, and distribution of self-antigen expression in thymic epithelia. Genome research, v. 24, n. 12, p. 1918–31, 15 dez. 2014.
SATO, K. et al. Aire downregulates multiple molecules that have contradicting immune-enhancing and immune-suppressive functions. Biochemical and biophysical research communications, v. 318, n. 4, p. 935–40, 11 jun. 2004.
SEDDON, B. Thymic IL-7 signaling goes beyond survival. Nature Immunology, v. 16, n. 4, p. 337–338, 19 mar. 2015.
SIGOVA, A. A. et al. Divergent transcription of long noncoding RNA/mRNA gene pairs in embryonic stem cells. Proceedings of the National Academy of Sciences of the United States of America, v. 110, n. 8, p. 2876–81, 19 fev. 2013.
SILVA, J. M. et al. LSINCT5 is over expressed in breast and ovarian cancer and affects cellular proliferation. RNA Biology, v. 8, n. 3, p. 496–505, jan. 2011.
SMITH, K. M. et al. Pancreatic gene expression in rare cells of thymic medulla: evidence for functional contribution to T cell tolerance. International immunology, v. 9, n. 9, p. 1355–65, set. 1997.
SMYTH, G. limma: Linear Models for Microarray Data. [s.l: s.n.].
SNIDER, B. J.; MORRISON-BOGORAD, M. Brain non-adenylated mRNAs. Brain research. Brain research reviews, v. 17, n. 3, p. 263–82, jan. .
SOSPEDRA, M. et al. Transcription of a broad range of self-antigens in human thymus suggests a role for central mechanisms in tolerance toward peripheral antigens. Journal of immunology (Baltimore, Md. : 1950), v. 161, n. 11, p. 5918–29, 1 dez. 1998.
SOUSA CARDOSO, R. et al. Onset of promiscuous gene expression in murine fetal thymus organ culture. Immunology, v. 119, n. 3, p. 369–75, nov. 2006.
STARR, T. K.; JAMESON, S. C.; HOGQUIST, K. A. Positive and negative selection of T cells. Annual review of immunology, v. 21, p. 139–76, jan. 2003.
101
ST-PIERRE, C. et al. Differential Features of AIRE-Induced and AIRE-Independent Promiscuous Gene Expression in Thymic Epithelial Cells. Journal of immunology (Baltimore, Md. : 1950), v. 195, n. 2, p. 498–506, 15 jul. 2015.
STRUHL, K. Transcriptional noise and the fidelity of initiation by RNA polymerase II. Nature structural & molecular biology, v. 14, n. 2, p. 103–5, fev. 2007.
TAKADA, K. et al. Development and function of cortical thymic epithelial cells. Current topics in microbiology and immunology, v. 373, p. 1–17, jan. 2014.
TAKAHAMA, Y. Journey through the thymus: stromal guides for T-cell development and selection. Nature reviews. Immunology, v. 6, n. 2, p. 127–35, fev. 2006.
TAO, Y. et al. AIRE recruits multiple transcriptional components to specific genomic regions through tethering to nuclear matrix. Molecular immunology, v. 43, n. 4, p. 335–45, fev. 2006.
TOWBIN, H.; STAEHELIN, T.; GORDON, J. Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proceedings of the National Academy of Sciences of the United States of America, v. 76, n. 9, p. 4350–4, set. 1979.
TYKOCINSKI, L.-O. et al. Epigenetic regulation of promiscuous gene expression in thymic medullary epithelial cells. Proceedings of the National Academy of Sciences of the United States of America, v. 107, n. 45, p. 19426–31, 9 nov. 2010.
UCAR, O. et al. An evolutionarily conserved mutual interdependence between Aire and microRNAs in promiscuous gene expression. European journal of immunology, v. 43, n. 7, p. 1769–78, jul. 2013.
UCAR, O.; RATTAY, K. Promiscuous Gene Expression in the Thymus: A Matter of Epigenetics, miRNA, and More? Frontiers in immunology, v. 6, p. 93, 3 jan. 2015.
UIBO, R. et al. Autoantibodies to cytochrome P450 enzymes P450scc, P450c17, and P450c21 in autoimmune polyglandular disease types I and II and in isolated Addison’s disease. The Journal of clinical endocrinology and metabolism, v. 78, n. 2, p. 323–8, fev. 1994.
ULITSKY, I. et al. Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution. Cell, v. 147, n. 7, p. 1537–50, 23 dez. 2011.
ULITSKY, I.; BARTEL, D. P. lincRNAs: genomics, evolution, and mechanisms. Cell, v. 154, n. 1, p. 26–46, 3 jul. 2013.
102
VAFIADIS, P. et al. Insulin expression in human thymus is modulated by INS VNTR alleles at the IDDM2 locus. Nature genetics, v. 15, n. 3, p. 289–92, mar. 1997.
VANCE, K. W.; PONTING, C. P. Transcriptional regulatory functions of nuclear long noncoding RNAs. Trends in genetics : TIG, v. 30, n. 8, p. 348–55, ago. 2014.
WALTERS, S. N. et al. A role for intrathymic B cells in the generation of natural regulatory T cells. Journal of immunology (Baltimore, Md. : 1950), v. 193, n. 1, p. 170–6, 1 jul. 2014.
WANG, L. et al. CPAT: Coding-Potential Assessment Tool using an alignment-free logistic regression model. Nucleic acids research, v. 41, n. 6, p. e74, 1 abr. 2013a.
WANG, P. et al. The STAT3-binding long noncoding RNA lnc-DC controls human dendritic cell differentiation. Science (New York, N.Y.), v. 344, n. 6181, p. 310–3, 18 abr. 2014.
WANG, X. et al. Induced ncRNAs allosterically modify RNA-binding proteins in cis to inhibit transcription. Nature, v. 454, n. 7200, p. 126–30, 3 jul. 2008.
WANG, Y. et al. Endogenous miRNA sponge lincRNA-RoR regulates Oct4, Nanog, and Sox2 in human embryonic stem cell self-renewal. Developmental cell, v. 25, n. 1, p. 69–80, 15 abr. 2013b.
WILLINGHAM, A. T.; GINGERAS, T. R. TUF love for “junk” DNA. Cell, v. 125, n. 7, p. 1215–20, 30 jun. 2006.
WILUSZ, J. E. et al. A triple helix stabilizes the 3’ ends of long noncoding RNAs that lack poly(A) tails. Genes & development, v. 26, n. 21, p. 2392–407, 1 nov. 2012.
WILUSZ, J. E.; FREIER, S. M.; SPECTOR, D. L. 3’ end processing of a long nuclear-retained noncoding RNA yields a tRNA-like cytoplasmic RNA. Cell, v. 135, n. 5, p. 919–32, 28 nov. 2008.
WU, L.; SHORTMAN, K. Heterogeneity of thymic dendritic cells. Seminars in immunology, v. 17, n. 4, p. 304–12, ago. 2005.
WU, Q. et al. Poly A- transcripts expressed in HeLa cells. PloS one, v. 3, n. 7, p. e2803, jan. 2008.
WU, Z. et al. Regulation of lncRNA expression. Cellular & molecular biology letters, v. 19, n. 4, p. 561–75, dez. 2014.
WUTZ, A.; RASMUSSEN, T. P.; JAENISCH, R. Chromosomal silencing and localization are mediated by different domains of Xist RNA. Nature genetics, v. 30, n. 2, p. 167–74, fev. 2002.
103
YAMANO, T. et al. Thymic B Cells Are Licensed to Present Self Antigens for Central T Cell Tolerance Induction. Immunity, v. 42, n. 6, p. 1048–1061, 16 jun. 2015.
YAMANO, T.; STEINERT, M.; KLEIN, L. Thymic B Cells and Central T Cell Tolerance. Frontiers in immunology, v. 6, p. 376, jan. 2015.
YANG, L. et al. Genomewide characterization of non-polyadenylated RNAs. Genome biology, v. 12, n. 2, p. R16, jan. 2011.
YILDIRIM, E. et al. Xist RNA is a potent suppressor of hematologic cancer in mice. Cell, v. 152, n. 4, p. 727–42, 14 fev. 2013.
YIN, Q.-F. et al. Long noncoding RNAs with snoRNA ends. Molecular cell, v. 48, n. 2, p. 219–30, 26 out. 2012.
YOON, J.-H. et al. LincRNA-p21 Suppresses Target mRNA Translation. Molecular Cell, v. 47, n. 4, p. 648–655, 24 ago. 2012.
YOON, J.-H.; ABDELMOHSEN, K.; GOROSPE, M. Functional interactions among microRNAs and long noncoding RNAs. Seminars in cell & developmental biology, v. 34, p. 9–14, out. 2014.
ZHANG, S. L.; BHANDOOLA, A. Trafficking to the thymus. Current topics in microbiology and immunology, v. 373, p. 87–111, jan. 2014.
ZHANG, Y. et al. Circular intronic long noncoding RNAs. Molecular cell, v. 51, n. 6, p. 792–806, 26 set. 2013.
ZHANG, Y.; YANG, L.; CHEN, L.-L. Life without A tail: new formats of long noncoding RNAs. The international journal of biochemistry & cell biology, v. 54, p. 338–49, set. 2014.
ZHAO, J. et al. Polycomb proteins targeted by a short repeat RNA to the mouse X chromosome. Science (New York, N.Y.), v. 322, n. 5902, p. 750–6, 31 out. 2008.
ZLOTOFF, D. A. et al. CCR7 and CCR9 together recruit hematopoietic progenitors to the adult thymus. Blood, v. 115, n. 10, p. 1897–905, 11 mar. 2010.