MARITZA QUEIROZ SALAS MOSELLA -...

UNIVERSIDADE DE SÃO PAULO

FACULDADE DE MEDICINA DE RIBEIRÃO PRETO

PROGRAMA DE PÓS-GRADUAÇÃO EM IMUNOLOGIA BÁSICA E APLICADA

MARITZA QUEIROZ SALAS MOSELLA

Efeito do gene Autoimmune regulator (Aire) sobre a expressão de

RNAs longos não codificadores em células tímicas epiteliais

medulares

Ribeirão Preto - SP

2015




medulares

Ribeirão Preto - SP

2015

Dissertação apresentada ao Programa

de Pós-graduação em Imunologia

Básica e Aplicada da Faculdade de

Medicina de Ribeirão Preto, da

Universidade de São Paulo, para

obtenção do título de Mestre em

Ciências.

Área de Concentração: Imunologia

Básica e Aplicada

Orientador: Prof. Dr. Geraldo Aleixo

da Silva Passos Júnior

AUTORIZO A REPRODUÇÃO E DIVULGAÇÃO TOTAL OU PARCIAL DESTE TRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRÔNICO, PARA FINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

FICHA CATALOGRÁFICA

Mosella, Maritza Queiroz Salas Efeito do gene Autoimmune regulator (Aire) sobre a expressão de RNAs longos não codificadores em células tímicas epiteliais medulares. Ribeirão Preto, 2015 103p.; Il.;30cm Dissertação de Mestrado, apresentada à Faculdade de Medicina de Ribeirão Preto/USP. Área de concentração: Imunologia Básica e Aplicada. Orientador: Passos, Geraldo Aleixo.

1.Timo 2. Células tímicas epiteliais medulares (mTECs) 3. gene Autoimmune regulator (Aire) 4. RNAs longos não codificadores (lncRNAs) 5. Expressão gênica.

Trabalho realizado no Laboratório de Imunogenética Molecular, localizado no

Departamento de Genética da Faculdade de Medicina de Ribeirão Preto da

Universidade de São Paulo, com auxílio Financeiro da Capes, CNPq e FAPESP.

FOLHA DE APROVAÇÃO




medulares

Aprovada em: ___ / ___ / ___

Banca Examinadora

Dissertação apresentada ao Programa de

Pós-graduação em Imunologia Básica e

Aplicada da Faculdade de Medicina de

Ribeirão Preto, da Universidade de São

Paulo, para obtenção do título de Mestre em

Ciências.

Área de Concentração: Imunologia Básica e

Aplicada

Dedico este trabalho aos meus pais, Enrique e Maria de Fátima pela confiança,

estímulo e amor incondicionais a mim conferidos.

À minha irmã, Walkiria, exemplo de perseverança e hombridade.

AGRADECIMENTOS

Agradeço primeiramente aos meus pais, Enrique e Maria de Fátima pelo esforço,

dedicação e carinho dedicados a mim, todos estes anos, pelo incentivo ao estudo e

busca pelo conhecimento. Sem vocês nada disso seria possível.

Meus sinceros agradecimentos a todas as pessoas que colaboraram e participaram

direta ou indiretamente da realização deste trabalho, e contribuíram para a minha

formação profissional.

Agradeço imensamente ao Prof. Dr. Geraldo Aleixo da Silva Passos, pela orientação

e dedicação durante o desenvolvimento deste trabalho. Agradeço pela confiança a

mim depositada e pela paciência e incentivo constantes. Sem dúvidas foi um período

de intenso aprendizado, tanto sob o ponto de vista acadêmico/profissional, quanto

pessoal.

Ao professor Dr. Denis Puthier da Université Aix-Marseille, França, pelos

ensinamentos intensivos e colaboração direta neste trabalho quando de sua visita

em nosso laboratório.

Ao Programa de Pós-Graduação em Imunologia Básica e Aplicada, da Faculdade de

Medicina de Ribeirão Preto, especialmente ao coordenador Prof. Dr. João Santana

da Silva. Agradeço também os docentes pelo conhecimento repassado e

contribuições para minha formação. E em especial, à secretária Ana Cristine

Ferreira, sempre muito solícita, pelo apoio e paciência dispensados durante o

mestrado.

À FAPESP pelo apoio financeiro necessário para a realização deste trabalho e ao

CNPq pela bolsa concedida.

Aos colegas do Grupo de Imunogenética Molecular do Departamento de Genética

da FMRP-USP, agradeço pela convivência agradável e colaboração profissional. Em

especial às amigas Nicole Pezzi e Rafaela Felício, por tornarem a jornada mais leve.

Às minhas grandes amigas de infância Mariana Telles, Amanda, Louise, Renata,

Fabiana, Tauany e Mariana Terron, agradeço pela amizade incondicional, união e

estímulo em todos os momentos; mesmo que à distância, por sempre acreditar em

mim e me dar força para enfrentar os obstáculos.

Aos amigos que a pós-graduação me proporcionou, Gabriela, Diana e Mikhael pelo

apoio diário e pela agradável convivência.

Aos membros da banca examinadora pela disponibilidade e contribuições.

A todos aqueles que, mesmo não tendo sido mencionados, contribuíram para a

realização deste trabalho, durante esta jornada educacional.

Muito obrigada!

Maritza Queiroz Salas Mosella.

“O estudo em geral, a busca da verdade e da beleza são domínios em que nos é

consentido ficar crianças toda a vida”.

Albert Einstein

SUMARIO LISTA DE FIGURAS ................................................................................................ 13

LISTA DE TABELAS ............................................................................................... 15

LISTA DE ABREVIATURAS .................................................................................... 16

RESUMO ................................................................................................................. 19

ABSTRACT ............................................................................................................. 20

1. INTRODUÇÃO ..................................................................................................... 22

1.1 Estrutura do timo ............................................................................................. 22

1.2 Função tímica ................................................................................................. 24

1.3 Expressão gênica promíscua (PGE) em células epiteliais medulares tímicas . 25

1.4 Regulação da expressão gênica promíscua no timo ....................................... 28

1.5 A descoberta do gene Autoimmune regulator (Aire) ........................................ 29

1.6 Mecanismo de ação de Aire ............................................................................ 30

1.7 Aire e autoimunidade ...................................................................................... 33

1.8 A descoberta dos RNAs longos não codificadores .......................................... 34

1.9 Definição e classificação dos RNAs longos não codificadores ........................ 34

1.10 Características dos RNAs longos não codificadores ..................................... 36

1.11 Função dos RNAs longos não codificadores ................................................. 37

2. HIPÓTESE ........................................................................................................... 40

3. OBJETIVOS ......................................................................................................... 42

3.1 Objetivo Geral ................................................................................................. 42

3.2 Objetivos específicos ...................................................................................... 42

4. DELINEAMENTO EXPERIMENTAL .................................................................... 44

5. MATERIAL E MÉTODOS .................................................................................... 47

5.1 Linhagem celular ............................................................................................. 47

5.2 Silenciamento de Aire em mTEC 3.10 por RNA interferente (siRNA) .............. 47

5.3 Extração de RNA total ..................................................................................... 48

5.4 Quantificação e avaliação da pureza das preparações de RNA total .............. 50

5.5 Avaliação da integridade das preparações de RNA total ................................. 50

5.6 Reação de transcrição reversa dos mRNAs .................................................... 52

5.7 Reação de polimerização em cadeia quantitativa e em tempo real (qRT-PCR) ............................................................................................................................. 52

5.8 Extração protéica ............................................................................................ 53

5.9 Eletroforese em Gel de Poliacrilamida na Presença de SDS (SDS-PAGE) .... 54

5.10 Western Blot ................................................................................................. 54

5.11 Oligomicroarrays ........................................................................................... 55

5.12 Aquisição de imagens de hibridação ............................................................. 56

5.13 Quantificação dos dados de microarrays ...................................................... 56

5.14 Análise dos dados de microarrays ................................................................ 57

5.14.1 Correção do background ............................................................................... 57

5.14.2 Normalização dos dados de microarrays ....................................................... 57

5.14.3 Correlação de Pearson .................................................................................. 57

5.14.4 Análise estatística dos dados para obtenção dos transcritos diferencialmente expressos ................................................................................................................. 58

5.14.5 Agrupamento hierárquico dos transcritos diferencialmente expressos .......... 58

5.15 Identificação das sequências dos RNAs longos não codificadores ............... 59

5.16 Classificação dos RNAs longos não codificadores ........................................ 59

5.17 Identificação e posicionamento dos genes codificadores mais próximos de loci de lncRNAs ..................................................................................................... 59

5.18 Análise do potencial codificador dos RNA longos não codificadores ............. 60

5.18.1 Análise do potencial codificador dos RNAs longos não codificadores por Coding-Potential Assesment Tool (CPAT) ................................................................ 60

5.18.2 Análise do potencial codificador pelo software Coding Potential Calculator (CPC) ....................................................................................................................... 61

5.19 Avaliação da presença da cauda poli A ......................................................... 61

6. RESULTADOS .................................................................................................... 63

6.1 Silenciamento de Aire na linhagem mTEC 3.10 .............................................. 63

6.2 Western Blot da proteína AIRE ....................................................................... 63

6.3 Normalização dos dados de microarray .......................................................... 64

6.4 Correlação de Pearson ................................................................................... 65

6.5 Transcritos diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 ............................................................................................................ 66

6.6 LncRNAs diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 ............................................................................................................ 68

6.7 Caracterização dos lncRNAs modulados por Aire ........................................... 69

6.7.1 Classificação dos lncRNAs .............................................................................. 69

6.7.2 Localização cromossômica dos lncRNAs modulados por Aire......................... 70

6.7.3 Identificação e posicionamento dos genes codificadores mais próximos ......... 71

6.7.4 Avaliação do potencial codificador dos lncRNAs ............................................. 73

6.7.5 Contagem de lncRNAs poliadenilados (lncRNAs poli A+) ................................ 76

7. DISCUSSÃO ........................................................................................................ 78

8. CONCLUSÕES .................................................................................................... 88

9. REFERÊNCIAS BIBLIOGRÁFICAS .................................................................... 90

LISTA DE FIGURAS

Figura 1 Composição celular do timo ...................................................................... 23

Figura 2 Diversos tecidos são representados em células tímicas epiteliais medulares (mTECs) através da expressão gênica promíscua...................................................27

Figura 3 Representação esquemática da proteína AIRE humana............................31

Figura 4 Mecanismo proposto para a ativação gênica mediada por AIRE...............32

Figura 5 Classificação dos RNAs longos não codificadores.....................................35

Figura 6 Sequência do RNA interferente para o transcrito do gene Aire.....................48

Figura 7 Eletroforese microfluídica das preparações de RNA total..........................51

Figura 8 Densitometria da eletrofese microfluídica das preparações de RNA total........................................................................................................................... .51

Figura 9 Histograma mostrando a expressão transcricional relativa do gene Aire determinada por qRT-PCR em células mTEC 3.10 controles (Ctrl) ou transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA)..................................................63

Figura 10 Westen blot da proteína AIRE em células mTECs 3.10 controles (Ctrl) e transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA)........................................................................................................................64

Figura 11 Gráfico boxplot das amostras controle (em verde) e tratadas com siRNA-anti Aire (em rosa) após a normalização pelo método quantile .................................. 65

Figura 12 Agrupamento hierárquico da expressão transcricional global de mRNAs e de lncRNAs resultante da aplicação do coeficiente de correlação de Pearson......................................................................................................................66

Figura 13 Heat map dos transcritos modulados (mRNA e lincRNAs) entre as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE).................................................................................................... ..................67

Figura 14 Heat map dos lncRNAs modulados por Aire entre as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE)......................................................................................................................68

Figura 15 Distribuição dos lncRNAs modulados por Aire segundo o tipo.................69

Figura 16 Distribuição dos lncRNAs de acordo à sua distância em relação ao gene codificador de proteína mais próximo no genoma.......................................................72

Figura 17 Diagrama de Venn resultante da análise do potencial codificador de lncRNAs modulados por Aire pelos softwares Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT).................................................................74

Figura 18 Porcentagem de lncRNAs poli A+ e lncRNAs poli A-.................................76

LISTA DE TABELAS

Tabela 1: Localização cromossômica dos lncRNAs modulados por Aire em células mTEC 3.10 e sua respectiva modulação, em log de fold change....................................................................................................................... 70

Tabela 2 Distância entre os genes codificadores de proteínas mais próximos e os lncRNAs modulados por Aire.....................................................................................72

Tabela 3 Potencial codificador dos lncRNAs modulados por Aire, segundo análise por Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT), e seus respectivos escores...........................................................................................75

LISTA DE ABREVIATURAS

AChR: receptor de acetilcolina

AIRE: Autoimmune regulator

APC: célula apresentadora de antígeno

APECED: síndrome de distrofia ectodérmica com poliendocrinopatia e candidíase

autoimune

APS1: síndrome autoimune poliglandular do tipo 1

ATTGGTTA: sítio G-box

CARD: domínio recrutar de caspase

Cauda poli A: poli adenilação da porção 3’

CBP: proteína ligadora de CREB

CCL19: Chemokine (C-C motif) ligand 19



cDNA: DNA complementar

CPAT: ferramenta de acesso ao potencial codificador

CPC: calculador de potencial codificador

CpG: sítios CG

CREB: AMPcíclico reponsivo a elementos ligadores de proteína.

cRNA: RNA complementar

CRP: proteína C reativa

cTEC: célula tímica epitelial cortical

Cy3: cianina 3 verde

DM1: Diabetes Mellitus tipo 1

DNA: ácido desoxirribonucléico

DNA-PK: proteína quinase DNA-dependente

EAE: encefalomielite autoimune experimental

FDR: razão de falsa descoberta

GAD1: glutamato descarboxilase 1

GAD67: glutamato descarboxilase 67

H3K4me3: trimetilação da lisina 4 da histona H3

Ins: insulina

Ins1: insulina I

Ins2: insulina II

kb: kilobase

KO: knockout

lncRNA: RNA longo não codificador

MBP: proteína básica da mielina

MeV: Visualizador experimental múltiplo

MHC: complexo maior de histocompatibilidade

miRNA: microRNA

MOG: glicoproteína associada a oligodendrócitos e mielina

mRNA: RNA mensageiro

mTEC 3.10: linhagem de células tímicas epiteliais medulares imortalizada

mTEC: célula tímica epitelial medular

MYC: oncoproteína mielocitomatose-homóloga

Nanog: nanog homeobox

NF-kB: fator nuclear kappa B

N-TEF: fator alongador negativo da transcrição

Oct4: fator de transcrição 4 ligador de octâmero

ORF: matriz aberta de leitura

p53: supressor tumoral

PCR: reação em cadeia de polimerase

PGE: expressão gênica promíscua

PHD1: domínio tipo dedo de zinco primeiro

PHD2: domínio tipo dedo de zinco segundo

PLP: lipoproteína da mielina

PTA: antígenos de tecidos periféricos

P-TEFb: fator b alongador positivo da transcrição

qRT-PCR: reação de polimerização em cadeia quantitativa e em tempo real

RIN: número de integridade do RNA

RNA pol II: RNA polimerase II

RNA pol III: RNA polimerase III

RNA: ácido ribonucleico

rRNA: RNA ribossômico

SAND: domínio denominado SP100, AIRE1, nucP41/P75 and DEAF1

SFB: soro fetal bovino

siRNA: pequeno RNA interferente

Sox2: box 2 da região Y determinante do sexo

STAT3: sinal transdutor e ativador da transcrição 3

SVM: máquina de suporte de vetores

TCR: receptor de célula T

TEC: célula tímica epitelial

TRA: antígeno tecido-específico

Treg: célula T reguladora

tRNA: RNA transportador

TTATTA: sítio TATA-box

UCSC: Universidade da Califórnia, Santa Cruz

V(D)J: v=variável, d=diversidade, j=junção.

RESUMO

O timo é um órgão linfoide primário envolvido na discriminação entre o próprio e não-próprio durante o processo de tolerância central. Neste órgão, células tímicas epiteliais medulares (mTECs) facilitam a eliminação de células T auto-reativas por expressarem e apresentarem um repertório diverso de antígenos dos tecidos periféricos (PTAs), um processo que depende, em grande parte, da expressão do gene regulador autoimune, do inglês, Autoimmune regulator (Aire). O gene Aire é um regulador transcricional que pode atuar de maneira dual, ou seja, ora ativando a transcrição, ora reprimindo-a. A proteína AIRE, modula a expressão ectópica de muitos PTAs e a transcrição de muitos miRNAs em células mTECs por influir no desencadeamento da liberação da RNA Pol II ancorada nas regiões promotoras ao longo da cromatina. No entanto, a associação entre o gene/proteína Aire e a expressão de RNAs longos não codificadores (lncRNAs) ainda permanece desconhecida. Por isto, investigamos se Aire exerce função moduladora sobre a expressão desta espécie de RNA em células mTECs. Através do silenciamento de Aire nestas células por meio de RNA interferente e posterior análise do transcriptoma murino por microarrays, nossos resultados demonstram que Aire exerce, de fato, uma função moduladora sobre a expressão de lncRNAs reprimindo a maioria deles. Além disso, a maioria consiste de lncRNAs intergênicos, sem cauda poli A sendo que no genoma estão situados até 10 kb do gene codificador mais próximo. Esta é a primeira evidência de que células mTECs expressam lncRNAs e que o gene Aire pode controlar a expressão dos mesmos.

Palavras-chave: Timo, células tímicas epiteliais medulares (mTECs), gene

Autoimmune regulator (Aire), RNAs longos não codificadores (lncRNAs), expressão

gênica.

ABSTRACT

The thymus is a primary lymphoid organ involved in the discrimination between self

and non-self for the central tolerance process. In this organ, medullary thymic

epithelial cells (mTECs) facilitate the elimination of self-reactive T cells by expressing

and presenting a diverse repertoire of antigens from peripheral tissues (PTA), a

process that depends largely on the expression of the autoimmune regulator gene

(Aire). Aire gene is a transcriptional regulator that can operate in dual manner,

namely, either activating or repressing transcription. The AIRE protein modulates the

ectopic expression of many PTAs and the transcription of many miRNAs in mTEC

cells triggering the release of RNA Pol II anchored in the promoter regions along the

chromatin. However, the association between the Aire gene/protein and long non-

coding RNAs (lncRNAs) remains unknown. Therefore, we investigated whether Aire

exert modulatory effect on the expression lncRNAs in mTECs cells. Our results of

Aire knockdown in these cells by RNA interference and subsequent analysis of the

murine transcriptome with microarrays demonstrate that Aire exert, in fact, a

modulating effect on lncRNAs expression, suppressing most of them. Moreover, the

majority of these consists of intergenic non-polyadenylated (poly A-) lncRNAs, which

are located in the genome no more than 10kb from the closest encoding gene. This

is the first evidence that mTEC cells express lncRNAs and that Aire can control their

expression.

Keywords: Thymus, medullary thymic epithelial cells (mTECs), Autoimmune regulator

(Aire) gene, long non-coding RNAs (lncRNAs), gene expression.

21

Introdução

22

1. INTRODUÇÃO

1.1 Estrutura do timo

O timo é um órgão linfóide primário envolvido no desenvolvimento de

linfócitos T e desempenha papel crucial no estabelecimento da tolerância

imunológica (GALLEGOS; BEVAN, 2006; HU; LANCASTER; EHRLICH, 2015).

Durante o desenvolvimento embrionário, o timo se origina da endoderme

da terceira bolsa faríngea e migra inferiormente até alcançar o mediastino

anterior, acima do coração (FARLEY et al., 2013; GORDON; MANLEY, 2011). É

o primeiro órgão linfóide a ser formado, atinge seu auge durante a maturidade

sexual e gradualmente involui ao longo da vida (GRAY et al., 2006; LINTON;

DORSHKIND, 2004; MONTECINO-RODRIQUEZ; MIN; DORSHKIND, 2005).

Este órgão é formado por dois lobos (o direito e o esquerdo) unidos por

um istmo. É circundado de uma cápsula de tecido conectivo que origina

trabéculas fibrosas, as quais contém os vasos sanguíneos e subdividem o órgão

em lóbulos interconectados. Cada lóbulo é formado por um córtex, mais externo,

que abriga da grande maioria de linfócitos T em processo de maturação

(chamados de timócitos); uma junção córtico-medular vascularizada,

intermediária, e uma medula, interna, que abriga menor quantidade células T, já

mais avançados em sua maturação (BOYD et al., 1993; GORDON; MANLEY,

2011; PEARSE, 2006).

O córtex e a medula são formados por um epitélio altamente

especializado contendo dois grupos de células epiteliais tímicas (TECs): as

células tímicas epiteliais corticais (cTECs) e as células tímicas epiteliais

medulares (mTECs) (ANDERSON; TAKAHAMA, 2012; GUERDER et al., 2012;

KLEIN et al., 2014).

Os progenitores de linfócitos T chegam ao timo, vindos da medula óssea,

pelas veias na junção córtico-medular e ao fim de sua maturação são enviados à

circulação pelas vênulas pós-capilares. Eferentes linfáticos também drenam o

timo para o linfonodo adjacente; sendo que inexistem os linfáticos afarentes

(PEARSE, 2006; ZHANG; BHANDOOLA, 2014). Além de timócitos, que

23

constituem 95% da celularidade tímica, o timo também apresenta células

dendríticas, macrófagos e linfócitos B (Figura 1) (KLEIN et al., 2014).

Dentre as células dendríticas, 2/3 são as chamadas residentes, cuja

diferenciação é intratímica e se localizam preferencialmente na medula do órgão.

O restante são células dendríticas migratórias, oriundas da periferia e podem ser

encontradas tanto na junção córtico-medular (regiões perivasculares) quanto no

interior da medula. Além desses dois tipos de células dentríticas habitam

também o timo as células dendríticas plasmocitóides, que como as migratórias,

também provem da periferia, carregam autoantígenos periféricos além de

conferir proteção tímica contra infecções virais, uma vez que são grandes

produtoras de interferon tipo I (KLEIN et al., 2014; LI et al., 2009; WU;

SHORTMAN, 2005).

Células B também são encontradas no timo, mas não existe consenso

quanto à origem das mesmas, ou seja, se são fruto da linfopoiese tímica ou da

migração periférica. Evidências recentes indicam que essas células B tem

função na indução da tolerância (CARNINCI et al., 2005; LEAVY, 2015;

PERERA et al., 2013; WALTERS et al., 2014; YAMANO; STEINERT; KLEIN,

2015; YAMANO et al., 2015).

Através do ambiente tímico que é altamente dinâmico os timócitos migram

e entram em contato com os diversos tipos celulares para ter seu processo de

maturação completado (KLEIN et al., 2014; TAKAHAMA, 2006).

Figura 1 Composição celular do timo. A interação célula-célula ao longo da migração dos

timócitos é destacada pelas setas. As células apresentadoras de antígenos aparecem em cor. Extraído e adaptado de (KYEWSKI; KLEIN, 2006).

24

1.2 Função tímica

O papel biológico do timo é garantir a geração de uma população

diversificada de linfócitos T periféricos hábeis a responder a antígenos não

próprios, mas, contudo, tolerante a antígenos próprios. Neste contexto, é

denominada de “tolerância central” todos os mecanismos intratímicos pelos

quais o reconhecimento de antígenos próprios por células T contribuem para a

tolerância ao próprio, o que inclui a morte das células autorreativas por

apoptose, além da indução de células T reguladoras (Tregs), mesmo que seu

sítio de ação seja a periferia (GALLEGOS; BEVAN, 2006; KLEIN et al., 2014;

MOUCHESS; ANDERSON, 2014; STARR; JAMESON; HOGQUIST, 2003)

Os progenitores linfoides de células T entram no timo no dia embrionário

11.5 em camundongos Mus musculus e na sétima semana de gestação na

espécie humana (FARLEY et al., 2013; HAYNES; HEINLY, 1995; PEARSE,

2006) e passam por grande expansão inicial, mediada por IL-7, produzida pelas

células epiteliais tímicas (BOUDIL et al., 2015; HARA et al., 2012; SEDDON,

2015). Neste estágio, as células T imaturas são duplo negativas (CD4-, CD8-) e

começam a rearranjar os loci das cadeias formadoras do receptor de antígenos

de células T (T cell receptor ou simplesmente TCR), por meio do processo

denominado de recombinação V(D)J (MORRIS; ALLEN, 2012). Após a correta

formação do TCR, os timócitos passam ao estágio de duplos positivos (CD4+,

CD8+) e são atraídos, por meio das quimiocinas CCL21 e CCL25, para contato

com as cTECs (MISSLITZ et al., 2004; PETRIE; ZÚÑIGA-PFLÜCKER, 2007;

ZLOTOFF et al., 2010). É através desse contato com cTECs que expressam

autoantígenos que os timócitos são selecionados favorecendo aqueles clones

que expressam TCRs úteis, ou seja, capazes de reconhecer o complexo

peptídeo-MHC (Major Histocompatibility Complex) próprio com baixa afinidade,

recebendo sinais de sobrevivência. Esse fenômeno é conhecido como “seleção

positiva” (MOUCHESS; ANDERSON, 2014; TAKADA et al., 2014).

Aqueles timócitos selecionados positivamente no córtex passam a ser

simples positivos (TCD4+CD8- ou TCD8+CD4-), se comprometendo com a

linhagem de células T auxiliares ou as T citotóxicas, respectivamente. São

atraídos à medula do timo pelas quimiocinas CCL25, CCL19 e CCL21

(MISSLITZ et al., 2004; PETRIE; ZÚÑIGA-PFLÜCKER, 2007; ZLOTOFF et al.,

25

2010), onde interagem com as mTECs que, juntamente com as demais células

apresentadoras de antígenos (APCs), lhes apresentam uma vasta gama de

autoantígenos. Aqueles que se ligarem ao complexo peptídeo-MHC com alta

afinidade serão deletados por apoptose ou convertidos em células Tregs,

processo esse denominado “seleção negativa” (ANDERSON et al., 2014;

MOUCHESS; ANDERSON, 2014).

Somente 5% dos timócitos resultam em linfócitos T maduros que, ao final

de sua jornada pelo timo, reconhecem o MHC próprio mas são tolerantes aos

autoantígenos (PALMER, 2003). O impedimento da deleção clonal ou da

indução de Tregs pode levar à quebra da tolerância central e o desenvolvimento

de doenças autoimunes (AKIYAMA et al., 2013).

Na seleção negativa participam os diversos tipos de células dendríticas

presentes no timo. As células dentríticas migratórias transportam antígenos

próprios adquiridos na periferia e provenientes do sangue e os apresentam para

os timócitos (JOFFRE et al., 2012; OH; SHIN, 2015). Estudos indicam que as

células B também são capazes de apresentar antígenos, contribuindo com o

processo de tolerância central (PERERA et al., 2013; YAMANO; STEINERT;

KLEIN, 2015; YAMANO et al., 2015).

Na seleção negativa, porém, um fator de grande relevância é a

colaboração entre as células epiteliais medulares tímicas e as células dentríticas.

Estudos demonstram que as células mTECs produzem linfopoietina, quimiocina

responsável por atrair e manter as células dendríticas residente próximas a elas.

Tal proximidade seria coerente com o fato de que as células mTECs

compartilham diversos autoantígenos periféricos expressos por elas com as

células dentríticas, promovendo uma apresentação indireta, que amplia o

alcance e eficácia da apresentação deles aos timócitos, para promoção da

seleção negativa (GALLEGOS; BEVAN, 2004; HUBERT et al., 2011; KLEIN et

al., 2011; KOBLE; KYEWSKI, 2009; OH; SHIN, 2015)

1.3 Expressão gênica promíscua (PGE) em células epiteliais medulares

tímicas

A primeira evidência de que autoantígenos periféricos podiam ser

expressos de maneira ectópica no timo foi a descoberta da expressão do

26

receptor de acetilcolina (AChR) e de componentes da mielina em timo humano

(KIRCHNER et al., 1988; LEVINSON et al., 2003; SMITH et al., 1997).

Posteriormente encontraram insulina (Ins), além da proteína C-reativa (CRP) do

fígado sendo expressos no timo humano e de camundongos (DERBINSKI et al.,

2001; JOLICOEUR; HANAHAN; SMITH, 1994; KLEIN et al., 1998; SOSPEDRA

et al., 1998).

Além de antígenos de tecidos periféricos (PTAs do inglês peripheral tissue

antigens) ou antígenos tecido-específicos (TRA do inglês tissue restricted

antigens) antígenos tumorais também foram encontrados no timo normal

(CLOOSEN et al., 2007). Essa expressão foi atribuída às células mTEC e foi

denominada expressão gênica promíscua (PGE) (DERBINSKI et al., 2001, 2005;

MAGALHÃES et al., ) A PGE é definida, operacionalmente, como a expressão

no timo de genes ectópicos, ou seja, que não fazem parte do programa de

expressão gênica fisiológica destas células. O conceito de antígenos TRAs por

sua vez, engloba antígenos que são expressos em menos de cinco tecidos

diferentes (DERBINSKI et al., 2005)

As células mTEC expressam enorme diversidade de genes (chegando a

mais de 19.000 genes) e isto faz com que elas façam a representação

imunológica de virtualmente todos os antígenos de todos os tecidos do corpo

(Figura 2)(SANSOM et al., 2014). Esta característica é diretamente relacionada

com o seu processo de maturação, isto é, com a maior expressão de MHC

classe II e a molécula co-estimulatória CD80 em sua membrana além da

expressão do gene regulador autoimune, do inglês Autoimmune regulator (Aire)

(MHCII+, CD80hi , Aire+), estágio em que se tornam competentes na

apresentação de antígenos (DERBINSKI et al., 2005).

Desbinski e colaboradores (2005), descreveram uma maior gama de

antígenos tecido-específicos expressos nas células mTECs, em modelos

murinos autoimune e não autoimune. Os antígenos tecido-específicos se

apresentaram fracamente expressos quanto a sua transcrição (RNAs

mensageiros ou mRNAs), porém capazes de ser detectados por meio das

respectivas proteínas.

Entretanto, somente cerca de 1-5% das células mTEC se mostraram com

esta capacidade transcricional as quais estiveram presentes durante a ontogenia

27

tímica, se mantendo no período pós-natal e coincidindo com o processo de

maturação dos linfócitos T (DERBINSKI et al., 2001).

Figura 2 Diversos tecidos são representados em células tímicas epiteliais medulares (mTECs) através da expressão gênica promíscua. Extraído e adaptado de(KYEWSKI; DERBINSKI, 2004).

Muitos desses antígenos estão associados com doenças autoimunes

como o diabetes mellitus do tipo 1 (DM1) (Ins1, Ins2, Gad1) esclerose múltipla

(MBP, MOG, PLP) e miastenia gravis (AchR). Logo os pesquisadores

correlacionaram a PGE com a tolerância central mediada pelo timo e

especificamente com a seleção negativa, na qual a medula tímica tem papel

fundamental (SMITH et al., 1997; SOSPEDRA et al., 1998).

Os timócitos permanecem na medula tímica cerca de quatro a cinco dias,

tempo necessário e suficiente para serem expostos às células do estroma e

serem apresentados aos autoantígenos (KLEIN, 2009), sendo que essa

apresentação é otimizada com o auxílio das células dendríticas (HUBERT et al.,

2011; KLEIN et al., 2011; KYEWSKI; FEUERER, 2014; MA; BAJIC; ZHANG,

2013; OH; SHIN, 2015).

28

1.4 Regulação da expressão gênica promíscua no timo

A PGE parece ser controlada em múltiplos níveis. Ela tem início nas

mTECs imaturas e progride juntamente com sua maturação. Nas mTECs

maduras que expressam Aire (mTECs Aire+), uma vasta gama de autoantígenos

periféricos controlados por Aire passam a ser expressos e são denominados

Aire-dependentes como por exemplo insulina 2 (Ins2) e caseína α. Estes

autoantígenos são expressos concomitantemente com outros antígenos Aire-

independentes (como CRP e GAD67), o que indica a presença de outros

controladores da PGE, ainda desconhecidos (ANDERSON et al., 2002). Até o

momento o gene Aire é considerado o principal controlador transcricional da

PGE apesar de atuar em conjunto com outras moléculas (proteínas) acessórias

chamadas de parceiras de Aire (ABRAMSON et al., 2010; KYEWSKI;

PETERSON, 2010; LAAN; PETERSON, 2013b; MEREDITH et al., 2015;

PETERSON; ORG; REBANE, 2008; ST-PIERRE et al., 2015).

Variações alélicas também refletem em variações na expressão

intratímica de certos PTAS e são correlacionadas com a suscetibilidade a

doenças autoimunes. Este é o caso da DM1 na qual uma variação alélica no

gene da insulina promove sua maior expressão no timo, resultando em um efeito

protetor (PUGLIESE et al., 1997; VAFIADIS et al., 1997). O background genético

em modelos murinos de esclerose múltipla, a encefalomielite autoimune

experimental (EAE), também obedece ao mesmo princípio, uma vez que a maior

expressão da proteína básica da mielina (MBP), no timo, está associada com a

resistência à doença (LIU et al., 2001).

.Um estudo focado no lócus da caseína, cujos genes são expressos

durante a PGE demonstrou ainda o controle epigenético sobre a expressão

promíscua. A demetilação do promotor do gene da caseína β no estágio imaturo

da mTEC foi seguida da acetilação da histona H4 e trimetilação da lisina 4 da

histona H3 (H3K4me3), um marcador de ativação transcricional, resultando em

descontração do lócus e consequente expressão de outros membros da família

gênica da caseína. Os mesmos marcadores epigenéticos permissivos foram

encontrados no promotor de um outro antígeno-tecido específico tipicamente

expresso durante a PGE, como é o GAD67 (TYKOCINSKI et al., 2010).

29

O controle pós transcricional da PGE também tem sido evidenciado.

Quando animais deficientes de Dicer – uma enzima essencial na maturação dos

microRNAs (miRNAs) – foram analisados quanto a expressão de autoantígenos,

observou-se que sua expressão era diminuída na ausência dos miRNAs

maduros. A ausência do miR-29a, em especial, afetou a expressão dos

antígenos tecido-específicos Aire-dependentes (UCAR; RATTAY, 2015; UCAR

et al., 2013)

Até o momento não se sabe se a PGE também pode ser modulada por

outros tipos de RNAs não codificadores, como os RNAs longos não

codificadores (lncRNAs).

1.5 A descoberta do gene Autoimmune regulator (Aire)

Um gene essencial na indução da tolerância central é o autoimmune

regulator (Aire), expresso nas células mTECs altamente diferenciadas (MHC IIhi,

CD80hi) (LAAN; PETERSON, 2013a). O gene Aire humano se localiza no

cromossomo 21q22.3 (AALTONEN et al., 1997; NAGAMINE et al., 1997) e

apresenta 71% de identidade de sequência com o seu correspondente murino

(Mus musculus) localizado no cromossomo 10 citobanda 39.72.(SOURCE Data

Base http://source-search.princeton.edu/).

Este gene foi caracterizado pela primeira vez em 1997, quando

observaram que determinadas mutações estavam associadas a uma doença

autoimune sistêmica denominada autoimmune polyendocrinpathy-candidiasis-

ectodermal-dystrophy (APECED)(AALTONEN et al., 1997; NAGAMINE et al.,

1997).

Dentre diversos tecidos endócrinos humanos analisados, o gene que foi

chamado de Aire, apareceu expresso principalmente no timo, pâncreas e córtex

da adrenal e por predição postulou-se que codificava uma proteína de 545

aminoácidos, cujo peso molecular era 57.7 kDa. Por sequenciamento,

determinou-se que o novo gene apresentava duas regiões ricas em cisteína que

formavam motivos PHD tipo dedos de zinco, e que, pelo alto conteúdo de prolina

deveria ter uma estrutural espiral, com pequena probabilidade de formar

estruturas alfa hélice ou folha B pregueada. Sem porção transmembrana,

30

apresentava um sinal de localização nuclear. A mutação neste gene

provavelmente levaria a formação de uma proteína truncada, com perda de pelo

menos um dos motivos tipo dedos de zinco. Tais motivos dedos de zinco seriam

importantes para interação com outras macromoléculas, como ácidos nucléicos

e proteínas e estavam presentes em proteínas nucleares que regulavam ou

mediavam a transcrição. Os indícios apontavam para a descoberta de um novo e

importante fator de transcrição (AALTONEN et al., 1997; NAGAMINE et al.,

1997).

Dois anos depois, Heino e colaboradores (HEINO et al., 1999)

investigaram a expressão de Aire por hibridação in situ de mRNA,

imunohistoquímica e imunofluorescência em diversos tecidos humanos. O que

chamou a atenção foi a sua expressão acentuada em células epiteliais da

medula tímica e também em células dendríticas (tanto no timo quanto nos

linfonodos); isto é, em duas populações de células APCs. Tal fato trouxe à luz a

possibilidade do gene Aire atuar na seleção negativa uma vez que ambas as

APCs participam desses eventos. Se isto fosse confirmado, esse gene teria um

papel primordial no estabelecimento da tolerância central e quando mutado,

como no caso da APECED, provocaria a quebra da tolerância órgão específica.

Além disso, já era sabido que vários autoantígenos relacionados com o DM1

eram expressos no timo e poderiam participar da indução da tolerância central,

corroborando novamente com a ideia de que a proteína Aire poderia estar

regulando a expressão e/ou apresentação de autoantígenos específicos

(FORNARI et al., 2010; SMITH et al., 1997; SOSPEDRA et al., 1998)

1.6 Mecanismo de ação de Aire

O gene Aire codifica uma proteína que compreende uma combinação de

domínios típicos de reguladores transcricionais e de proteínas ligadoras da

cromatina. Além disso, apresenta um sinal de importação e um de exportação

nuclear. Sua porção N-terminal apresenta um domínio de recrutamento de

caspase, do inglês, caspase recruitment domain (CARD), ao qual sua

oligomerização tem sido atribuída. Um domínio SAND (SP100, AIRE1,

31

nucP41/P75 and DEAF1), envolvido com sua ligação ao DNA e domínios tipo

dedos de zinco (PHD1 e PHD2). PHD 1 é responsável por sua ligação à histona

H3 e à subunidade catalítica das proteínas quinases DNA-dependentes (DNA-

PKs) e o domínio PHD2 característico de proteínas ligadoras de cromatina

(Figura 3 )(CHAKRAVARTY; ZENG; ZHOU, 2009; KOH et al., 2010).

Figura 3 Representação esquemática da proteína AIRE humana. Os domínios e elementos

funcionais da proteína reguladora autoimune (AIRE) são mostradas em diferentes cores. CARD= domínio recrutador de caspase; NLS= sinal de localização nuclear; SAND=(SP100, AIRE1, nucP41/P75 and DEAF1); PHD= domínios tipo dedos de zinco. Extraído de (PETERSON; ORG; REBANE, 2008).

Observou-se que a proteína AIRE se liga ao DNA em regiões TATA-box

(TTATTA) e repetições de ATTGGTTA (G-box) (KUMAR et al., 2001), mas mais

do que um fator de transcrição clássico, AIRE atualmente é tida como uma

proteína moduladora da transcrição (KEANE; CEREDIG; SEOIGHE, 2015;

KYEWSKI; PETERSON, 2010; MEREDITH et al., 2015; PETERSON; ORG;

REBANE, 2008; SATO et al., 2004; ST-PIERRE et al., 2015).

Ela é capaz de promover, através da interação com outras proteínas

consideradas “parceiros transcricionais”, um maior acesso da maquinaria de

transcrição em determinados loci gênicos, culminando em sua ativação

transcricional, exemplo; os PTAs nas mTECs. Para tanto, AIRE se liga, através

de seus domínios PHD a promotores hipometilados ou não metilados na lisina 4

da histona 3 (H3K4) e é fosforilado por DNA-PKs em dois resíduos N-terminais

(treonina -68 e serina – 156), tornando-se ativado. Ativo, recruta a proteína

ligadora de CREB (CBP) um importante co-ativador transcricional. CBP atua na

iniciação da transcrição, promovendo a acetilação das histonas e recrutando

remodeladores da cromatina (PETERSON; ORG; REBANE, 2008; PITKÄNEN et

al., 2000). A seguir, é recrutado o fator alongador positivo da transcrição (P-

TEFb, do inglês, positive transcription elongation factor b), que remove o fator

alongador negativo da transcrição (N-TEF, negative elongation factor), fosforila a

RNA polimerase II (RNA Pol II), permitindo assim a progressão da transcrição

32

para a fase de alongamento (OVEN et al., 2007; PETERSON; ORG; REBANE,

2008). Sua função consiste, em suma, em promover a liberação de moléculas de

RNA pol II travadas nas regiões promotoras de genes ao longo da cromatina,

contribuindo assim com a promoção da transcrição (Figura 4) (GIRAUD et al.,

2012).

E foi considerando a interação de AIRE com RNA Pol II que nosso grupo

de pesquisa em um trabalho recente demonstrou, pela primeira vez, que este

gene também pode controlar a transcrição de miRNAs em células mTECs

(MACEDO et al., 2013).

AIRE, no entanto, pode apresentar um papel duplo na regulação da

expressão gênica, funcionando como um ativador transcricional e também como

um repressor de vários genes, por meio do fenômeno de transrepressão

(ILMARINEN et al., 2008; JOHNNIDIS et al., 2005; SATO et al., 2004; TAO et al.,

2006).

Figura 4 Mecanismo proposto para a ativação gênica mediada por AIRE. O autoimune regulator (AIRE) é preferencialmente recrutado para promotores com baixos níveis de trimetilação da lisina 4 da histona H3. Em adição a ligação às histonas, uma interação direta com o DNA é necessária para guiar AIRE a regiões específicas. Nas regiões regulatórias alvo, AIRE recruta o fator alongador positivo da transcrição (P_TEFb), responsável por fosforilar a RNA pol II, o que a converte de uma forma pausada para uma forma de alongamento. AIRE também interage com a proteína ligadora de CREB (CBP), a qual acetila histonas, permitindo maior acesso da maquinaria de transcrição ao DNA. A interação de AIRE com proteínas quinases DNA-dependentes (DNA-PKs) e com a proteína inibidora de STAT1 (PIAS1) também aumentam a ativação transcricional. DNA-PKs fosforilam AIRE e, através de interação com a matrix nuclear colaboram com AIRE para a formação de loops na cromatina. Extraído e modificado de (PETERSON; ORG; REBANE, 2008)

33

1.7 Aire e autoimunidade

Humanos deficientes em Aire, isto é, aqueles indivíduos portadores de

mutações que ocasionam perda de função deste gene, desenvolvem APECED

também conhecida como Síndrome Autoimune Poliglandular Tipo 1 (APS 1) uma

doença autoimune hereditária autossômica recessiva. Essa doença é debilitante

e é caracterizada por insuficiência da glândula adrenal, hipoparatireoidismo e

candidíase mucocutânea (NAGAMINE et al., 1997; PERHEENTUPA, 2002);

sendo que a ocorrência de duas das três manifestações já é suficiente para

diagnóstico clínico da doença (BUZI et al., 2003).

Além dessas características clínicas, os pacientes de APECED

apresentam anticorpos séricos anti-citocinas, principalmente anti-interferon (IFN)

e anti-IL-17 (KISAND et al., 2010; MEAGER et al., 2006) e anticorpos anti-

enzimas estereidogênicas (UIBO et al., 1994). Pacientes com APECED também

apresentaram menor quantidade de células Tregs (RYAN et al., 2005).

Existem mais 60 mutações associadas à APS1 já identificadas, que

variam entre mutações sem sentido, onde a troca de bases origina um stop

codon, mutações de sentido trocado, deleções que mudam a matriz de leitura;

substituições e mutações de ponto não sinônimas (AKIRAV; RUDDLE;

HEROLD, 2011). Tais mutações originam proteínas truncadas com domínios

comprometidos (ISHII et al., 2000).

Assim como pacientes com APS1, camundongos Aire knockout (Aire KO)

também desenvolvem quadro de doença autoimune e nestes animais observou-

se diminuição da expressão de PTAs no timo (ANDERSON et al., 2002;

DERBINSKI et al., 2005). Isso pode influir na seleção negativa permitindo que

células T auto reativas escapem para a periferia (RAMSEY et al., 2002).

Resultados recentes de nosso laboratório demonstram que não apenas as

mutações de Aire, mas também alterações na sua expressão transcricional

podem ocasionar alterações na expressão downstream de genes que codificam

PTAs (OLIVEIRA et al., 2013).

34

Até o momento, não houve relato na literatura associando Aire com a

expressão de outros tipos de RNAs diferentes de mRNAs e de miRNAs, como

por exemplo os lncRNAs.

1.8 A descoberta dos RNAs longos não codificadores

Análises aprofundadas do transcriptoma de mamíferos demonstraram que

90% de toda a transcrição realizada pela RNA Pol II não corresponde a “genes-

padrão”. A hipótese levantada para explicar tal fato era que a RNA Pol II iniciaria

uma transcrição inespecífica a partir de sítios “incorretos”, gerando um ruído

transcricional sem relevância biológica (STRUHL, 2007).

Rastreamentos genômicos demonstraram que a RNA Pol II se associa

com a maior parte do genoma, incluindo regiões que eram consideradas

transcricionalmente inertes. Observou-se que grande parte dessa transcrição

tinha início em regiões intergênicas e que encontravam-se preferencialmente

acessíveis à maquinaria transcricional e originavam transcritos antisense e

RNAs não codificadores em eucariotos (STRUHL, 2007; WILLINGHAM;

GINGERAS, 2006). Muitos dos RNAs não codificadores foram justificados, mais

tarde, como componentes da maquinaria de splicing de mRNAs e RNAs da

maquinaria de tradução e sua regulação, ou seja, o RNA ribossômico (rRNA), o

RNA transportador (tRNA), RNAse P. Porém, muitos permaneciam como

transcritos longos com pouco ou nenhum potencial codificador cuja função não

era conhecida. A esta nova espécie RNAs denominou-se “RNAs longos não

codificadores” ou lncRNA (MATTICK; RINN, 2015a; RINN; CHANG, 2012).

1.9 Definição e classificação dos RNAs longos não codificadores

Os lncRNAs são definidos como RNAs maiores que 200 bases, sem

poder codificador (RINN; CHANG, 2012). São classificados de acordo com a

localização de seu lócus em relação a genes codificadores de proteínas), ou

35

seja, são classificados da seguinte forma (HARROW et al., 2012; MA; BAJIC;

ZHANG, 2013) (Figura 5):

Figura 5 Classificação dos RNAs longos não codificadores. Genes codificadores de proteína e seus exons são representados em azul; em vermelho estão os lncRNAs e seus exons. Extraído e adaptado de (MA; BAJIC; ZHANG, 2013).

LincRNAs: são RNAs não codificadores intergênicos, isto é, têm sua unidade

transcricional separada da unidade transcricional de genes codificadores de

proteínas. Uma definição de lincRNAs determina, ainda, que estejam a 5

kilobases (kb) de distância a partir de genes codificadores de proteínas

(GUTTMAN et al., 2009).

36

LncRNAs intrônicos: sua unidade transcricional se encontra inserida no íntron de

um gene codificador, mas não intersecta com nenhum éxon do mesmo.

LncRNAs antisense: apresentam em seus lócus pelo menos um produto de

transcrição que intersecta qualquer éxon de um lócus codificador e que sejam

transcritos no sentido oposto ou, ainda, que tenham evidência publicada de

regulação antisense de um gene codificador.

LncRNAs sense: aqueles RNAs cujas unidades transcricionais contém éxons de

um gene codificador, transcritos na mesma fita sense.

1.10 Características dos RNAs longos não codificadores

Apesar de pertencerem a uma classe distinta, os lncRNAs compartilham

semelhanças com os mRNAs: alguns deles também têm sua regulação

transcricional mediada por fatores de transcrição-chave como p53, NF-kB, Sox2,

Oct4 e Nanog (cujos genes se situam próximos a eles) e muitos deles

apresentam domínios K4-K36 (trimetilação da lisina 4 da histona H3 - H3K4me3

no seu promotor e trimetilação da lisina 36 da histona H3 – H3K36me3- ao longo

da unidade transcrita), marcadores de genes ativamente transcritos pela RNA

Pol II (GUTTMAN et al., 2009; KHALIL et al., 2009). Seus promotores, assim

como o de genes codificadores, possuem forte enriquecimento na ligação à RNA

Pol II (GUTTMAN et al., 2009; STRUHL, 2007) e sua expressão pode também

ser regulada por miRNAs, assim como a expressão de mRNAs (LEUCCI et al.,

2013; YOON; ABDELMOHSEN; GOROSPE, 2014).

Alguns lncRNAs compartilham como os mRNAs o processamento com 5’

cap, o splicing alternativo, a poli adenilação na sua porção 3’ (cauda poli A)

(GUTTMAN et al., 2009; HARROW et al., 2012; STRUHL, 2007; WU et al.,

2008). Diferentemente dos mRNAs, são pouco conservados e, como

demonstrado por Cabili e colaboradores, que investigaram a expressão dos

mesmos em 24 tecidos humanos, são altamente tecido específicos, fato

confirmado também em murinos (CABILI et al., 2011; RAVASI et al., 2006).

37

Função biológica importante não significa apresentar altos níveis de

expressão transcricional. Os lncRNAs são pouco expressos, podendo ser até

dez vezes menos expressos que os genes codificadores de proteínas

(GUTTMAN et al., 2009; RAVASI et al., 2006; ULITSKY; BARTEL, 2013). Eles

são regulados nas células pelo estado da cromatina, ou seja, padrões de

metilação e acetilação das histonas, sendo que muitos são transcritos a partir de

promotores com poucas ilhas CpG e promotores bidirecionais, cujo início da

transcrição se dá a menos de 1000 bases do sítio de início da transcrição de um

gene codificador (WU et al., 2014).

1.11 Função dos RNAs longos não codificadores

Os lncRNAs consistem em uma classe altamente heterogênea de RNAs,

têm papel crucial no controle da expressão gênica e seu número (diversidade)

aumenta acompanhando o nível de complexidade dos organismos (FATICA;

BOZZONI, 2014). Tem sido associados com diversos processos celulares como

a pluripotência, resposta imune e regulação do ciclo celular (GUTTMAN et al.,

2009; HU et al., 2011; HUARTE et al., 2010; LOEWER et al., 2010).

Podem atuar de diversas maneiras na célula. Existem aqueles que podem

mediar modificações epigenéticas por recrutar e guiar remodeladores da

cromatina a determinados loci gênicos, definindo assim os domínios de

metilação diferencial de histonas e interferindo na acessibilidade da RNA Pol II a

estes loci (FATICA; BOZZONI, 2014; MERCER; DINGER; MATTICK, 2009).

Sabe-se que o imprinting genômico também é um fenômeno controlado

por lncRNAs, sendo que um complexo remodelador da cromatina pode ser

convocado para silenciar um dos cromossomos X na espécie humana, ou ainda,

proporcionar a origem a um pequeno RNA interferente na célula, no momento de

seu processamento (OGAWA; SUN; LEE, 2008; ZHAO et al., 2008).

Alguns servem de “iscas moleculares” a proteínas ligadoras de RNA que

atuam como repressores transcricionais e agem como mediadores de sua ação

em promotores gênicos, causando a repressão de determinados genes (WANG

38

et al., 2008). Podem, ainda, se ligar do DNA, em regiões promotoras, formando

uma tripla hélice, o que impede a ligação de co-fatores transcricionais nestes

sítios (MARTIANOV et al., 2007; VANCE; PONTING, 2014).

Eles não são, no entanto, somente repressores da transcrição, pois

podem atuar como enhancers, sendo neste caso, co-ativadores da transcrição

(FENG, 2006; VANCE; PONTING, 2014).

lncRNAs podem também podem afetar a transcrição de modo mais global

por interagir com componentes básicos da maquinaria de transcrição da qual

depende a RNA Pol II. Neste caso são transcritos pela RNA polimerase III (RNA

pol III) (Amaral & Mattick, 2008; Silva, Boczek, Berres, Ma, & Smith, 2011).

Outros lncRNAs atuam na regulação pós transcricional. LncRNAs do tipo

antisense podem se ligar à porção 5’ de alguns mRNAs, complicando o acesso

da maquinaria de splicing e causando retenção de íntrons. Alguns íntrons podem

conter sítios que sinalizam para a entrada de ribossomos, sendo requeridos à

tradução e expressão de determinada proteína (BELTRAN et al., 2008).

Alguns lncRNAs podem atuar como RNAs endógenos competidores ou

“esponjas” de miRNAs, sequestrando-os e, consequentemente possibilitando

meia-vida mais longa aos mRNAs, que ficam livres para serem traduzidos

(EBERT; SHARP, 2010; JOHNSSON et al., 2013; WANG et al., 2013b).

lncRNAs atuam também sobre proteínas. Podem se ligar diretamente a

elas impedindo ou contribuindo com o processo de fosforilação. No caso de

impedir, pode diminuir sua degradação mediada por fosforilação, como acontece

com a oncoproteína mielocitomatose-homóloga (MYC), regulando seus níveis

celulares. Já no caso de contribuir com a fosforilação, pode torná-la ativa, como

acontece com o fator de transcrição STAT3 (JOHNSSON; MORRIS, 2014;

WANG et al., 2014).

39

Hipótese

40

2. HIPÓTESE

RNAs longos não codificadores (lncRNAs) são controlados por fatores de

transcrição e transcritos pela RNA Pol II, a qual pode ser liberada por AIRE nas

regiões promotoras. De acordo com essas informações, formulamos a hipótese

de que o gene Aire pode exercer efeito modulador sobre a expressão de

lncRNAs em células tímicas epiteliais medulares.

41

Objetivos

42

3. OBJETIVOS

3.1 Objetivo Geral

Avaliar o efeito do gene autoimune regulator (Aire) sobre a expressão de

RNAs longos não codificadores (lncRNAs) em células tímicas epiteliais

medulares murinas imortalizadas (mTECs 3.10).

3.2 Objetivos específicos

Avaliar a expressão do gene Aire em células mTECs linhagem 3.10

Avaliar a expressão de lncRNAs em células mTEC 3.10.

Silenciamento de Aire em mTEC 3.10 por meio de RNA interferente

(siRNA).

Avaliar o transcriptoma identificando os mRNAs e os lncRNAs

diferencialmente expressos entre células mTEC 3.10 controle e Aire

silenciadas.

Caracterizar os lncRNAs Aire-dependentes expressos pelas células

mTECs 3.10.

43

Delineamento experimental

44

4. DELINEAMENTO EXPERIMENTAL

Obtenção das imagens de hibridação (Agilent Microarray Scanner)

Quantificação dos dados numéricos e controle de qualidade

(Programa Feature Extraction)

Células mTECs 3.10 (controle e Aire silenciadas por meio de siRNA)

Avaliação dos níveis transcricionais e protéicos de Aire (qRT-PCR e Wertern Blot)

Extração de RNA total e avaliação de sua integridade (Agilent RNA Nano Chips)

Amplificação e marcação das amostras de RNA total com Cy3 (controle e Aire silenciadas)

Hibridação com lâminas de microarray Agilent 8 x 60 K (genoma murino completo)

Correção do background (plataforma R)

Normalização dos dados (plataforma R)

45

Aplicação do coeficiente de correlação de Pearson (plataforma R)

Análise estatística dos dados (LIMMA) (plataforma R)

Identificação e agrupamento hierárquico dos mRNAs e dos lncRNAs diferencialmente expressos (Multiple Experiment Viewer - MeV)

Identificação das sequências dos lncRNAs modulados por Aire (UCSC Genome Browser)

Caracterização dos lncRNAs modulados por Aire

Avaliação da presença da cauda poli A

Identificação e posicionamento do gene codificador mais próximo

(Bed Tools - Linux)

Análise do potencial codificador (Coding-Potential Assesment Tool)

(Coding Potential Calculator)

Classificação dos lncRNAs

(UCSC Genome Browser)

46

Material e métodos

47

5. MATERIAL E MÉTODOS

5.1 Linhagem celular

Utilizamos a linhagem de células tímicas epiteliais medulares primárias

(Mus musculus, linhagem mTEC 3.10, MHC II + CD80

+) gentilmente cedida pelo

Prof. Dr. W. Savino, do Laboratório de Pesquisas sobre o Timo da Fundação

Instituto Oswaldo Cruz, Rio de Janeiro, Brasil.

As células mTEC 3.10 foram estabelecidas a partir do timo de

camundongos da linhagem C57BL/6 e o fenótipo de células medulares foi

determinado por imunofenotipagem com o anticorpo Th-3 e Th-4 (HIROKAWA et

al., 1986; MIZUOCHI et al., 1992). Elas foram avaliadas utilizando-se um painel

de anticorpos monoclonais anti-citoqueratina, confirmando o fenótipo medular

distinto (NIHEI et al., 2003). Além disso, confirmou-se por citometria (FACS) que

essas células são MHCII+, CD80+.

As células mTEC 3.10 são aderentes ao plástico e foram cultivadas em

garrafas de 75 cm2 contendo 15 mL de meio RPMI 1640 Cultilab (Campinas, SP,

Brasil) suplementado com 10% de soro fetal bovino (SFB) Cultilab Campinas,

SP, Brasil) a 370 C, em estufa com atmosfera de 5% de CO2.

5.2 Silenciamento de Aire em mTEC 3.10 por RNA interferente (siRNA)

Ao atingirem semi-confluência, as células mTEC 3.10 foram destacadas

das garrafas de cultura utilizando-se 10 ml de solução de tripsina 1x (2,5 g de

tripsina suína + 0.5 ml de EDTA pH 8.0 por cinco minutos a temperatura

ambiente). As células foram quantificadas em um contador automatizado

(Cellometer Auto T4 Cell Viability Counter Nexcelom Bioscience, Lawrence, MA,

USA). As células foram então colhidas por centrifugação a 1000 x g durante

cinco minutos. Aproximadamente 5 x 105 células foram semeadas em garrafas

de cultura de 25 cm2 contendo 5 ml de meio RPMI 1640 e 10% SFB e colocadas

em cultura.

A preparação dos complexos RNAi-lipofectamina se deu da seguinte

forma: Cinco (5) nanomoles de siRNA anti-Aire (Figura 6) foram dissolvidos em

48

100 μl de Opti-MEM® I Reduced Serum Medium Gibco (Paisley, Scotland, UK)

com 6 μl de HiperFect Transfection Reagent Qiagen® (Germantown, MD, USA).

A mistura foi vigorosamente agitada durante 10 segundos e em seguida

incubada por 10 minutos a temperatura ambiente para a formação dos

complexos de transfecção siRNA-lipofectamina (lipossomos).

Figura 6 Sequência do RNA interferente para o transcrito do gene Aire.

Os complexos foram adicionados à cultura das células mTEC 3.10 na

proporção de 5nM de siRNA/5x106 células, e a cultura foi incubada por 24 horas,

a 37°C em atmosfera com 5% de CO2. As amostras foram divididas em dois

grupos: (1) células mTEC 3.10 cultivadas apenas na presença de lipofectamina

(grupo controle) e (2) células mTEC 3.10 cultivadas na presença do complexo

siRNA anti-Aire + lipofectamina (grupo Aire silenciado).

5.3 Extração de RNA total

A fim de prevenir a contaminação por ribonucleases durante a extração e

manuseio dos RNAs, toda a vidraria, tubos plásticos, espátulas e pinças

utilizadas foram previamente autoclavados, sendo que os materiais plásticos

(tubos e ponteiras) foram novos e descartáveis. Todo o procedimento foi

realizado usando luvas de látex novas sem talco e também descartáveis, que

foram trocadas durante o decorrer do procedimento da extração de RNA.

As células mTEC 3.10 após 24 horas do início do silenciamento com

siRNA anti-Aire foram destacadas das garrafas de cultura de 25 cm2 por

tratamento com 5 ml de solução de tripsina 1x por cinco minutos. A tripsina foi

inativada por adição de excesso de meio de cultura RPMI + SFB e as células

foram colhidas por centrifugação a 1000 x g durante cinco minutos. A seguir,

49

elas foram lavadas duas vezes com PBS 1 x e centrifugadas a 1000 x g durante

cinco minutos.

Para a extração de RNA total utilizamos o kit mirVanaTM miRNA Isolation

Kit Ambion ® (Grand Island, NY, USA), o qual permite a separação simultânea

de RNAs de alto peso molecular (≥ 200 nucleotídeos, incluindo os mRNAs e os

lncRNAs) e de RNAs de baixo peso molecular (≤ 200 nucleotídeos, incluindo os

miRNAs).

Para iniciar a extração, foram acrescidos 1000 μl de solução de lise à

suspensão de células. Agitou-se vigorosamente (pipetagens sucessivas e 10

segundos no vórtex) para lise completa das células formando um lisado

homogêneo. Adicionou-se 100 μl de miRNA Homogenate Additive e misturou-se

bem (vórtex por 15 segundos).

A mistura foi deixada em banho de gelo picado por 10 minutos e depois

juntamos mais 1000 μl de solução de fenol:clorofórmio (1:1, solução ácida), a

qual foi agitada vigorosamente em vórtex por 60 segundos. O lisado então foi

centrifugado a 10.000 x g por cinco minutos à temperatura ambiente. A fase

aquosa foi cuidadosamente recolhida e transferida para um novo tubo ao qual

adicionamos etanol absoluto na proporção de 1,25 x em relação ao volume do

lisado recuperado após a centrifugação. Agora a mistura foi passada numa

coluna de sílica que acompanha o kit de extração. Para cada amostra foi

montada uma coluna em um tubo coletor e 700 μl da mistura foram pipetados na

superfície desta coluna que fora centrifugada por 15 segundos a 10.000 x g. O

líquido (void volume) foi descartado e o procedimento repetido até que toda a

mistura lisado/etanol tivesse sido filtrada. O RNA total que ficou adsorvido na

sílica da coluna precisou ser liberado e coletado. Para isto, passamos nesta

coluna 700 μl de miRNA Wash Solution 1 por centrifugação (10 segundos a

10.000 x g). O líquido (void) foi descartado e 500 μl de miRNA Wash Solution 2/3

foi aplicado na coluna e centrifugado por 10 segundos a 10.000xg. O último

passo foi repetido e, após o descarte do líquido, o tubo foi centrifugado por 1

minuto para remoção dos resíduos líquidos. A coluna foi transferida para um

novo tubo coletor e a ela foram adicionados 100 μl de água DEPC pré-aquecida

(95°C). O tubo foi centrifugado por 30 segundos para a recuperação da solução

de RNA total que foi armazenada em freezer a -80°C.

50

5.4 Quantificação e avaliação da pureza das preparações de RNA total

A quantificação das amostras de RNA total foi feita por espectrofotometria

UV no aparelho NanoDrop ND-1000 (NanoDrop Products, Wilmington, DE,

USA). Uma unidade (1U) de absorbância A260 corresponde a 40µg de RNA/ml.

Também avaliamos pureza das preparações por meio de cálculo das razões

absorbância em diferentes comprimentos de onde de UV. Amostras livres de

fenol apresentaram razão A260/A230 entre 1.8 a 2.0 e livres de contaminação com

proteínas razão A260/A280 entre 1.8 e 2.2.

5.5 Avaliação da integridade das preparações de RNA total

A integridade das preparações de RNA total extraído das células controle

e transfectadas com RNA de interferência anti-Aire, em triplicatas, foi avaliada

por meio de eletroforese microfluídica utilizando um aparelho Agilent 2100

Bioanalyzer (Agilent Technologies, Santa Clara, CA, USA), segundo o protocolo

do fabricante. A técnica permite a separação eletroforética das frações de RNA

em um chip (RNA Nano Chip 6000 Agilent) a partir de 200 ng de RNA total. O

aparelho calcula o índice de integridade (RNA Integrity Number ou RIN), com

escala de qualidade variando de 0 a 10 (sendo 10 a melhor) baseada na razão

entre as áreas dos picos correspondentes aos RNAs ribossômicos 28S e 18S,

além de exibir o perfil eletroforético das amostras.

A integridade dos RNAs utilizados pode ser observada em imagens do gel

virtual (Figura 7) e da densitometria (Figura 8). No gel, o perfil eletroforético das

amostras demonstra a ausência de produtos de degradação. Na imagem da

densitometria podem ser visualizados os picos das frações de RNAr 28S, RNAr

18S e RNAr 5S + RNAt 4S. As amostras exibiram um perfil de excelente

integridade, com RIN superior a 9.0.

51

Figura 7 Eletroforese microfluídica das preparações de RNA total. mTECs 3.10. controle (C) e

Aire silenciadas (A).

Figura 8 Densitometria da eletroforese microfluídica das amostras de RNA total. mTECs 3.10

controle (C) e Aire silenciadas (A).

52

5.6 Reação de transcrição reversa dos mRNAs

As reações de transcrição reversa foram realizadas com 2 μg de RNA

total, 1 μl de oligo (dT) e 1 μl de dNTP mix a 10 nM, em um volume final de 12 μl,

segundo instruções do fabricante (Invitrogen Corporation, Carlsbad, CA, USA).

As amostras permaneceram a 65°C durante cinco minutos em um termociclador

e, em seguida, foram colocadas em banho de gelo picado e foram adicionados 4

μl de Buffer 5x first-strand, 2 μl de dTT e 1 μL de RNasin® Ribonuclease

Inhibitors Promega (Sydney, Australia), antes de incubar a amostra por 2

minutos a 42 °C. Finalmente, 1 μl da enzima transcriptase reversa SuperScript

II® Invitrogen (Carlsbad, CA, USA) foi adicionado, resultando em um volume

final de 20 μl.. A reação permaneceu a 42°C por 50 minutos seguindo a 70°C por

15 minutos.

5.7 Reação de polimerização em cadeia quantitativa e em tempo real (qRT-

PCR)

A PCR quantitativa e em tempo real (qRT-PCR) foi utilizada para a

confirmação do silenciamento do gene Aire, por meio da quantificação relativa

da expressão do seu mRNA (DNA complementar ou cDNA).

As sequências do par de primers forward (F) e reverse (R) utilizada para o

cDNA de Aire de Mus musculus (GenBank acc NM_009646.1) foram as

seguintes:

F: 5’ GCAACTCTGGCCTCAAAGAG 3’

R: 5’ GGTCTGAATTCCGTTTCCAA 3’

O nível de expressão de Aire foi normalizado pela expressão do gene

constitutivo HPRT de Mus musculus (GenBank acc NM_013556.2), o qual é

comumente utilizado para este fim. As sequências do par de primers F e R

utilizadas para amplificar o mRNA (cDNA) de HPRT foram:

F: 5’ GCCCCAAAATGGTTAAGGTT 3’

R: 5’ CAAGGGCATATCCAACAACA 3’

As reações de qRT-PCR foram realizadas utilizando-se o reagente

SYBR® Green PCR Master Mix Applied Biosystems (Life Technologies

Corporation, Carlsbad, CA, USA), em placas de 48 poços, com ciclagem padrão

http://www.ncbi.nlm.nih.gov/nuccore/6753019

53

de aproximadamente duas horas no aparelho StepOne® Real-Time PCR

System Applied Biosystems (Life Technologies Corporation, Carlsbad, CA, USA)

e software de leitura StepOne® Real-Time PCR System Software (versão 2.1).

Na reação final foram utilizados 10 μl de SYBR Green PCR Master Mix,

7,4 μl de água livre de nucleases, 0,8 μl de cada primer e 1 μl de cDNA,

resultando em um volume final de 20 μl. O protocolo de ciclagem térmica foi: 1 x

95°C durante 10 minutos (holding stage); 40 x desnaturação a 95°C por 15

segundos e anelamento a 60°C por um minuto (cycling stage); obtenção da

curva de melting (melting curve stage). A curva é obtida após três passos, sendo

o primeiro de 15 segundos a 95°C, o segundo de um minuto a 60°C e o terceiro

de 15 segundos a 95°C.

A avaliação da expressão dos transcritos do gene Aire por meio da qRT-

PCR foi realizada pela da comparação dos valores de quantificação relativa

deste com os valores de quantificação relativa do gene constitutivo (HPRT), Para

a análise estatística dos dados utilizamos o teste t-student por meio do software

estatístico GraphPad Prism 6.0 (http://www.graphpad.com/prism/Prism.htm),

sendo considerados significativos valores de p ≤ 0.05.

5.8 Extração protéica

Ainda com a finalidade de avaliar possíveis variações na quantidade da

proteína AIRE, foi realizado o western blot das amostras tratadas com RNAi anti-

Aire e das amostras controle. Após 24 horas de silenciamento de Aire, as

proteínas totais das mTEC 3.10 de cada cultura foram extraídas. As células

(aproximadamente 5x105 células) foram destacadas das garrafas de cultura de

25 cm2 utilizando-se Cell Scraper (Techno Plastic Products AG, Switzerland) e

colhidas por centrifugação a 1000 x g durante cinco minutos. As células foram

lavadas três vezes com PBS 1x, e centrifugadas a 1000 x g durante cinco

minutos. Após, 400 µl do tampão RIPA com inibidores de protease foi adicionado

e as células foram lisadas com o auxílio de um sonicador. O homogeneizado foi

então centrifugado a 12.000 rpm por 15 minutos a 4°C. O sobrenadante/lisado

foi armazenado em freezer -80°C. A diluição das amostras foi 1:10, e a curva de

concentração de proteína nas amostras foi comparada com uma curva padrão

(padrão=BSA 2mg/ml) aos quais foram adicionados solução de Bradford, o qual,

54

na presença de proteína reage, resultando em coloração azul. A dosagem foi

realizada em espectrofotômetro Ultrospec 2100 (Amershan Pharmacia Biotech,

Uppsala, Sweden).

5.9 Eletroforese em Gel de Poliacrilamida na Presença de SDS (SDS-PAGE)

Foi realizada eletroforese em gel desnaturante (SDS-PAGE) utilizando-se

o sistema de tampão descontínuo descrito por (LAEMMLI, 1970). Nesta

eletroforese as proteínas são separadas de acordo com seu peso molecular. Foi

utilizado gel de poliacrilamida, com gel de empilhamento de 4% e gel de

separação a 10% As amostras para eletroforese foram preparadas obedecendo-

se a proporção em volume 3:1, respectivamente, de amostra e Tampão de

Amostra concentrado 4x (240 mM Tris-HCl pH 6,8; 8% SDS; 40% glicerol;

bromofenol blue e betamercaptoetanol). As amostras foram aquecidas por cinco

minutos a 95°C em banho seco. O Tampão de Corrida continha 25 mM Tris-HCl,

pH 8,3; 190 mM glicina; 0,1% SDS e o padrão de peso molecular utilizado foi:

Precision Plus Protein™ Dual Color Standards Biorad (250 kDa, 150 kDa, 100

kDa, 75 kDa, 50 kDa, 37 kDa, 25 kDa, 20 kDa, 15 kDa e 10 kDa) (Hercules, CA,

USA), em corrida a 20 mA por aproximadamente duas horas.

5.10 Western Blot

Após a corrida, as proteínas do gel foram transferidas para membrana

de nitrocelulose: as proteínas foram eletrotransferidas a 70 volts por duas horas,

utilizando-se como Tampão de Transferência 25 mM Tris-HCl, 190 mM glicina,

20% metanol e 0,1% SDS (TOWBIN; STAEHELIN; GORDON, 1979). Após a

transferência, a membrana foi corada com 0,5% Ponceau por cinco minutos,

para visualização das bandas. Em seguida, a membrana foi lavada com água

miliQ e bloqueada por duas horas em leite desnatado 5% preparado em PBS-

Tween (50 mM Tris-HCl, pH 8,0; 150 mM NaCl; 0,1% Tween-20), sob agitação

constante a 23°C. Após o bloqueio, a membrana foi incubada com o anticorpo

primário Anti-Aire D17 Santa Cruz Biotechnology®, inc (Dallas, Texas, USA)

55

diluído 1:500 overnight, sob agitação, a 23°C. Após, foram realizadas lavagens

com PBS-T por cinco vezes de cinco minutos, também sob agitação. Em

seguida, a membrana foi incubada com o anticorpo secundário conjugado com

peroxidase (diluído 1:10000 em PBS-T) por 50 minutos. Após incubação fez-se a

lavagem da membrana em PBS-T por cinco vezes de cinco minutos e a

revelação foi feita através do aparelho ImageQuant™ LAS 500 Ge Life Sciences

(Piscataway, NJ, USA), utilizando-se o substrato apropriado para a peroxidase

(Luminata™ Forte Merck Millipore). A reação foi conduzida protegida da luz em

diferentes intervalos de exposição.

Após a revelação a membrana foi lavada cinco vezes de cinco minutos e

o processo anteriormente descrito foi repetido a partir do bloqueio com o

anticorpo primário anti-GAPDH (14C10) Cell Signaling Technology (Danvers,

Massachusetts, USA) diluído 1:10000 e secundário conjugado com peroxidase

(a 1:10000).

A intensidade das bandas foi convertida em valores numéricos pelo

software Image J e analisados estatisticamente por meio do software estatístico

GraphPad Prism 6.0 com o teste t-student

5.11 Oligomicroarrays

Para análise do transcriptoma das células mTEC 3.10 controle e Aire

silenciadas utilizamos a tecnologia de oligomicroarrays da Agilent, do tipo

SurePrint G3 Mouse GE 8 x 60K Microarray Kit (Agilent Technologies, Santa

Clara, CA, USA) (AMADID:- 028005). Os microarrays continham o genoma

funcional murino completo. Os arrays continham 60.000 oligos-sondas de 60

mer preparados pelo processo SurePrint (sistema de impressão) em lâminas de

vidro (2,5 x 7,5 cm), incluindo sondas de mRNA e de lncRNAs (genoma do

camundongo anotado em julho de 2007 = NCBI37/mm9).

Utilizamos a metodologia monocolor cianina 3, verde (Cy3) e os

procedimentos de amplificação e marcação dos RNAs foram feitos com o Quick

56

Amp Labeling Kit One-Color (Agilent Technologies, Santa Clara, CA, USA) a

partir de 100 ng de RNA total.

Foram misturadas as amostras de RNA controle (spike-in) com 100 ng de

RNA total para realização da etapa de transcrição reversa com a enzima

transcriptase reversa Monoley Murine Leukemia Virus – Reverse Transcriptase

(MMLV-RT). Além disso, foram utilizados primers adaptados com timinas (T)

consecutivas acopladas a um promotor T7 para síntese de cDNAs de dupla fita.

Após essa reação, a enzima T7 RNA polimerase foi adicionada juntamente com

nucleotídeos marcados com Cy3 (síntese de RNA complementar, cRNAs) e sua

posterior amplificação.

As amostras de cRNAs foram purificadas e hibridadas em lâminas de

microarrays em câmaras de hibridação Agilent Microarray Hibridization

Chambers (Agilent Technologies, Santa Clara, CA, USA) a 65°C por 17 horas

em um forno rotativo (Agilent Technologies). As lâminas foram lavadas com os

tampões GE Wash Buffer 1 e GE Wash Buffer 2.

5.12 Aquisição de imagens de hibridação

As imagens de hibridação foram obtidas com auxilio de um Microarray

Scanner de alta resolução Surescan (Agilent) a 550 nm.

5.13 Quantificação dos dados de microarrays

A quantificação dos dados foi realizada com auxílio do software Feature

Extraction, versão 12.0.1.1 (Agilent Technologies, Santa Clara, CA, USA), que

realiza o posicionamento automático de grids por reconhecimento de regiões

marginais, além de fornecer diversos parâmetros para análise do controle de

qualidade das hibridações.

57

5.14 Análise dos dados de microarrays

Após o escaneamento das lâminas, os dados numéricos foram analisados

no ambiente R (versão 3.1.2 - R Development Core Team, 2011 disponível em R

Project for Statistical Computing ( https://www.r-project.org/), que consiste em

um ambiente estatístico-matemático que permite a execução de múltiplas

funções, sendo amplamente empregado em análise de dados de microarray,

permitindo ainda execução de cálculos e visualização gráfica dos resultados.

5.14.1 Correção do background

Os dados de expressão foram introduzidos no ambiente estatístico-

matemático R, versão 3.2.1 e tiveram seus controles internos positivos e

negativos retirados. Foram eliminados os dados cujos valores sobrepuseram os

valores de background (correção do background ou signal-background).

5.14.2 Normalização dos dados de microarrays

A fim de remover as variações não biológicas capazes de afetar as

medições dos níveis de expressão gênica para tornar os dados comparáveis

realizamos a normalização dos mesmos. A normalização foi realizada pela

metodologia quantile, método considerado robusto que corrige as diferenças nas

densidades de probabilidade de todas as amostras (BOLSTAD et al., 2003).

Para a visualização e conferência dos dados normalizados foi gerado gráfico em

formato boxplot (Figura 11).

5.14.3 Correlação de Pearson

O cálculo da correlação de Pearson e a montagem do agrupamento

hierárquico dos coeficientes de correlação foram executados no ambiente R.

Este coeficiente reflete o grau de correlação entre variáveis de escala métrica. É

obtido pela divisão entre a covariância de cada uma das variáveis e o produto

https://www.r-project.org/

58

dos desvios padrão amostrais destas variáveis. Indica a relação entre dois

conjuntos numéricos ordenados. Varia de -1.0 a 1.0, sendo -1.0 uma correlação

negativa perfeita, isto é; por exemplo, se a expressão de um gene A aumentar

ao longo do tempo, a do gene B deve diminuir proporcionalmente. Em contraste,

se os genes A e B aumentam proporcionalmente ao longo do tempo apresentam

uma correlação perfeita positiva e tem um coeficiente de correlação igual a 1.0.

Se não apresentarem absolutamente nenhuma relação um com o outro seu

coeficiente será de 0 (BEN-DOR; SHAMIR; YAKHINI, ; MÅNSSON et al., 2004).

Além disso, para melhor visualização do resultado, realizou-se o

agrupamento hierárquico das amostras, a fim de agrupá-las segundo a

semelhança do perfil de expressão (Figura 12)(EISEN et al., 1998). As análises

foram realizadas utilizando o pacote gplots (disponível no Bioconductor Latin

America: https://cran.r-project.org/web/packages/gplots/).

5.14.4 Análise estatística dos dados para obtenção dos transcritos

diferencialmente expressos

Para análise dos transcritos diferencialmente expressos utilizamos as

funções do pacote Limma (Linear Models for Microarray Data) (SMYTH, 2005)

(disponível em: http://bioconductor.org/packages/release/bioc/html/limma.html),

o qual aplica um modelo linear na análise estatística e reajusta os erros padrão

segundo um modelo Bayesiano (Empirical Bayes e outros métodos), usado para

pedir informações através de genes que fazem as análises estáveis mesmo para

experimentos com pequeno número de matrizes. O método de Benjamini-

Hochberg foi aplicado para a correção para múltiplos testes (BENJAMINI;

HOCHBERG, 1995).

5.14.5 Agrupamento hierárquico dos transcritos diferencialmente

expressos

Foram considerados diferencialmente expressos aqueles transcritos com

valor de p < 0.05 no teste t moderado e corrigido por false discovery rate (FDR)

59

(Benjamini Hochberg) e que apresentaram fold change ≥ 1.5. A seguir, foram

submetidos ao agrupamento hierárquico não supervisionado (Hierarchical

Clustering – HCL) (Figuras 13 e 14), que consiste em um método aglomerativo

no qual os perfis de expressão semelhantes são agrupados. A distância métrica

utilizada foi a correlação de Pearson e o método de agrupamento foi average

linkage. As semelhanças e diferenças de expressão estão apresentadas como

heat maps. O agrupamento hierárquico e os heat maps foram montados

utilizando-se a função Multiple Array Viewer do Multiple Experiment Viewer

(MeV) , versão 4.9.0, (disponível em www.tm4.org/mev.html).

5.15 Identificação das sequências dos RNAs longos não codificadores

A identificação das sequências dos lncRNAs foi feita através do University

of California, Santa Cruz Genome Browser (UCSC Genome Browser),

(disponível em https://genome.ucsc.edu/) de acordo com a montagem do

genoma murino de julho de 2007 (NCBI37/mm9), levando-se em conta as

posições cromossômicas e o blast das sondas, cujas sequências foram

fornecidas pela Agilent (Tabela 1).

5.16 Classificação dos RNAs longos não codificadores

A classificação dos lncRNAs foi realizada de acordo com a anotação de

cada um deles no UCSC Genome Browser e anotação fornecida pela Agilent

junto às lâminas de array (Figura 15).

5.17 Identificação e posicionamento dos genes codificadores mais

próximos de loci de lncRNAs

Um arquivo com todo o genoma murino foi obtido através do GENCODE

(http://gencodegenes.org) e por meio da plataforma Linux, pacote Bed Tools

(Closest) (http://bedtools.readthedocs.org/en/latest/content/tools/closest.html) foi

http://www.tm4.org/mev.html

http://gencodegenes.org/

http://bedtools.readthedocs.org/en/latest/content/tools/closest.html

60

realizada a busca e posicionamento ao longo do genoma dos genes

codificadores mais próximos aos lncRNAs (somente daqueles diferencialmente

expressos e modulados por Aire) (Figura 16 e Tabela 2).

5.18 Análise do potencial codificador dos RNA longos não codificadores

A análise do potencial codificador dos lncRNAs diferencialmente

expressos foi realizada através de dois softwares (Tabela 3) que utilizam

abordagens diferentes. Como controle e comparação foram utilizados além dos

lncRNAs, 50 genes codificadores randomicamente escolhidos e cujas

sequências dos respectivos mRNAs foram obtidas no UCSC Genome Browser.

Os resultados obtidos por cada software foram comparados e são mostrados na

forma de Diagrama de Venn (Figura 17).

5.18.1 Análise do potencial codificador dos RNAs longos não codificadores

por Coding-Potential Assesment Tool (CPAT)

Utilizamos a ferramenta Coding-Potential Assesment Toll (CPAT)

(disponível em: code.google.com/p/cpat/) que permite a detecção do potencial

codificador de transcritos por meio de uma técnica livre de alinhamentos. Este

software utiliza um modelo de regressão logística baseado em quatro

características: 1) O tamanho da Open Reading Frame (ORF, ou matriz aberta

de leitura), uma vez que ORFs longas dificilmente são observadas em

sequências não codificadoras; 2) A cobertura da ORF, isto é, a razão entre os

comprimentos da ORF e do transcrito; 3) O Fickett TESTCODE score, que

reflete o efeito combinatório possível da composição de nucleotídeos e a

tendenciosidade ao uso de determinado códon; e por fim o 4) hexâmero score,

que determina o grau relativo de viés no uso de um hexâmero em determinada

sequência (WANG et al., 2013a).

Cada uma dessas características são mostradas ao final da análise, e

resultam em um score que indica a probabilidade de codificação daquela

sequência. Os valores desse score variam de 0 a 1. Valores próximos a 0

61

indicam menor potencial codificador, sendo que à medida que se aproximam de

1 indicam maior potencial codificador. O cutoff, portanto, fica em 0.5 (WANG et

al., 2013a).

A vantagem desta técnica consiste na independência de alinhamentos,

uma vez os RNAs longos não codificadores não são, em sua maioria,

conservados entre as espécies(WANG et al., 2013a).

5.18.2 Análise do potencial codificador pelo software Coding Potential

Calculator (CPC)

A análise do potencial codificador de um transcrito realizada pelo software

CPC (disponível em: cpc.cbi.pku.edu.cn/) se baseia em dois conceitos: 1) ORFs

– seu tamanho, sua qualidade, sua cobertura e sua integridade (se ela começa

com um códon de início e termina com um stop códon). 2) Alinhamento do tipo

BLASTX, ou seja, é realizada a “tradução” do lncRNA o e o resultado é

comparado com os dados dos bancos de dados de proteínas. Dessa forma,

transcritos não codificadores tendem a ter ORFs menores, com baixa cobertura

e integridade, além de não alinhar com proteínas. Em caso de alinhamento com

sequencias codificadoras de proteínas, pode se dispersar por qualquer uma das

três frames. Cada uma dessas classes fornece um score, que são incorporados

por uma máquina de vetores de suporte (SVM – support vector machine), um

classificador linear binário não probabilístico, que fornece um score final.

Escores negativos indicam transcritos não codificadores e positivos indicam os

codificadores. O SVM padrão toma como entrada um conjunto de dados e

prediz, para cada entrada dada, qual de duas possíveis classes a entrada faz

parte (KONG et al., 2007).

5.19 Avaliação da presença da cauda poli A

A presença da cauda poli A foi realizada avalindo-se as sequências

obtidas através do UCSC Genome Browser após identificação das mesmas.

62

Resultados

63

6. RESULTADOS

6.1 Silenciamento de Aire na linhagem mTEC 3.10

Visando avaliar o nível de sileciamento do gene Aire em células mTECs

transfectadas in vitro com RNA interferente anti-Aire após período de 24 horas

da transfecção, nós avaliamos a expressão relativa deste gene por qRT-PCR. O

histograma (Figura 9) demonstra que a transfecção com RNA interferente foi

eficaz em diminuir os níveis transcricionais de Aire, promovendo o silenciamento

parcial (70%) deste gene.

Figura 9 Histograma mostrando a expressão transcricional relativa do gene Aire determinada por

qRT-PCR em células mTEC 3.10 controles (Ctrl) ou transfectadas com RNA interferente siRNA anti-Aire (Aire-siRNA). Teste t de Student *p ≤ 0,0193.

6.2 Western Blot da proteína AIRE

Com o objetivo de verificar o efeito do silenciamento de Aire a nível

proteico foi realizado o western blot das proteínas totais das amostras controles

e tratadas com RNAi anti-Aire, após 24 horas da transfecção. Pode-se observar

que o silenciamento de Aire foi capaz de promover uma redução nos níveis da

proteína AIRE nas células mTECs 3.10. (Figura 10).

64

Figura 10 Westen blot da proteína AIRE em células mTECs 3.10 controles (Ctrl) e transfectadas

com RNA interferente siRNA anti-Aire (Aire-siRNA). (a) membrana de nitrocelulose. (b)

histograma da intensidade das bandas convertidas em valores numéricos, teste t de Student *p ≤

0,0215. Dados representativos de três experimentos .

6.3 Normalização dos dados de microarray

O primeiro passo no tratamento dos dados obtidos nas as hibridizações

com os microarrays foi a retirada dos controles positivos e negativos existentes

nas lâminas e a correção do backgroud, além da conversão dos dados

numéricos em escala logaritmica.

Depois dessa etapa procedemos a normalização dos dados, com o intuito

de remover aqueles valores oriundos de variações não biológicas que poderiam

afetar as medições dos níveis de expressão gênica entre as condições

experimentais. Os métodos de normalização visam compensar as variações

técnicas sistemáticas entre as lâminas de microarrays afim de aprimorar a

análise das diferenças biológicas entre as amostras. A normalização utilizada foi

a do tipo quantile a qual tornou as amostras comparáveis, reduzindo ao máximo

os artefatos experimentais (BOLSTAD et al., 2003). O resultado da normalização

pode ser visto na Figura 11, por meio do gráfico boxplot, onde cada um dos

boxes representa uma amostra. É possível observar que todos possuem o

mesmo comprimento e estão dispostos de maneira uniforme, indicando que os

valores foram normalizados.

a b

Ctrl Aire-siRNA

65

Figura 11 Gráfico boxplot das amostras controle (em verde) e tratadas com siRNA-anti Aire (em

rosa) após a normalização pelo método quantile.

6.4 Correlação de Pearson

A primeira abordagem utilizada após a normalização dos dados foi a

comparação do padrão de expressão global entre as células controle e Aire

silenciadas dos dois tipos de transcritos cujas sondas estavam presentes nos

microarrays (mRNA e lncRNAs). Para tanto, utilizou-se a coeficiente de

correlação de Pearson como medida da correlação entre a expressão gênica de

ambas as condições e o agrupamento hierárquico dos dados de expressão pré-

processados, para melhor visualização do resultado (Figura 12).

No agrupamento hierárquico resultante da aplicação do coeficiente de

correlação de Pearson é possível observar, segundo a escala de cor e seu

respectivo valor numérico, que houve baixa correlação entre as amostras

controle e silenciadas para o gene Aire, indicando baixa similaridade entre elas.

O dendrograma, que apresenta a relação hierárquica entre as amostras, também

permite notar a distinção entre os dois grupos (Figura 12).

66

Figura 12 Agrupamento hierárquico da expressão transcricional global de mRNAs e de lncRNAs

resultante da aplicação do coeficiente de correlação de Pearson. Neste tipo de análise foram comparadas as expressões transcricionais de células mTEC 3.10 (controle) com as de células mTEC 3.10 Aire silenciadas (Aire si-RNA).

6.5 Transcritos diferencialmente expressos após silenciamento de Aire em

células mTEC 3.10

Após normalização e análise da similaridade transcricional entre as

amostras procedeu-se com a análise estatística dos perfis transcricionais nas

duas condições (mTECs controle e mTEC 3.10 Aire silenciadas) através da

definição da expressão gênica diferencial por meio dos recursos de modelagem

linear do pacote limma.

Foram identificados 480 transcritos modulados após o silenciamento de

Aire, dentre os quais 65 são lncRNAs. Para isto, utilizamos como cuttoff um valor

de p ajustado ≤ 0.05 (Benjamini-Hochberg FDR) e fold change ≥ 1.5, conforme

mostrado nos heat map da Figura 13. Pode-se observar a diferença

transcricional entre as duas condições.

67

Figura 13 Heat map dos transcritos modulados (mRNAs e lncRNAs) comparando as amostras de mTEC3.10 controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE) (fold change ≥. 1.5, p value ≤ 0.05).

68

6.6 LncRNAs diferencialmente expressos após silenciamento de Aire em

células mTEC 3.10

O heat map e agrupamento hierárquico não supervisionado dos lncRNAs

diferencialmente expressos após silenciamento de Aire em células mTEC 3.10 é

mostrado na Figura 14. Este tipo de análise permitiu a identificação dos lncRNAs

modulados, ou seja, aqueles induzidos e os reprimidos indicando o papel

modulador de Aire sobre esta espécie de RNAs. Dentre os lncRNAs

significativamente modulados por Aire, a maioria teve sua expressão aumentada

após o silenciamento de Aire.

Figura 14 Heat map dos lncRNAs modulados por Aire comparando as amostras de mTEC 3.10

controle (CTL) versus mTEC3.10 Aire silenciadas (siAIRE) (fold change ≥. 1.5, p value ≤ 0.05).

69

6.7 Caracterização dos lncRNAs modulados por Aire

6.7.1 Classificação dos lncRNAs

Os lncRNAs modulados por Aire também foram distribuídos segundo seus

tipos (lincRNAs, intronicos, sense RNAs ou antisense RNAs) (HARROW et al.,

2012; MA; BAJIC; ZHANG, 2013) (Figura 15), segundo suas posições

genômicas em relação aos genes codificadores de proteína mais próximos.

O primeiro passo para realizar essa distribuição foi a identificação das

sequências dos lncRNAs utilizando o UCSC Genome Browser A busca foi

baseada no identificador (ID) de cada lncRNA presente nos microarrays

fornecido pela Agilent. Para alguns lncRNAs esse ID correspondia a designação

da própria posição genômica dos mesmos e para aqueles já anotados já havia a

atribuição de um “símbolo”. A maioria dos lncRNAs foi do tipo intergênica e os

outros do tipo sense ou antisense. Alguns não puderam ser classificados por

serem expressed sequence tags (ESTs) ou por ainda não terem sido anotados.

Figura 15 Distribuição dos lncRNAs modulados por Aire segundo o tipo.

70

6.7.2 Localização cromossômica dos lncRNAs modulados por Aire

Os 56 lncRNAs modulados por Aire apresentaram ampla distribuição

genômica, pois dos 19 cromossomos do camundongo 16 abrigam genes que

codificam esses RNAs. Os únicos cromossomos que, segundo nossas análises,

não abrigam genes de lncRNAs modulados são o 7, 11 e 14.

A localização cromossômica e a respectiva modulação dos lncRNAs

modulados está disponível na Tabela 1.

Tabela 1 Localização cromossômica dos lncRNAs modulados por Aire em células mTEC 3.10 e sua respectiva modulação, em log de fold change.

Transcrito Localização cromossômica

Modulação

chr1:166985480-166986024 1q H2.3 -0.624141

chr1:173353316-173367449 1q H3 0.619478

chr1:23340097-23340552 1q A5 -0.608960

chr1:42972297-42972716 1q B -1.145429

chr1:51753968-51803787 1q C1.1 -0.653655

chr2:132079092-132087069 2q F2 -1.318858

chr2:168136389-168136560 2q H3 0.719833

chr2:50917152-50917519 2q C1.1 -0.631880

chr3:41158056-41173053 3q B -0.754731

chr4:131905739-131910814 4q D2.3 0.892929

chr4:56013597-56020622 4q B3 0.958476

chr5:109154386-109154906 5q F 0.676600

chr5:113771679-113771745 5q F 1.8350136

chr5:20457725-20477550 5q A3 -0.607812

chr6:120613889-120648725 6q F1 -2.977375

chr6:128389484-128403407 6q F3 -0.679612

chr6:140904129-140992655 6q G2 1.346274

chr6:148163559-148164253 6q G3 0.949989

chr8:124569775-124639500 8q E2 0.9020438

chr8:124648600-124731250 8q E2 -0.706082

chr8:40072950-40088400 8q A4 -0.697459

chr8:48480224-48480698 8q B1.2 0.633400

chr10:93819821-93976621 10q C2 0.619878

chr12:17438940-17439119 12q A1.1 -0.833077

chr12:76765238-76765739 12q C3 -1.265034

chr16:30200995-30205965 16q B2 2.606374

chr16:40096026-40097242 16q B4 -0.822622

chr16:40312038-40315564 16q B4 -0.640034

chr16:40470294-40470935 16q B4 -0.749837

chr17:26679595-26688270 17q A3.3 -0.947260

chr17:56687541-56694616 17q D -0.716584

71

chr18:82862340-82875566 18q E3 -0.746198

chr19:55715078-55776694 19q D2 -1.008789

chr19:60261340-60273465 19q D3 -0.678625

chrX:138969489-138969953 Xq F1 -0.611557

AA545190 (chr6:10921468-10924378) 6q A1 -2.190374

Gldnos (chr9:54116387-54149377) 9q A5.3 -0.899747

Gm10649 (ch8:79272986-79424072) 8q C1 1.237955

Gm12603 (ch4:88696211-88730514) 4q C4 -0.986532

Gm2109 (chr9:83585082-83586854) 9q E2 -0.625288

Gm5083 (chr13:44216536-44220548) 13q A4 -0.609658

Gm839 (chr6:89162191-89166173) 6q D1 -0.756991

0610012G03Rik (chr16:31947137-31948607) 16q B2 -0.679947

1700028E10Rik (chr5:152171250-152198739) 5q G3 -0.805611

1700081H04Rik (chr5:119558245-119564552) 5q F 0.971099

2210409D07Rik (chr18:57791733-57798239) 18q D3 1.004202

2310002D06Rik (chr12:81608193-81618941) 12q C3 -0.726975

2700046A07Rik (chr18:62911328-62916001) 18q E1 -1.240995

4921515E04Rik (chr15:18007892-18299382) 15q A2 -1.425627

4930478P22Rik (chr5:35704202-35710326) 5q B2 0.913002

4930543E12Rik (chr7:120243750-120285529) 7q F1 0.816987

8430426J06Rik (chr15:81073084-81078401) 15q E1 0.918343

9330178D15Rik (chr3:155639318-155671556) 3q H4 -0.818355

E130018N17Rik (chr2:167978103-67980013) 2q H3 0.682404 Scarletltr (chr9:63928568-63935852) 9q C -1.087578

Wbscr25 (chr5:135463303-135477220) 5q G2 0.744069

6.7.3 Identificação e posicionamento dos genes codificadores mais

próximos

Procedeu-se a identificação e posicionamento genômico do gene

codificador mais próximo de cada um dos lncRNAs, abordagem é muito utilizada

no estudo dos lncRNAs. Através do pacote Bed Tools, ferramenta Closest. Foi

possível posicionarmos ao longo do genoma os genes codificadores mais

próximos de cada um dos lncRNAs (Figura 16 e Tabela 2).

Notamos que a maioria dos lncRNAs estão localizados até 10 kb de um

gene codificador de proteína. Alguns lncRNAs se mostraram sobrepostos a

esses genes (distância 0 kb) podendo ser do tipo intrônico, sense ou antisense.

72

Figura 16 Distribuição dos lncRNAs de acordo à sua distância em relação ao gene codificador

de proteína mais próximo no genoma. Em virtude do tamanho, as distâncias, em pares de base são apresentadas em escala logarítmica de base 10.

Tabela 2 Distância entre os genes codificadores de proteínas mais próximos e os lncRNAs modulados por Aire.

lncRNA Gene mais próximo Distância (pb)

chr1:166985480-166986024_R Tbx19 81960

chr1:173353316-173367449_F F11r 243

chr1:23340097-23340552_F Ogfrl1 32711

chr1:42972297-42972716_R Mrps9 9770

chr1:51753968-51803787_R Myo1b 2815

chr2:132079092-132087069_F Pcna 177

chr2:168136389-168136560_R Kcng1 41559

chr2:50917152-50917519_F Rnd3 68440

chr3:41158056-41173053_F Jade1 186603

chr4:131905739-131910814_R Phactr4 1025

chr4:56013597-56020622_R Klf4 468251

chr5:109154386-109154906_F Fgfrl1 18418

chr5:113771679-113771745_F Aym1 14569

chr5:20457725-20477550_R Rsbn1l 86

chr6:120613889-120648725_R Cecr2 0

chr6:128389484-128403407_R Fkbp4 836

chr6:140904129-140992655_F Pde3a 205135

chr6:148163559-148164253_F Ergic2 2664

chr8:124569775-124639500_R Banp 16616

chr8:124648600-124731250_R Zfpm1 74791

chr8:40072950-40088400_R Tusc3 0

chr8:48480224-48480698_R Stox2 42523

73

chr10:93819821-93976621_F Tmcc3 981

chr12:17438940-17439119_F Nol10 2040

chr12:76765238-76765739_R Wdr89 0

chr16:30200995-30205965_R Cpn2 50500

chr16:40096026-40097242_F Igsf11 1068757

chr16:40312038-40315564_F Lsamp 1217891

chr16:40470294-40470935_F Lsamp 1062520

chr17:26679595-26688270_R Ergic1 10187

chr17:56687541-56694616_F Safb2 7749

chr18:82862340-82875566_F Zfp236 215

chr19:55715078-55776694_R Vti1a 13128

chr19:60261340-60273465_R Fam204a 1024

chrX:138969489-138969953_R Acsl4 144412

AA545190 Ndufa4 875995

Gldnos Gldn 0

Gm10649 Nr3c2 2335

Gm12603 Mtap 52760

Gm2109 Elovl4 85445

Gm5083 Cd83 318035

Gm839 Etv6 0

0610012G03Rik Ncbp2 25

1700028E10Rik Vmn2r18 165497

1700081H04Rik Med13l 342800

2210409D07Rik 1700011I03Rik 0

2310002D06Rik Galnt16 1036

2700046A07Rik Spink13 10288

4921515E04Rik Cdh10 450702

4930478P22Rik Hmx1 21440

4930543E12Rik Arntl 65450

8430426J06Rik Mchr1 3691

9330178D15Rik Negr1 553202

E130018N17Rik Adnp 26452

Scarletltr Lctl

29102 Wbscr25 Cldn3

0

6.7.4 Avaliação do potencial codificador dos lncRNAs

Com o intuito de avaliar o potencial codificador dos lncRNAs modulados

por Aire, os respectivos transcritos foram analisados por meio de dois softwares:

Coding Potential Calculator (CPC) e Coding-Potential Assesment Tool (CPAT),

cujos resultados são mostrados na Tabela 3. Como controle e comparação foram

utilizados além dos lncRNAs, 50 genes codificadores randomicamente escolhidos

cujas sequências foram obtidas através do UCSC Genome Browser.

74

Dos 56 lncRNAs modulados por Aire, dez deles não tiveram suas

sequências identificadas apesar de procedermos buscas extensivas. Portanto,

esses RNAs não foram incluídos nesta análise.

Dentre os 46 RNAs analisados, 36 foram considerados lncRNAs sem

potencial codificador de acordo com as duas análises mencionadas (Figura 17).

Como os softwares CPC e CPAT utilizam abordagens diferentes, eles

também apresentam escores diferentes. Segundo a análise realizada pelo CPC,

os escores negativos indicam transcritos não codificadores e os positivos indicam

os codificadores, sendo que a escala é gradual, isto é, quanto menor o valor

(negativo), menor o potencial codificador, e quanto maior o valor, positivo, maior o

potencial codificador. Já a análise pelo CPAT define que valores próximos de 0

indicam RNAs com menor potencial codificador, os valores que se aproximam de

1 indicam RNAs com maior potencial codificador (cutoff = 0.5).

Figura 17 Diagrama de Venn resultante da análise do potencial codificador de lncRNAs

modulados por Aire pelos softwares Coding Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT).

75

Tabela 3 Potencial codificador dos lncRNAs modulados por Aire, segundo análise por Coding

Potential Calculator (CPC) e Coding Potential Assesment Tool (CPAT), e seus respectivos escores. PC= potencial codificador; NC= não codificador; C= codificador.

LncRNA

CPC CPAT Score PC Score PC

chr1:23340097-23340552_F

-1.1174 NC 0.524117 0.052411663618296

NC chr1:42972297-42972716_R

-0.868686 NC/fraco 0.031137

NC chr1:51753968-51803787_R

-1.16527 NC 0.074099

NC chr2:132079092-132087069_F

-0.952192 NC/fraco 0.026809

NC chr2:168136389-168136560_R

-1.51765 NC 0.001501

NC chr2:168136389-168136560_R

-1.0431 NC 0.010904

NC chr3:41158056-41173053_F

-0.998832 NC/fraco

0.020401

NC chr4:131905739-131910814_R

-1.08338 NC 0.066420

NC chr5:109154386-109154906_F

-1.07826 NC 0.034967

NC chr6:128389484-128403407_R

0.474943 C/fraco 0.071964

NC chr6:140904129-140992655_F

-1.1484 NC 0.057108

NC chr6:148163559-148164253_F

-1.3231 NC 0.019348

NC chr8:48480224-48480698_R

-0.974074 NC/fraco

0.006676

NC chr10:93819821-93976621_F

0.652656 C/fraco 0.563927

C chr12:17438940-17439119_F

-1.21435 NC 0.010353

NC chr12:76765238-76765739_R

-1.17462 NC 0.001280

0012805

NC chr16:30200995-30205965_R

-0.0449321 NC/fraco 0.076222

NC chr16:40096026-40097242_F

-1.11308 NC 0.018454

NC chr16:40312038-40315564_F

-1.29536 NC 0.009491

NC chr16:40470294-40470935_F

-1.0287 NC 0.027202

NC chr17:26679595-26688270_R

-1.0473 NC 0.035964

NC chr17:56687541-56694616_F

-1.11562 NC 0.040293

NC chr18:82862340-82875566_F

3.05171 C 0.137073

NC chr19:55715078-55776694_R

-0.982277 NC/fraco

0.078869

NC chrX:138969489-138969953_R

-1.33506 NC 0.018988

NC AA545190

-1.02647 NC 0.065524

NC Gldnos

4.09424 C 0.280901

NC Gm10649 0.719603 C/fraco 0.021866

NC Gm12603

-1.04526 NC 0.062977

NC Gm2109

-1.24438 NC 0.076009

NC Gm5083

-0.801628 NC/fraco 0.112012

NC Gm839

2.60907 C 0.410533

NC 0610012G03Rik

1.2344 C 0.758213

C 1700028E10Rik

0.23414 C/fraco 0.021682

NC 1700081H04Rik

0.889214 NC/fraco 0.049884

NC 2210409D07Rik

1.04089 C 0.200118

NC 2310002D06Rik

1.83068 C 0.179129

NC 2700046A07Rik

0.719603 C/fraco 0.217934

NC 4921515E04Rik

0.424853 C/fraco 0.014455

NC 4930478P22Rik

-0.823472 NC/fraco 0.294145

NC 4930543E12Rik

-1.0177 NC 0.032313

NC 8430426J06Rik

-1.20454 NC 0.051467

NC 9330178D15Rik

-0.970053 NC/fraco 0.155912

NC E130018N17Rik

-1.09724 NC 0.081384

NC Scarletltr

1.34505 C 0.061401

NC Wbscr25

0.512386 C/fraco

0.885803

C

76

6.7.5 Contagem de lncRNAs poliadenilados (lncRNAs poli A+)

A análise da sequência dos transcritos dos lncRNAs mostrou que a

maioria deles (41) não apresenta cauda poli A na extremidade 3’. Os poucos

RNAs poli A+ (5), apresentaram caudas variando de 10 a 30 resíduos de adenina

(Figura 18).

Figura 18 Porcentagem de lncRNAs poli A+ e lncRNAs poli A

-.

77

Discussão

78

7. DISCUSSÃO

Os timócitos em desenvolvimento, ainda no interior do timo, interagem

sequencialmente com duas estruturas desse órgão: a região cortical e a região

medular, entrando em contato íntimo com o estroma tímico composto, além de

outras células, pelas células tímicas epiteliais corticais (cTECs) e pelas epiteliais

medulares (mTECs). Esse contato timócitos-células estromais contribui com o

processo de maturação dos linfócitos T (GRIESEMER; SORENSON; HARDY,

2010; GUERDER et al., 2012; KLEIN, 2009; KLEIN et al., 2014; LAAN;

PETERSON, 2013a; LOPES et al., 2015).

Neste ambiente, as células cTECs estão envolvidas com a seleção

positiva dos timócitos e as mTECs com a seleção negativa (ANDERSON;

TAKAHAMA, 2012; MOUCHESS; ANDERSON, 2014; STARR; JAMESON;

HOGQUIST, 2003; TAKADA et al., 2014; TAKAHAMA, 2006).

As células mTECs exibem expressão ectópica de grande diversidade de

PTAs, um fenômeno denominado “expressão gênica promíscua” ou

simplesmente PGE. A expressão dos PTAs é de suma importância durante o

processo de seleção negativa de clones de linfócitos T (timócitos) autorreativos

antes que migrem para a periferia, contribuindo assim com a manutenção da

tolerância central (AKIYAMA et al., 2013; KYEWSKI; DERBINSKI, 2004; UCAR;

RATTAY, 2015).

Células mTECs expressam o gene regulador autoimune (Aire) cuja

proteína (AIRE) controla a expressão de um conjunto grande de PTAs e

consequentemente grande parte da PGE (ANDERSON; SU, 2011; GIRAUD et

al., 2012; LAAN; PETERSON, 2013b). Além de PTAs, Aire também controla a

expressão de diversos miRNAs nestas células (MACEDO et al., 2013; PASSOS;

MENDES-DA-CRUZ; OLIVEIRA, 2015; UCAR et al., 2013).

O gene Aire atua como um regulador transcricional e seu mecanismo de

ação está relacionado com a promoção da transcrição através da liberação da

RNA Pol II travada nas regiões promotoras de genes ao longo da cromatina

(GIRAUD et al., 2012; PETERSON, 2015). Segundo as observações mais

recentes, este seria o modo com que Aire contribui com a promoção da

transcrição de genes codificadores de PTAs em células mTECs.

79

Além de mRNAs, é sabido que a RNA Pol II também transcreve

microRNAs (miRNAs) em células de mamíferos (CORCORAN et al., 2009; LEE

et al., 2004). Baseados nesta propriedade, pesquisadores de nosso laboratório

demonstraram recentemente, e pela primeira vez, que Aire também pode

controlar a expressão de miRNAs em células mTECs murinas (MACEDO et al.,

2013).

Considerando que a RNA Pol II também promove a transcrição de lncRNAs

(GUTTMAN et al., 2009), desenvolvemos então, o raciocínio de que se RNA Pol II

transcreve lncRNAs e se Aire atua em conjunto com essa enzima em células

mTECs, nos pareceu plausível levantar a hipótese que Aire poderia controlar a

expressão deste tipo de RNA. Surgiu, então, o interesse de se realizar uma

investigação sobre a eventual relação entre a expressão de Aire e a expressão de

lncRNAs em células mTECs murinas.

A técnica de microarray foi a escolhida para testarmos esta idéia. Em

especial as lâminas de microarrays da Agilent seriam as mais adequadas, pois

apresentam um formato com o qual poderíamos explorar a expressão tanto dos

mRNAs como dos lncRNAs. Além disso, nosso Laboratório tem a expertise nesta

tecnologia há mais de dez anos, com a qual explora-se o transcriptoma de células

do sistema imune, incluindo as mTECs (FORNARI et al., 2010; MACEDO et al.,

2009, 2013; MAGALHÃES et al., 2005; OLIVEIRA et al., 2013b; SOUSA

CARDOSO et al., 2006).

Para avaliar o efeito dos níveis de expressão do gene Aire sobre os

lncRNAs (o que consistiu no sistema-modelo principal deste trabalho) empregou-

se a técnica de silenciamento gênico de Aire por RNA interferente (siRNA). Este

procedimento também é executado com sucesso em nosso laboratório há mais de

dois anos, manipulando células mTEC in vitro (MACEDO et al., 2013) ou o timo

de camundongos in vivo (OLIVEIRA et al., 2013).

Nossos resultados mostraram que o silenciamento in vitro de Aire em

células mTEC 3.10 foi obtido rapidamente, ou seja, atingindo o máximo da

eficiência após 24 horas da transfecção (Figura 9).

80

O silenciamento de Aire foi capaz de promover um perfil transcricional

(perfil do transcriptoma incluindo mRNAs e lncRNAs) distinto nas células mTECs

transfectadas com siRNA em relação às células controle. Isto foi visualizado com

a aplicação do coeficiente de correlação de Pearson (Figura 12). Com o

agrupamento de amostras (controle e Aire silenciadas) estabelecendo a

correlação de Pearson, ficou claro que o silenciamento de Aire perturbou a

expressão global de mRNAs, como esperado, mas também dos lncRNAs, os

quais representam o foco principal deste trabalho.

Com o intuito de identificar aqueles RNAs diferencialmente expressos entre

os dois tipos de amostras (controle e Aire silenciada) consideramos aqueles

transcritos cujo valor p ≤ 0.05 no teste t moderado e corrigido por FDR (Benjamini

Hochberg) com fold change ≥ 1.5 (Figura 13). O valor de fold change ≥ 1.5 foi

considerado adequado uma vez que os lncRNAs apresentam fraca expressão,

que pode ser até dez vezes menor do que a expressão de mRNAs (CABILI et al.,

2011; DERRIEN et al., 2012; GUTTMAN et al., 2009; PAULI et al., 2012; RAVASI

et al., 2006; SIGOVA et al., 2013; ULITSKY; BARTEL, 2013; ULITSKY et al.,

2011).

O agrupamento hierárquico e o heat-map representados na Figura 14 nos

possibilitou observar que Aire exerceu efeito modulador sobre a expressão de

lncRNAs nas células mTEC 3.10. Dentre os lncRNAs significativamente

modulados por Aire, a maioria teve sua expressão aumentada após o

silenciamento.

Este resultado sugere que sob condições fisiológicas Aire poderia exercer

um efeito modulador negativo, já que quando induzimos artificialmente sua

repressão, muitos lncRNAs apresentam sua expressão aumentada. Entretanto,

esta presunção não se encaixa bem no modelo no qual Aire atuaria em conjunto

com a RNA Pol II.

Este resultado corrobora com diversos estudos que demonstraram que Aire

não atua somente como indutor, mas pode também exercer efeito repressor na

transcrição (ILMARINEN et al., 2008; JOHNNIDIS et al., 2005; SATO et al., 2004;

TAO et al., 2006).

81

Na realidade a proteína AIRE atua em conjunto com diversas proteínas

parceiras durante a modulação transcricional. Uma delas, e a primeira a ser

recrutada é a proteína CBP, um importante co-ativador transcricional, responsável

por promover a acetilação das histonas, gerando uma cromatina

transcricionalmente ativa (ABRAMSON et al., 2010; PETERSON; ORG; REBANE,

2008; PITKÄNEN et al., 2000).

Estudos indicam que é através da interação com a proteína CBP que Aire

exerce efeito dual sobre a expressão gênica, seja ativando a expressão de

determinados genes, seja reprimindo-os. O primeiro registro do mecanismo

através do qual Aire pode atuar reprimindo a expressão gênica surgiu em 2004,

quando Sato e colaboradores (SATO et al., 2004) transfectaram macrófagos

murinos com vetores de expressão de Aire, estimularam estas células com

lipopolissacarídeo LPS, ligante de TLR4 (Toll- like receptor 4) e analisaram a

expressão de diversas citocinas e quimiocinas. Observaram que a citocina

antagonista do receptor alfa de IL-1 (IL-1Ra) teve sua expressão reduzida nas

células transfectadas com o vetor de Aire, mesmo após estimulação. Sabendo-se

que acima (upstream) da região 5’ do gene IL-1Ra encontraram sítios de ligação

da proteína CBP, parceira de AIRE, foi demonstrado que AIRE reprime a

expressão desse gene por competir pela ligação à CBP, isto é, a ligação de AIRE

a CBP resulta na ausência da ligação desse co-ativador transcricional no

promotor do gene da IL-1Ra. O mesmo aconteceu com a expressão das

moléculas de MHC de classe II nestas células.

Este mecanismo é denominado transrepressão, ou seja, o processo pelo

qual uma proteína reprime ou inibe a atividade de uma segunda proteína através

de interação física entre elas (proteína-proteína). A proteína reprimida é

geralmente um fator de transcrição que regula positivamente a expressão gênica,

sendo assim, o efeito da transrepressão é a atenuação da transcrição gênica

(TAO et al., 2006).

De acordo com isto, supomos que este poderá ser o mecanismo utilizado

por AIRE para reprimir a maioria dos lncRNAs Aire-dependentes em células

mTECs, como observado neste trabalho.

82

Johnnidis et al (2005) relataram a repressão de genes exercida por Aire a

partir de análises de microarrays provenientes de células mTEC Aire KO. Os

autores observaram que 93 genes tiveram sua expressão aumentada nas células

Aire KO (JOHNNIDIS et al., 2005). Isto faz supor que o mesmo possa ter atuado

como um repressor desses genes. De acordo com isto, também supomos que

Aire esteja atuando como um repressor dos lncRNAs nas células mTEC 3.10.

Quando investigado se a repressão exercida por Aire envolve outras

proteínas nucleares além da CBP, observou-se que o mesmo também é capaz de

transreprimir também, através de seu domínio PHD1, os fatores de transcrição

NF-kB e p53. (TAO et al., 2006). Este domínio tem sido associado tanto com a

ativação transcricional quanto com a transrepressão exercida por Aire

(PITKÄNEN et al., 2000; TAO et al., 2006).

Em 2009, lncRNAs dependentes da sinalização intracelular mediada por

NF-kB foram descritos em células dendríticas (GUTTMAN et al., 2009). Supondo

que ocorra transrepressão de NF-kB exercida por Aire em células mTECs, essa

poderia pode ser uma via que o mesmo utiliza para reprimir alguns lncRNAs NF-

kB dependentes. Procuramos evidencia disto levantando os lncRNAs NF-kB

dependentes, os mesmos repertoriados por Guttman et al (2009), os quais seriam

reprimidos por Aire nas células mTEC, mas não encontramos nenhum lncRNA em

comum. Isso se deve, provavelmente, ao fato de se tratar de uma comparação

envolvendo dados provenientes de células diferentes uma vez sabe-se que os

lncRNAs são altamente tecido-específicos (CABILI et al., 2011; RAVASI et al.,

2006). Esta é uma via interessante que necessita ser melhor estudada em células

mTECs.

Considerando a possibilidade de que o mecanismo de liberação da RNA

Pol II na cromatina mediada por Aire poderá não se aplicar à transcrição da

maioria dos lncRNAs nas mTECs, uma outra hipótese terá que ser levantada,

talvez considerando a participação da RNA Pol III (SILVA et al., 2011).

Seja como for, o presente trabalho proporciona uma contribuição original

no sentido de que é o primeiro relato sobre a expressão de lncRNAs em células

tímicas e também por tentar associar o efeito do gene Aire nesta classe de RNA.

Isto contribui com o preenchimento de uma lacuna que ainda existe sobre dados

83

de expressão de lncRNAs em tecidos outros além de células tronco embrionárias

ou tecido canceroso, como aparece na maioria das publicações (GUTSCHNER et

al., 2013; GUTTMAN et al., 2009; SILVA et al., 2011; YILDIRIM et al., 2013).

Aqueles lncRNAs os quais observamos sua expressão nas células mTEC,

foram também caracterizados. Iniciamos com a classificação dos lncRNAs

modulados por Aire. O tipo predominante foi o dos lncRNAs intergênico

(lincRNAs) (Figura 15). Esses RNAs têm sido alvo de diversos estudos por serem

abundantes; terem sido os primeiros lncRNAs descritos e devido ao fato que seus

loci não coincidem com o de nenhum gene codificador. Como classe de RNAs,

eles participam de diversas funções celulares, desde imprinting genômico do

cromossomo X na espécie humana, como também com o sequestro de miRNAs,

funcionando como “esponjas de miRNAs” e ainda regulando os níveis

transcricionais de mRNAs, dentre outras funções (GUTTMAN et al., 2009, 2011;

ULITSKY et al., 2011; WANG et al., 2013b; WUTZ; RASMUSSEN; JAENISCH,

2002; YOON et al., 2012).

Devido a amplitude de mecanismos nos quais os lncRNAs em geral

podem estar envolvidos, o papel específico dos lincRNAs nas células mTEC é

ainda difícil prever. No entanto podem, de alguma maneira, estar relacionados

com a PGE.

Guttman (2009) relatou que mais 90% dos transcritos analisados em

células tronco-embrionárias murinas, fibroblastos pulmonares e células

precursoras neuronais puderam ser enquadrados como lincRNAs. Esse valor foi

maior que a proporção encontrada no presente trabalho com células mTECs

(64%), mas concebemos que esta estimativa pode estar subestimada já que ela

foi determinada apenas na tabela de sondas presentes nos microarrays

utilizados neste trabalho cuja atualização data de julho de 2007.

A seguir, realizamos a identificação e análise da distância do gene

codificador mais próximo ao longo do genoma, uma abordagem muito utilizada no

estudo dos lncRNAs. O interesse nesta vizinhança genômica está no

conhecimento da co-modulação, ou seja, muitos lncRNAs podem ser co-

modulados ou co-expressos com os genes codificadores mais próximos, ou até

84

apresentar uma interação funcional com os mesmos (CABILI et al., 2011;

DINGER et al., 2008; GUTTMAN et al., 2009; RAVASI et al., 2006)

A maioria dos lncRNAs modulados por Aire localizaram-se a até 10 kb de

genes codificadores de proteínas (Figura 16). Tal resultado corrobora com o fato

destes lncRNAs serem intergêncios. Guttman (2009) define que os lincRNAs

devem estar a no mínimo 5 kb de distância de algum gene codificador. Corrobora

também com Cabili (2011) que encontrou a mesma distância em vários dos mais

de 8.000 lincRNAs humanos avaliados.

A distância de até 10 kb de algum gene codificador parece ser uma

característica que se se aplica no geral a diversos lincRNAs, uma vez que os

8.000 lincRNAs estudados por Cabili (2011) eram de 24 tecidos diferentes. Assim,

as distâncias genômicas dos lncRNAs (lincRNAs) das células mTECs

encontradas neste trabalho (poucos pb até cerca de 1 Mb, estiveram dentro do

descrito por estes pesquisadores, cujo limiar abrangeu desde poucas bases até 3

Mb de distância. Mas diferiu do encontrado por Ravasi (2006), estudando 20

tecidos humanos diferentes, e cujos lncRNAs estiveram a cerca de 74 kb do gene

codificador mais próximo.

Com o intuito de verificar o potencial codificador das sondas presentes em

nossas lâminas de array, reavaliamos o potencial codificador de cada um dos

lncRNAs Aire dependentes e diferencialmente expressos, sendo que cerca de

23% foram reclassificados como RNAs codificadores.

Sequências codificadoras são comumente caracterizadas por

apresentarem longas open reading frames (ORFs), porém, lncRNAs também

podem apresentar longas ORFs e, portanto, ser classificados como RNAs

codificadores. Por esse motivo, a classificação de RNAs codificadores baseada

somente no tamanho das ORFs não é indicada. Ambos os softwares utilizados

neste trabalho, CPC e CPAT consideram outros parâmetros além do tamanho

das ORFs e, portanto, representam ferramentas confiáveis para tal classificação

(KONG et al., 2007; WANG et al., 2013a).

O conceito de RNA codificador, porém, ainda é controverso, pois existem

mRNAs que não codificam proteínas e lncRNAs que o fazem, codificando

85

pequenas proteínas menores que 100 aa, por meio de suas ORFs, geralmente

curtas. (BAZZINI et al., 2014; DINGER et al., 2008; INGOLIA; LAREAU;

WEISSMAN, 2011; KONDO et al., 2007; MERCER; DINGER; MATTICK, 2009).

Apesar disso, quando comparados os escores obtidos para os lncRNAs com

aqueles obtidos para os 50 genes codificadores conhecidos, utilizados como

controle, fica evidente que o potencial codificador daqueles 23% é muito fraco.

Isto é, o escores obtidos pelo CPC para os genes codificadores foram, em sua

maioria, valores positivos altos, que alcançaram até mesmo 15. Para o software

CPAT, cujo cut off se situa em 0.5, todos os codificadores apresentaram-se

muito próximos de 1, ao contrário dos lncRNAs considerados codificadores em

ambas análises (Tabela 3). O real significado biológico neste caso é difícil

prever, mas não se pode descartar a possibilidade de serem capazes de originar

pequenas proteínas.

Finalmente, analisamos a presença da cauda poli A. Observamos que a

maioria dos lncRNAs não apresentavam poliadenilação em sua porção 3’,

lembrando que a poliadenilação é uma característica de transcritos oriundos da

RNA Pol II (FATICA; BOZZONI, 2014; ZHANG; YANG; CHEN, 2014). Entretanto,

a ausência de poliadenilação em RNAs tem sido amplamente descrita na

literatura, tanto para lncRNAs quanto para transcritos típicos como mRNAs

(CHENG et al., 2005; GU; DAS GUPTA; SCHOENBERG, 1999; SNIDER;

MORRISON-BOGORAD, ; WU et al., 2008; ZHANG; YANG; CHEN, 2014).

Além dos RNAs (lncRNAs ou mRNAs) sem cauda poli A, também foram

relatados alguns com cauda poli A de tamanho reduzido, contendo cerca de 30

resíduos de adeninas (A), embora o reflexo biológico desta característica ainda

não tenha sido elucidado (CHENG et al., 2005; GU; DAS GUPTA;

SCHOENBERG, 1999; WU et al., 2008; YANG et al., 2011)

As caudas poli A dos lncRNAs modulados por Aire observados no

presente trabalho apresentaram-se reduzidas, ou seja, com 10 a 30 resíduos de

A. Esta característica já foi observada no lincRNA MALAT1 expresso em células

epiteliais e em mRNAs de albumina e transferrina em rãs (GU; DAS GUPTA;

SCHOENBERG, 1999; WILUSZ; FREIER; SPECTOR, 2008; ZHANG; YANG;

CHEN, 2014).

86

Inicialmente os lncRNAs sem cauda poli A foram descritos como oriundos

de pre-mRNAs (RAVASI et al., 2006b), porém atualmente se sabe que eles são

transcritos próprios com a capacidade de se manterem estáveis, mesmo na

ausência de longas caudas poli A. Neste caso eles utilizam outros meios para se

manterem estáveis como por exemplo a clivagem pela RNAse P, que origina

transcritos maduros (BROWN et al., 2014; WILUSZ et al., 2012), ou se

complexam com pequenos RNAs nucleolares (small nucleolar RNAs ou

snoRNAs) (YIN et al., 2012) ou ainda, formam estruturas circulares (HANSEN et

al., 2013; MEMCZAK et al., 2013; ZHANG et al., 2013).

Dentre tantas características peculiares, os lncRNAs se fortalecem cada

vez mais com uma classe única dentre os RNAs não codificadores, sendo

importantes determinadores da expressão gênica (JOHNSSON; MORRIS, 2014;

MATTICK; RINN, 2015b; MERCER; DINGER; MATTICK, 2009).

Mas estudos posteriores ainda são necessários para elucidar efeito

repressor de Aire sobre a maioria dos lncRNAs em células mTECs e a

consequência disto sobre a PGE e seu significado sobre a seleção negativa e a

indução da tolerância central.

De qualquer forma, os resultados obtidos neste trabalho evidenciaram, pela

primeira vez, a ação moduladora de Aire sobre a expressão de lncRNAs em

células mTECs além de promover o primeiro relato da expressão desta espécie

de RNAs nestas células, lembrando que eles são altamente tecido específicos e

foram pouco explorados no timo.

87

Conclusões

88

8. CONCLUSÕES

Este é o primeiro relato sobre a expressão de lncRNAs em células mTECs

de camundongos Mus musculus.

Neste trabalho foi possível colher evidências que Aire pode exercer efeito

modulador sobre a expressão de lncRNAs em células mTEC.

A maioria dos lncRNAs modulados por Aire têm disposição genômica do

tipo intergênica, não apresentaram cauda poli A e se localizaram a até 10kb do

gene codificador mais próximo.

89

Referências bibliográficas

90

9. REFERÊNCIAS BIBLIOGRÁFICAS

AALTONEN, J. et al. An autoimmune disease, APECED, caused by mutations in a novel gene featuring two PHD-type zinc-finger domains. Nature genetics, v. 17, n. 4, p. 399–403, dez. 1997.

ABRAMSON, J. et al. Aire’s partners in the molecular control of immunological tolerance. Cell, v. 140, n. 1, p. 123–35, 8 jan. 2010a.

ABRAMSON, J. et al. Aire’s partners in the molecular control of immunological tolerance. Cell, v. 140, n. 1, p. 123–35, 8 jan. 2010b.

AKIRAV, E. M.; RUDDLE, N. H.; HEROLD, K. C. The role of AIRE in human autoimmune disease. Nature reviews. Endocrinology, v. 7, n. 1, p. 25–33, jan. 2011.

AKIYAMA, T. et al. Regulations of gene expression in medullary thymic epithelial cells required for preventing the onset of autoimmune diseases. Frontiers in immunology, v. 4, p. 249, jan. 2013.

AMARAL, P. P.; MATTICK, J. S. Noncoding RNA in development. Mammalian genome : official journal of the International Mammalian Genome Society, v. 19, n. 7-8, p. 454–92, ago. 2008.

ANDERSON, G. et al. Mechanisms of thymus medulla development and function. Current topics in microbiology and immunology, v. 373, p. 19–47, jan. 2014.

ANDERSON, G.; TAKAHAMA, Y. Thymic epithelial cells: working class heroes for T cell development and repertoire selection. Trends in immunology, v. 33, n. 6, p. 256–63, jun. 2012.

ANDERSON, M. S. et al. Projection of an immunological self shadow within the thymus by the aire protein. Science (New York, N.Y.), v. 298, n. 5597, p. 1395–401, 15 nov. 2002.

ANDERSON, M. S.; SU, M. A. Aire and T cell development. Current opinion in immunology, v. 23, n. 2, p. 198–206, abr. 2011.

BAZZINI, A. A. et al. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. The EMBO journal, v. 33, n. 9, p. 981–93, 2 maio 2014.

BELTRAN, M. et al. A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition. Genes & development, v. 22, n. 6, p. 756–69, 15 mar. 2008.

BEN-DOR, A.; SHAMIR, R.; YAKHINI, Z. Clustering gene expression patterns. Journal of computational biology : a journal of computational molecular cell biology, v. 6, n. 3-4, p. 281–97, jan. .

91

BENJAMINI, Y.; HOCHBERG, Y. Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society. Series B (Methodological), v. 57, n. 1, p. 289 – 300, 1995.

BOLSTAD, B. M. et al. A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics (Oxford, England), v. 19, n. 2, p. 185–93, 22 jan. 2003.

BOUDIL, A. et al. IL-7 coordinates proliferation, differentiation and Tcra recombination during thymocyte β-selection. Nature immunology, v. 16, n. 4, p. 397–405, abr. 2015.

BOYD, R. L. et al. The thymic microenvironment. Immunology today, v. 14, n. 9, p. 445–59, set. 1993.

BROWN, J. A. et al. Structural insights into the stabilization of MALAT1 noncoding RNA by a bipartite triple helix. Nature structural & molecular biology, v. 21, n. 7, p. 633–40, jul. 2014.

BUZI, F. et al. Autoimmune polyendocrinopathy-candidiasis-ectodermal dystrophy syndrome: time to review diagnostic criteria? The Journal of clinical endocrinology and metabolism, v. 88, n. 7, p. 3146–8, jul. 2003.

CABILI, M. N. et al. Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes & development, v. 25, n. 18, p. 1915–27, 15 set. 2011.

CARNINCI, P. et al. The transcriptional landscape of the mammalian genome. Science (New York, N.Y.), v. 309, n. 5740, p. 1559–63, 2 set. 2005.

CHAKRAVARTY, S.; ZENG, L.; ZHOU, M.-M. Structure and site-specific recognition of histone H3 by the PHD finger of human autoimmune regulator. Structure (London, England : 1993), v. 17, n. 5, p. 670–9, 13 maio 2009.

CHENG, J. et al. Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution. Science (New York, N.Y.), v. 308, n. 5725, p. 1149–54, 20 maio 2005.

CLOOSEN, S. et al. Expression of tumor-associated differentiation antigens, MUC1 glycoforms and CEA, in human thymic epithelial cells: implications for self-tolerance and tumor therapy. Cancer research, v. 67, n. 8, p. 3919–26, 15 abr. 2007.

CORCORAN, D. L. et al. Features of Mammalian microRNA Promoters Emerge from Polymerase II Chromatin Immunoprecipitation Data. PLoS ONE, v. 4, n. 4, p. e5279, 23 abr. 2009.

DERBINSKI, J. et al. Promiscuous gene expression in medullary thymic epithelial cells mirrors the peripheral self. Nature immunology, v. 2, n. 11, p. 1032–9, nov. 2001.

92

DERBINSKI, J. et al. Promiscuous gene expression in thymic epithelial cells is regulated at multiple levels. The Journal of experimental medicine, v. 202, n. 1, p. 33–45, 4 jul. 2005.

DERRIEN, T. et al. The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression. Genome research, v. 22, n. 9, p. 1775–89, 1 set. 2012.

DINGER, M. E. et al. Differentiating protein-coding and noncoding RNA: challenges and ambiguities. PLoS computational biology, v. 4, n. 11, p. e1000176, nov. 2008.

EBERT, M. S.; SHARP, P. A. Emerging roles for natural microRNA sponges. Current biology : CB, v. 20, n. 19, p. R858–61, 12 out. 2010.

EISEN, M. B. et al. Cluster analysis and display of genome-wide expression patterns. Proceedings of the National Academy of Sciences, v. 95, n. 25, p. 14863–14868, 8 dez. 1998.

FARLEY, A. M. et al. Dynamics of thymus organogenesis and colonization in early human development. Development (Cambridge, England), v. 140, n. 9, p. 2015–26, 1 maio 2013.

FATICA, A.; BOZZONI, I. Long non-coding RNAs: new players in cell differentiation and development. Nature reviews. Genetics, v. 15, n. 1, p. 7–21, jan. 2014.

FENG, J. The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator. Genes & Development, v. 20, n. 11, p. 1470–1484, 1 jun. 2006.

FORNARI, T. A. et al. Age-related deregulation of Aire and peripheral tissue antigen genes in the thymic stroma of non-obese diabetic (NOD) mice is associated with autoimmune type 1 diabetes mellitus (DM-1). Molecular and Cellular Biochemistry, v. 342, n. 1-2, p. 21–28, 23 abr. 2010.

GALLEGOS, A. M.; BEVAN, M. J. Central tolerance to tissue-specific antigens mediated by direct and indirect antigen presentation. The Journal of experimental medicine, v. 200, n. 8, p. 1039–49, 18 out. 2004.

GALLEGOS, A. M.; BEVAN, M. J. Central tolerance: good but imperfect. Immunological reviews, v. 209, p. 290–6, fev. 2006.

GIRAUD, M. et al. Aire unleashes stalled RNA polymerase to induce ectopic gene expression in thymic epithelial cells. Proceedings of the National Academy of Sciences of the United States of America, v. 109, n. 2, p. 535–40, 10 jan. 2012.

93

GORDON, J.; MANLEY, N. R. Mechanisms of thymus organogenesis and morphogenesis. Development (Cambridge, England), v. 138, n. 18, p. 3865–78, set. 2011.

GRAY, D. H. D. et al. Developmental kinetics, turnover, and stimulatory capacity of thymic epithelial cells. Blood, v. 108, n. 12, p. 3777–85, 1 dez. 2006.

GRIESEMER, A. D.; SORENSON, E. C.; HARDY, M. A. The role of the thymus in tolerance. Transplantation, v. 90, n. 5, p. 465–74, 15 set. 2010.

GU, H.; DAS GUPTA, J.; SCHOENBERG, D. R. The poly(A)-limiting element is a conserved cis-acting sequence that regulates poly(A) tail length on nuclear pre-mRNAs. Proceedings of the National Academy of Sciences of the United States of America, v. 96, n. 16, p. 8943–8, 3 ago. 1999.

GUERDER, S. et al. Differential processing of self-antigens by subsets of thymic stromal cells. Current opinion in immunology, v. 24, n. 1, p. 99–104, fev. 2012.

GUTSCHNER, T. et al. The noncoding RNA MALAT1 is a critical regulator of the metastasis phenotype of lung cancer cells. Cancer research, v. 73, n. 3, p. 1180–9, 1 fev. 2013.

GUTTMAN, M. et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals. Nature, v. 458, n. 7235, p. 223–227, 2009.

GUTTMAN, M. et al. lincRNAs act in the circuitry controlling pluripotency and differentiation. Nature, v. 477, n. 7364, p. 295–300, 28 ago. 2011.

HANSEN, T. B. et al. Natural RNA circles function as efficient microRNA sponges. Nature, v. 495, n. 7441, p. 384–8, 21 mar. 2013.

HARA, T. et al. Identification of IL-7-producing cells in primary and secondary lymphoid organs using IL-7-GFP knock-in mice. Journal of immunology (Baltimore, Md. : 1950), v. 189, n. 4, p. 1577–84, 15 ago. 2012.

HARROW, J. et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome research, v. 22, n. 9, p. 1760–74, set. 2012.

HAYNES, B. F.; HEINLY, C. S. Early human T cell development: analysis of the human thymus at the time of initial entry of hematopoietic stem cells into the fetal thymic microenvironment. The Journal of experimental medicine, v. 181, n. 4, p. 1445–58, 1 abr. 1995.

HEINO, M. et al. Autoimmune regulator is expressed in the cells regulating immune tolerance in thymus medulla. Biochemical and biophysical research communications, v. 257, n. 3, p. 821–5, 21 abr. 1999.

94

HIROKAWA, K. et al. Analysis of the thymic microenvironment by monoclonal antibodies with special reference to thymic nurse cells. Thymus, v. 8, n. 6, p. 349–60, jan. 1986.

HU, W. et al. Long noncoding RNA-mediated anti-apoptotic activity in murine erythroid terminal differentiation. Genes & development, v. 25, n. 24, p. 2573–8, 15 dez. 2011.

HU, Z.; LANCASTER, J. N.; EHRLICH, L. I. R. The Contribution of Chemokines and Migration to the Induction of Central Tolerance in the Thymus. Frontiers in immunology, v. 6, p. 398, 7 jan. 2015.

HUARTE, M. et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response. Cell, v. 142, n. 3, p. 409–19, 6 ago. 2010.

HUBERT, F.-X. et al. Aire regulates the transfer of antigen from mTECs to dendritic cells for induction of thymic tolerance. Blood, v. 118, n. 9, p. 2462–72, 1 set. 2011.

ILMARINEN, T. et al. Functional interaction of AIRE with PIAS1 in transcriptional regulation. Molecular immunology, v. 45, n. 7, p. 1847–62, abr. 2008.

INGOLIA, N. T.; LAREAU, L. F.; WEISSMAN, J. S. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell, v. 147, n. 4, p. 789–802, 11 nov. 2011.

ISHII, T. et al. Novel mutations of the autoimmune regulator gene in two siblings with autoimmune polyendocrinopathy-candidiasis-ectodermal dystrophy. The Journal of clinical endocrinology and metabolism, v. 85, n. 8, p. 2922–6, ago. 2000.

JOFFRE, O. P. et al. Cross-presentation by dendritic cells. Nature reviews. Immunology, v. 12, n. 8, p. 557–69, ago. 2012.

JOHNNIDIS, J. B. et al. Chromosomal clustering of genes controlled by the aire transcription factor. Proceedings of the National Academy of Sciences of the United States of America, v. 102, n. 20, p. 7233–8, 17 maio 2005.

JOHNSSON, P. et al. A pseudogene long-noncoding-RNA network regulates PTEN transcription and translation in human cells. Nature structural & molecular biology, v. 20, n. 4, p. 440–6, abr. 2013.

JOHNSSON, P.; MORRIS, K. V. Expanding the functional role of long noncoding RNAs. Cell research, v. 24, n. 11, p. 1284–5, nov. 2014.

JOLICOEUR, C.; HANAHAN, D.; SMITH, K. M. T-cell tolerance toward a transgenic beta-cell antigen and transcription of endogenous pancreatic genes in thymus. Proceedings of the National Academy of Sciences, v. 91, n. 14, p. 6707–6711, 5 jul. 1994.

95

KEANE, P.; CEREDIG, R.; SEOIGHE, C. Promiscuous mRNA splicing under the control of AIRE in medullary thymic epithelial cells. Bioinformatics (Oxford, England), v. 31, n. 7, p. 986–90, 1 abr. 2015.

KHALIL, A. M. et al. Many human large intergenic noncoding RNAs associate with chromatin-modifying complexes and affect gene expression. Proceedings of the National Academy of Sciences of the United States of America, v. 106, n. 28, p. 11667–72, 14 jul. 2009.

KIRCHNER, T. et al. Pathogenesis of myasthenia gravis. Acetylcholine receptor-related antigenic determinants in tumor-free thymuses and thymic epithelial tumors. The American journal of pathology, v. 130, n. 2, p. 268–80, fev. 1988.

KISAND, K. et al. Chronic mucocutaneous candidiasis in APECED or thymoma patients correlates with autoimmunity to Th17-associated cytokines. The Journal of experimental medicine, v. 207, n. 2, p. 299–308, 15 fev. 2010.

KLEIN, L. et al. CD4 T cell tolerance to human C-reactive protein, an inducible serum protein, is mediated by medullary thymic epithelium. The Journal of experimental medicine, v. 188, n. 1, p. 5–16, 6 jul. 1998.

KLEIN, L. Dead man walking: how thymocytes scan the medulla. Nature immunology, v. 10, n. 8, p. 809–11, ago. 2009.

KLEIN, L. et al. Autonomous versus dendritic cell-dependent contributions of medullary thymic epithelial cells to central tolerance. Trends in immunology, v. 32, n. 5, p. 188–93, maio 2011.

KLEIN, L. et al. Positive and negative selection of the T cell repertoire: what thymocytes see (and don’t see). Nature reviews. Immunology, v. 14, n. 6, p. 377–91, jun. 2014.

KOBLE, C.; KYEWSKI, B. The thymic medulla: a unique microenvironment for intercellular self-antigen transfer. The Journal of experimental medicine, v. 206, n. 7, p. 1505–13, 6 jul. 2009.

KOH, A. S. et al. Global relevance of Aire binding to hypomethylated lysine-4 of histone-3. Proceedings of the National Academy of Sciences of the United States of America, v. 107, n. 29, p. 13016–21, 20 jul. 2010.

KONDO, T. et al. Small peptide regulators of actin-based cell morphogenesis encoded by a polycistronic mRNA. Nature cell biology, v. 9, n. 6, p. 660–5, jun. 2007.

KONG, L. et al. CPC: assess the protein-coding potential of transcripts using sequence features and support vector machine. Nucleic acids research, v. 35, n. Web Server issue, p. W345–9, jul. 2007.

KUMAR, P. G. et al. The autoimmune regulator (AIRE) is a DNA-binding protein. The Journal of biological chemistry, v. 276, n. 44, p. 41357–64, 2 nov. 2001.

96

KYEWSKI, B.; DERBINSKI, J. Self-representation in the thymus: an extended view. Nature reviews. Immunology, v. 4, n. 9, p. 688–98, set. 2004.

KYEWSKI, B.; FEUERER, M. Love is in the Aire: mTECs share their assets. Immunity, v. 41, n. 3, p. 343–5, 18 set. 2014.

KYEWSKI, B.; KLEIN, L. A central role for central tolerance. Annual review of immunology, v. 24, p. 571–606, jan. 2006.

KYEWSKI, B.; PETERSON, P. Aire, master of many trades. Cell, v. 140, n. 1, p. 24–6, 8 jan. 2010.

LAAN, M.; PETERSON, P. The many faces of aire in central tolerance. Frontiers in immunology, v. 4, p. 326, jan. 2013a.

LAAN, M.; PETERSON, P. The many faces of aire in central tolerance. Frontiers in immunology, v. 4, p. 326, 11 jan. 2013b.

LAEMMLI, U. K. Cleavage of structural proteins during the assembly of the head of bacteriophage T4. Nature, v. 227, n. 5259, p. 680–5, 15 ago. 1970.

LEAVY, O. B cells: Mediators of central tolerance. Nature reviews. Immunology, v. 15, n. 7, p. 404, 25 jun. 2015.

LEE, Y. et al. MicroRNA genes are transcribed by RNA polymerase II. The EMBO journal, v. 23, n. 20, p. 4051–60, 13 out. 2004.

LEUCCI, E. et al. microRNA-9 targets the long non-coding RNA MALAT1 for degradation in the nucleus. Scientific reports, v. 3, p. 2535, jan. 2013.

LEVINSON, A. I. et al. Intrathymic expression of neuromuscular acetylcholine receptors and the immunpathogenesis of myasthenia gravis. Immunologic research, v. 27, n. 2-3, p. 399–408, jan. 2003.

LI, J. et al. Thymus-homing peripheral dendritic cells constitute two of the three major subsets of dendritic cells in the steady-state thymus. The Journal of experimental medicine, v. 206, n. 3, p. 607–22, 16 mar. 2009.

LINTON, P. J.; DORSHKIND, K. Age-related changes in lymphocyte development and function. Nature immunology, v. 5, n. 2, p. 133–9, fev. 2004.

LIU, H. et al. Mice resistant to experimental autoimmune encephalomyelitis have increased thymic expression of myelin basic protein and increased MBP specific T cell tolerance. Journal of Neuroimmunology, v. 115, n. 1-2, p. 118–126, 2 abr. 2001.

LOEWER, S. et al. Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells. Nature genetics, v. 42, n. 12, p. 1113–7, dez. 2010.

97

LOPES, N. et al. Thymic Crosstalk Coordinates Medulla Organization and T-Cell Tolerance Induction. Frontiers in immunology, v. 6, p. 365, jan. 2015.

MA, L.; BAJIC, V. B.; ZHANG, Z. On the classification of long non-coding RNAs. RNA biology, v. 10, n. 6, p. 925–33, jun. 2013.

MACEDO, C. et al. Evidence for a network transcriptional control of promiscuous gene expression in medullary thymic epithelial cells. Molecular immunology, v. 46, n. 16, p. 3240–4, out. 2009.

MACEDO, C. et al. Autoimmune regulator (Aire) controls the expression of microRNAs in medullary thymic epithelial cells. Immunobiology, v. 218, n. 4, p. 554–60, abr. 2013.

MAGALHÃES, D. A. R. et al. Promiscuous gene expression in the thymus: the root of central tolerance. Clinical & developmental immunology, v. 13, n. 2-4, p. 81–99, jan. .

MAGALHÃES, D. A. R. et al. Hybridization signatures during thymus ontogeny reveals modulation of genes coding for T-cell signaling proteins. Molecular immunology, v. 42, n. 9, p. 1043–8, maio 2005.

MÅNSSON, R. et al. Pearson correlation analysis of microarray data allows for the identification of genetic targets for early B-cell factor. The Journal of biological chemistry, v. 279, n. 17, p. 17905–13, 23 abr. 2004.

MARTIANOV, I. et al. Repression of the human dihydrofolate reductase gene by a non-coding interfering transcript. Nature, v. 445, n. 7128, p. 666–70, 8 fev. 2007.

MATTICK, J. S.; RINN, J. L. Discovery and annotation of long noncoding RNAs. Nature structural & molecular biology, v. 22, n. 1, p. 5–7, jan. 2015a.

MATTICK, J. S.; RINN, J. L. Discovery and annotation of long noncoding RNAs. Nature structural & molecular biology, v. 22, n. 1, p. 5–7, jan. 2015b.

MEAGER, A. et al. Anti-Interferon Autoantibodies in Autoimmune Polyendocrinopathy Syndrome Type 1. PLoS Medicine, v. 3, n. 7, p. e289, 2006.

MEMCZAK, S. et al. Circular RNAs are a large class of animal RNAs with regulatory potency. Nature, v. 495, n. 7441, p. 333–8, 21 mar. 2013.

MERCER, T. R.; DINGER, M. E.; MATTICK, J. S. Long non-coding RNAs: insights into functions. Nature reviews. Genetics, v. 10, n. 3, p. 155–9, mar. 2009.

MEREDITH, M. et al. Aire controls gene expression in the thymic epithelium with ordered stochasticity. Nature immunology, v. 16, n. 9, p. 942–949, set. 2015.

98

MISSLITZ, A. et al. Thymic T cell development and progenitor localization depend on CCR7. The Journal of experimental medicine, v. 200, n. 4, p. 481–91, 16 ago. 2004.

MIZUOCHI, T. et al. Medullary but not cortical thymic epithelial cells present soluble antigens to helper T cells. The Journal of experimental medicine, v. 175, n. 6, p. 1601–5, 1 jun. 1992.

MONTECINO-RODRIQUEZ, E.; MIN, H.; DORSHKIND, K. Reevaluating current models of thymic involution. Seminars in immunology, v. 17, n. 5, p. 356–61, out. 2005.

MORRIS, G. P.; ALLEN, P. M. How the TCR balances sensitivity and specificity for the recognition of self and pathogens. Nature immunology, v. 13, n. 2, p. 121–8, fev. 2012.

MOUCHESS, M. L.; ANDERSON, M. Central tolerance induction. Current topics in microbiology and immunology, v. 373, p. 69–86, jan. 2014.

NAGAMINE, K. et al. Positional cloning of the APECED gene. Nature genetics, v. 17, n. 4, p. 393–8, dez. 1997.

NIHEI, O. K. et al. A novel form of cellular communication among thymic epithelial cells: intercellular calcium wave propagation. AJP: Cell Physiology, v. 285, n. 5, p. C1304–C1313, 23 jul. 2003.

OGAWA, Y.; SUN, B. K.; LEE, J. T. Intersection of the RNA interference and X-inactivation pathways. Science (New York, N.Y.), v. 320, n. 5881, p. 1336–41, 6 jun. 2008.

OH, J.; SHIN, J.-S. The Role of Dendritic Cells in Central Tolerance. Immune network, v. 15, n. 3, p. 111–20, jun. 2015.

OLIVEIRA, E. H. et al. Expression profile of peripheral tissue antigen genes in medullary thymic epithelial cells (mTECs) is dependent on mRNA levels of autoimmune regulator (Aire). Immunobiology, v. 218, n. 1, p. 96–104, jan. 2013a.

OLIVEIRA, E. H. et al. Expression profile of peripheral tissue antigen genes in medullary thymic epithelial cells (mTECs) is dependent on mRNA levels of autoimmune regulator (Aire). Immunobiology, v. 218, n. 1, p. 96–104, jan. 2013b.

OVEN, I. et al. AIRE recruits P-TEFb for transcriptional elongation of target genes in medullary thymic epithelial cells. Molecular and cellular biology, v. 27, n. 24, p. 8815–23, dez. 2007.

PALMER, E. Negative selection--clearing out the bad apples from the T-cell repertoire. Nature reviews. Immunology, v. 3, n. 5, p. 383–91, maio 2003.

99

PASSOS, G. A.; MENDES-DA-CRUZ, D. A.; OLIVEIRA, E. H. The Thymic Orchestration Involving Aire, miRNAs, and Cell-Cell Interactions during the Induction of Central Tolerance. Frontiers in immunology, v. 6, p. 352, 14 jan. 2015.

PAULI, A. et al. Systematic identification of long noncoding RNAs expressed during zebrafish embryogenesis. Genome research, v. 22, n. 3, p. 577–91, mar. 2012.

PEARSE, G. Normal structure, function and histology of the thymus. Toxicologic pathology, v. 34, n. 5, p. 504–14, jan. 2006.

PERERA, J. et al. Autoreactive thymic B cells are efficient antigen-presenting cells of cognate self-antigens for T cell negative selection. Proceedings of the National Academy of Sciences of the United States of America, v. 110, n. 42, p. 17011–6, 15 out. 2013.

PERHEENTUPA, J. APS-I/APECED: the clinical disease and therapy. Endocrinology and metabolism clinics of North America, v. 31, n. 2, p. 295–320, vi, jun. 2002.

PETERSON, P. Sirt-ainly Aire. Nature immunology, v. 16, n. 7, p. 680–1, jul. 2015.

PETERSON, P.; ORG, T.; REBANE, A. Transcriptional regulation by AIRE: molecular mechanisms of central tolerance. Nature reviews. Immunology, v. 8, n. 12, p. 948–57, dez. 2008.

PETRIE, H. T.; ZÚÑIGA-PFLÜCKER, J. C. Zoned out: functional mapping of stromal signaling microenvironments in the thymus. Annual review of immunology, v. 25, p. 649–79, jan. 2007.

PITKÄNEN, J. et al. The autoimmune regulator protein has transcriptional transactivating properties and interacts with the common coactivator CREB-binding protein. The Journal of biological chemistry, v. 275, n. 22, p. 16802–9, 2 jun. 2000.

PUGLIESE, A. et al. The insulin gene is transcribed in the human thymus and transcription levels correlated with allelic variation at the INS VNTR-IDDM2 susceptibility locus for type 1 diabetes. Nature genetics, v. 15, n. 3, p. 293–7, mar. 1997.

RAMSEY, C. et al. Aire deficient mice develop multiple features of APECED phenotype and show altered immune response. Human molecular genetics, v. 11, n. 4, p. 397–409, 15 fev. 2002.

RAVASI, T. et al. Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome. Genome research, v. 16, n. 1, p. 11–9, jan. 2006a.

100

RAVASI, T. et al. Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome. Genome research, v. 16, n. 1, p. 11–9, jan. 2006b.

RINN, J. L.; CHANG, H. Y. Genome regulation by long noncoding RNAs. Annual review of biochemistry, v. 81, p. 145–66, jan. 2012.

RYAN, K. R. et al. CD4+CD25+ T-regulatory cells are decreased in patients with autoimmune polyendocrinopathy candidiasis ectodermal dystrophy. The Journal of allergy and clinical immunology, v. 116, n. 5, p. 1158–9, nov. 2005.

SANSOM, S. N. et al. Population and single-cell genomics reveal the Aire dependency, relief from Polycomb silencing, and distribution of self-antigen expression in thymic epithelia. Genome research, v. 24, n. 12, p. 1918–31, 15 dez. 2014.

SATO, K. et al. Aire downregulates multiple molecules that have contradicting immune-enhancing and immune-suppressive functions. Biochemical and biophysical research communications, v. 318, n. 4, p. 935–40, 11 jun. 2004.

SEDDON, B. Thymic IL-7 signaling goes beyond survival. Nature Immunology, v. 16, n. 4, p. 337–338, 19 mar. 2015.

SIGOVA, A. A. et al. Divergent transcription of long noncoding RNA/mRNA gene pairs in embryonic stem cells. Proceedings of the National Academy of Sciences of the United States of America, v. 110, n. 8, p. 2876–81, 19 fev. 2013.

SILVA, J. M. et al. LSINCT5 is over expressed in breast and ovarian cancer and affects cellular proliferation. RNA Biology, v. 8, n. 3, p. 496–505, jan. 2011.

SMITH, K. M. et al. Pancreatic gene expression in rare cells of thymic medulla: evidence for functional contribution to T cell tolerance. International immunology, v. 9, n. 9, p. 1355–65, set. 1997.

SMYTH, G. limma: Linear Models for Microarray Data. [s.l: s.n.].

SNIDER, B. J.; MORRISON-BOGORAD, M. Brain non-adenylated mRNAs. Brain research. Brain research reviews, v. 17, n. 3, p. 263–82, jan. .

SOSPEDRA, M. et al. Transcription of a broad range of self-antigens in human thymus suggests a role for central mechanisms in tolerance toward peripheral antigens. Journal of immunology (Baltimore, Md. : 1950), v. 161, n. 11, p. 5918–29, 1 dez. 1998.

SOUSA CARDOSO, R. et al. Onset of promiscuous gene expression in murine fetal thymus organ culture. Immunology, v. 119, n. 3, p. 369–75, nov. 2006.

STARR, T. K.; JAMESON, S. C.; HOGQUIST, K. A. Positive and negative selection of T cells. Annual review of immunology, v. 21, p. 139–76, jan. 2003.

101

ST-PIERRE, C. et al. Differential Features of AIRE-Induced and AIRE-Independent Promiscuous Gene Expression in Thymic Epithelial Cells. Journal of immunology (Baltimore, Md. : 1950), v. 195, n. 2, p. 498–506, 15 jul. 2015.

STRUHL, K. Transcriptional noise and the fidelity of initiation by RNA polymerase II. Nature structural & molecular biology, v. 14, n. 2, p. 103–5, fev. 2007.

TAKADA, K. et al. Development and function of cortical thymic epithelial cells. Current topics in microbiology and immunology, v. 373, p. 1–17, jan. 2014.

TAKAHAMA, Y. Journey through the thymus: stromal guides for T-cell development and selection. Nature reviews. Immunology, v. 6, n. 2, p. 127–35, fev. 2006.

TAO, Y. et al. AIRE recruits multiple transcriptional components to specific genomic regions through tethering to nuclear matrix. Molecular immunology, v. 43, n. 4, p. 335–45, fev. 2006.

TOWBIN, H.; STAEHELIN, T.; GORDON, J. Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proceedings of the National Academy of Sciences of the United States of America, v. 76, n. 9, p. 4350–4, set. 1979.

TYKOCINSKI, L.-O. et al. Epigenetic regulation of promiscuous gene expression in thymic medullary epithelial cells. Proceedings of the National Academy of Sciences of the United States of America, v. 107, n. 45, p. 19426–31, 9 nov. 2010.

UCAR, O. et al. An evolutionarily conserved mutual interdependence between Aire and microRNAs in promiscuous gene expression. European journal of immunology, v. 43, n. 7, p. 1769–78, jul. 2013.

UCAR, O.; RATTAY, K. Promiscuous Gene Expression in the Thymus: A Matter of Epigenetics, miRNA, and More? Frontiers in immunology, v. 6, p. 93, 3 jan. 2015.

UIBO, R. et al. Autoantibodies to cytochrome P450 enzymes P450scc, P450c17, and P450c21 in autoimmune polyglandular disease types I and II and in isolated Addison’s disease. The Journal of clinical endocrinology and metabolism, v. 78, n. 2, p. 323–8, fev. 1994.

ULITSKY, I. et al. Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution. Cell, v. 147, n. 7, p. 1537–50, 23 dez. 2011.

ULITSKY, I.; BARTEL, D. P. lincRNAs: genomics, evolution, and mechanisms. Cell, v. 154, n. 1, p. 26–46, 3 jul. 2013.

102

VAFIADIS, P. et al. Insulin expression in human thymus is modulated by INS VNTR alleles at the IDDM2 locus. Nature genetics, v. 15, n. 3, p. 289–92, mar. 1997.

VANCE, K. W.; PONTING, C. P. Transcriptional regulatory functions of nuclear long noncoding RNAs. Trends in genetics : TIG, v. 30, n. 8, p. 348–55, ago. 2014.

WALTERS, S. N. et al. A role for intrathymic B cells in the generation of natural regulatory T cells. Journal of immunology (Baltimore, Md. : 1950), v. 193, n. 1, p. 170–6, 1 jul. 2014.

WANG, L. et al. CPAT: Coding-Potential Assessment Tool using an alignment-free logistic regression model. Nucleic acids research, v. 41, n. 6, p. e74, 1 abr. 2013a.

WANG, P. et al. The STAT3-binding long noncoding RNA lnc-DC controls human dendritic cell differentiation. Science (New York, N.Y.), v. 344, n. 6181, p. 310–3, 18 abr. 2014.

WANG, X. et al. Induced ncRNAs allosterically modify RNA-binding proteins in cis to inhibit transcription. Nature, v. 454, n. 7200, p. 126–30, 3 jul. 2008.

WANG, Y. et al. Endogenous miRNA sponge lincRNA-RoR regulates Oct4, Nanog, and Sox2 in human embryonic stem cell self-renewal. Developmental cell, v. 25, n. 1, p. 69–80, 15 abr. 2013b.

WILLINGHAM, A. T.; GINGERAS, T. R. TUF love for “junk” DNA. Cell, v. 125, n. 7, p. 1215–20, 30 jun. 2006.

WILUSZ, J. E. et al. A triple helix stabilizes the 3’ ends of long noncoding RNAs that lack poly(A) tails. Genes & development, v. 26, n. 21, p. 2392–407, 1 nov. 2012.

WILUSZ, J. E.; FREIER, S. M.; SPECTOR, D. L. 3’ end processing of a long nuclear-retained noncoding RNA yields a tRNA-like cytoplasmic RNA. Cell, v. 135, n. 5, p. 919–32, 28 nov. 2008.

WU, L.; SHORTMAN, K. Heterogeneity of thymic dendritic cells. Seminars in immunology, v. 17, n. 4, p. 304–12, ago. 2005.

WU, Q. et al. Poly A- transcripts expressed in HeLa cells. PloS one, v. 3, n. 7, p. e2803, jan. 2008.

WU, Z. et al. Regulation of lncRNA expression. Cellular & molecular biology letters, v. 19, n. 4, p. 561–75, dez. 2014.

WUTZ, A.; RASMUSSEN, T. P.; JAENISCH, R. Chromosomal silencing and localization are mediated by different domains of Xist RNA. Nature genetics, v. 30, n. 2, p. 167–74, fev. 2002.

103

YAMANO, T. et al. Thymic B Cells Are Licensed to Present Self Antigens for Central T Cell Tolerance Induction. Immunity, v. 42, n. 6, p. 1048–1061, 16 jun. 2015.

YAMANO, T.; STEINERT, M.; KLEIN, L. Thymic B Cells and Central T Cell Tolerance. Frontiers in immunology, v. 6, p. 376, jan. 2015.

YANG, L. et al. Genomewide characterization of non-polyadenylated RNAs. Genome biology, v. 12, n. 2, p. R16, jan. 2011.

YILDIRIM, E. et al. Xist RNA is a potent suppressor of hematologic cancer in mice. Cell, v. 152, n. 4, p. 727–42, 14 fev. 2013.

YIN, Q.-F. et al. Long noncoding RNAs with snoRNA ends. Molecular cell, v. 48, n. 2, p. 219–30, 26 out. 2012.

YOON, J.-H. et al. LincRNA-p21 Suppresses Target mRNA Translation. Molecular Cell, v. 47, n. 4, p. 648–655, 24 ago. 2012.

YOON, J.-H.; ABDELMOHSEN, K.; GOROSPE, M. Functional interactions among microRNAs and long noncoding RNAs. Seminars in cell & developmental biology, v. 34, p. 9–14, out. 2014.

ZHANG, S. L.; BHANDOOLA, A. Trafficking to the thymus. Current topics in microbiology and immunology, v. 373, p. 87–111, jan. 2014.

ZHANG, Y. et al. Circular intronic long noncoding RNAs. Molecular cell, v. 51, n. 6, p. 792–806, 26 set. 2013.

ZHANG, Y.; YANG, L.; CHEN, L.-L. Life without A tail: new formats of long noncoding RNAs. The international journal of biochemistry & cell biology, v. 54, p. 338–49, set. 2014.

ZHAO, J. et al. Polycomb proteins targeted by a short repeat RNA to the mouse X chromosome. Science (New York, N.Y.), v. 322, n. 5902, p. 750–6, 31 out. 2008.

ZLOTOFF, D. A. et al. CCR7 and CCR9 together recruit hematopoietic progenitors to the adult thymus. Blood, v. 115, n. 10, p. 1897–905, 11 mar. 2010.

MARITZA QUEIROZ SALAS MOSELLA -...

Documents

Transcript of MARITZA QUEIROZ SALAS MOSELLA -...