MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO … · Genomas de árvores tem sido...

MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

PRÓ-REITORIA DE PÓS-GRADUAÇÃO

UNIDADE ACADÊMICA ESPECIALIZADA EM CIÊNCIAS AGRÁRIAS - UAECIA

ESCOLA AGRÍCOLA DE JUNDIAÍ - EAJ

PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FLORESTAIS

CARACTERIZAÇÃO ESTRUTURAL E FUNCIONAL DOS GENES DE TIORREDOXINA EM

Eucalyptus grandis

VITÓRIA RÉGIA ALVES CAVALCANTE

Macaíba/RN

Janeiro de 2019

Eucalyptus grandis

Dissertação de Mestrado apresentada ao Programa de

Pós-Graduação em Ciências Florestais da

Universidade Federal do Rio Grande do Norte, como

parte das exigências para obtenção do título de Mestre

em Ciências Florestais (Área de Concentração em

Ciências Florestais - Linha de Pesquisa:

Biodiversidade, Conservação E Uso Dos Recursos

Genéticos Florestais).

Orientador:

Prof. Dr. Paulo Sérgio Marinho Lúcio

Macaíba/RN

Janeiro de 2019

Universidade Federal do Rio Grande do Norte - UFRN

Sistema de Bibliotecas - SISBI

Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede

Bezerra, Vitória Régia Alves Cavalcante.

Caracterização estrutural e funcional dos genes de Tiorredoxinas

em Eucalyptus grandis / Vitória Régia Alves Cavalcante Bezerra. -

70 f.: il.

Dissertação (mestrado) - Universidade Federal do Rio Grande do

Norte, Unidade Especializada em Ciências Agrárias, Programa de Pós-

Graduação em Ciências Florestais. Macaíba, RN, 2019.

Orientador: Prof. Dr. Paulo Sérgio Marinho Lúcio.

1. Eucalipto - Dissertação. 2. Análise in silico - Dissertação.

3. Genoma de árvore - Dissertação. I. Lúcio, Paulo Sérgio Marinho.

II. Título.

RN/UF/BCZM CDU 528.776

Elaborado por Ana Cristina Cavalcanti Tinôco - CRB-15/262

Eucalyptus grandis

Dissertação julgada para obtenção do título de Mestre em Ciências Florestais (Área

de Concentração em Ciências Florestais - Linha de Pesquisa: BIODIVERSIDADE,

CONSERVAÇÃO E USO DOS RECURSOS GENÉTICOS FLORESTAIS).

Banca Examinadora

________________________________________________

Prof. Dr. Paulo Sérgio Marinho Lúcio

UAECIA/UFRN

________________________________________________

Prof. Carlos Alfredo Galindo Blaha

DBG/UFRN

Examinador interno

________________________________________________

Prof. Dr. Glauber Henrique de Sousa Nunes

PPGFITO/UFERSA

Examinador externo ao programa

Natal/RN

Janeiro de 2019

AGRADECIMENTOS __________________________________________________________________________

Agradeço,

À Deus primeiramente por ter colocado essa oportunidade em minha vida em uma

época que eu não esperava mas que foi o período que eu mais precisava.

Ao professor Dr Paulo Marinho, professor e amigo que fez o convite para que eu

embarcasse com ele nessa nova jornada. Por acreditar no meu potencial e por ser muito mais

que um orientador.

À minha filha Maria Eduarda que apesar da minha ausência em alguns momentos

soube compreender de uma forma única que só ela sabe demostrar e derreter meu coração.

Aos meus pais Lenildo e Ivani que são meu alicerce e meu porto seguro. Sempre estão

ao meu lado apesar da distância geográfica mas me apoiam, acreditam em mim e fazem o

possível para me ver bem e feliz.

Aos meus amigos do mestrado que contribuíram com apoio e ajuda mútua ao longo

desses 2 anos. Às minhas melhores amigas que torcem pelo meu sucesso

À todos os professores que contribuíram com seus conhecimentos durante o

mestrado.

À Capes e Fapern pela ajuda financeira.

Ao núcleo de processamento de alto desempenho (NPAD) da UFRN por disponibilizar

os recursos necessários para a realização das análises de bioinformática.

À Abidã, Isabel, Matheus alunos de graduação de Engenharia Florestal e João aluno

de graduação de Ciências Biológicas pela ajuda realizando e acompanhando cada passo no

laboratório.

À Fabiana colega de mestrado e de laboratório que se disponibilizou a ir a campo fazer

as coletas.

À Diego, doutorando da bioquímica, pelo tempo disponilizado e a ajuda fornecida.

À Thiago Guimarães, que chegou na reta final, mas que teve uma importância

relevante demostrando compreensão nos momentos em que não estive presente e

companheirismo. Além da paciência nos momentos de estresse.

E por último mas não menos importante apesar de todo o desenrolar da minha vida ao

longo desses 2 anos, agradeço à meu ex marido que me incentivou a estudar e fazer a

seleção. E a minha ex sogra Luzia que toda vez que foi necessário se disponibilizou a ficar

com minha filha para que eu conseguisse cumprir as exigências do mestrado a cada semestre.

RESUMO

_______________________________________________________________________

Genomas de árvores tem sido sequenciados nos últimos dez anos e constituem

uma fonte de informação de base para o estudo de famílias multigências em

plantas. A genômica comparativa, uma vez disponibilizadas as sequências

completas dos genomas em bancos públicos, é uma ferramenta potente para

progredir com o estudo da caracterização funcional de genes. Neste trabalho, o

interesse se concentra nos genes que codificam Tiorredoxinas (Trxs) e considera

a diversidade, estrutura e expressão desses genes no genoma de Eucalyptus

grandis. Para tanto, ferramentas de bioinformática em plataformas de domínio

público (Phytozome; Eucgenie; NCBI; PREDOTAR) foram utilizadas para

identif icar as sequências codantes e validar dados, e programas específ icos

(MEGA7, BEAST3) foram empregados para caracterizar a estrutura e expressão

in silico dos genes. Ensaios de RT-PCR foram realizados para 4 genes de

tiorredoxinas citoplasmáticas a partir de tecidos de folha, f loema, xilema,

meristema apical e plântulas para confirmar a expressão observada in silico.

Foram identif icadas 22 Trxs com sítio ativo com motivo característico

confirmando a existência de todos os representantes dos três principais grupos

ja definidos em plantas, plastidiais (m, f, x, y, z) citop lasmáticas (h), e

mitocondriais (o) no genoma do eucalipto. Observou-se, no entando, diferenças

quanto ao número de genes por grupos em comparação com outros genomas de

árvores já feitos como o de Populus trichocarpa e Vitis vinifera. A expressão

desses genes de tiorredoxina mostrou-se, para alguns genes homólogos,

divergente do que fora observado em Arabidopis thaliana sugerindo uma

especificidade de função em eucalipto, a exemplo do gene Eucgr.F01604 que

codifica uma Trx citoplasmática h1 com forte expressão em tecidos condutores.

As análises por RT-PCR reforçam o que fora visto com as ferramentas da

Bioinformática e a abordagem aqui empregada envolvendo a análise estrutural e

funcional através do perfi l da expressão gênica contribui significativamente para

progredir na elucidação da função das Trxs em plantas, sobretudo em genomas

de árvores.

Palavras-chave: bioinfomática, análises in silco, genoma de árvore.

ABSTRACT

__________________________________________________________________________

Tree genomes have been sequenced over the last ten years and constitute basic information

for plant gene characterization. Comparative genomics once complete genome sequences are

made available in public data is a powerful tool to enabe progress within the study of gen

function. In this work the interest is concentrated in the genes coding for thioredoxins and

considers the diversity, structure and expression of these genes in the genome of Eucalyptus

grandis. Bioinformatics tools on public domain platforms (Phytosome; Eucgenie.org; NCBI;

PREDOTAR) have been used to identify the coding sequences and to validate data and

specific softwares (MEGA7, BEAST3) were employed to characterize the structure and in silico

expression of the genes. RT-PCR assays were performed for 6 cytoplasmic thioredoxin genes

from leaf tissue, phloem, xylem and apical meristem to confirm the expression observed in

silico. Twenty-one thioredoxins with a characteristic active site were identified, confirming the

existence of all three major groups already defined in cytoplasmic (h), mitochondrial (m, f, x,

y, z) and cytidine plants in the eucalyptus genome. Differences in the number of genes per

group were observed in comparison with other genomes of already grown trees such as

Populus trichocarpa and Vitis vinifera. The expression of these thioredoxin genes was shown

to be divergent for some genes observed in A. thaliana, suggesting a function specificity in

eucalyptus, such as the Eucgr.F01604 gene coding for a h1 cytoplasmic Trx with strong

expression in conducting tissues. RT-PCR analysis validate Bioinformatics and the approach

employed here involving structural and functional analysis through the profile of the gene

expression contributed significantly to progress in elucidating the function of Trxs in plants,

especially in tree genomes.

Keywords: bioinformatics, in silico analysis, tree genomes.

SUMÁRIO

__________________________________________________________________________

Página

1.0 INTRODUÇÃO ................................................................................................................ 1

2.0 REVISÃO DE LITERATURA ........................................................................................... 3

2.1. Sistema Tiorredoxina .................................................................................................. 3

2.2. Tiorredoxinas em genoma de árvores ........................................................................ 8

2.3. Tiorredoxinas do eucalipto ........................................................................................ 10

2.4 Tiorredoxinas e interesse biotecnológico .................................................................. 11

3.0 MATERIAL E MÉTODOS .............................................................................................. 13

3.1 Análise in silico..............................................................................................................13

3.2 Ensaio de RT- PCR.......................................................................................................14

4.0 RESULTADOS E DISCUSSÃO ..................................................................................... 16

4.1. Sistema Tiorredoxina...................................................................................................16

4.2. Tiorredoxinas em genoma de árvores ...................................................................... 19

4.3. Tiorredoxinas do eucalipto ........................................................................................ 20

6.0 CONCLUSÕES ............................................................................................................. 28

7.0 LITERATURA CITADA .................................................................................................. 29

ANEXO 1 Sequências de Tiorredoxinas das cinco espécies de plantas (Eucalyptus grandis,

Jatropha curcas, Populus trichocarpa, Vitis vinifera, Arabdopsis thaliana usadas para a

construção de árvores filogenéticas. ................................................................................... 37

ANEXO 2 Seqûencias genômicas, gênicas, codantes e protéicas ....................................... 44

ANEXO 3 Tabela com dados brutos da expressão gênica retiradas do Phytozome ............. 65

LISTA DE FIGURAS __________________________________________________________________________

Figura 1. Alinhamento peptídico parcial com sequência de tiorredoxinas típicas de Eucalyptus

grandis ................................................................................................................................. 20

Figura 2. Árvore filogenética evidenciando os diferentes grupos de tiorredoxinas em cinco

espécies de plantas. ............................................................................................................ 22

Figura 3. Mapa de expressão dos transcritos de tiorredoxinas típicas de Eucalyptus

grandis....................................................................................................................................25

Figura 4. Expressão gênica por RT-PCR semi-quantitativa em tecidos de E.

grandis....................................................................................................................................26

Figura 5. Análise de co-expressão dos genes de Trxs evidenciando as dez vias mais

relevantes...............................................................................................................................27

LISTA DE TABELAS __________________________________________________________________________

Tabela 1. Sequências dos primers obtidos com software Primer 3 e utilizados nas

amplificações das tiorredoxinas citoplasmáticas....................................................................15

Tabela 2. Tiorredexina típicas de Eucalyptus grandis na plataforma Phytozome

................................................................................................................................................17

Tabela 3. Diversidade numérica de Tiorredoxina típicas em cima espécias

vegetais..................................................................................................................................19

LISTA DE ABREVIATURAS __________________________________________________________________________

A: Alanina

ATP: Adenosina trifosfato

AGPase : enzima ADPGcl pirofosforilase

AtACHTs: tiorredoxinas atípicas Cys His – rich

C: isteína

cDNA: DNA complementar

CITRX: Cf-9 tiorredoxina interação

DNA: ácido desoxirribonucléico

EST: marcador de sequência genética expressa

FBPase: Frutose 2,6 - bifosfato

Fdx: ferredoxina

FOREST: Eucalyptus spp EST Project

FPKM: quilo base de exóns por milhões de reads mapeados

FTR: ferredoxina tiorredoxina redutase

G: glicina

GFP: proteína verde fluorescente

H2O2: peróxido de hidrogênio

KDa – quilo Dalton

Ids: sistema de detecção de intrusão

K: Lisina

KEGG: Encicopledia de genes e genomas de Kioto

FLN: Flightin

MDH – Malato desidrogenase

NADP – Dinucleotídeo de nicotinamida e adenina

NADPH – Dinucleotídeo de nicotinamida e adenina fosfato

NCBI – Centro Nacional de Informação e Biotecnologia

Nrx: Nucleorredoxina

NTR – tiorredoxina redutase dependente de NADPH

O2: oxigênio

OH: hidroxila

P: Prolina

PCR: reação em cadeia da polimerase

PFAM: banco de dados de família e proteínas

PKC: proteína kinase interating cousin

PPI: Protein-Protein interacion network

PRX: Peroxirredoxina

TCA: ácido tricarboxílico

TDNA: DNA de transferência

Trx: Tiorredoxinas

TrxH: Tiorredoxina heterotrófica

Trxs-like: Tiorredoxinas similares

R: Arginina

RNA: ácido ribonucléico

RNR: ribonucleótideos redutase

ROS: espécie reativa de oxigênio

RT – PCR: reação da transcriptase resversa seguida de reação em cadeia da polimerase

S: Serina

S-S: Ponte dissulfeto

S-H: Sulfridílico

W: triptofano

Y: Tirosina

1. INTRODUÇÃO

________________________________________________________________________

Tiorredoxinas (Trxs) são enzimas ubíquas, presentes em todos os organismos, e

responsáveis, principalmente, pela manutenção do estado redox nas células. Eles foram

descobertas inicialmente em Escherichia coli (LAURENT et al., 1964; HOLMGREN et al., 1985)

como doadores de hidrogênio para a Redutase de Nucleotídeos (RNR), importante enzima que

participa da síntese de nucleotídeos indispensáveis à replicação do DNA. Essas pequenas

proteínas, com cerca de 14kDa, possuem um sítio ativo característico e com motivo WCGPC

preservado e foram caracterizadas como agentes redutores por reações redox abrindo as

pontes dissulfeto de outras proteínas. No mecanismo de reação o ditiol, presente no sítio

protuberante das Trxs graças as suas duas cisteínas presentes, convertem o dissulfeto (S-S)

em sulfidrilo (SH). Esta função foi então sendo esclarecida e expandida para inúmeras

proteínas alvo a medida que outras Trxs foram sendo estudadas em outros organismos o que

levou à caracterização de muitos dos seus alvos específicos. Elas foram então caracterizadas

como agentes pós-traducionais que modificam e regulam a atividade de fatores de transcrição,

proteínas de replicação viral, bem como de proteínas envolvidas com a mobilização de reserva

em sementes (MEYER et al., 2012).

Em plantas, as Trxs foram inicialmente estudadas e identificadas como proteínas

ativadoras de duas enzimas importantes do ciclo de Calvin-Benson, FBPase-Fructose 1,6-

bisfosfatase (GÜTLE et al., 2016) e MDH-malato desidrogenase (JACQUOT & BUCHANAN,

1981). Neste sistema, as Trxs f e m, assim denominadas, são elas mesmas reduzidas pela

FTR-Ferredoxina tiorredoxina redutase dependente de FDX (WOLOSIUK & BUCHANAN,

1977; BUCHANAN et al., 2002), constituindo o primeiro sistema tiorredoxina descrito. A

complexidade e abundância de Trxs em plantas se revelou surpreendente à medida que

projetos de sequênciamento sistemático de genomas foram sendo feitos. Neste contexto,

sobretudo com o genoma de Arabidopsis thaliana, revelou-se uma diversidade de Trxs

surpreendente sendo elas então classificadas em função de sua localização na célula como

cloroplásticas, citoplasmáticas (REICHHELD et al., 2002) , mitocondriais (LALOI et al., 2001)

e, mais recentemente, nucleares (SERRATO et al., 2013). Para estes três últimos tipos os

agentes redutores das Trxs, são as Tiorredoxinas Redutases dependentes de NADPH (NTR)

constituindo o segundo sistema completo (JACQUOT et al., 1994). Nos cloroplastos, foram

ainda identificadas outras Trxs chamadas x (BERNAL-BAYARD et al., 2014) y, z (ARSOVA et

al., 2010; CHIBANI, 2011), e as consideradas atípicas CDSP32, Lillium (CAIN et al., 2009),

Picot (ISAKOV et al., 2000), Clot (MEYER et al., 2009), HCF164 e CITRX (RIVAS et al., 2004).

No citoplasma, foram descobertas as Trxs denominadas h (heterotrófico), mais próximas

evolutivamente às Trxs animais.

A partir do momento que outros genomas de plantas foram sendo publicados, e eles

são mais de 100 atualmente (MICHAEL & JACKSON, 2013), uma grande quantidade de dados

e de sequências nucleotídicas tornou-se disponível.

O objetivo geral deste trabalho é caracterizar de forma estrutural e funcional os genes

que codificam as tiorredoxinas em eucalipto. Especificamente, pretende-se identificar os

genes e sequências protéicas disponibilizadas com o projeto de sequenciamento do genoma

do Eucalyptus grandis, recentemente publicado por Myburg et al (2014). Validar os dados

obtidos com o primeiro transcriptoma da planta realizado no Brasil pelo projeto FORESTs –

Eucalyptus Genome Sequencing Project Consortium (VICENTINI et al., 2005) e realizar uma

análise com enfoque em genômica comparativa das Trxs presentes no genoma de árvores

cujos dados já estão disponíveis, bem como, quantificar a expressão gênica in silico e

confirmar a expressão de genes de Trx h com maior potencial tecido específicos por ensaios

de RT-PCR. Obtendo -se assim um amplo repertório estrutural e de diversidade de genes em

eucalipto.

2. REVISÃO DE LITERATURA

__________________________________________________________________________

2.1. SistemaTiorredoxina

Tiorredoxinas são enzimas envolvidas na manutenção do estado redox nas células e

presentes em todos os organismos. Elas foram identificadas inicialmente a partir de extratos

da bactéria Escherichia coli (LAURENT et al., 1964; HOLMGREN, 1985) em experimentos

com abordagem em bioquímica clássica, purificação e realização testes enzimáticos, como

sendo doadoras de átomos de hidrogênio para a enzima Redutase de Nucleotídeos (RNR),

uma enzima chave da síntese de nucleotídeos. Esta atividade enzimática foi em seguida

caracterizada pela presença de duas cisteínas no sítio ativo característico CXXC onde, nele,

o par de cisteínas forma um ditiol e é responsável pela quebra de pontes dissulfeto de uma

vasta quantidade de proteínas alvo.

São enzimas de baixo peso molecular, 14 kDa aproximadamente, e definidas como

redutoras em contraponto às enzimas Dissulfeto Isomerases que são agentes oxidantes

(HOLMGREN, 1985). Quando em estado reduzido, este sítio ativo e protuberante encontra-

se em estado conformacional pronto a doar hidrogênios a proteínas portadoras de pontes

dissulfeto ativando-as (MEYER et al., 2009). A reação ocorre pela abertura das pontes

dissulfeto alvo com o ataque da ponte dissulfeto pela porção N-terminal da primeira cisteína

do sítio liberando um tiol livre e formando uma ponte dissulfeto com a segunda cisteína do

alvo. Então, a porção C-terminal do sítio CXXC quebra a ponte dissulfeto da proteína alvo

reduzindo-a. Este sítio catalítico, composto em muitas Trxs por sequências consenso de

aminoácidos WCGPC, mostrou-se ser altamente conservado nas demais Trxs purificadas em

seguida a esses experimentos iniciais. Ele constitui o principal motivo peptídico de

identificação dessas proteínas nas plataformas digitais de análise de sequências genômicas

tais como PROSITE (SIGRIST et al., 2012), entre muitos outros.

Ao longo dos últimos 40 anos, inúmeras tiorredoxinas e genes que as codificam foram

estudadas. Em diferentes abordagens, bioquímicas e genéticas, essas proteínas tiveram suas

atividades enzimáticas estabelecidas e o que se chamou de sistema tiorredoxina foi sendo

caracterizado. Neste sistema, responsável pela redução das diferentes Trxs, foram primeiro

identificadas as proteínas redutoras de Trxs tanto em tecidos fotossintetizantes, nos

cloroplastos, quanto em tecidos heterotróficos, no citoplasma. E observou-se que, em plantas,

os sistemas e a diversidade de Trxs é surpreendentemente mais complexo do que nos demais

organismos não fotossintetizantes (GEIGENBERGER et al., 2017).

Em vegetais foi caracterizado inicialmente o sistema tiorredoxina que envolve uma

Ferredoxina Tiorredoxina Redutase - FTR (WOLOSIUK & BUCHANAN, 1977; BUCHANAN et

al., 2002; JACQUOT et al., 2009) como ativadora de dois tipos de Trxs, f e m, enzimas assim

denominadas por ativarem respectivamente duas enzimas presentes nas reações da

fotossíntese, a FBPase-Frutose 1,6 bifosfatase (GÜTLE et al., 2017) e a MDH – Malato

desidrogenase (JACQUOT & BUCHANAN, 1981). Com o sequênciamento do genoma de

Arabidopsis, também foram identificadas nos plastídios além das m e f já citadas, as Trxs x,

y, CDSP32 e Lilium totalizando 6 tipos contendo respectivamente 4, 2, 1, 2, 1, e 5 membros

(MEYER et al., 2009). Estas são então reduzidas pelo denominado sistema Fdx/Trx em que

atua a Ferredoxina Tiorredoxina Redutase - FTR.

A diversidade e complexidade de Trxs nos cloroplastos é relevante. Neste

compartimento celular ocorre a fotossíntese e a manutenção do estado redox é de

fundamental importância porque ocorre a geração de espécies reativas de oxigênio ROS (O2,

O−2O2−,H2O2, e OH). Uma das respostas mais comuns a estes compostos é formação de

pontes dissulfeto. As Trxs, como descrito, são portadoras de duas cisteínas no seu sítio ativo

e formam um ditiol que quebra pontes dissulfeto de outras proteínas num mecanismo de

sinalização redox. A disponibilidade de mutantes de inserção bem como a utilização de

plataformas de proteômica levaram a uma precisão melhor na caracterização funcional das

tiorredoxinas do cloroplasto além de indicar fortemente a atuação dessas proteínas também

em tecidos heterotróficos como a raiz. As Trxs m e f foram as primeiras a serem estudadas e,

portanto, há mais informações sobre elas do que as recentes x, y e z.

Em Arabidopsis thaliana existem 4 Trx m e 2 Trx f. Ocorre aqui uma divisão de trabalho

quanto a atividade enzimática (SERRATO et al., 2013). A função dessas Trxs in vivo vem

sendo esclarecida mais recentemente (GEIGENBERGER et al., 2017). O uso de mutantes de

inserção de Arabidopsis que tem seus genes que codificam as Trxs f1 e f2, mutantes únicos

ou duplos para os dois genes, mostraram um relação direta entre esses genes e a síntese de

açúcares por ativação da enzima ADPGcl pirofosforilase (AGPase). Ainda, que a f1 age em

sincronia com a TRX atípica ACHT4 que inativa a AGPase pela oxidação de suas cisteínas

regulatórias. Já as do tipo m apresentam comportamento funcional mais diverso. Elas

correspondem a 70% das Trxs do cloroplasto sendo que m1, m2 e m4 se acumulam nas

mesmas proporções enquanto que m3 é menos abundante. A Trx m3 está relacionada ao

transporte intercelular e manutenção do meristema, m4 tem função regulatória no ciclo de

transporte de elétrons durante a fotossíntese. Mutantes para m1 e m2 não mostraram

alterações quanto à fotossíntese ou crescimento em condições de luz normais. No entanto,

os parâmetros fotossintéticos foram alterados em condições de luz flutuante nestes mutantes

devido a inabilidade dessas enzimas em atuarem sobre a Malato desidrogenase.

As Trxs do tipo x foram descritas pela primeira vez em 2003 por Colin et al (2003).

durante o sequênciamento de Arabidopsis thaliana. Trata-se de uma Trx cloroplástica, de

origem procariota, que foi identificada e para qual foram produzidas proteínas recombinantes

e plantas transgênicas com genes de fusão com a GFP. Observou-se que sua ação

enzimática é insuficiente para ativar a FBPase ou a MDH. Sua localização celular no

cloroplasto foi confirmada pela observação da expressão das proteínas de fusão com genes

do tipo repórter. A Trx x foi capaz, no entanto, de ativar uma 2 Cys peroxirredoxina (Prx) o

que associou esta Trx x a uma atividade à resposta ao estresse oxidativo, já que esta Prx tem

esta função. Os mutantes para Trx x realizam fotossíntese normalmente e a fixação de

carbono não foi alterada (BERNAL-BAYAL et al., 2014).

Em 2010, foi identificada a Trx z em dois trabalhos independentes (ARSOVA et al.,

2010; MENG et al., 2010). Presente no cloroplasto, ela se distingue das demais tanto pela

estrutura quanto pela função. No trabalho do grupo de Arsova, observou-se, em mutantes

“knockout” de Arabidopsis thaliana para este gene, um fenótipo albino severo além de

apresentarem uma inibição no crescimento de seus cloroplastos. Neste mutante, outros genes

dependentes da ação da RNA polimerase PEP também tiveram sua expressão diminuída.

Foram então identificadas duas proteínas alvo da Trx z neste contexto, FLN1 e FLN2, que

constituem na verdade membros da família de pfkB-carboidrato quinase e que apresentam

resíduos de sisteínas mediando a interação Trx z - FLN. Igualmente, observou-se que o

estado redox de FLN2 é alterado pela ação da Trx z. Concluiu-se então que esta tiorredoxina

tem uma função diretamente ligada a FLN bem como ao funcionamento da regulação da RNA

polimerase PEP no cloroplasto. O gene AT3G06730 que codifica esta proteína em

Arabidopsis thaliana encontra-se no cromossomo 3 e contém 4 éxons. A proteína apresenta

o sítio ativo típico WCGPC e tem expressão gênica em 22 estruturas da planta e em 13 fases

de desenvolvimento. Recentemente, Díaz et al (2018) demonstraram que a proteína PRIN2,

que apresenta uma regulação do tipo redox, é indispensável ao funcionamento da RNA

polimerase PEP e depende da ação da Trx z para ser reduzida e por conseguinte funcional.

As Trxs do tipo z foram identificadas no genoma de Populus trichocarpa onde exercem além

da função reguladora da transcrição nos cloroplastos, também uma função na resposta ao

estresse oxidativo (CHIBANI et al., 2011).

Em compartimentos celulares não fotossintetizantes foram caracterizadas as Trxs dos

tipos h no citoplasma (JACQUOT et al., 1994; REICHHELD et al., 2002; NIKKANEN et al.,

2014). Em A. thaliana 10 do tipo h foram descritas. As Trxs h, assim chamadas por se

encontrarem em tecidos heterotróficos, são as mais abundantes. Evolutivamente são mais

próximas àquelas encontradas em animais. Elas foram alvo de inúmeros trabalhos de

caracterização funcional nos últimos 15 anos com o emprego de todas as ferramentas

técnicas disponíveis na biologia molecular. Observou-se, principalmente com uso de mutantes

de inserção em A. thaliana, que elas não são indispensáveis à vida da célula podendo ser

substituídas funcionalmente pelas Glutarredoxinas (REICHHELD et al., 2007). Estas são

enzimas da grande família das redoxinas onde também se incluem as proteínas Dissulfeto

Isomerases. Todas, as do tipo h, são reduzidas pelo segundo sistema descrito que envolve

uma NTR, tiorredoxina redutase dependente de NADPH.

A questão interessante sobre as Trxs h é a dificuldade em determinar suas proteínas

alvo. Isto se deve seguramente à simplicidade do sistema redox e à multiplicidade de genes

onde uma Trx pode ser substituída por uma outra. Há uma redundância funcional neste caso.

No entanto, esforços têm sido feitos no sentido de identificar essas proteínas alvo. Sabe-se,

por exemplo que a Trx h5 apresenta uma resposta ao ataque por patógenos, no caso a

Pseudomonas syringae e que sua ação se deve à interação com o fator de transcrição WRKY

(LALOI et al., 2004). Trx h3 confere tolerância ao choque térmico e aumenta sua tolerância

em A. thaliana exercendo uma atividade do tipo chaperona (PARK et al., 2009). Trx h1 pode

estar relacionada com o reparo de DNA conforme foi sinalizado pelo uso de mutantes para

este gene em Chlamydomonas que mostraram-se sensíveis a agentes mutagênicos (MEYER

et al., 2009).

O terceiro tipo de Trx identificado, além das citadas cloropásticas e citoplasmáticas,

são as mitocondriais denominadas o. A primeira Trx o foi clonada por Laloi et al (2001). O

sistema é mais simples do que o citoplasmático e é composto por duas Trxs. Trxo1 é a mais

abundante e presente na mitocôndria enquanto que Trx o2 é expressa em nível muito baixo.

Recentemente, esforços foram feitos com uso de mutantes para os dois genes e foram enfim

esclarecidas importantes funções dessas proteínas nas mitocôndrias (GEIGENBERGER et

al., 2017). Sabe-se agora que essas proteínas exercem função relevante sobre proteínas do

ciclo do ácido tricarboxílico (TCA), da fotorrespiração, do transporte de elétrons, da síntese

de ATP, transporte através de membrana, tradução, e síntese de hormônio. Isto com base em

experimentos de proteômica. O aprofundamento do estudo sobre as proteínas do ciclo do

TCA comprovou a função delas na desativação da sucinato desidrogenase e da fumarase

mitocondrial. Para as Trxs o, o sistema tiorredoxina funciona também com as mesmas sendo

reduzidas pelas tiorredoxinas redutases NTRB e NTRA.

O último sistema identificado em plantas, e que constitui um quarto e novo grupo, foi

descrito para as Trxs presentes no núcleo, as nucleorredoxinas-Nrx. Elas já haviam sido

descobertas em mamíferos por Kurooka et al (1997), trabalhando com ratos, porém seu

agente redutor permanecia desconhecido. Marchal et al (2014), num trabalho envolvendo

todas as ferramentas moleculares disponíveis, tais como produção de proteínas

recombinantes, testes enzimáticos, complementação na levedura, western blot,

imunodetecção e RT-PCR, caracterizaram em Arabidopsis thaliana este novo sistema

tiorredoxina nuclear. A partir dos dois genes de nucleorredoxina já descritos, Nrx1 e Nrx2, e

das tiorredoxinas redutases NTRA e NTRB, eles foram capazes de demonstrar in vitro e in

vivo, através de mutantes de inserção, que NTRA é o agente redutor das Trxs do núcleo em

plantas. Aqui também se dirimiu a dúvida quanto a compartimentação das nucleorredoxinas

como sendo efetivamente encontradas nesta organela. Nesse trabalho, um exaustivo esforço

em bioinformática também permitiu evidenciar a existência dos três subgrupos de Nrxs

presentes em plantas. No entanto, as duas Nrxs de Arabidopsis estão presentes somente nos

sub-grupos I e III (MARCHAL et al., 2014; Martins et al., 2018).

Ainda sobre a versatilidade, plasticidade e abundância das Trxs, há que ser ater

àquelas consideradas atípicas. Aqui se incluem as do tipo CDSP32, Lilium, TDX, Clot, CITRX

, HCF164 e Picot.

A Trx-like CDSP32 foi identificada inicialmente por Rey et al (1998). Trata-se de uma

proteína cloroplástica de Solanum tuberosum, de 23kDa, localizada no estroma de plantas

submetidas ao estresse hídrico. Foi assim denominada "chloroplastic drought-induced stress

protein" e não apresentava homologia com nenhuma proteína conhecia. A proteína obtida a

partir de uma biblioteca de cDNA mostrou-se ter 243 amino ácidos e ter uma atividade

tiorredoxina na sua porção c-terminal (122 resíduos) com sítio ativo característico CGPC. Ela

está então diretamente relacionada à resposta ao estresse hídrico e com a proteção dos

grupos tióis.

As Trxs do tipo Lillium, também presentes nos cloroplastos, foram identificadas por

Cain et al (2009) em Lilium longiflorum por homologia de sequência. Elas se constituem em

três grupos distintos conforme seus sítios ativos. No primeiro podem ser GCGGC, GCAGC,

SCGGC, ou RCGGC. Elas não estão presentes em musgos, algas ou cianobactérias o que

sugere um aparecimento evolutivo depois da separação entre musgos e angiospermas. O

segundo grupo contém os sítios WC[G/N/A][A/S]C. Em Arabidopsis há 5 genes que codificam

estas Trxs Lillium e que foram recentemente denominadas AtACHTs (atypical Cys His-rich

Trxs) por NIKKANEN & RINTAMÄKI (2014). CAVALCANTE et al (2018) realizaram estudos in

silico e identificaram as Trxs do tipo ACTH em Eucalyptus grandis. Neste trabalho observou-

se a presença de 6 genes com expressão em tecidos jovens e em folhas adultas. Ainda não

há dados quanto as possíveis proteínas alvo para estas Trxs.

As TDXs-tetratricoredoxin foram clonadas e estudadas inicialmente por Vignols et al

(2003). São proteínas com dois domínios contendo um deles de chaperonas associados com

um motivo tiorredoxina na porção C-terminal e encontradas somente em plantas vasculares.

Elas interagem com Ssb2, uma chaperona HSP70 através do domínio HIP da AtTDX e do

domínio ATPase da chaperona. Elas estão presentes em outras plantas como o Populus, além

outros genomas recentemente clonados. Os mutantes para o gene são viáveis mostrando que

não são indispensáveis à vida celular tendo suas funções provavelmente realizadas por outras

proteínas.

ATrx-like do tipo Picot - protein kinase PKC-interacting cousin of thioredoxin (ISAKOV

et al., 2000) é citosólica e apresenta um motivo proteico conservado WCDAS. Ela foi

descoberta inicialmente em células humanas e apresentam na sua porção N terminal um

motivo tiorredoxina sem o sítio ativo característico. Ela intermedeia, no entanto, a ligação com

PKC. Neste C-terminal o domínio Trx conservado se repete em vários outros organismos. Em

plantas elas estão diretamente relacionadas às glutarredoxinas.

CITRX (Cf-9-interacting thioredoxin) são tiorredoxinas like descritas por Rivas et al

(2004). Elas foram identificadas e relacionadas à resistência em tomate como associadas ao

gene Cf-9. Na verdade CITRX é inativada pela ação de vírus e ativa, por sua vez, a reação

de defesa de Cf-9.

HCF164 é uma Trx do cloroplasto que se encontra ancorada na membrana dos

tilacóides (LENNARTZ et al., 2009; MOTOHASHI & HISABORI, 2006). Esta Trx like foi

descoberta a partir da análise de um mutante de inserção de Arabidopsis thaliana que

apresentava "high chlorophyll fluorescense phenotipe (hcf164 mutant)" em condições de

fotossíntese normais, o que sugeriu uma falha no transporte de elétrons. Observou-se que

esta Trx é de fato uma proteína de membrana com dois motivos CXXC, um na porção C

terminal e outra na porção C terminal. Ela seria então responsável pela transdução de sinal

no lúmen do tilacóide.

Clot Trxs são também proteínas atípicas presentes no cloroplasto cujas funções ainda

não foram bem esclarecidas. Elas são homólogas as proteínas clot de Drosophila envolvidas

na síntese de drosopterinas, pigmentos presentes nos olhos desses insetos. Em Arabidopsis

há um único gene clot mas já foram identificadas em uma grande variedade de plantas cujos

genomas foram sequênciados (MEYER et al., 2009).

As Trxs Picot foram identificadas em 2000 (ISAKOV et al., 2000) e estão envolvidas

na ativação dos fatores de transcrição AP-1 e NFkB. A proteína tem um domínio tiorredoxina

na sua porção N terminal seguido por dois domínios repetitivos em tandem e altamente

conservados.

2.2. Tiorredoxinas em genomas de árvores

O estudo sobre os genes de Trxs em plantas progrediu muito com o sequênciamento

do genoma de Arabidopsis thaliana. A grande maioria dos genes desta vasta família

multigênica foi e vem sendo caracterizados graças aos mutantes de inserção de Arabidopsis

bem como pela a disponibilização das sequências. A importância desta planta modelo é

inquestionável. No entanto, à medida em que novos genomas de plantas passaram a ser

sequênciados, e especificamente no caso das Trxs, observou-se que genomas mais

complexos, diversos do genoma de Arabidopsis, apresentavam uma complexidade gênica

significativa, duplicações gênicas e ricas particularidades (MEYER el al., 2009). O

sequênciamento de genomas de árvores e a disponibilização de seus dados, por exemplo,

representa um grande interesse neste estudo sobre a diversidade e função das Trxs.

O primeiro genoma de uma árvore a ser sequênciado foi o de Populus trichocarpa

(TUSKAN et al., 2006), o Álamo, planta comum em florestas do hemisfério norte. Neste

genoma de 410Mb, considerado de pequeno tamanho uma vez que corresponde a 4 vezes o

tamanho do genoma de Arabidopsis, foram identificados cerca de 45000 genes. A

contribuição deste trabalho de genômica comparativa em que foram utilizados dados de

outras plantas, foi a identificação dos genes diretamente envolvidos com o desenvolvimento

da madeira, crescimento perene, transporte de nutrientes, movimento da água e resistência a

pragas. Observou-se, igualmente, dois eventos de duplicação no próprio genoma. O foco

neste trabalho foi dado à caracterização dos genes envolvidos com a síntese da lignina e da

hemicelulose, principalmente. Mostrou-se que, embora estes genes estejam presentes em

Arabidopsis, no Álamo estão muitas vezes duplicados e, em geral, em maior número.

A disponibilização desses dados, bem como dos dados obtidos com o genoma de Vitis

vinifera, também um genoma de árvore, além dos genomas de Sorghum bicolor, do musgo

Physcomitrella patens, das algas Chlamydomonas reinhardtii e Ostreoccocus lucimarinus, e

das cianobactérias Synechocystis e Nostoc puntiforme, permitiu a Chibani et al (2009) uma

análise muito precisa da família multigênica de tiorredoxinas. Neste trabalho, observou-se um

aumento na complexidade no número de Trxs. P. trichocarpa codifica 49 genes incluindo Trxs

típicas, atípicas ou “Trxs-like”, e as bem estudadas tiorredoxinas redutases. Observou-se

duplicações nos genes que codificam as classes m, h e de nucleorredoxinas. Ainda neste

trabalho um enfoque detalhado foi dado às classes de Trxs-like chamadas Clot,

nucleorredoxinas e àquelas dos tipos Lilium que até então não haviam sido bem descritas.

Uma análise comparativa neste artigo entre o genoma do Álamo e de demais plantas

quanto ao número, tipos, sub-grupos e grupos de Trxs mostrou-se muito interessante. Quando

se considera o número de Trxs, Arabidopsis thaliana dispõe de um total de 41 genes entre

típicos, atípicos, de multidomínio e de redutases. O Álamo tem 49 genes. As diferenças

ocorrem sobretudo com relação ao número de Trxs m, 8 em Álamo e 4 em Arabidopsis, Nrxs,

7 em Álamo e 2 em Arabidopsis, por exemplo. Ainda quanto ao número observa-se, de uma

maneira geral, que o número de redutases permanece igual entre as duas plantas. O mesmo

pode ser dito com relação àquelas Trxs atípicas como HCF164, Clot e CiTrx que mantém o

mesmo número de um gene por genoma nas duas plantas.

A medida em que esta comparação se expande para outras plantas citadas como Vitis

vinifera, Oriza sativa, Sorghum bicolor há um decréscimo nesta ordem de um total de genes

de 35, 34 e 33 genes. Há, no entanto, uma manutenção numérica entre álamo e Vitis quanto

às Nrxs, de 7 genes para cada ao contrário de 2 genes em Arabidopis thaliana.

Este artigo de Chibani et al (2009) é pioneiro no sentido de trazer uma análise

detalhada sobre a família Trx em um genoma de árvore. No entanto, nos dados já disponíveis

em bancos de dados de sequências, várias Trxs podem ser acessadas como, por exemplo,

em Jatropha curcas, entre outras plantas lenhosas cujos genomas já foram publicados.

2.3. Tiorredoxinas do eucalipto.

Em eucalipto o estudo dos genes de Trxs começa com a análise in silico do primeiro

transcriptoma da planta. Este trabalho, feito pelo consórcio FOREST-Eucalyptus Genome

Sequencing Project Consortium/FAPESP (VICENTINI et al., 2005), propiciou a primeira

identificação de genes que codificam essas enzimas na planta. A análise de “data-mining” foi

aberta para diferentes grupos de pesquisa no Brasil através da submissão e aprovação pelo

consórcio de projetos envolvendo diferentes genes de interesse.

Neste contexto, Barbosa & Marinho (2005) identificaram, a partir de sequências

correspondentes a transcritos (reads),15 proteínas que potencialmente com base na tradução

feita a partir desses “reads”, codificam Trxs. Foram então identificadas sequências para 7 Trxs

h, 4 Trx m, 2 Trx f, 1 Trx x e 1 Trx y. Não foram identificadas as Trxs o e z já vistas em A.

thaliana naquele momento, bem como não foi objeto da análise as tiorredoxinas redutases.

Há que se ressaltar que lidava-se com um transcriptoma onde as sequências disponíveis

correspondiam a exomas das diferentes bibliotecas que compunham o projeto. Nelas não

necessariamente estavam disponíveis os “reads” correspondentes à totalidade de Trxs. Essa

análise preliminar mostrou que, no eucalipto, a complexidade de grupos e subgrupos de genes

observada em A. thaliana estava também bem representada. Alinhamentos múltiplos de

sequência confirmaram a disposição do sítio ativo característico das proteínas deduzidas

reforçando a análise. Ainda neste trabalho, foi identificada igualmente uma sequência de Trx

atípica TDX. Árvores filogenéticas comparando as Trxs do eucalipto com as de Arabidopsis

confirmaram a disposição das mesmas por grupos em função da localização na célula.

Barbosa & Marinho (2005) também traçaram, com base no número total de “reads” de

cada transcrito, um perfil do que seria a expressão desses genes em diferentes tecidos. Isto

com base nas 13 diferentes bibliotecas de cDNA que deram origem ao FORESTs. Elas foram

preparadas com tecidos de calos, folhas jovens, adultas, flores, frutos, raízes, plântulas,

plantas expostas a patógenos entre outras. Os resultados obtidos mostraram que, em geral,

as Trxs do Eucalipto se expressam preferencialmente em tecidos jovens, sobretudo as do tipo

h. Algumas delas poderiam ter uma expressão tecido específica e é o que se observa para

alguns genes mais presentes em bibliotecas de botões florais. Elas são identificadas em

bibliotecas de folhas jovens, plântulas em desenvolvimento, por exemplo. As do tipo

cloroplásticas estão presentes em bibliotecas de folhas adultas.

Este trabalho inicial, feito com base nos dados do primeiro transcriptoma, foi de

importância significativa porque mostrou, com base em ferramentas de Bioinformática usuais

e aceitas, a complexidade e a multiplicidade das Trxs no eucalipto naquele ano de 2005, com

base em análises comparativas com os genes disponíveis no momento. No entanto, se

consideramos igualmente que se tratava de uma análise de genes expressos a partir de

diferentes bibliotecas, onde tem-se somente o produto da expressão dos genes, há que se

constatar que outros genes não expressos nas condições estudadas certamente poderiam

não ter sido identificados como já mencionado acima. A verificação destes dados requer o

acesso aos dados do genoma de Eucalyptus grandis publicado em 2014 (MYBURG et al.,

2014).

Neste genoma, a prioridade de análise dos genes foi dada àqueles que participam da

formação da madeira. Não obstante, na seção que trata da sintenia com os genes de P.

trichocarpa, 5 genes que codificam Trxs, entre 894 averiguados no trabalho, foram

identificados. São os genes Eucgr.C00122.2, Eucgr.C00603.1, Eucgr.C00663.1,

Eucgr.C00774.1, Eucgr.C03890.1. que podem ser acessados nos arquivos suplementares em

anexo ao artigo publicado na revista Nature (MYBURG et al., 2014).

2.4. Tiorredoxinas e interesse biotecnológico

Hiroyuki Yano, em artigo publicado na revista Molecular Plant (YANO, 2014), traça um

perfil bastante preciso das potencialidades biotecnológicas das tiorredoxinas. O princípio

básico deste interesse aplicado está no próprio funcionamento da reação de abertura de

pontes dissulfeto de outras proteínas. Parte-se do princípio, por exemplo, que as Trxs podem

ser utilizadas como antialérgicos. Isto diz respeito a degradação de proteínas de reserva na

semente, em grãos, durante a germinação. As proteínas de reserva estão estocadas em

corpos protéicos compactos e enlaçados por pontes dissulfeto. São as Trxs que

descompactam estas estruturas quebrando suas pontes dissulfeto. Ressalta o autor que

quando se ingere grãos as proteínas são digeridas com proteases, mas não se

descompactam bioquimicamente estas estruturas. Neste caso podem ocorrer problemas

alérgicos uma vez que a região em torno da ponte dissulfeto torna-se resistente a proteases

e essa proteína pode se tornar um agente potencialmente alergênico. As Trxs podem então

quebrar estas pontes dissulfeto e disponibilizar as proteínas tornando-as não alergênicas.

Uma outra abordagem já realizada no uso biotecnológico das Trxs consiste na

obtenção de plantas transgênicas superexpressando ou suprimindo os genes de Trxs. No

trigo (LI et al., 2009), por exemplo, plantas transgênicas foram produzidas superexpressando

a Trx h5 e a massa do pão produzido a partir desses transformantes mostrou-se menos

alergênica. Igualmente, os mesmos autores mostraram que repressão da Trx h9 por uma

construção antissenso retarda a germinação da semente em até uma semana evitando assim

o fenômeno da germinação precoce ou brotação pré-colheita (PSH-pre-harvest sprouting).

Outros exemplos podem ser citados como a superexpressão de Trx h5 em cevada

tornando a cerveja de melhor qualidade e a planta menos alergênica (CHO et al.,1999; WONG

et al., 2004); a superexpressão de Trx f em tabaco produzindo maior acúmulo de amido nas

folhas e possibilitando a produção de biocombustíveis (SANZ-BARRIO et al., 2013);

superexpressão de TDX em Arabidopsis levando a um aumento da tolerância a altas

temperaturas (LEE et al., 2009).

3. MATERIAL E MÉTODOS

________________________________________________________________________

3.1 Análise in silico

As análises in silico foram realizadas em seis etapas: identificação das sequências

codantes para tiorredoxinas; construção de alinhamentos múltiplos de sequências protéicas;

construção de árvores filogenéticas; análise da expressão gênica; análise; análise de

interação entre proteínas e localização celular. O software Primer 3 (1996 – 2019) foi utilizado

para fazer a escolha de primers para os ensaios de RT-PCR.

Para a identificação de sequências de Trxs três bancos de dados foram utilizados. O

primeiro a partir do link de acesso ao genoma disponibilizado no próprio artigo do genoma

eucalipto. Os dois outros foram o banco de dados que reúne genomas de plantas, o

Phytozome e o banco de dados específico para eucalipto o Eucgenie (EUCGENIE, 2011 -

2018). No GenBank as buscas foram feitas via National Center for Biotechnology Information

(NCBI, 1988) através de alinhamentos utilizando o programa BLAST, em que sequências de

nucleotídeos de tiorredoxinas de Arabidopsis thaliana foram usadas. Nos demais bancos de

dados específicos, Phytozome e Eucgenie, empregou-se uma busca textual com a palavra

"thioredoxin".

Os alinhamentos múltiplos foram feitos inicialmente com programa Clustal Omega

(LARKIN et al., 2007) abrigado no site do European Bioinformatic Institute (EMBL, 1974). O

software Clustal também foi utilizado para alinhar as sequências das proteínas levantadas

anteriormente no transcriptoma contra as proteínas homólogas encontradas durante a análise

in silico no presente trabalho. Em anexo 1 encontram-se as sequências utilizadas para fazer

os alinhamentos. Após a obtenção dos alinhamentos de sequências selecionadas foram

construídas árvores filogenéticas utilizando o programa MEGA 7 (TAMURA et al., 2007).

Nestes experimentos também foram empregadas sequências de Populus trichocarpa, Vitis

vinfera e Arabidopsis thaliana, retiradas do material suplementar do artigo do genoma de

Populus trichocarpa, além das sequências do eucalipto.

O programa BEAST2 (2014) foi utilizado para fazer as árvores filogenéticas. Antes da

obtenção da árvore final fez -se necessário avaliar o modelo mais adequado. O modelo com

melhor aplicação para esse caso foi o LG+G+I. Neste caso, domínios de Trxs foram deduzidos

a partir de alinhamentos do CDD, utilizando alinhamento SEED (10 sequênias) como guia

para alinhar as 22 sequências de Trx de interesse com a utilização do programa MAFFT

(2013) . A topoligia das árvores foi visualizada com o software figtree.

A localização celular foi feita usando o software PREDOTAR (SMALL et al., 2004),

submetendo-se todas as sequências proteícas encontradas e deduzidas diretamente na

plataforma online.

A expressão dos genes foi analisada usando dados públicos disponíveis na plataforma

Phytozome considerando os índices de FPKM (quilo base de éxons por milhões de reads

mapeados).

O software STRING (2017) foi o meio utilizado para realizar a análise de interação

entre proteínas, utilizando parâmetros pradrões, default. A implementação deste recurso foi

possível numa abordagem comparativa uma vez que não há sequências de eucalipto

disponível neste banco de dados. Neste sentido, empregou-se uma estratégia de utilização

das proteínas homólogas, às Trxs de eucalipto presentes no genoma de Populus trichocarpa.

Inicialmente foram coletados os dados de genes co-expressos para a Tiorredoxina no banco

de dados específico para vegetais, Phytozome (PHYTOZOME, 1996 – 2017). Como ainda

não existe dados para a construção de redes para E. grandis, tivemos que identificar os genes

ortólogos para uma espécie próxima, a P. trichocarpa, para isso utilizamos os dados de

cruzamento de identificadores do Phytomine e em seguida obtivemos os identificadores no

Europian Molecular Biology Laboratory (ENSEMBL, 1996 – 2018) através do plantgenie. Uma

vez identificados os IDs, eles foram submetidos ao programa para interação de proteínas

(STRING, 2017) para a construção da rede de interação proteína-proteína (Protein-Protein

interacion network - PPI) sob as informações de Textmining, Experiments, Databases e Co-

expression, com o valor mínimo de escores combinados de 0.7, definido pelo programa como

sendo de alta confiança. Os dados da rede foram importados no R e a rede foi editada

utilizando o pacote RedeR (CASTRO et al., 2012). As análises de enriquecimento para termos

do KEGG pathway e do PFAM foram realizadas pelo STRING.

3.2 Ensaios de RT-PCR

Os estudos de RT-PCR foram realizados em 4 etapas que consistiram em: extração

de RNA total de tecidos de E. grandis (plântulas) e de E. urograndi (folhas adultas, folhas

jovens, xilema, floema e meristema apical); preparação de cDNA total com as amostras de

RNA de plântulas; amplificações de PCR com primers específicos para as tiorredoxinas h;

análise dos produtos de PCR em gel de agarose sob eletroforese.

A extração de RNA total foi feita com Trizol (Invitrogen 15596026) seguindo protocolo

clássico do fabricante. As reações de RT-PCR foram feitas com o kit Promega AccessQuick

RT-PCR system (A1701) cuja característica é a realização da transcrição reversa e da reação

de PCR em um único tubo. As condições de PCR padrão, feita em termociclador Techne TC-

512, foram as recomendadas no kit consistindo na seguinte ciclagem: desnaturação inicial a

95o, 2 min, seguida de 30 ciclos de PCR contendo desnaturação a 95o, 1 min, anelamento a

55o, 30 seg, extensão a 72o, 1 min, seguido extensão final a 72o, 4 min. Os primers utilizados

para as amplificações são os descritos na tabela abaixo.

Tabela 1. Sequências dos primers obtidos com software Primer 3 e utilizados nas

amplificações das tiorredoxinas citoplasmáticas e do controle interno de normalização

(actina).

Genes Sequência 5’ - 3’

I01913.1 AGT TCA GTG TGC AGG CAA TG

AGC AAA AGG GAT CGA ACT CA F01854.1 ACA CCG TCG ATT CTT GGA AC

ACA CCG TCG ATT CTT GGA AC

F01604.1 AGA AGA TGC CCC ATG TTT TG

ATC GGA GCC GGT TTA TTT TT

I02383.1 AGC TGG TGG TTG TCG ATT TC

GAT CCT TCT GGG CTC CTA CC I00241.1 AGG ATA TTC AGC CCC TCG TT (actina)

TGG GCT TCA TCA CCA ACA TA

Os produtos de PCR foram analisados em gel de agarose 1,5% em equipamento de

eletroforese com cuba submarina runVIEW Cleaver. O tampão de depósito das amostras foi

acrescido de 2l de GelRed Biotium para a marcação do DNA. Após a realização da corrida

os géis foram visualizados em transilumidandor Hoefer e fotografados em equipamento de

fotodocumentação Cleaver.

4. RESULTADOS E DISCUSSÃO

__________________________________________________________________________

4.1. Trx de E. grandis: Diversidade

Foi definido como classificação das Trxs de plantas aquela utilizada por Chibani (2009)

que considera 4 grupos. AS Trxs típicas, de baixo peso molecular e com sítio ativo clássico

CXXC/S, as Trxs atípicas com domínios protéicos únicos, Trxs like, por exemplo, as Trxs

atípicas com domínios múltiplos, TDX, e as tiorredoxinas redutases que são redutoras nos

diferentes sistemas tiorredoxinas descritos.

Neste trabalho progrediu -se na caracterização dos genes de tiorredoxina em eucalipto

a partir de uma abordagem em Bioinfomática e em Biologia Molecular. Com o objetivo de

aprimorar a análise das sequências a partir do genoma complete de Eucalyptus grandis tanto

do ponto de vista estrutural como expressão gênica da planta. Com a mineração de dados

constatou -se que o genoma de Eucalyptus grandis codifica mais de 50 Trxs entre típicas,

atípicas, ditas de domínio único ou aquelas de múltiplos domínios.

O principal interesse foi pelas Trxs típicas, ou seja, aquelas com sítio ativo

característico CXXC/S e de baixo peso molecular em torno de 14kDa. Os resultados mostram

que, no eucalipto, todos os representantes dos sete tipos de Trxs descritos (m, f, h, x, y, z e

o) estão presentes no genoma e, que, em termos de números de genes, conforme tabela 2,

são de 4 , 2 , 9, 1, 2, 1, 1 respectivamente, além de 2 com sítio CxxS.

Tabela 2. Tiorredoxinas típicas de Eucalyptus grandis identificadas na plataforma Phytozome

a partir de busca indeireta por palavra – chave “thioredoxin” e classificadas através do sítio

ativo conservado, número de aminoácidos, número de identificação para o Locus e da

localização celular.

Identificação Tipo Locus Cromossomo Aa Localização

Sítio

Eucgr.A00783.2.p h2 Eucgr.A00783 Chr01 148 P/M/C WCGPC

Eucgr.A01813.1.p m2 Eucgr.A01813 Chr01 193 P/M/C WCGPC

Eucgr.B01424.1.p f2 Eucgr.B01424 Chr02 332 P WCGPC

Eucgr.B02586.4.p h2 Eucgr.B02586 Chr02 165 C WCGPC

Eucgr.D00028.1.p o Eucgr.D00028 Chr04 184 M WCGPC

Eucgr.D00853.1.p CxxS1 Eucgr.D00853 Chr04 207 C WCMPS

Eucgr.F01604.2.p h1 Eucgr.F01604 Chr06 150 C WCGPC

Eucgr.F01854.1.p h(5Pt) Eucgr.F01854 Chr06 118 C WCGPC

Eucgr.F02754.1.p m(5Pt) Eucgr.F02754 Chr06 188 P/M/C WCGPC

Eucgr.F03319.1.p m(4Pt) Eucgr.F03319 Chr06 187 P WCGPC

Eucgr.F04223.1.p y Eucgr.F04223 Chr06 109 P WCGPC

Eucgr.F04229.1.p y Eucgr.F04229 Chr06 152 P WCGPC

Eucgr.G03224.1.p z Eucgr.G03224 Chr07 186 P WCGPC

Eucgr.H01629.1.p f1 Eucgr.H01629 Chr08 185 P WCGPC

Eucgr.I01912.1.p h2 Eucgr.I01912 Chr09 158 C WCGPC

Eucgr.I01913.1.p h(2Pt) Eucgr.I01913 Chr09 159 C WCGPC

Eucgr.I02383.1.p h1 Eucgr.I02383 Chr09 117 C WCGPC

Eucgr.J00880.2.p x Eucgr.J00880 Chr10 182 P WCGPC

Eucgr.J02387.1.p h(2Pt) Eucgr.J02387 Chr10 119 C WCGPC

Eucgr.K01294.1.p h9 Eucgr.K01294 Chr11 137 P/M/C WCGPC

Eucgr.L01943.1.p cxxs Eucgr.L01943 scaffold_464 81 C WCGPC

Eucgr.L03049.1.p m3 Eucgr.L03049 scaffold_1873 116 P WCGPC

PMC, Plastítios, Mitocondrias, Citoplasma; Pt, Populus trichocarpa

Barbosa & Marinho (2005), analisando o primeiro transcriptoma de eucalipto

identificaram 7 h, uma delas com sítio CXXS, 1 x e não identificaram as Trxs dos grupos z e

o. No mesmo trabalho, 4 m e 2 f foram identificadas. Com relação a ausência de transcritos

para as Trxs o e z, é fácil deduzir que, muito provavelmente, as bibliotecas empregadas

naquele transcriptoma não continham transcritos para estes genes que ora podem ser

encontrados no genoma de E. grandis. Sabe-se que estes genes são transcritos em níveis

baixos de expressão porque implicados em situações mais específicas como a resposta ao

estresse oxidativo e, portanto, não de forma constitutiva (LALOI, 2002; CHIBANI, 2011). Há

que se ressaltar, também, que estes dois tipos de Trxs foram os últimos a serem identificados

(MEYER, 2012) quando da disponibilização do genoma de A. thaliana. Já com relação às Trxs

m e f, envolvidas nas reações do cliclo de Calvin-Benson (BUCHANAN, 2002), então

abundantes em termos de transcritos, os resultados se repetem entre o que observamos aqui

quanto a número de genes, 4 e 2 respectivamente, e que foram relatados anteriormente. A

presença de 9 Trxs h e não 7 como visto por Barbosa & Marinho (2005) também se explica

pelos níveis de transcritos mas também pela redundância desses genes que tem sido alvo de

muito interesse ao longo da última década (JACQUOT, 1994). É inclusive interessante

observar que mesmo em um transcriptoma realizado com limitações técnicas maiores, e

somente com a análise dos transcritos em 5’(ESTs), 7 delas já foram identificadas à época.

Isto mostra provavelmente a plasticidade deste grupo de Trxs que atuam preferencialmente

no citoplasma. Com relação às Trxs h de sítio CXXS, o genoma apresenta duas delas

enquanto uma só havia sido encontrada na abordagem de data-mining anterior.

Aqui também se observa que o conjunto básico de genes de Trxs visto em A. thaliana

durante a análise do genoma na linhagem verde assim definida por Meyer (2009), se mantém

no genoma de E. grandis como nos demais genomas de plantas estudadas. No entanto, o

número de genes e consequentemente de proteínas se altera como se pode observar nas

análises de genômica comparativa. Muito provavelmente, como ressalta Meyer (2009)

ocorreram ao longo da evolução das plantas duplicações gênicas o que talvez se explique

aqui pela localização de alguns genes nos mesmos cromossomos (Tabela 2).

Tomando - se ainda esses dados numéricos quanto aos genes de Trxs em E. grandis,

observa - se, como demonstrado na tabela 2, que esta situação de diversidade de tipos de

genes dentro da sub-família de Trxs típicas, se repete em outros genomas de plantas arbóreas

sequênciados. P. trichocarpa, por exemplo, em que Chibani (2009) estudou toda a família

multigênica de tiorredoxinas, apresenta uma situação similar ao que vemos em E. grandis à

diferença de apresentar, o Álamo, 8 genes de Trxs m uma situação incomum. Esta análise,

no entanto, vai se aprimorar com o sequênciamento de outros genomas de árvores o que vem

sendo realizado, e permitirá lançar mais hipóteses sobre a diversidade numérica de genes de

Trxs nesses genomas.

Tabela 3. Diversidade numérica de Tiorredoxinas típicas e conservação dos grupos de Trx em

cinco espécies vegetais, inclusive Eucalyptus grandis, com base em dados de sequências

publicadas ou disponibilizadas em bancos de dados públicos.

Eucalyptus

grandis

Jatropha

curcas

Populus

trichocarpa

vinífera

Arabidopsis

thaliana

Trx h 9 7 7 5 8

Trx cxxs 2 2 3 1 3

Trx o 1 1 1 1 2

Trx m 4 1 8 3 4

Trx x 1 - 1 1 1

Trx f 2 1 1 1 2

Trx y 2 1 2 1 2

Trx z 1 1 1 1 1

Modificado a partir de CHIBANI et al (2009).

4.2. Conservação dos domínios e motivos das Trxs

Alinhamentos múltiplos foram realizados com as sequências protéicas de Trxs

deduzidas para melhor caracterizá- las estruturalmente e evidencias domínios conservados.

É o que se mostra na figura 1 permitindo a visualização das sequências de aminoácidos das

proteínas essencialmente na parte onde se identificam motivos característicos das Trxs como,

por exemplo, o centro ativo conservado WCGPC/S. No alinhamento observa – se, igualmente,

entre as 22 sequências, aquelas que codificam as do tipo h com sítio CXXS, Eucgr.D00853.1.

Eucgr.L01943.1 a última estando incomplete a partir do sítio ativo. As demais sequências

estão completes e são disponibilizadas em arquivos anexos.

Figura 1. Alinhamento peptídico parcial com sequência de tiorredoxinas típicas de Eucalyptus

grandis realizado por software T-COFFE abrigado na plataforma CLUSTAWL do EMBL

European Bioinformatic Institute, evidenciando os domínios conservados com destaque para

o sítio ativo WCGPC.

4.3. Filogenia Estrutural

A construção de árvores filogenéticas em abordagens como esta voltada à

caracterização estrutural e functional de genes é frequentemente usada. Ela permite inferior,

a partir de outras sequências de genes ortólogo já plubicados e bem caracterizados

experimentalmente, a provável função cellular dos genes alvo de um estudo. Neste context,

procurou-se aqui realizar não uma análise filogenética mas confirmer a identificação dos

genes por anotação automática dos diferentes tipos de tiorredoxinas. Nesta análise

comparativa utilizamos sequências homólogas às Trxs de 4 diferentes espécies de plantas,

A. thaliana, V. vinifera, P. thicocarpa e J. curcas. Esta escolha se deu utilizando A. thaliana

como modelo, planta que reúne a maioria dos dados publicados sobre Trx, e as demais por

se tratarem de árvores tendo sido o Álamo o primeiro genoma de árvore a ser sequenciado

(TUSKAN et al., 2006). Os resultados desta análise filogenética apresentados na figura 2

permitiram o agrupamento de todas as sequências de tiorredoxinas neste trabalho com seus

ortólogos potenciais nas demais espécies.

Figura 2: árvore filogenética gerada com o programa BEAST3 evidenciando os diferentes tipos

de tiorredoxinas de E. grandis agrupados com seus ortólogos potenciais em P. trichocarpa, V.

vinifera, J. carcass e A. thaliana.

*Tiorredoxinas de Eucalyptus grandis

4.4. Padrão de Expressão de Trxs de E. grandis em diferentes tecidos

O estudo da expressão dos genes de tiorredoxina neste trabalho foi feito com base

nos dados de RNA-Seq disponibilizados após o sequenciamento do genoma de E. grandis.

Estes dados brutos em FPKM estão disponíveis em plataformas de domínio público

(https://eucgenie.org/) e foram utilizados para gerar o mapa de expressão apresentado a

figura 3. Neste contexto foram utilizadas as sequências que codificam as Trxs típicas com sítio

ativo característico e conservado. Trata -se consequentemente das 22 sequências

codificantes para Trxs m,f h, o, x, y e z além das CXXS.

Os genes em questão foram analisados com base nos perfis de expressão individuais

em relação a seis diferentes bibliotecas contend transcritos de tecidos de floema, xilema

imaturo, xilema, folhas adultas, meristema apical e folhas jovens. O perfil de expressão geral

em eucalipto, considerando todos os genes, condiz com o que é explicitado na literature em

relação as Trxs (MEYER et al., 2009) e que justifica sua classificação em função da atuação

na célula. Há uma nítida diferença de expressão em função dos tecidos estudados e os

diferentes transcritos mesmo que algumas generalizações possam ser feitas.

O perfil da expressão em tecidos condutores, por exemplo, é mais discrete do que nos

tecidos de folha ou meristema para a maioria dos genes slavo algumas exceções para o grupo

das tiorredoxinas h que apresentam um perfil mais variado. As Trxs f, por exemplo, atuam

nitidamente em tecidos fotossintetizantes de folha adultas , o que já era esperado devido a

dua atuação já bem caracterizada em tecidos fotossintetizantes. O mesmo pode ser ditto para

as Trxs m que também atuam em tecidos fotossintetizantes.

Na literatura a expressão gênica das tiorredoxinas do eucalipto em transcriptomas

realizados com RNA-seq aind não foi relatada, este é o primeiro trabalho com este enfoque.

Vining et al (2015) analisa o transcriptome da planta a partir de órgãos florais mas estes

tecidos não estão presentes neste trabalho. No entanto, um amplo estudo foi realizado por

Belin et al (2014) em A. thaliana analisando dados de RNA-seq para todos os genes de

tiorredoxina da planta. A partir deste trabalho com as Trxs de A. thaliana algumas

considerações relevantes podem ser feitas em relação aos resultados obtidos aqui.

Se forem considerados individualmente os diferentes grupos de tiorredoxinas no nosso

estudo pode -se afirmar que as 4 Trxs plastidiais m se expressam predominantemente em

tecidos de folha adulta, assim como visto em A. thaliana. Nesta planta a Trx m3, no entento,

tem baixa expressão e é constitutive nos tecidos analisados. O gene Eucgr.L03049 que

corresponde a esta tiorredoxina em eucalipto tem forte expressão em folha adulta, em

comparação com as demais 3 Trx m, o que poderia lhe conferir uma possível especificidade

de função em genomas de árvore. O mesmo padrão de expressão pode se observer para as

duas f de eucaliptp que estão significativamente presentes em tecidos de folhas adultas

fotossintetizantes. As também plastidiais x, y e z de eucalipto, tem expressão mais discreta

do que as m ou f nos tecidos estuados. Há predominância de transcritos para estas Trxs

plastidiais nos tecidos de folhas maduras ou jovens ressaltando-se a inexistência de valores

para a Trx z em folha adulta. Esta tiorredoxina de fato é particular tendo função mais

específicas nas proteínas alvo FLN1 e FLN2 (ARSOVA et al., 2010; MENG et al., 2010). Isto

provavelmente explicaria a ausência de transcritos na biblioteca estudada. Em A. thaliana

Belin et al (20014) menciona uma forte expressão da Trx z em tecidos do ovário o que reforça

o seu caráter mais específico.

A Trx o de eucalipto tem discretae constante expressão nas seis bibliotecas

analisadas, o mesmo observado em A. thaliana, reforçando seu caráter mais generalista

recentemente elucidado (GEIGENBERGER et al., 2107).

As Trxs CXXS em eucalipto apresentam interessante padrão de expressão mais

nitidamente forte em tecidos condutores embora também presentes em tecidos de folhas

jovens ou adultas. Elas se destacam das demais quanto a esta especificidade pelos tecidos

condutores sugerindo também funções específicas. Em A. thaliana CXXS2 é fortemente

detectada em grãos de de polen Nelin et al (2104).

As 9 Trxs h de eucalipto apresentam expressão gênica em todos os tecidos estudados

e que pode ser caracterizada em dois grupos. Há aquelas cuja expressão é mais discreta e

uniforme nas seis bibliotecas, são as Eucgr.J02387, Eucgr.A00783, Eucgr.I01912,

Eucgr.B02586 e Eucgr.K01294, num crescente de produção de transcritos. E um segundo

grupo formado por 4 Trxs, as Eucgr.I02383, Eucgr.I01913, Eucgr.F01854 e Eucgr.F01604 cuja

expressão é nitidamente mais abundante que todas as demais h e inclusive maior do que

todas as Trxs aqui estudadas. Esta divisão de trabalho de caráter funcional em se tratando de

um genoma de árvore pode ser de grande interesse. Por exemplo, os genes cuja expressão

é mais abundante são Eucgr.F01854 e Eucgr.F01604, o primeiro com menor expressão em

tecidos condutores mas com forte numero de reads em tecidos de folhas, jovens ou adultas.

E o gene Eucgr.F01604 apresenta fortíssima expressão em todas as seis bibliotecas

sugerindo um atuação importante no crescimento da planta, na sua expansão vertical até

porque implicado supostamente no transporte em tecidos condutores.

Em A. thaliana, no trabalho de Belin et al (2104), esta Trx se expressa em vários

tecidos mas o trabalho não contempla bibliotecas de tecidos condutores como aqui, o que

reforca a condução de experimentos complementares.

Figura 3. Mapa de expressão dos transcritos de tiorredoxinas típicas de E. grandis em

diferentes tecidos (Floema, Xilema imaturo, Xilema, Folhas Adultas, Meristema Apical, Folhas

Jovens), a partir de dados obtidos no programa R.

4.5. RT- PCR

Neste sentido, realizou-se experimentos preliminares de RT-PCR para estudar com

mais detalhe e em laboratório a expressão de alguns desses genes que parece ser mais

relevantes em tecidos de plantas arbóreas. Foram escolhidos então os quatros genes que

codificam Trx h, Eucgr.I02383, Eucgr.I01913, Eucgr.F01854 e Eucgr.F01604, inclusive,

conforme o que fora observado in silico (Figura 2).

Figura 3. Expressão gênica por RT-PCR semi-quantitativa em tecidos de E. grandis: JF, folha

jovem; MA, meristema apical; X, xilema; FL, floema; PL, plântulas. F00241.1, actina.

Para um maior refinamento da caracterização das Trx h em árvore, foi escolhido o

gene Eucgr.F01604, cuja expressão é mais importante para realizar uma análise de co-

expressão in silico. As plataformas utilizadas produziram uma rede de co-expressão deste

genes a partir de seus ortólogos em P. trichocarpa que é mostrada na figura 4.

Nela observa-se que, a princípio, foram identificados 1359 genes co-expressos com a

Trx h F01604, sendo que somente 530 proteínas foras associadas a esses genes para formar

a rede em Populus trichocarpa. Já em relação a PPI, obtive -se uma rede representada na

figura 4. Na imagem os nós representam as proteínas e as arestas são as conexões entre os

nós. Na figura, temos duas representações da mesma rede, do lado esquerdo são

apresentadas as vias do KEGG e do lado direito os as famílias proteicas enriquecidas da base

do PFAM. Com relação às vias do KEGG, foram selecionados as 10 vias mais relevantes de

acordo com o P valor ajustado (BH), os nós foram coloridos para distinguir a qual termo eles

pertenciam, destacando as vias relacionadas a Ribossomo, transporte de RNA e também de

reparo por excisão de bases. Já para o PFAM, também foram selecionados as 10 famílias

mais relevantes ranqueadas por P valor ajustado. Observa-se que a maior parte das famílias

proteicas co-expressas na rede é a das Tiorredoxinas, seguidas pelas Glutarredoxinas

confirmando o que ja fora consistentemente comprovado por vários autores a começar pelo

trabalho de REICHHELD et al (2007) com o emprego de mutantes em A. thaliana. Os

resultados sugerem fortemente que a investigação in plantae é indispensável para melhor

caraterizar estes genes e aprofundar, por exemplo, sua relação com as vias de reparo do DNA

por excisão de bases.

Figura 4. Análise de co-expressão dos genes de Trxs evidenciando as dez vias mais

relevantes. A esquerda utilizando dados do PFAM e a direita dados de KEGG.

5. CONCLUSÕES

__________________________________________________________________________

Os dados aqui apresentados e que se restringem as Trxs definidas como típicas,

aquelas com sitio ativo único e conservado CXXC, de baixo peso molecular, confirmam a

complexidade numérica e de grupos já observada no primeiro transcriptoma do Eucalipto.

Foram identificados genes para todos os grupos, plastidiais, citoplasmáticos e cloropásticos,

já definidos quanto a localização celular. A análise do genoma complementa as informações

com o conjunto de genes de Trxs inclusive com a do tipo z, o e duas h ainda não identificadas

em abordagem anterior. O Eucalipto apresenta 22 genes de tiorredoxinas típicas. A análise

filogenética desses genes com sequências de outras três árvores, P. tricocharpa, V. vinífera

e J. curcas permitiu a identificação e o agrupamento dos genes nos seus diferentes tipos

confirmando sua identificação por homologia nas plantas estudadas. Todos os genes aqui

identificados se agruparam dentro do que se previa quanto aos tipos de Trxs. A distribuição

numérica de genes por grupos no eucalipto se assemelha ao que fora relatado para P.

trichocarpa ressaltando-se, no entanto, a manutenção de 4 genes de Trx como em

Arabidopsis thaliana, m ao invés de 8. O grupo mais abundante em genes é o das Trxs h,

com 9 genes, um a mais do que no Álamo. Este perfil numérico comparativo entre os genes

de Trxs de outras três árvores analisadas não permite generalizações absolutas. Há

especificidas para cada genoma quanto ao número de genes mas permanece a existência de

representantes de todos os grupos. O estudo de expressão gênica com base em dados

normalizados de FPKM, obtidos por RNA-seq em plataformas como o Phytozome, permitiram

a elaboração de mapas de expressão com interessante padrão. A análise desses dados

confirmou o que ja havia sido visto em Arabidopsis thaliana quanto a atuação das tiorredoxinas

em diferentes tecidos mas revelou perfis de expressão únicos ainda não reportados até então.

É o caso, por exemplo do gene Eucgr.F01604 que codifica uma Trx h1 com forte atuação em

tecidos condutores além de relevante expressão em tecido de folhas jovens. Esses resultados

reforçam a já bem definida atividade enzimática tecido específica para muitas das

tiorredoxinas, bem como confirma, por outro lado, o caráter de atuação também mais

generalista para talvez a maioria das tiorredoxinas em plantas.

6. LITERATURA CITADA __________________________________________________________________________

ARSOVA, B.;HOJA, U.; WIMMELBACHER, M.; GREINER. E.; USTÜN, S.; MELZER, M.;

PETERSEN, K.; LEIN, W.; BÖRNKE, F. Plastidial Thioredoxin Z Interacts With Two

Fructokinase-Like Proteins In A Thiol-Dependent Manner: Evidence For An Essential Role

In Chloroplast Development In Arabidopsis And Nicotiana Benthamiana. Plant Cell. v. 22,

p.1498-1515, 2010.

BARBOSA, A. E; MARINHO, P. In Silico Analysis Of Eucalyptus Thioredoxins. Genetics

And Molecular Biology, v. 3, p. 539-547, 2005. Suplemento..

BELIN, C.; BASHANDY, T.; CELA, J.; DELORME-HINOUX, V.; RIONDET, C.; REICHHELD, J.

P. A comprehensive study of thiol reduction gene expression under stress conditions in

Arabidopsis thaliana. Plant Cell Environ. v. 38, p. 299-314, 2015.

BERNAL-BAYARD, P.; OJEDA, V.; HERVÁS, M.; CEJUDO, F. J; NAVARRO, J. A.;

VELÁZQUEZ-CAMPOY, A., PÉREZ-RUIZ, J. M. Molecular Recognition In The Interaction

Of Chloroplast 2-Cys Peroxiredoxin With NADPH-Thioredoxin Reductase C (NTRC) And

Thioredoxin X. Federation of European Biochemical Societies Letters. v. 588, p. 4342-

4347, 2014.

BEAST: Disponível em: www.beast2.org. Acesso em: 07 de agosto de 2018.

BUCHANAN, B. B.; SCHÜRMANN, P.; WOLOSIUK, R. A.; JACQUOT, J. P.T he

Ferredoxin/Thioredoxin System: From Discovery To Molecular Structures And

Beyond.Photosynth Research. v. 73, p. 215-222, 2002.

CAIN, P.; HALL, M.; SCHRÖDER, W. P.; KIESELBACH, T.; ROBINSON, C. A Novel

Extended Family Of Stromal Thioredoxins. Plant Molecular Biology. v. 70, 273-281,

CASTRO, M.A. ;WANG, X., FLETCHER, M.N.; MEYER, K.B.; MARKOWETZ, F. “RedeR:

R/Bioconductor package for representing modular structures, nested networks and multiple

levels of hierarchical associations.” Genome Biology, v. 13, 2012.

CAVALCANTE, V. R. A e MARINHO, P. Tiorredoxinas Típicas Codificadas Pelo Genoma

De Eucalyptus Grandis. X Simpósio Brasileiro de Pós – Graduação em Ciências Florestais

(XSIMPÓS). Anais. Natal, p. 1494 – 1498, 2018.

CHIBANI, K. TARRAGO, L.; SCHÜRMANN, P.; JACQUOT, J. P.; ROUHIER, N.

Biochemical Properties Of Poplar Thioredoxin Z. Federation of European Biochemical

Socieries Letters. v. 585, p. 1077-81, 2011.

CHIBANI, K.; WINGSLE, G.; JACQUOT, J. P.; GELHAYE, E.; ROUHIER, N. Comparative

Genomic Study Of The Thioredoxin Family In Photosynthetic Organisms With Emphasis

On Populus Trichocarpa. Molecular Plant. v. 2, p. 308-22, 2009.

CHO, M. J.; WONG, J. H.; MARX, C.; JIANG, W.; LEMAUX, P. G.; BUCHANAN, B. B.

Overexpression of thioredoxin h leads to enhanced activity of starch debranching enzyme

(pullulanase) in barley grain.Proceedings of National Academy of Sciences U S A. v. 96,

p. 4641-6, 1999.

CLUSTAL OMEGA. Disponível em: https://www.ebi.ac.uk/Tools/msa/clustalo/. Acesso em: 12

de março de 2018.

COLLIN, V.; ISSAKIDIS-BOURGUET, E.; MARCHAND, C.; HIRASAWA, M., LANCELIN,

J. M.; KNAFF, D. B.; MIGINIAC-MASLOW, M. The Arabidopsis Plastidial Thioredoxins:

New Functions And New Insights Into Specificity. Journal Biology Chemmistry. v. 278,

p. 23747-52, 2003.

DATABASE OF PLANT PROMOTERS AND CIS – ACTING REGULATORY ELEMENTS .

Disponível em: http://bioinformatics.psb.ugent.be/webtools/plantcare/html/. Acesso em: 01 de

março de 2017.

DÍAZ, M. G.; HERNÁNDEZ-VERDEJA, T.; KREMNEV, D.; CRAWFORD, T.; DUBREUIL, C.;

STRAND, Å. Redox Regulation Of PEP Activity During Seedling Establishment In Arabidopsis

thaliana. Nature Communications. v. 9, p. 50, 2018.

DRUMMOND, A. J. E.; RAMBAUT, A. BEAST: Bayesian Evolutionary Analysis by Sempling

Tress. BMC Evolutionary Biology. 2007.

ENSEMBL GENOME ARCHIVES SITES. Disponível em: http://plants.ensembl.org.

www.plantgbd.org/. Acesso em: 01 de março de 2017.

EUCGENIE, THE EUCALYPTUS GENOME INTEGRATIVE EXPLORER. Disponível em:

https://eucgenie.org/. Acesso em: 01 de outubro de 2017.

GEIGENBERGER, P.; THORMÄHLEN, I.; DALOSO, D. M.; FERNIE, A. R. The

Unprecedented Versatility Of The Plant Thioredoxin System. Trends Plant Sci. p. 249-

262, 2017.

GÜTLE, D. D.; RORET, T.; MÜLLER, S. J.; COUTURIER, J.; LEMAIRE, S. D.; HECKER,

A.; DHALLEINE, T.; BUCHANAN, B. B.; RESKI, R.; EINSLE, O.; JACQUOT, J. P.

Chloroplast Fbpase And Sbpase Are Thioredoxin-Linked Enzymes With Similar

Architecture But Different Evolutionary Histories.Proceeding of the National Academy

of Sciencies USA. v. 113, p. 6779-84, 2016.

HOLMGREN, A. Thioredoxin. Annual Review Biochemestry. v. 54, p. 237-71, 1985.

ISAKOV, N.; WITTE, S.; ALTMAN, A. PICOT-HD: A Highly Conserved Protein Domain

That Is Often Associated With Thioredoxin And Glutaredoxin Modules. Trends

Biochemical Science, v. 25 p. 537- 539, 2000.

JACQUOT, J. P.; EKLUND, H.; ROUHIER, N.; SCHÜRMANN, P. Structural And

Evolutionary Aspects Of Thioredoxin Reductases In Photosynthetic Organisms.Trends

Plant Sciences. v.14, p. 336-343, 2009.

JACQUOT, J. P.; RIVERA-MADRID, R.; MARINHO, P.; KOLLAROVA, M.; LE

MARÉCHAL, P.; MIGINIAC-MASLOW, M.; MEYER, Y. Arabidopsis Thaliana NADPH

Thioredoxin Reductase. Cdna Characterization And Expression Of The Recombinant

Protein In Escherichia Coli. Journal Molecular Biology. v. 235, p. 1357-63, 1994.

JACQUOT, J. P.; BUCHANAN, B. B. Enzyme Regulation In C(4) Photosynthesis :

Purification And Properties Of Thioredoxin-Linked NADP-Malate Dehydrogenase From

Corn Leaves.Plant Physiology. v. 68, p. 300-304, 1981.

KATHOH, K.; MISAWA, K.; KUMAK, K.; MIYATA, T. MAFFT: A Model Method for Rapid

Multiple Sequecia Alignament Baseado on Fast Fourier Transform. Nucleic Acid Res. v.

30, p. 3059 – 3066, 2002.

KUROOKA, H.; KATO, K. MINOGUCHI, S.; TAKAHASHI, Y.; IKEDA, J.; HABU, S.;

OSAWA, N.; BUCHBERG, A. M.; MORIWAKI, K.; SHISA, H.; HONJO, T.Cloning And

Characterization Of The Nucleoredoxin Gene That Encodes A Novel Nuclear Protein

Related To Thioredoxin.Genomics. v. 39, p. 331-339, 1997.

LAURENT, T. C.; MOORE, E. C. E.; REICHARD, P. Enzymatic Synthesis Of

Deoxyribonucleotideos. IV. Isolation And Characterization Of Thioredoxin, The Hydrogen

Donor From Escherichia Coli. Journal Biological Chemistry, v. 239, p. 3436 – 3444,

LALOI, C.; RAYAPURAM, N.; CHARTIER, Y.; GRIENENBERGER, J. M.; BONNARD, G.;

MEYER, Y. Identification And Characterization Of A Mitochondrial Thioredoxin System In

Plants.Proceedings of the National Academy of Sciences USA, v. 98, p. 14144-9,

LALOI, C.; MESTRES-ORTEGA, D.; MARCO, Y.; MEYER, Y.; REICHHELD, J. P. The

Arabidopsis Cytosolic Thioredoxin H5 Gene Induction By Oxidative Stress And Its W-Box-

Mediated Response To Pathogen Elicitor. Plant Physiology. v. 134, p. 1006-1016, 2004.

LARKIN, M. A.; BLACKSHIELDS, G.; BROWN, N. P.; CHENNA, R.; MCGETTIGAN, P.

A.; MCWILLIAM, H.; VALENTIN, F.; WALLACE, I. M.; WILM, A.; LOPEZ, R.; THOMPSON,

J. D.; GIBSONT J.; IGGINSD, G.Clustal W And Clustal X Version 2.0. Bioinformatics, v.

23, p. 2947-2948, 2007.

LEE, J. R.; LEE, S. S.; JANG, H. H.; LEE, Y. M.; PARK, J. H.; PARK, S. C.; MOON, J. C.;

PARK, S. K.; KIM, S. Y.; LEE, S. Y.; CHAE, H. B.; JUNG, Y. J.; KIM, W. Y.; SHIN, M. R.;

CHEONG, G. W.; KIM, M. G.; KANG, K. R.; LEE, K. O.; YUN, D. J.; LEE, S. Y. Heat-shock

dependent oligomeric status alters the function of a plant-specific thioredoxin-like protein,

AtTDX. Proceeding of the National Academy of Sciences U S A. v. 106, p. 5978- 5983,

LENNARTZ, K.; PLÜCKEN, H.; SEIDLER, A.; WESTHOFF, P.; BECHTOLD, N.;

MEIERHOFF, K. HCF164 encodes a thioredoxin-like protein involved in the biogenesis of

the cytochrome b(6)f complex in Arabidopsis. Plant Cell. v. 13, p. 2539-2551, 2001.

LESCOT, M.; DÉHAIS, P.; THIJS, G.; MARCHAL, K..; MOREAU, Y.; VAN DE PEER

,Y.; ROUZÉ, P.; ROMBAUTS, S. PlantCARE, a database of plant cis-acting regulatory

elements and a portal to tools for in silico analysis of promoter sequences. Nucleic Acids

Res. v. 30, p.325-327, 2002.

LI, Y. C.; REN, J. P.; CHO, M. J.; ZHOU, S. M.; KIM, Y. B.; GUO, H. X.; WONG, J. H.;

NIU, H. B.; KIM, H. K.; MORIGASAKI, S.; LEMAUX, P.G.; FRICK, O. L.; YIN, J.;

BUCHANAN, B. B. The level of expression of thioredoxin is linked to fundamental

properties and applications of wheat seeds. Molecular Plant. v 2, p.430-441, 2009.

MAFFT: Disponível em: http://mafft.cbrc.jb/alignment/seven. Acesso em: 07 de agosto de

MARCHAL, C.; DELORME-HINOUX, V.; BARIAT, L.; SIALA, W.; BELIN, C.; SAEZ-

VASQUEZ, J.; RIONDET, C.; REICHHELD, J. P. NTR/NRX Define A New Thioredoxin

System In The Nucleus Of Arabidopsis Thaliana Cells. Molecular Plant. v.7, p. 30-44,

MARTINS, L.; TRUJILLO-HERNANDEZ, J. A.; REICHHELD, J. P. Thiol based redox signaling

in plant nucleus. Front Plant Sci. 28;9:705, 2018.

MENG, L.; WONG, J. H.; FELDMAN, L. J.; LEMAUX, P. G.; BUCHANAN, B. B. A

Membrane-Associated Thioredoxin Required For Plant Growth Moves From Cell To Cell,

Suggestive Of A Role In Intercellular Communication. Proceeding National Academy

Sciences U S A. v. 107, p. 3900-3905, 2010.

MEYER, Y.; BUCHANAN, B. B.; VIGNOLS, F.; REICHHELD, J. P. Thioredoxins And

Glutaredoxins: Unifying Elements In Redox Biology. Annual Review of Genetic. v. 43, p.

335-367, 2009.

MEYER,Y.; BELIN, C.; DELORME-HINOUX, V.; REICHHELD, J. P.; RIONDET, C.

Thioredoxin And Glutaredoxin Systems In Plants: Molecular Mechanisms, Crosstalks, And

Functional Significance. Antioxid Redox Signal. v. 17, p.1124-1160, 2012.

MICHAEL, T. P.; JACKSON S. The first 50 plant genomes. The Plant Genome, v. 6, p. 1-7,

MYBURG, A. A; GRATTAPAGIA, D.; TUSKAN, G. A.; HELLSTEN, U.; HAYES, R. D.;

GRIMWOOD, J.; JENKINS, J.; LINDQUIS, T. The Genoma Of Eucalyptus Grandis.

Nature, v. 510, p. 356-62, 2014.

MOTOHASHI, K.; HISABORI, T. HCF164 receives reducing equivalents from stromal

thioredoxin across the thylakoid membrane and mediates reduction of target proteins in the

thylakoid lumen. Journal Biological Chemistry. v. 281, 2006.

NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION. Disponível em:

https://www.ncbi.nlm.nih.gov/. Acesso em: 01 de março de 2017.

NIKKANEN, L.; RINTAMÄ, K. I. E. Thioredoxin-Dependent Regulatory Networks In

Chloroplasts Under Fluctuating Light Conditions.Philos Trans R. Society London

Biochemical Biology Science. v. 369, 2014.

PARK, S. K; JUNG, Y. J.; LEE, J. R.; LEE, Y. M.; JANG, H. H.; LEE, S. S.; PARK, J. H.;

KIM, S. Y.; MOON, J. C.; LEE, S. Y.; CHAE, H. B.; SHIN, M. R.; JUNG, J. H.; KIM, M. G.;

KIM, W. Y.; YUN, D. J.; LEE, K. O.; LEE, S. Y. Heat-Shock And Redox-Dependent

Functional Switching Of An H-Type Arabidopsis Thioredoxin From A Disulfide Reductase

To A Molecular Chaperone. Plant Physiology. v. 150, p. 552-561, 2009.

PHYTOZOME, THE PLANTS GENOMICS RESOURCE. Disponível em:

https://www.phytozome.jgi.doe.gov/. Acesso em: 01 de março de 2017.

PRIMER3, PICK PRIMERS FROM A DNA SEQUENCE. Disponível em:

http://bioinfo.ut.ee/primer3/. Acesso em: 23 de abril de 2018.

REICHHELD, J. P.; MESTRES-ORTEGA, D.; LALOI, C.; MEYER, Y. The Multigenic

Family Of Thioredoxin H In Arabidopsis Thaliana: Specific Expression And Stress

Response. Plant Physiology Biochemistry. v. 40, p. 685-690, 2002.

REICHHELD, J. P.; KHAFIF, M.; RIONDET, C.; DROUX, M.; BONNARD, G.; MEYER, Y.

Inactivation of thioredoxin reductases reveals a complex interplay between thioredoxin and

glutathione pathways in Arabidopsis development. Plant Cell. v. 19, p. 1851-1865, 2007.

REY, P.; PRUVOT, G.; BECUWE, N.; EYMERY, F.; RUMEAU, D.; PELTIER, G. A Novel

Thioredoxin-Like Protein Located In The Chloroplast Is Induced By Water Deficit In

Solanum Tuberosum L. Plants Plant Journal. v. 13, p. 97-107, 1998.

RIVAS, S.; ROUGON-CARDOSO, A.; SMOKER, M.; SCHAUSER, L.; YOSHIOKA, H.;

JONES, J. D. CITRX Thioredoxin Interacts With The Tomato Cf-9 Resistance Protein And

Negatively Regulates Defence European Molecular Biology Organization Journal.

v.23, p. 2156-2165, 2004.

SANZ-BARRIO, R.; CORRAL-MARTINEZ, P.; ANCIN, M.; SEGUI-SIMARRO, J. M.; FARRAN,

I. Overexpression of plastidial thioredoxin f leads to enhanced starch accumulation in tobacco

leaves. Plant Biotechnology Journal. v.11, p. 618–627, 2013

SERRATO, A. J.; FERNÁNDEZ-TRIJUEQUE, J.; BARAJAS-LÓPEZ, J. D.; CHUECA, A.;

SAHRAWY, M. Plastid Thioredoxins: A "One-For-All" Redox-Signaling System In Plants.

Frontiers in Plant Science. v. 4, p. 463, 2013.

SIGRIST, C. J. A.; DE CASTRO, E.; CERUTTI, L.; CUCHE, B. A.; HULO, N.; BRIDGE, A.;

BOUGUELERET, L.; XENARIOS, I. New And Continuing Developments At PROSITE.

Nucleic Acids Research. 2012.

SMALL, I.; PEETERS, N.; LEGEAI, F.; LURIN, C. Predotar: A tool for rapidly screening

proteomes for N-terminal targeting sequences.Proteomics. v. 4, p. 1581-1590, 2004.

STRING, FUNCTIONAL PROTEIN ASSOCIATION NETWORKS. Disponível em:

http://string_db.org. Acesso em: 07 de agosto de 2018.

TAMURA, K.; DUDLEY, J.; NEI, M.; KUMAR, S. Mega4: Molecular Evolutionary Genetics

Analysis (MEGA) Software Version 4.0. Molecular Biology And Evolution 2. v.4, p.

1596-1599, 2007.

TUSKAN, G. A.; DIFAZIO, S.; JANSSON, S.; BOHLMANN, J.; GRIGORIEV, I.; ROKHSAR, D.

et al. The genome of black cottonwood, Populus trichocarpa. Science. v. 15; p. 313-604, 2006.

VICENTINI, R.; SASSAKI, F. T.; GIMENES, M. A.; MAIA, I. G.; MENOSSI, M. In Silico

Evaluation Of TheEucalyptus Transcriptome. Genetic Molecular Biology, v. 28, p. 487–

495, 2005.

VINING, K.J.; ROMANEL, E.; JONES, R.C.; KLOCKO, A.; ALVES-FERREIRA, M.; HEFER,

C. A. The floral transcriptome of Eucalyptus grandis. New Phytol. v. 206; p. 1406-1422,

VIGNOLS, F.; MOUAHEB, N.; THOMAS, D.; MEYER, Y. Redox Control Of Hsp70-Co-

Chaperone Interaction Revealed By Expression Of A Thioredoxin-Like Arabidopsis

Protein. Journal Biology Chemestry. v. 278, p. 4516-4523, 2002.

WOLOSIUK, R. A.; BUCHANAN, B. B. Thioredoxin and glutathione regulate photosynthesis in

chloroplasts. Nature, v. 266, p. 565-567, 1977.

WONG, J. H.; CAI, N.; BALMER, Y.; TANAKA, C. K.; VENSEl, W. H.; HURKMAN, W. J.;

BUCHANAN, B. B. Thioredoxin targets of developing wheat seeds identified by

complementary proteomic approaches. Phytochemistry. v. 65, p. 1629-1640, 2004.

YANO, H. Ongoing Applicative Studies of Plant Thioredoxins. Molecular Plant. v. 7, p. 4 -13,

ANEXO 1

__________________________________________________________________________

Sequências de Tiorredoxinas das cinco espécies (Eucalyptus grandis, Jatropha curcas, Populus trichocarpa, Vitis vinífera, Arabidopsis thaliana) utilizadas para a construção de árvores filogenéticas. TIORREDOXINAS F >Eucgr.B01424.1 MRAREAREKGYPLGSCKPMPMPTMRSKRAPFVCGRSESSSWGRRMRPCSIRVIDSSDHARGHDKRSIQSDLVVFQEWPPNNISLASSNFSTTTPLDARRPPHTQSDIPKTPPPASPHIHKTKAPVSFLLSLRRRRRRRRRLRLLVLLSLRSAPMALQLSLSNPPSLRSSSAGSSGLSVASSSSSSSVFSPPSRPLKSVSIAGRAPRSGATGVVRCSVETAIAEVGQVTEVNKDSFWPIVRSAGDKTVVLDMYTQWCGPCKVMAPKYQELSEKYSDVLFLKLDCNQDNKPLAKELGLKVVPTFKILKDNKVVKEVTGAKLDNLVLAIDAVRSS >Eucgr.H01629.1 MALQLSLSASSSLRSQNSVPCLSSSGSSSSSSAISSSRWCWLGCKNVSLLRAGGNVGRGGNGVVVKCSVDTTGVYTVGTVTDVDKDTFWPIVNSAPDKTVVLDMYTQWCGPCKIIAPKFQELAEKYLDVVFLKLDCNQENKPLAKELGIRVVPTFKILKGGKIVKEVTGAKFDDLLLAIDTVRSS >JCDBP23011 (XP_012085778.1 thioredoxin F-type, chloroplastic) MSLIQFSITPTTPRSSPSFSSSQAHPIAAAIAKDSFTNSSPKPSSRSSFSRSLKVFKRNDCAFTVRSSLD TVGPTATVGQVTEVNKDTFWPIVKSAGAKAVVLDMYTQWCGPCKVIAPKFQELSEKYLDVVFLKLDCNQE NKPLAKELGIKVVPTFKILKDSKVVKEVTGAKYDDLVAAIEAVRSS >PtTrxf(estExt_fgenesh4_pg.C_LG_XIX0571) MASIQFSLSPTSSIRSSPSFAGSPANPITPQYSSTPTKDLSSYCKLSSRQKNVIKRNGSRNLVSTVRSSLDTAGPTSAVGQVTEVTKDTFWPIVNSAGDKTVVLDMYTQWCGPCKLIAPKYKELSQKYDDVVFLKLDCNQENKPLAKELGIKVVPTFKILKQGKIVKEVTGAKFDNLVIAIESVRSAS >VvTrxf(GSVIVP00025050001) MALRLSLSPPPIRSSASPSWAAPHSIAISCSSSSSVGVSVPTQEKRRARVVVRSSSIDTAEAVVGQVTEVNKDTFWPIVKAAGDKAVVLDMYTQWCGPCKVMAPKFQELSGKYLDVVFLKLDCNQDNKTLAKELGIRVVPTFKILKDSKIVKEVTGAKLDDLVVAIETVRSS >AtTrxf1(At5g16400) MPLSLRLAPSPTSFRYSPITSTGAGGFSPVKQHCRIPNSGVATKIGFCSGGGGVLDSGRRIGSCVVRCSLETVNVTVGQVTEVDKDTFWPIVKAAGDKIVVLDMYTQWCGPCKVIAPKYKELSEKYQDMVFLKLDCNQDNKPLAKELGIRVVPTFKILKDNKVVKEVTGAKYEDLLAAIEAARSG >AtTrxf2(At3g02730) MPLSLRLSPSPTALSPTTGGFGPSRKQCRIPYSGVPTTKIGFCSLDSRKRGDSSVVRCSLETVNVSVGQVTEVDKDTFWPIVKAAGEKLVVLDMYTQWCGPCKVIAPKYKALSEKYDDVVFLKLDCNPDNRPLAKELGIRVVPTFKILKDNKVVKEVTGAKYDDLVAAIETARSAASG

TIORREDOXINAS H

>Eucgr.A00783.1 MGQCVTKILCCSWCFQQEIKDNESDQHIDFASGNVHLITTKESWDEKLSQAIKDGKIVIANFSATWCGPCRVIAPFYSELSEKHPSLMFLLVDVDELTEFSTSWDIKATPTFFFLKDGNQVDKLVGANKPELQKKITAILDSIDQSQK >Eucgr.B02586.1 MGQNVSSGDCNDWAPAKASRVMEFHSKSRWDEHNDWAPAKASRVMEFHSKSRWDEHFEASKGNNKLMVIDFTATWCGPCRRMEPTIDELAETFADVDFIKIDVDELMNVARQYEVQAMPTFLLMKNGKVVDEVIGAKKDELRNKIEQNCNKSQPYLQSNSHHYAI >Eucgr.F01604.1 MAEEGQVYGCHTVDAWKEQFQKGVESKKLVVVDFTASWCGPCRLIAPIFAEMAKKMPHVLFLKVDVDELQSVATEHSVEAMPTFLLLKDGQIVDKVVGADKEHCCLTVYLVLREKNKPAPMLDALESIWLVSFPWISDTLVCEELSYLQI >Eucgr.F01854.1 MAGEGQVISCHTVDSWNQQLQTGAESKKLVVVDFSATWCGPCRLISPVLDNLARKLTDVIFLKVDVDELRSVAEDWAVEAMPTFIFIKEGAVVDKVVGANKDDLQMKIAKHAAATVTA >Eucgr.I01912.1 MGSFLSRLLRALGLGPRAPAAAPATTVSTDSPSQSSSSDSPPRHSRVQALHSTPPWQLHFNTVKETPKLMLIDFTASWCGPCKSMQPVVDAMASKFTDVDFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRLVGASKDELERKIQKHRGLVPTR

>Eucgr.I01913.1 MTTRKGWVQPAKQSERSSCHGLLPLQPPRSSGRRRLAGIVVGAFPRPGVPLHPAVAAPLQQSQGYLPIAKMVIDFAASWCGPCRMMEPAVSAMASKFADVEFAKIDVDELSDVAREFSVQAMPTFVLVKKGKEVDRIVGAKKDELERKVQKHRALMASS >Eucgr.I02383.1 MAEEGQVISCHSAESWSEQIAKSNESDKLVVVDFTASWCGPCRFIAPFLAELAKKFPNVLFLKVDVDELKTVAQEWAVEAMPTFMFVKGGKIVDRVVGAQKDQLQMTLAKHMATASA >Eucgr.J02387.1 MASSEEGQVIGCHTVGAWTEQIQKGNEPDQLVVVDFTASWCGPCRFIAPFLAELAKKFPAVLFLKVDVDELKQVAQEWAVEAMPTFIFVKGGKVVDKVVGAKKDDLQQTIGKHVATASA >Eucgr.K01294.1 MGQCYPKNQMHGDDSDEHVEFAGGNVHIVTTKESWDQKLSEANKDGKIVLANFSATWCGPCKMMAPFYSELSEKHSSILFLVVDVDELTEMSTSWDIKATPTFFFLRDGQQIDKLVGANKPELQKKITAILDSANPR

>NP_001295646.1 thioredoxin H1-like [Jatropha curcas] MAEEGQVIACHTVEAWNEQLEKGKESKTLIVVDFTATWCGPCRFITPILQDLAKKMPHVTFLKVDVDELR TVAEDWAVEAMPTFMFLKEGKIVDKVVGAKKEELQMTIVKHATEVAAA >JCDBP18536 (XP_012078402.1 thioredoxin H-type) MAAEEGQVIGCHTVEAWNEQLQKGNESKKLVVVDFTASWCGPCRFISPLLAELAKKLPNVIFLKVDVDEL QTVAQDWAVEAMPTFIFLKEGNILDKMLGANKDELQQKIAKHLATSTATASA

>XP_012091966.1 thioredoxin H7 [Jatropha curcas] MFRQMNSFQRARTMRSSFSFNYNKGLTDTQPSGIVEIRSVDQWKAYFEATKGNNKLLVIQFTATWCGPCR LIDPAIKEFAAKYKDVDFIKIDVDKLFLVAQQFEANTLPAFVLIKKGKEVDKIVGVKKIELQNKIEQLRI >XP_012091029.1 thioredoxin H-type [Jatropha curcas] MGQCLCLDKSQGADDADEHVEFVGSNVHLVTTNETWEQKLSEASRDGKTVLANFSATWCGPCRMIAPFYR ELSEKYPSLMFLLVDVDELPDFSTSWDIKATPTFFFLRDGQQLDKLVGANKPELQKKIAAVLDATA >XP_012067568.1 thioredoxin H4-1-like [Jatropha curcas] MGQCWSQVSICGKSKNNGNDDTKKSKDTGHGDCRCKNVHRINSIQKWEEKLSEANKDNKIVVVNFCSSWC SPSKSIAPAYCELADKYTSLVFLSVDIDELAEFSSSWEIKSTPTFFFLKDGRQVDKLVGADKPELQKKIA SFVGSK >XP_012082815.1 thioredoxin H2 [Jatropha curcas] MGSLFSALAGDSAAAAEDNSADHSGVTTFHSPERWQLHFNSVKDSSQLMVIDFAASWCGPCKLMEPEVKG MAVKFTDVQFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRIVGARKDELQRKIEKHRALVAAT >ADU56183.1 thioredoxin H-type [Jatropha curcas] MAEEGQVIACHTVEAWNEQLEKGKESKTLIVVDFTATWCGPCRFITPILQDLAKKMPHVTFLKVDVDELR TVAEDWAVEAMPTFMFLKEGKIVDKVVGAKKEELQMTIVKHATEVAAA >PtTrxh1.1(estExt_fgenesh4_pg.C_LG_V1461) MAEEGQVIACHTVDTWKEHFEKGKGSQKLIVVDFTASWCPPCKMIAPIFAELAKKFPNVTFDGKLVDKTVGADKDGLPTLVAKHATALKVDVDELKAVAEEWNVEAMPTFIFLK >PtTrxh2(gw1.VIII.1883.1) MEFAWPVLQRGRTVQTSFFHFDHSNGFPCKKPSAGVVDVHSVDAWRSFFEANKQNNKLLVVEFTATWCGPCRYMEQTMKDFAAKYADVVFIRIDVDELQHVAQQFNVTTMPAFSLLKKGKIVDEVAGVKKSELQNKIEKHGMI >PtTrxh3(gw1.VII.3777.1) MAAEDGQVIGCHTVEAWDEQLQRGNESKKLVVIDFHASWCGPCRVIAPFLAELARKLPDVIFLKVDVDELKTVAQDWAVEAMPTFMFLKEGKIVDKVVGARKDELQQAIAKHTAPAAATASA >PtTrxh4.2(estExt_fgenesh4_pg.C_LG_VI0901) MGLCLDKHKHDADNDELHVEFAGGNVHLVTTKESWDQKLSEASRDGKIVLANFSATWCGPCKQIAPFYNELSEKYPSLLFLLVDVDELSDLSTSWEIKATPTFFFLRDGKQLEKLVGANKPELQKKITAIADSLPPSDK >PtTrxh4.1(estExt_fgenesh4_pg.C_LG_XVI1300) MGLCLAKRNHDADDDEPHIELAGGNVHLITTKERWDQKLSEASRDGKIVLANFSARWCGPCKQIAPYYIELSENYPSLMFLVIDVDELSDFSASWEIKATPTFFFLRDGQQVDKLVGANKPE LHKKITAILDSLPPSAK >PtTrxh1.2(estExt_Genewise1_v1.C_LG_II0911) MAEEGQVIACHTVDVWKEQFEKGKGTQKLIVVDFTASWCPPCKFIAPVFADLAKKFTNVTFKDGKLVDKIVGADKDGLPALVEKHSVYTALKVDVDELKPVAAEWEVEAMPTFIFL >PtTrxh5(gw1.XVII.864.1) MGAVLSSIGSILSYLFGASAAGEDSASDGQSGVTAFHSSARWQLHFNSIKNTSQLTVIDFAASWCGPCKHMEPAVHAMAAKFTDVQFAKIDVDELPDVAQEFGVQAMPTFVLVKKGNEVDRVVGAQKEELQRKIEKHRPR

>VvTrxh1(GSVIVP00036859001) MAEEGQVIGVHSVEAWNDHLQKCNESNKLIVVDFTASWCGPCRFITPFLVELAKKIPTVTFLKVDVDELKSVATDWAVEAMPTFMFLKQGKIVDKVVGANKDSLQQTIAKHMATA >VvTrxh2(GSVIVP00028970001) MGASHSSSSKSSRVLTFNSSASWKIHFEEAKSTGKLMVIDFSATWCGPCRFMEPVINEFAEKYTDVEFVKIDVDELSDVAQEFGVQGMPTFLLIKRGTEVDKVVGAKKEELQKKIEAHRKN >VvTrxh3(GSVIVP00014532001) MAEEGQVVGCHSVESWKEQFQHGIESKKLVVVDFTASWCGPCRVISPFLAELAKKMPNVIFLKVDVDELETVAKEWEVEAMPTFLFLKEGNVVDKVVGAKREELVQKTEKHATA >VvTrxh4(GSVIVP00023385001) MVQHHNDDDDSDHNAAFASGNVHLITTKENWEEKLAEASKDGKIVIANFSATWCGPCKMIAPFYCELSEAHPSLMFLTVDVDELSEFSSSWDIKATPTFFFLRDGQQVDKLVGANKPELQKKITAILDSMTQCNK >VvTrxh5(GSVIVP00020873001) MGSVVSGLLGGGAADASDSTLEGSGVNVFHSSERWLLHFNASKESNQLMVIDFAATWCGPCKFMEPAVKSMASKYTDVDFVKIDVDELPDVAQEFTVQAMPTFVLLKKGKELERVIGAKKDELEKKIQKHRAVSNA >AtTrxh1(At3g51030) MASEEGQVIACHTVETWNEQLQKANESKTLVVVDFTASWCGPCRFIAPFFADLAKKLPNVLFLKVDTDELKSVASDWAIQAMPTFMFLKEGKILDKVVGAKKDELQSTIAKHLA >AtTrxh2(At5g39950) MGGALSTVFGSGEDATAAGTESEPSRVLKFSSSARWQLHFNEIKESNKLLVVDFSASWCGPCRMIEPAIHAMADKFNDVDFVKLDVDELPDVAKEFNVTAMPTFVLVKRGKEIERIIGAKKDELEKKVSKLRA >AtTrxh3(At5g42980) MAAEGEVIACHTVEDWTEKLKAANESKKLIVIDFTATWCPPCRFIAPVFADLAKKHLDVVFTFIFMKEGEIKETVVGAAKEEIIANLEKHKTVVAAAFKVDVDELNTVAEEFKVQAMP >AtTrxh4(At1g19730) MAAEEGQVIGCHTNDVWTVQLDKAKESNKLIVIDFTASWCPPCRMIAPIFNDLAKKFMSSAMPTFVFIKAGEVVDKLVGANKEDLQAKIVKHTGVTTAIFFKVDVDELQSVAKEFGVEA >AtTrxh5(At1g45145) MAGEGEVIACHTLEVWNEKVKDANESKKLIVIDFTASWCPPCRFIAPVFAEMAKKFTNVVFFKIDVDELQAVAQEFKVEAMPTFVFMKEGNIIDRVVGAAKDEINEKLMKHGGLVASA >AtTrxh7(At1g59730) MGSNVSSVHDVHSSMEITSNGFVVEIESRRQWKSLFDSMKGSNKLLVIDFTAVWCGPCKAMEPRVREIASKYSEAVFARVDVDRLMDVAGTYRAITLPAFVFVKRGEEIDRVVGAKPDELVKKIEQHRV >AtTrxh8(At1g69880) MGANVSTPDQRFQVTHFRSTKPWTPRPEIYPFKVNSPCIVEIKNMNQWKSRLNALKDTNKLLVIEFTAKWCGPCKTLEPKLEELAAKYTDVEFVKIDVDVLMSVWMEFNLSTLPAIVFMKKYTQSFFRGREVDMVVGVKVDELERKLN >AtTrxh9(At3G08710) MGSCVSKGKGDDDSVHNVEFSGGNVHLITTKESWDDKLAEADRDGKIVVANFSATWCGPCKIVAPFFIELSEKHSSLMFLLVDVDELSDFSSSWDIKATPTFFFLKNGQQIGKLVGANKPELQKKVTSIIDSVPESPQRP TIORREDOXINAS M

>Eucgr.A01813.1 MSSMAAMLDSVALSSPKIRPSPRRPAAAMASSPAAISLPSRPKADALPGFAGLRIQSRSLAPSNSRSSRGPRCSRNGRIVCEASDTALDLPPVTDTTWKSLVLKADGPVLVEFWAPWCGPCRMLHPVVGEIADEYAGKLKCFKLNTDESPSIATQYGVRSVPTIMIFSSGEKKDAVLGAVPKSTLTTCIEKFL >Eucgr.F02754.1 MEQCVQMMSATRGRVLQCCDRPVAFARRGMPNSPTRKGGAVLKKSALNFSLSSSPPPLASSLSVRHQRRSSIICKARDALDEVRVVTDSSWSNLVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIACYKLNTDDCPTIATQYGIRSIPTVLFFKNGEKKESVIGAVPKSTLSATVEKYLDL >Eucgr.F03319.1 MAAVLESLAVPRSSGAASAAALSPVASASSLAPTAGRRRSATFPQASGLRIGPVSVARSLRSPSQRPRRAPAVVCEAQDTAVEVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL >Eucgr.L03049.1 MNDVMPKKLHKKVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL

>XP_012066098.1 thioredoxin M-type, chloroplastic [Jatropha curcas] MAMKNCFQVCTSGRGGVVQCSQPLKIHLPTSCKGIFNIANKDLLSLSSSSLRLKPRSQKARFVCKAREAL NEVQAVTDSSWDNLVISSENPALVEFWAPWCGPCRMIAPVIDELAKEYAGKISCFKVNTDECPNIANKYG IRSIPTVLFFKKGEKKESVIGAVPKTTLSSTIEKYIDA

>PtTrxm1(eugene3.01420010) MVSSMVLSSYPSSRLKCSLSNPQSVIMMSSPQPTVALLFPVRLGGAASFAEFGGLRIQMGSKLSPSLVSINTRRNPKVFCRIVSEAQETVVDIPTVTDETWQSLVIEADGPVMIEFWAPWCGPCRIIHPVIAELSTEYGGKLKCFMLNTDESPSTVTKYGIRSIPTIIIFKKGEKKDAIIGAVPKTTLISNIKKFL >PtTrxm2(estExt_Genewise1_v1.C_LG_XIX2392) MDSSMALSSYSSRLKCSLPNPPPMMMVPSPQLPGVLPLSSRRCGIASFAEFRGLRIQMGSKLSTSLVSIGTRRNPKVFSRIVSEAHETFVDIPAVTDETWQSLIIEADGPVLVEFWAPWCGPCRIIHPVIAELSTEYDGKLKCFKLNTDESPSTTTKYGIRSIPTIMIFKNGEKKDAIIGSVPKTTLISNMKKFL >PtTrxm3(estExt_Genewise1_v1.C_LG_IX2199) MASSATSLYSPPLTSSRAAVLHQCQQLNPNRLSFPSDFNTAKRATNLTVQHVPLPLKVLCGRGNRATAVTQDSWENSILKSDIPVLVEFYASWCGPCRMVHRVIDEIAAEYDGKLKCFVLNTDNDLQIAEDYEIKAVPVVLLFKNGEKRESVVGTMPKEFYIAAVERVLQS >PtTrxm4.1(gw1.107.137.1) MAALLESLTVPPLTFPKPKPTTTTPLSAFASPIHRRSLRLPHVKGLKLSFNSSTINRSPGSFVTLTSSRLSRGGRIVCEAQETAVEVASVTDATWKSVVLESESPVLVEFWAPWCGPCRMIHPIIDELATQYTGKLKCYKVNTDDCPSIATQYGIRSIPTVIIFKNGEKKEAIIGAVPKTTLTTTIEKFL >PtTrxm4.2(estExt_Genewise1_v1.C_LG_XI3916) MATVLESLTAPSRSSAVLPKPTTTLVTAFASTINRRSLRFPQLKGLKIHFHSSSTVNRSLGSVSQSSSRLACAGRIVCEAQDIAVKVPAVTDATWKSLVLESESPVLVEFWAPWCGPCRMIHPVIDELANQYAGKLKCYKLNTDDCSSIATEYGIRSIPTVIIFKNGEKKEAIIGAVPKTTLTTSIEKFL >PtTrxm5.1(estExt_fgenesh4_pg.C_LG_II0671) MAMKNCFQVSSVSTTRAGVCHPFAPVEKLQLPTSKGLNTSNLLLSSPSSSFPPSLRSRCQESRIVCKAREAVDAVQVATDASWDAVIGGDTPVLVEFWAPWCGPCKMIAPVIEELAQEYAGKKTTLSSSIEKYIDVIACYKVNTDDCPSIATKYGIRSIPTVLFFKKGEKKESVIGAVP >PtTrxm5.2(estExt_fgenesh4_pg.C_LG_V1048) MAMKNCFQVSSVSTTTRAGVCHPFAPVEKLQLPTCKGPNTSNLSLSSPSSSFPRSLRSRCQKSRVVCKAREAVDAVQVATDASWDTVIGSDTPVLVEFWAPWCGPCKMIAPVVEELAKEYAGKIACYKVNTDDCPNIATKYGIRSIPTVLFFKKGEKKESVIGAVPKTTLSNSIDKYIDA >PtTrxm6(eugene3.00700019) MALHASMNMSTMSTTRAGVLCSNHVACSKEKLKLPTGRGLRRSSSLSFPSSFSSSYASVKNHKIHHCMQSSRSCRLQVVTDSSWDSLVIGCEIPVLVEFWAPWCGPCRMITPVIDELAAEYAIRSIPTVLMFKNGEKKEGVIGAVPKATLAAAIEKYVEA GKIACFKVNTDDCPNIASQYA >VvTrxm1(GSVIVT00018570001) MPSPTVVSVGRSSFSLPEFSGLKIHTNSSSALASLNSRTSRVCRRGGRIVCEAQETALDVPIVTDTTWQSLVLKATGPVLVEFWAPWCGPCRIIHPVVAELSEEYAGKLKFFKLNTDDSPSIATQYGIRSVPTTMIFINGEKKDAVLGAVPKTTLTASIEKFL >VvTrxm3(GSVIVT00036607001) MASCSNPPPLSSPLSPSLQTRKLFAPLSYPRSGGPSYALHFHAKRGIRFSNPPLRLKVLCSADYDKAAVVTGDSWEKSILNSEIPVLVEFYASWCGPCRMVHRVIDEIAEDYAGRLKCFVLNTDHDLHIAENYEIKAVPVVLLFKNGEKRESVVGTMPKEFYVAAIERVLSSGQFKFYKLNTDESPATPGQYG >VvTrxm5(GSVIVP00014312001) MALENCFQVSTVSCARAGVLQSHHPFSAKEKLNLPTCKGVKPSILSFSSSPSSLDYSFHRICRKSRIVCKAREAVDEVQVVTDSSWSNVVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIVCCKVNTDDCPNIATQYGIRSIPTVLFFKNGERKESVIGAVPKSTLTATIEKYVDM >AtTrxm1(At1g03680) MAAYTCTSRPPISIRSEMRIASSPTGSFSTRQMFSVLPESSGLRTRVSLSSLSKNSRVSRLRRGVICEAQDTATGIPVVNDSTWDSLVLKADEPVFVDFWAPWCGPCKMIDPIVNELAQKYAVRSIPTIMIFVNGEKKDTIIGAVSKDTLATSINKFL >AtTrxm2(At4g03520) MAAFTCTSRPPISLRSETRIVSSSPSASSLSSRRMFAVLPESSGLRIRLSLSPASLTSIHQPRVSRLRRAVVCEAQETTTDIQVVNDSTWDSLVLKATGPVVVDFWAPWCGPCKMIDPLVNDLAQHYTGKIKFYKLNTDESPNTPGQYGVRSIPTIMIFVGGEKKDTIIGAVPKTTLTSSLDKFLP >AtTrxm3(At2g15570) MAISSSSSSICFNPTRFHTARHISSPSRLFPVTSFSPRSLRFSDRRSLLSSSASRLRLSPLCVRDSRAAEVTQRSWEDSVLKSETPVLVEFYTSWCGPCRMVHRIIDEIAGDYAGKLNCYLLNADNDLPVAEEYEIKAVPVVLLFKNGEKRESIMGTMPKEFYISAIERVLNS >AtTrxm4(At3g15360) MASLLDSVTVTRVFSLPIAASVSSSSAAPSVSRRRISPARFLEFRGLKSSRSLVTQSASLGANRRTRIARGGRIACEAQDTTAAAVEVPNLSDSEWQTKVLESDVPVLVEFWAPWCGPCRMIHPIVDQLAKDFAGKFKFYKINTDESPNTANRYGIRSVPTVIIFKGGEKKDSIIGAVPRETLEKTIERFLVE

TIORREDOXINAS O >Eucgr.D00028.1 MRRCAALLRRSWTSSGRTGAGGLSRRPQFPLPLPGHADAACRAVAPKAAAAAAFAALSLPRTFSSASSPSPGSSKMHLIKSEEQFDGVLAKIRDESSPAILYFTAAWCGPCRLMSPAIEALNEKYPHVTTYKIDIDQEGIQDKLMELRIDSVPRLHFFSKGQKVDEIVGADIESLEHTMDRLYK >XP_012087817.1 thioredoxin O1, mitochondrial [Jatropha curcas] MRGISAIRRFVDRRSGWNFGSICSVSRFHETQISTPINFSSPTISLKLPFANVYSTKIQFSCPSLQLQRT LSSSAGSSKTVLIKSEEQFNNSLKDVQDKSLPAIFYFTAKWCGPCKFISPILAEQSEKYPNVTTFKIDID QEGLESLLSRLSIISVPTLHFFENGKKAAEIVGADVERLKDTMEELYGEDK >PtTrxo(estExt_fgenesh4_pg.C_290035) MRGNNKALLVRALIFGSHRSSMNSFSRHLHENLISNPSKTSHPSKSLSNFTTKFHFSTPYLQPFQRTLCSSSSSGASNIVLVKSDEELNSGLKNVQEKSSPAVFYFTATWCGPCKFISPVIEELSKKYPHATIYKVDIDTEGLQNALASLNIAAVPTLDFYKNGKKETTIVGADVAKLKNTMESLYRED >VvTrxo(GSVIVP00017858001) MARNSVLLRHLLRFSPSSRARSSSLIETLASSPIAVPSPPIHTISSFFTTATANSQFSRPCLNYRTLCSSSGQSKIALIKSEEEFNTSLSKVQDESLPAIFYFTAVWCGPCRFIAPIIAELSEKYPHVTTYKIDIDQDGLENTLRRLNIASVPTLHFFQNGKKAAEIIGADVARLKDTMDKLYKKD >AtTrxo1(At2g35010) MKGNWSIVRKVLHRQFSTLRSSTPSSRLSTSIRPLVLAPNSISSLIARNSLFTASNIGPSIDFNFSNTSLPHRRSLCSEAGGENGVVLVKSEEEFINAMSKAQDGSLPSVFYFTAAWCGPCRFISPVIVELSKQYPDVTTYKVDIDEGGISNTISKLNITAVPTLHFFKGGSKKGEVVGADVTKLKNLMEQLYK >AtTrxo2(At1g31020) MKSQWSNFHQIGRNSFLAASTVYVSNEFNFLNTSLLNRRSFCFAEGDRSSFVVLKSEAEFNSALSKARDGSLPSVFYFTAAWCGPCRLISPVILELSNKYPDVTTYKVDIDEGGLSNAIGKLNVSAVPTLQFFKGGVKKAEIVGVDVVRLKSVMEQLYKYYKGGRRVESFSGARADMLESLIQKHAK TIORREDOINAS X >Eucgr.J00880.1 MDGAALVSSSGVLFPPSLPPARLATALSAAAGCRFAPPPRSSFRTWRSGAGVAPVRKSARRCGAAVGGGGITEIDESQFPETVLKSDRPVLVEFVANWCGPCRLISPAMEWLAQEYKERLIIVKIDHDANPKLIEEYKVYGLPALILFKNGKEVPESRREGAITKVKLKEYLDSLLDSISVA >PtTrxx(gw1.VII.2415.1) MDKIILSSTSTPLSTSSLPPLRTVTSTASLSSPKKLFLLRSTQSQRKLSSSSRRSTSFCKVHKSTTITCGAITEINESEFQNVVLNSDRPVLVEFVATWCGPCRLISPAMESVAQEYGDRLTVVKIDHDANPKLIKEYKVYGLPALVLFKDGKEVPESRREGAITKAKLKEYVDALLESISVA >VvTrxx(GSVIVP00007099001) METMVSNSMPISVSSLPPVRVVASPRKLEFSSFTPKTTLFGSRSQRKIGFRCSPVRRAAVTCGVVTEIKESQFSDVVLKADEPVLVEFVATWCGPCRLISPAMEAIAQEYGDRLTVVKIDHDANPRLIEEYKVYGLPTLILFKNGQEVPESRREGAITKGKLKEYVDALLESISVA >AtTrxx(At1g50320) MDSIVSSSTILMRSYLTPPVRSCSPATSVSVKPLSSVQVTSVAANRHLLSLSSGARRTRKSSSSVIRCGGIKEIGESEFSSTVLESAQPVLVEFVATWCGPCKLIYPAMEALSQEYGDKLTIVKIDHDANPKLIAEFKVYGLPHFILFKDGKEVPGSRREGAITKAKLKEYIDGLLNSISVA TIORREDOXINAS Y >Eucgr.F04223.1 VEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPIFNEVSIRLKDTIQVVKIETEKYRSITHLYHGKPFERFVHGELWKEYLHFAKKAQTPLEMYIGTCGMENL >Eucgr.F04229.1 MAISLSASSIPRLSGENPAASSSMSPLRLRLPAGARGFGGGGRRISVNSKPRGFSLVVEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPILNEVSIRLNDTIQVVKIDTEKYPSIADKYKIEALPTFIIFKDGKPFERFVRCSDG >JCDBP18536 (XP_012080734.1 thioredoxin Y2, chloroplastic) MAISSLSASTIPSLKTPQLQSSTTKLTSLSSLQFQSHLQRLQFGNGGITSSPSRPRILPLVAAKKQTFSS FDELLENADKPVLVDFYATWCGPCQIMGPILNEVSTVLKDTIQVVKIDTEKYPTIADKYRIEALPTFIIF KDGKPYDRFEGAFSKDKFIQRIESSLQVKQ >PtTrxy1(estExt_fgenesh4_pg.C_LG_V1100) MAISSLSASTIPSLNTRNSTSNYSSKLSSFSSLQFPAQLHRLQFRNRGVSSHSRQRNLPLVAAKKQTFSTFDELLQNSDKPVFVDFYATWCGPCQFMAPILDEVGAVLKDTVQVVKIDTEKYIQRIESSLNVKQPSIADKYKIEALPTFIIFKDAEPYDRFEGALTKDQL

>PtTrxy2(fgenesh4_pg.C_LG_II000621) MAISSLSASTIPSLNTPNSTSNYSSKISSFSSLQFPVQLHRLQFRKRWITSPSRPPILPLVAAKKQTFSTLDELLEKSDKPVLVDFYATWCGPCQFMAPILNEVSAVLEDTIQVVKIDTEKYRFEGALTKDQLIQRIENSLNVEQPSIADKYRIEALPTFIIFKDGKPYD >VvTrxy(GSVIVP00031751001) MATSLTFSTVRALNSQRPTPLAFSSSSPSSKLFSSSPLQFPRQLRPIRIGNNGISSPSRPRTLPVVEAKKQTFSSLDELLANSEKPVLVDFYATWCGPCQFMVPILNEVGASLKDKIQVVKIDTEKYPSIADKYRIEALPTFIIFKDGKPYDRFEGALTADQLIQRIETTLKVKQ >AtTrxy1(At1g76760) MASISLSSSTVPSLNSKESSGVSAFASRSISAVKFQFPVRRVRTGDLKFPSLSSTTRCTPRRIEAKKQTFDSFEDLLVNSDKPVLVDYYATWCGPCQFMVPILNEVSETLKDKIQVVKIDTEKYPSIANKYKIEALPTFILFKDGEPCDRFEGALTAKQLIQRIEDSLKVKP >AtTrxy2(At1g43560) MAISLATAYISPCFTPESSNSASPSRTLSSVRLPSQIRRFGSVQSPSSSTRFAPLTVRAAKKQTFNSFDDLLQNSDKPVLVDFYATWCGPCQLMVPILNEVSETLKDIIAVVKIDTEKYPDGKLWDRFEGALPANQLVERIENSLQVKQSLANKYQIEALPTFILFK TIORREDOXINAS CXXS >Eucgr.D00853.1 APGIQKDFTSPTIPQVHIQKWAPPPAFLVLQSDQRRHQPLCLNYNGNSLDASGAGGTERRRRRPGKAPAPALSQISSGQARMEGQYDQQNKSRVVKVDSPESWETCLTQAAAQGCPVVVHFTAAWCMPSVAMNPFVEELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFCTSVA >Eucgr.L01943.1 MPSVAMNPFVRELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFRTSVA >XP_012091425.1 thioredoxin-like protein CXXS1 [Jatropha curcas] MENQEQQTKSRVVKVDSVQSWEFYVTQANNQGCPIVVHFTASWCIPSVAMNPFFEELASTYPDVLFLTVD VDDVKEVASKLEVKAMPTFVLMKEGAQVDRLVGANPEEIRKRIDGFVHSVRVYVA >XP_012070723.1 thioredoxin-like protein CXXS1 [Jatropha curcas] MAQHKQVKKSRVVKVDSEESWNFFTTQAANKGCPVMVHFTASWCMPSVAMNPFFEQLAITYQDFLFLTVD VDELKGVATKMEVKAMPTFVLMSKGAKVHKLVGANPHEIKKRVHAFILST >PtTrxCXXS1.1(grail3.0055010001) MAGHSQVIKTRVVRIDSEKSWDFFINQATNKECPVVVHFTACWCMPSVAMNPFFEEVASNYKHILFLSVDVDEVKEIATRMEVKAMPTFLLMMGGARVDKLVGANPEEIRRRIGGFVHTIHGYKAI >PtTrxCXXS1.2(grail3.0093003601) MESQEQQPKSRVIKVESVESWDFYITQATNQACPIVVHFTALWCMPSVAMNPVFEELASAYPDGLFLIVDVDEVKEVATKMEVKAMPTFVLMKDGAQVDKIVGANPEEIRKRIDGFVQSIRAYNA >PtTrxCXXS1.3(estExt_Genewise1_v1.C_LG_XI2388) MESEATNKSRVVMVESGESWDFYISQATTQTCPIAVHFTASWCMPSVAMNPIFEDLASAHPDILFLTVDVDAVKVINSFFCMPTFVLMKDSAQVDKIVGANPEEIRKRIDSFVQSIPANIA >VvTrxCXXS1(GSVIVP00012977001) MENQEPEENKSRVIKVESEESWDFYISQATTQGCPVVVHFTAAWCIPSVAMNQFFEELASNYPDALFLTVDVDEVKAVAVKMEVKAMPTFLLMKEGAQVDRLVGANPDEIRKRIDALVQSFRVYVA >AtTrxCXXS1(At1g11530) MARVVKIDSAESWNFYVSQAKNQNCPIVAHFTALWCIPSVFMNSFFEELAFNYKDALFLIVDVDEVKEVASQLEVKAMPTFLFLKDGNAMDKLVGANPDEIKKRVDGFVQSSRVVHIA >AtTrxCXXS2 (At2g40790) MGNHCTRIPCCKKVCSCICCCNRRNKTQARSQKGSYFIKGKVHPVSRMEKWEEKITEANSHGKILVVNFKASWCLPSKTILPIYQELASTYTSMIFVTIDVEELAEFSHEWNVDATPTVVFLKDGRQMDKLVGGDAAELQKKTAAAANLLLRQS >AtTrxCXXC2(At3g56420) MVKPEANTGPKERSIRAPWCVPCKKIEPVFRDLASRYPSMIFVTVDVEELAEFSNEWNVEAFLRKPTPTVVFLKDGRQMDKLVGAETSELQKKTAAAADL THIORREDOXINA Z >Eucgr.G03224.1 MGLLQIHSPIAVFLSKPVSSSHSKPPRLPPFQDSTRNFGQSSLFSSSPGIKDRVFTLSTAPRKLLCTPPQGKHVREDYLVKKLSAQEVQELVRGERNVPLIIDFYATWCGPCILMAQELEMLAVEYENNAMIVKVDTDDEYEFARDMQVRGLPTLYFISPDPNKDAIRTEGLIPIQMMRDILDNEM >XP_012068680.1 thioredoxin-like protein CITRX, chloroplastic [Jatropha curcas] MARLQPYTTTHKVTTFSSTFALLAPPLSSLSFPLCSLKTQKENSLFSTTNTTRKRPFSLSTQPRRLLCRP PLGKYVREDYLVKKKSAQEIQELVRGERNVPIIIDFYATWCGPCILMAQELEMLAVEYESNAIIVKVDTD EEYEFAHDMQVRGLPTLFFISPDPKKDAIRTEGLIPIQMMRDIIDKDM

>XP_002299198.3 thioredoxin-like protein CITRX, chloroplastic [Populus trichocarpa] MALLQTHSLHIRTLPSTFKSHSFLPLFSSPQSSFKTHQESSLFSITRTPKKRPFSLSTQQRRLLCRPPQG KYIREDYLVKKLSAEEIQELVKGERNVPLVIDFYATWCGPCVLMAQELEMLAVEYESNVMIVKVDTDDEY EFAQDMQVRGLPTLFFISPDANKDAIRTEGLIPLQMMRDIINNEM >XP_002264063.1 PREDICTED: thioredoxin-like protein CITRX, chloroplastic [Vitis vinifera] MAMMQTATRLPHSTITSVSPMIPLQGPPSHLCFSHSPMTHQPNLLFSTTNTRPFSLRPPRKLLCTPPRGK YVREDYLVKKMSAKEVQELVKEERTVPLIIDFYATWCGPCILMAQELEMLAVEYESNALIVKVDTDDEYE FARDMQVRGLPTLYFISPDPTKNAIRTEGLIPIQMMRDIIDNEM >AT3G06730.1 MALVQSRTFPHLNTPLSPILSSLHAPSSLF IRREIRPVAA PFSSSTAGNLPFSPLTRPRK LLCPPPRGKF VREDYLVKKL SAQELQELVK GDRKVPLIVDFYATWCGPCILMAQELEMLAVEYESNAIIVKVDTDDEYEFARDMQVRGLPTLFFISPDPSKDAIRTEGLIPLQMMHDIIDNEM

ANEXO 2

__________________________________________________________________________

Dados brutos dassequências genômicas, sequência CDS, sequências do transcriptoma, e sequências protéicas.

Legenda

5` UTR CDS 3`UTR

SEQUÊNCIAS DE EUCGENIE

Eucgr.A00783, Eucgr.A01813, Eucgr.B01424, Eucgr.B02586, Eucgr.D00028, Eucgr.D00853, Eucgr.F01604,

Eucgr.F01854, Eucgr.F02754, Eucgr.F03319, Eucgr.F04223, Eucgr.F04229, Eucgr.G03224, Eucgr.H01629,

Eucgr.I01912, Eucgr.I01913, Eucgr.I02383, Eucgr.J00880, Eucgr.J02387, Eucgr.K01294, Eucgr.L01943,

Eucgr.L03049

1. Eucgr.A00783

Genomic Sequence >Chr01:12689099..12692977 [3879 nucleotides] CTTGATCTCGAGCCAATACTTTTTCTTGGCAAATTTCGCCTCGCGCGGAGACGACCTCGCGTGGAGGGTCAACCGGAATTCGATCGCGGTACGTGTTGCATGGCGTTCTTGGGTTCATTTTGAATTGATGGTATTGTAGACGCGTGCATTGGGTTTGATGCATGGTCCTTTGGGTTTCCTCTTGTTGTTCTTGATGTTCTTGTTTTCTAGTGAGATGATTCAATTAGAAATTTTTATATCTGCGCGCGCTCAAATTGGTTGGAGGAATGAGGTTCTGGAATTCCGTCGTCTTTTCTCGGTTAGATTGATGGGGGATATGAATTTGGTTGAGAGCATTGGGAAAGAACATGGTGGCAGCTTCTGGTTGTGGGGTTTGATTAGAGGTTTATTGGGTGGCATGAAATGAGAGCTGTTTTAAGCATTGCTATTTTGCTAGCGGAGCTACTCATTGGAAATCCTGGAGAAATCCTTGATGTCGGTTGGATTGTCCTTCCATGGCGGCGACACGGACTGAAAAGCTGTATGTGGAGAAAGTTATTTTCTGAATTTTTCTCTGGTGCAACCTGTTGTGGCAGGGAGACGCTGCAGAAGTTCTTCGTGTTCATCAGATGACATTTGATCTAGTTTATCCATTGGATTGTTGTGTTGTCATCAAGGAATAATTTTTGTTGAAGTGGCACCAATGCGAACCCGACTTGTACCGAAATGATAGACAAGATACGAGCTTGACTATAACTGGCTTATCCTGTGATTCTAGATATAGAAAGAGTTAATGGTGTGGAACCAAGAGTCCTGTATTTTCCAATTTACTCTCTACACACCCTTGGATGCTCTTCATCCGTCCCTCCCATCATTTTGTCCTCAATGCATTTTATGGTTTGCGCATCTGATACCACTCAAGCCAAAAATCATGTTCCAATATGCAAAGACCTCACGTTCAGCCCCAGCATATGAACAAATCCCTTGCTGTTTTTGCAGCCACCTTACGTAGAGGGCCCAAGGTTATTCCCCCTTTGCAAATGACTTGCTGTTATAACGTTTGGCCGGGATGCATTCTGCATAAATAAGGAAATCTTGGTAGGAAGAGCCAAGTTCTTGCCAATCCTTAAAGGGTTTTAGTTTTTCTTCTCCTTGTCGTCACAGTTAATGTTGCTTGTGGTACATTTGACTTTGAGACATCCATTCTTGCTATTCTGCTATCTTCCTCATCCATTTTCAGTATTACCTCCTATAGCACATCATGAAACTTACCACAATATTCCAATACCCAATCATTAAAGTTTCTGACAATATCTGCTGGGACATGTAAAGTTGAAACAGGAAAGATTTGTGTAACACTTGCCCTTTAATTCTTAGCAAGTCTAACTAATTGAGCCAATCGGCCTTTAAGTGGAGTTGAGCCACACTTTATCCTGCCAGAAGAAAACAGAATCTCCTCTGCCAACAATGTGATCTATGGTAGAGTAGGAGGATCCACCTAACTTTTGTTAGTCCATCTCCAAGGGATCACTCTGAAAGTGCACCAACATTGTTAACCTGGCCAACATGGTTACATTTTTCTTATCGATGAATTCCCTCTGGAGGATTTTTTTTTTTGGTCATAATTTTCCAAGCCACTTGGCACACAGAGCTTCGTGGAAATGTAATAAAGACCGATACCCAAAGGCAAAGCCACTTTCACATGGGAAGTTTAATGATGCCTCACCTACCAAGGCTGAAATTATAAGCCTTTTGCTTACCTCCTTTAGAAACTCTCTCTCAATGTTATCGAGTATTCTAGCTGCCACACTTGAAGAGGGAAAAGCAGGGAAAGGAAAGCTGGCAGAGTTGTATGAGTCTCTCTACTGAAGTTAATCTGCCGCCATAGGAAGAATAACCTCTTTGAACTAATCAATTTTCTCTCTGTCTTGCAAAAAGCCAGGTCCTTCCAGTTTAATTCCTTGAGGTGGGTCCAAATAAGTGATAGGAAGACTACCTAGCTTACAGCCTATTACTCAACTGCAATGTCCTGGATTTTTCTTCAAACAAGAGAACAAAATGCTGTCATCAGCAAATAATAGATTGGAAAGTTTTAGGTTAGAATTACTTCTAGATACACGAAAGGATTATATCAAGTGTTTCGTATTGCTGCTCTGCCAATGGATTTCCTCATGCTTTTCCTGGGCTCCACTTGTTATGTGATCTATGTACCTATTTAGAATACCCTTTTGACTATACTTCAATATCATGCAGTAATCCTTATCTATATTGACCTTCAGGTTCTTCGTGCTTTCTTCTGCTGAATCTTGGAATTTGCATTCCGACCATCATTATGGGGCAATGCGTAACCAAGGTAATACATCTGGGCCATGTTTTGCTGGAATCTGTTGTGCAGATCTTTTACTTACTATCGTGAAGATGTACACATTTTTGTAGTTCTATCATACAATCACTTCTTGACCACTTCTCTCATGATATTTTGCTCTGTTGTTTGGGTAAGATTTCTGTCGTTTATAAAATATATGTATTATGGTGACTCTACTAAGTATACTTCTCCTACTCTATTCAACCATGTTTTCCCTACAACAGTTGTGCTCTGGCATTTGAAGGCTGCCTCCATTTATTTGCTGTTCCATGTCTTCTGTGTTTTGGCTTGAAATATTTCAATGAAACACTGTCAATTCTTTTTGTCAAAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTAAGTTTTCAAAATTAGTTATTTGCAGTTTAGATAAATATCTCGCTCTTGCTATGATCTATAACAAGATAAGCCTTTTTCTTCTCTCGGTAATGAGACTGAGTTTGTGGTTTATGCTTTAAGTATTTGCTTGATATTTGACAAATTGTATCTCCCTGTGTTTTCTCTTTTTGCGTATGTATTATTCAGCATAGGGATGATTCTTAGAGTTCATTTCAGTTTTTGAGAATCCAGAATAGACAGTTGCATGCACTCTGTATTGTGTCAAGTTCTGGCAAACTTTAATAATTCCAAGGTGTTTATGTGGGGAAGAAGGCTGAGAAAATCCTGTTATGTCAACTCTTATTTTATGTCAATTGTAACCTTTTCTTTGCATGAAAATTTGGCTGCCCACTGTGACGTGTGAATGCTTAACAGGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGTAAGTATGACTTTCATCTCTCGGACCTTGCAACCCGCGGCTCGGATGAGAAATTGGCCTAGTTATGTGCTGAATGTACCGACCGTGGCTCTTGTTTATTTCACAGGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGACGACGGGTTGCTAGAGGTGGGGGAGAACAAAGCTAAGCCATTTTGAAATTTTGTCGAACCACGTACATGCAGGTCTCCATGTTGTAAAATGCTTGCCACGGCACTCGTTCTTGAATGTAAATAGAGATGCTTGAGGGTGTCGAATAGTGAAAATATTGGAATGGTAATCGCCGTTCTCTTTATCGTGCCCTCGATGCCCATGCCGGGTGGAGAATGTCCATCGGTTTTGATTGGATTTCGAAAGTCTTTCTCAC

CDS sequence: >Eucgr.A00783.1 [447 nucleotides] ATGGGGCAATGCGTAACCAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGA

Transcript sequence: >Eucgr.A00783.1 [842 nucleotides] CTTGATCTCGAGCCAATACTTTTTCTTGGCAAATTTCGCCTCGCGCGGAGACGACCTCGCGTGGAGGGTCAACCGGAATTCGATCGCGGTTCTTCGTGCTTTCTTCTGCTGAATCTTGGAATTTGCATTCCGACCATCATTATGGGGCAATGCGTAACCAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGACGACGGGTTGCTAGAGGTGGGGGAGAACAAAGCTAAGCCATTTTGAAATTTTGTCGAACCACGTACATGCAGGTCTCCATGTTGTAAAATGCTTGCCACGGCACTCGTTCTTGAATGTAAATAGAGATGCTTGAGGGTGTCGAATAGTGAAAATATTGGAATGGTAATCGCCGTTCTCTTTATCGTGCCCTCGATGCCCATGCCGGGTGGAGAATGTCCATCGGTTTTGATTGGATTTCGAAAGTCTTTCTCAC

Protein sequence: >Eucgr.A00783.1.p [148 residues] MGQCVTKILCCSWCFQQEIKDNESDQHIDFASGNVHLITTKESWDEKLSQAIKDGKIVIANFSATWCGPCRVIAPFYSELSEKHPSLMFLLVDVDELTEFSTSWDIKATPTFFFLKDGNQVDKLVGANKPELQKKITAILDSIDQSQK

2. Eucgr.A01813

Genomic Sequence >Chr01:33116772..33122609 [5838 nucleotides] TCGTCAACCCCCGGCACTTCCACACTGTCCCGTCTTCCTTCTTCCTCTCCCTCGCCGCCTTCCATCTTCAGGTCCCCCACCGGAATCTCCATCTCTCTCTATCTTCAGCTCCTTGCGCACCGCTCTCATCTAACTTTCTCGCATCCCTCGTTCCGCTGCCGGCCGCGCGCGCTCCCTCCCTCCCCCATATAAACTCGCGCTTCCTCGTAATATCATCTCTCGATAATCTCTAGGCGCAGCGGTCGTTCCTCATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCGTGAGTTTTCATTCTCTTCCCTCCTTTTTGTATTTCGTTGATTGTAGACTTTGGCGTAGGGGGTTTTGCCGAAACGGTTTATCGTGCACTCGCGAATTTAGGACTGCGAAATGATGTGGTTTAGATTGAGCTGATTGATAGGGACTTTTGAATGGAAATGCCATATGTTCTATAGTTTGGTTGTTTCGGCATCGAGACTTAATTGTTTCGAGTGTGCATTTGATCGGTAGACTCGAGAAAAAAAAGAAGCAAAGAGACTTGTGTCTATGCTAATATACAGCACTAAGGCTTGTGGAGCAAATTTAACTACAAGAATCCTGCTGTAGATAGGCTCTCTCTCATAGTCTACGAGTTGTTCGACTCGCTACTTTTTACCAAGCACTGAATTTTCATGGAACGTCTCGGAATTGCTATGTATGATTTAGGGAATTATACTCGACCATCAGTATGATCTGATGTAAGTAGAATAGATCGATTTATTGGATCTGTATATTTCTTTATGAAGGCTATAGCTGAGTACGCATCCATATAGATATATAGGTGCGCCTTATAGGAATCAAAGGTAGAAGCAGAGTCCCGTCCTTCTTTCTCTTCGATAATGTCCTTGCTGGTAGCTAGAGAAAGTCCAATAGTTGGCGCGATCCCTTATTTTGATTGCATTGGAATATCAGCTTATTGCTGACATATGCTAATAACCATGTTTTTTGCTTGGGTAGAACTTTGAAAAACGTAATTTCATGCTCAAGTTTGAGATATAGACCAGCAGTCTTGAGGAGAATTTGGATTCGTCAGCGCCTTGGTTCAGGAACTCATTTACTATGCTCCCAAAACCTCAAATTATCTTAAGGTCTCCTCTAAATGCTCTGTTACCTCAAACTTTCGCAGATTCTTCACAATGGAAAGATAACTATAGTATCAACAGTGGGATGCATTTGCTTTGATACTAATCACTTATATGTTTGCCATTATAACAAAGTGACGCCATCTTCTTATTTCAAACACATTACCACAGAATTTTGTATATATGTAATGCATGAATACTGATCTTCACGACTTGGATCAATGAATGCGCTAGTAGACTGGCTAGTGATTGTCGTGAAGTTAATGTTTGACAAGGGAAGAATTGTCCCTGTAGACTTGGAACACCTTTGACCTGCTTAAACAGTGAATTATAATTGTTGGTCAACTAGATGTTTGTGAATGTGTTTGCCCACTCATATTGGATGACGATTCAATAGTTCATTAAAAGTTTGTTCCTTTTCTTCTGTTCCATCAATGGAAGATGTGCATCTCAAGATCATTAAATCCCAAACATGCTATTGCAAGCACTTGTTATTAATGTGAATGAGGGTGATTGGTGACAATTGACTGAGTCGTTGACACTCCCGTAAACTTTCTTTAGTTAATATAGGATAGGTTTTTCTCTCAACCTTTTTGGTTTTACTTTACAATAACTATGTTTCATACTGCAAGCATCCTGTTTGCTGAGTCTGATTAATTGGTCCCTAAGTATAACCCTGTTTCCATCTCAAAGCATATGACAGCCTTCTATGTTCTAGATTAAGTTTTCTAATTGCTAAAACAGAAGATAAGCAGAATCCCTGTTATATTTGAAGCTGGTATAAGTATGCACTTTTACTTTACACGATTAGAATGAGCTCTTTCCAGTTCCTCCAGTTAATGTTTAATGTAAATTCACATTCCTTACTGTTTTTGTTAATTGAGGAAGTAATGGAGTTGTAAAAGATCGAACTTCTATCTGATCATTTTGTCAGCCTAAGCACCAAAAGTTATTTGGATGCTCTTAAGTCTTGTCGTTTAGCCTTAGTTATAGGTCTGGAAGTTTATGTCCTGAAAACATTTGTCTACTTGTGGATCCATCCTCCTTTTACTTTCTCTAGATTATGCTTTCTTCATTCAAGCATAATCCCAATAATTCTTGTCTATGGTTTGGATGGCGTGACTGATGAGGTCTTAGTTTTTTGTCGTGTCCTTTCACTGATGCATGGAGGAAAATTTTAGATCAAGTGATCTTGATGAATATAAAGCATCTGGTAGCATCATAAAATGAAAGTATTTGTAACTTCTTTGCCCGAGTCAGCTCCAAGGGAGAAAATGATGTGTGTTCACGAGTCCTCTGATATTCGTGTATGTTAGTTTTGGTTGCTCTATTGTGTAAGGTTTGTGTGGTAGCATAAACCCTTTTGTTGGAATTCATCTTTAAAATCTTTTCTGAGAGTATGCTCTTCAGCTAGATTATTTTCAAGCTTTGGCTTAAATTTGCTGGAAATGCTGGAAGGAGACGTTACGTTTCTTGGACTATTGGAACCTGATCCTTCAACCTGGTTCTTCCTTAAGTCACATACTTGCATTGAAATAGATTTTGATCCCTGAGCCAGCAATTCCTCTGGTGATCCTCATCCACGTTCAACTTGTTGATCTAATGCTATTGCAGTGCTGCAATCATTGACCACATTTCTATACAACCTTCTGAAATGTCAAAGATGTTCCCATCTTTCTGGGTCTGTGGCTGCTTTGAGGATGCTACTGGGTAGTGGGTAGTTCTATGAATGTGGAGCTGTGGACTAGGATATATGAATGCATAAGTTTGCCACTTTAAGTTATGCGCTGAAAGTATTGTTTGCTGGCCGGTTTTTTCCACCCTTCCACTCCTATCATAAGTTTGTTTGATGTCTCTTTTAGGAGCAACACGAAGTTCTTTTCCAAGTGTGTGTTTGGATAGTGACTTGGTTCTGTTTCCTTTATAATGAACCGCAGTTCATGTCCAATACAGCCTAAATTCAGGCCTTCATAGTCTTCTGCAGGATTTGCAATTTTCTTTTCAACTTCGGTTCGAAATTATGTTGAAATAATTAGAATTCATCTTCAAACATGATCAGATCAATTATGTTGGAGTGACATTAACATTTGTAGTCTGGAGAACACAGTAG

TATGACAGCACTTAGACATAGAATATACGCTTTAAGCAATCATCTTTTATATTTTTGTCTTCTTCTTCAAGTAATGGGGAAAAGGTTTGCTGTACTAGCTGCATTTGGGCTTGGTTAATATCTCGAAGTATCTTGAAAGAACTAAGAAACTCGGCGGAGATAGGAGTGGGTTTATACTTACCTGAAAAAATAAAAGGTGGATTGGCAAGTTGCTTGTTTCACTTCATTTTCACCTGGACACTTGGTAATGGTGTTAAGATTCTTAAGAATAAAGCATGGTGTCATCATTAATAATTAAGTGAATTGTGCTATCTTAACATCATATCACCCTAATCTAGAAGTCAAGTTCATGTTTGATTCATGGACTAAGACAACACCATTAAAGTCATGCAGCTGACGCACATGCAGCGTGAAAACCTCATGCAAGTCAGACTGGAAGCAATTCTTGATGGAGACTATCAAAGGGTGGAAAGCTGGTTAATGGAAAATTAATATCAGAAGTGGACACTTCATCTCACCTACCTGTTACTTCATGTTCAAGATGCTCTTCTATATAAACACTTCTGAATGATGTTGGAAAACACTGCCATGCGTAGATCAACTACTCTTGTGGTATGTATTGATGTAACTAGTGTGTCGTTTAGGATGCTCTGTTTTTTTGTTGGACACTTAAGCATGGAAAGACAAAATCTTAAGGGAGTAAAAAGAGATTTGAAATAAGAGAGGTTCTGTGATGGAAAGGAAATCTGATCATTTTCGTTGTACTTGGTGCAAAGCGAAGTATAGGATTTGTCATGGGGATTTAGTTCTGCTTCAGTTGGTATCTTGATATGTATACTTTGTTCTCCTGCTTTTCAATACTTAGAGAATTCTACAACGGAGTCTACATGTTGGCGTGATCCTTGCTGAAAGGTCAAAGCACTTTATGTTGATGGACCATTTGTTTAGAATTTAGTCCAAAGGGTCTTTACAACCATATCTTTGAATTGTCGAGAATCTTTAACTTTATTCTGGAAAGAATGGGTCCTAGAAAGAGGACTAAGTTTGTTCTATTATAGTTTAATACAATTTGTCGTGTTTATTCATCAAATTTCTCGGCATTTAGATTCTAGGACAACTTTTTCTTGCTGTTGGCCCCATTGACCCACATACTGACTTCTTAGCAATGCAAGCACATGCGCAGAAAAAGATCGATTTTGTTTCTTGCTTTAGGTGTTCATTTTTTTATATACTAGCAAGTAATAAATTTGACTTCGATATTGGTTTATATATACTTCAAAATTTTTAAGTTGCTATTCCTTCAGACGATCATCTAAGCTTAATTGGTTTCCTCTTTATTGGCAAGTCCTGCATCTGCACTCAATTTATTCTCGTGGAGGTTTAATTTCTTTGTTTTATAATTCAGCAGAGTAATGCCACGAGATATAGTAGTTGTCTGAACTCATTAATCTAGCTGCCAGCATTTCTGGGGCTGCCCATTACTTCAGTACAGGCGAGATGTGAATTTTGAAGAAGCATGAGTGACTTTTCCCCTAGAATCTTGTGTTCCCATTTTGTCTGGAAAAGTTCATGATCCTTATTAGAATAAGATAATCATTTTTCTCATCTATATAATGTTCTTTGATATTGAAATTTATCAGCTGCTTAAACCATTTTTCTTTTCTTTTTCCAAAGAAGTTTGACTTCATTGCTTAAATTGGTCTGTCGGGCTCTGATCAGAATTAATTTTATTCAGTGGGTAACTCGTTTGTTTGTCTTCCTGCAGTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGAAAACAAATAGTGATGTGTAAAAGGTCAATTGGCTACGTTTTTATGATTTTGGAGAGTTCCATCTGTCTATGTTAGTGTGTACCTAGAATTCAATTATGTTTTTGTCTGGTGTGGGAATCGACATAGAGCCATGAAAAATAAGAAAGTTGATAGGATACCAATAGCTTGGTGGTGGTTGCTTGTCAACTGTAAGAGCATAAATGATACTGCTTTGCCCTTTTGTCAAAGTTTCAGTTTGAAATAATGCAAATCCGCACCACCGACCGAGGTGACGTGGATGGTAGATCAT

CDS sequence: >Eucgr.A01813.1 [582 nucleotides] ATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGA

Transcript sequence: >Eucgr.A01813.1 [1122 nucleotides] TCGTCAACCCCCGGCACTTCCACACTGTCCCGTCTTCCTTCTTCCTCTCCCTCGCCGCCTTCCATCTTCAGGTCCCCCACCGGAATCTCCATCTCTCTCTATCTTCAGCTCCTTGCGCACCGCTCTCATCTAACTTTCTCGCATCCCTCGTTCCGCTGCCGGCCGCGCGCGCTCCCTCCCTCCCCCATATAAACTCGCGCTTCCTCGTAATATCATCTCTCGATAATCTCTAGGCGCAGCGGTCGTTCCTCATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGAAAACAAATAGTGATGTGTAAAAGGTCAATTGGCTACGTTTTTATGATTTTGGAGAGTTCCATCTGTCTATGTTAGTGTGTACCTAGAATTCAATTATGTTTTTGTCTGGTGTGGGAATCGACATAGAGCCATGAAAAATAAGAAAGTTGATAGGATACCAATAGCTTGGTGGTGGTTGCTTGTCAACTGTAAGAGCATAAATGATACTGCTTTGCCCTTTTGTCAAAGTTTCAGTTTGAAATAATGCAAATCCGCACCACCGACCGAGGTGACGTGGATGGTAGATCAT

Protein sequence: >Eucgr.A01813.1.p [193 residues] MSSMAAMLDSVALSSPKIRPSPRRPAAAMASSPAAISLPSRPKADALPGFAGLRIQSRSLAPSNSRSSRGPRCSRNGRIVCEASDTALDLPPVTDTTWKSLVLKADGPVLVEFWAPWCGPCRMLHPVVGEIADEYAGKLKCFKLNTDESPSIATQYGVRSVPTIMIFSSGEKKDAVLGAVPKSTLTTCIEKFL

3. Eucgr.B01424.1 Genomic Sequence >Chr02:25446921..25449412 [2492 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGGTGTTTCCGTCTTTCCAATGTTTTTAAAAACGACAATGGGCCCCTGTCGTATTTATAATCGCCCGCGCCTCTTCGAACTCTCCACCCCCGAAGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTAACGTTTCCTTCCCTCTCTCTCTCTCTCTCTCTCTCGCTCGCTCGCGTAGCTCATCTTCTTCGCGAGTTGGACTGTGCTTTCCTCGATATCGATTTCCCGTACTGTTTATGTGAACTGTGATCGGTGGCCGAGATTCAGAGGAGCTGCGGGAAGCGGCGAAATCGAAGATGATTACTGGGGAAACGCAGGACGTCCTGCTTACTTGGCACTTGTCGGGTAACCTGTCGAATGTATGATGAATATCAGATTGTTTACTAGCTAGAGTGTAGCATCACCAGTTCCAGGAAACTCCCTCGATTCTAAATTCGGATAGAATTATTGAACAGAAGTAACTTCTTGGAAAAGTATAGACCGGGGAATAGTTGCAGGGCTCTGCTCAAAATCACGTCTTGCTGCCGCTTTACAGAACCGTATGCGCGAGGCTCTTGCCTTGTGATGCTCCTCGGTACCATGTTCTGTCCACATCCTAAAAGGGGTTACACGATGATATATCGGGTGTGGAAGTAGGCCAACATTTCGATTGGCAAATTTGCCCGTTTAGGATCTGTGCTTCTTAGGACTGCTGCTATTCGCCCGAATGGCATTAGATCCTGCACCCTTGCTCCGAAGCTTTTGGTTGATGGCCGATGGCCTCGGCATGTAATATCCCCTGCAGGAAGTTCCTGCTTGATTCACATCGTTATCACACGGAAATTTTTGGGGTGGCTGAGTTTTAGGCATGGCCTCAATTAACAAATTGGGGAGATCTGGTTTTCTTTTGATTATCCCAAGTGTGAGGATCTCTGTGTTCATTGAGCTTTCTTACATTTGGTGGCAGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGGTAACGAACCACTTTCACTCGCGGGATGGTTTTGCGTGGTCCGTTCGAATTCCTCCCTTTCTCACACTCCCATGATCTTTCGAAACATTGTCCGTCAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGAATTGCGCTCCACCAGAAGAGAGATTCTCGTATACCATGACCGACTTCGCGGCATAATCGTTGTACTTATATGTATCTATCTGTATCCATCACTTGACATTTCGAGCTGAAGCTGAAATGAACCGGAGTGACTTTACACACGCCTTTGAGCACTGAAGTCCTGAAGTCGCTGGACTACCTATCTTTTGACTGCGAGGTAACGCACGACGTCGGTGTTTACCTGATGTATGTATGCAAAGCTCAGACAGCTGCTAGAAATTCAAGAAGCTTACAGAACTTAGTTGCCAATGAAGTCTTCTTTGACACAAACTAGCATGCATGTCTTCTTTCACTAGTCAAGAGGGCCTCTAATCACTATGTCTACATATGGTAGTTGGGATAAATTCAGGATATGATAAAATTTATTTTATCCTACGTTTAATGTCTGCTTAAGATAGGATGAAATCGAATATAAAGGGCATATAGACTGAATAAAATTATCCC

CDS sequence: >Eucgr.B01424.1 [999 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGA

Transcript sequence: >Eucgr.B01424.1 [1481 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGAATTGCGCTCCACCAGAAGAGAGATTCTCGTATACCATGACCGACTTCGCGGCATAATCGTTGTACTTATATGTATCTATCTGTATCCATCACTTGACATTTCGAGCTGAAGCTGAAATGAACCGGAGTGACTTTACACACGCCTTTGAGCACTGAAGTCCTGAAGTCGCTGGACTACCTATCTTTTGACTGCGAGGTAACGCACGACGTCGGTGTTTACCTGATGTATGTATGCAAAGCTCAGACAGCTGCTAGAAATTCAAGAAGCTTACAGAACTTAGTTGCCAATGAAGTCTTCTTTGACACAAACTAGCATGCATGTCTTCTTTCACTAGTCAAGAGGGCCTCTAATCACTATGTCTACATATGGTAGTTGGGATAAATTCAGGATATGATAAAATTTATTTTATCCTACGTTTAATGTCTGCTTAAGATAGGATGAAATCGAATATAAAGGGCATATAGACTGAATAAAATTATCCC

Protein sequence:

>Eucgr.B01424.1.p [332 residues] MRAREAREKGYPLGSCKPMPMPTMRSKRAPFVCGRSESSSWGRRMRPCSIRVIDSSDHARGHDKRSIQSDLVVFQEWPPNNISLASSNFSTTTPLDARRPPHTQSDIPKTPPPASPHIHKTKAPVSFLLSLRRRRRRRRRLRLLVLLSLRSAPMALQLSLSNPPSLRSSSAGSSGLSVASSSSSSSVFSPPSRPLKSVSIAGRAPRSGATGVVRCSVETAIAEVGQVTEVNKDSFWPIVRSAGDKTVVLDMYTQWCGPCKVMAPKYQELSEKYSDVLFLKLDCNQDNKPLAKELGLKVVPTFKILKDNKVVKEVTGAKLDNLVLAIDAVRSS

4. Eucgr.B02586.1

Genomic Sequence >Chr02:45847427..45849118 [1692 nucleotides] CCAAGCCAAGCAAAGCACCTCCCAATCCCCAAAGCATTTGCTAGCTTTTGCATAAGCCATTAGCCGTCGTATTGTAGGGACAAAAGAGAAGGAAAAAGGAAATAACTGATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGGTTAATGCTGCTCCATTGATGACTGAACTGTTGCTCTCTTTTTTCATTCATCATTTCCATTGCTTCATATTGACTGTGCTTCAAAATATTGGTATGGCAACAGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGGTACGGTTGTCGTTATTTTCCCTTCCAAGGAATTGAAAAGGGCCGCATGATCATTGCAATAAAGTTGGACTTGCATGCCCATATGGTGTCGGGTTTCGATCGTGTGTACTCAGGATAATGTGAACGTTGTTGTTGTGGAAATGCAGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGACCGCCGCCTCCTCAGTCGACAAAAGTATGATCGGCCTGTGCCTTCCACAGATAAATAAGATCGCGTTTCTGACCCAAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAAGATCGTGTTTCTCTCTCTTGCTTTTAATATTTTTTCTTGGAGTCGGTTGCTAAGAAACAGATGAGACACGGGCATATTCACTGCCAAAGATCATGCTTGAATAATAATCATCTTCCATGAGGTTTTGGCTGAATTGCTCTTTCGATGCAGCTAAGTAACAATCGAATGACATGGTTAGGGGACTTAATTTCCCTTCGGTCAACAGTATGAGCCGGAAAGTTTGCTGAAACGCAAACACTAATGGTCAGGGTGCCAACAACTTACAGAACAACCTCATGCGAATTGTACAAATGGGGTCGGACGATACAATGGAAATTGATCCAGCCAAACATCTCACATCACCATAGGACCGTACATAAATTTAATCAAACAAAAATTGAAAGAATTTGGTATAAACCTAAATAGAAAAGTTTCCAAGTGCCATTTATAAACTTCCAAGGCTGACAGAAACTGCAGACATCATGGCCGGTGACGGAGACTGGAGAGTGCTATTATGATACTTCACCCATCTGACATCTTCCTTTTCTCGCTTTCAGGCAATAAAATTGGGTCGATACTTCCTCTACGAACAATTAACAAGTAGAGGTCTCTGGAAGCGTAAAAGCAGAACTCAATCAAAGCTTATGAATATGTAATTCTGTAGAACGTTTTTGTACGCCCTATACTCTTGCTCCATGACTGCTTCACAATCCCTTACTTAATGAAGTCTTCAGCCACTGTT

CDS sequence: >Eucgr.B02586.1 [498 nucleotides] ATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGA

Transcript sequence: >Eucgr.B02586.1 [1443 nucleotides] CCAAGCCAAGCAAAGCACCTCCCAATCCCCAAAGCATTTGCTAGCTTTTGCATAAGCCATTAGCCGTCGTATTGTAGGGACAAAAGAGAAGGAAAAAGGAAATAACTGATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGACCGCCGCCTCCTCAGTCGACAAAAGTATGATCGGCCTGTGCCTTCCACAGATAAATAAGATCGCGTTTCTGACCCAAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAAGATCGTGTTTCTCTCTCTTGCTTTTAATATTTTTTCTTGGAGTCGGTTGCTAAGAAACAGATGAGACACGGGCATATTCACTGCCAAAGATCATGCTTGAATAATAATCATCTTCCATGAGGTTTTGGCTGAATTGCTCTTTCGATGCAGCTAAGTAACAATCGAATGACATGGTTAGGGGACTTAATTTCCCTTCGGTCAACAGTATGAGCCGGAAAGTTTGCTGAAACGCAAACACTAATGGTCAGGGTGCCAACAACTTACAGAACAACCTCATGCGAATTGTACAAATGGGGTCGGACGATACAATGGAAATTGATCCAGCCAAACATCTCACATCACCATAGGACCGTACATAAATTTAATCAAACAAAAATTGAAAGAATTTGGTATAAACCTAAATAGAAAAGTTTCCAAGTGCCATTTATAAACTTCCAAGGCTGACAGAAACTGCAGACATCATGGCCGGTGACGGAGACTGGAGAGTGCTATTATGATACTTCACCCATCTGACATCTTCCTTTTCTCGCTTTCAGGCAATAAAATTGGGTCGATACTTCCTCTACGAACAATTAACAAGTAGAGGTCTCTGGAAGCGTAAAAGCAGAACTCAATCAAAGCTTATGAATATGTAATTCTGTAGAACGTTTTTGTACGCCCTATACTCTTGCTCCATGACTGCTTCACAATCCCTTACTTAATGAAGTCTTCAGCCACTGTT

Protein sequence: >Eucgr.B02586.1.p [165 residues] MGQNVSSGDCNDWAPAKASRVMEFHSKSRWDEHNDWAPAKASRVMEFHSKSRWDEHFEASKGNNKLMVIDFTATWCGPCRRMEPTIDELAETFADVDFIKIDVDELMNVARQYEVQAMPTFLLMKNGKVVDEVIGAKKDELRNKIEQNCNKSQPYLQSNSHHYAI

5. Eucgr.D00028.1

Genomic Sequence >Chr04:234953..238152 [3200 nucleotides] GTTTCTCTCTCATCGCCACAATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTGCGCTTTCTCTCTCTCCTCCGCCCCGATTCATCAATACCTGCTTCGCTGCATTCCCGTCTTTTCCGTCGTTTTTAGATTGCTTCCTCAGTCTGCTTGTCGACGTGTGTCCGATTCTTGCATCGGCTATGCCCCGTTCGCGTGTCGGTACCGTTTGAAGAAATAACGCGACTTGCGACTTGAAAGATTGCATTTTGATTGCGAGTCGCCCAGTTGGAATTCAGATCTTTTCCTGCTTTCCACAAACCAAGCTTCCTATCCACTACACAACGGGCATTTGACTAACTGTGGACTCTTGTCTATATTTCTCCCAATTTTGGCGAAGGGGGTTATGAAACGAGGAAGGGTGTGATAGTTGGAATTGGATTCAATGCGCAAAATTCATGGTCCCCAGTTATGGACAGGGTTGCTCATGCTTTCTTGAAAGGCTGATAATTTGTGGCATTTCTGTTGGTTGCTTATTTTCCCTATTTAAGAATGTAAAAGTTAATGGTCGTATAGTGGATAGTTCCTGCCTCTTGGATGAATTGTGTATTCCGAATGGCTTAAATTTGATAAATTCATTCGGGCCAATCTTGCAATCTCAGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGGTTTGTTCTTCTTCTGCTGTTGACTCCTTATTGCTTTATGGCTATTGCACATGTGTGACACGGAAGAGATGGGATCGCAATGCTTACCACTTCGACGGCCCCCAAAATATGAAATTAACTTATGCTTTTGTCTGATTGATTTTGATAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGTAAGTAATCTCAACATCTAGGCATTTGTCAATGTCCTCCAGGCACTTCTTCCTCTTGGTTATCCTCTGTTACTTGAATGGAAAAGGTTATTTTAGCCTTCACATTAATCTGTGTCTTGCAGGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGTAATATCTTTTGCTTCTTCTCAGGTTTCCCCGTAGTCCCTCTAGACCATTTCATTAATCTTAGTGGAAGTTTTCCATGGTGATGCTCATGGCTGTCTCTTCTATGATAGGAATGCTTTCTACTCTAGGAAGCTAAAATTGTTGTTTTGTCTGCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGGTAAGCCAATGTTTATGCATGTTATGGAATGCTATTTTCAAGCAATGCATATGGGATGTTTAATTTCACTAACAAAGATGATCTGAAGATTGCTTTTCTAATTGATGCTGCAAATGGAGGAATGCTCTCAAAACTCAAGCTCTTCTTGGGAAGAAATTTGTGTCTTGATGCCTCCCTCTTATCTATGGAAGAAAATTCTTGGTTGTGATCTAAAATGTCTTGCAAACTGATGGTGGTTCCTTCTGATAGAGTTTATATCTTGGTACAGAGATAACAGTCTTTTCTGTTGTCAATCTGCTACCAAAACACCAAATCTTTTGCTCCAGTATGATTTCATGAGCCCACAGCAGTTGTTGCTTCATTCTATACTGTCCACATCTAGTGCTTTTCAAGTGCACAGCATTTGAACACACTTATCTGACCCAATTGACCTTTTATAATTTCTTGAAATGGATCTTTACTGGAGCAATATGGAGTTGGTCATTCTTTCCTTAGCCATTAGGAAAATATGTTTTAGTTATTTCTTTAATTGGAGCTATTACAGCTTCACTACAGCTGCCATCTTTTGAGTTTTTCATTTCATTTCATTTTATTTTATTTTTTTGGTGCTGGGGGTAAGAAATGGGGCTTGGTACAAAATCCTTGGTATGGAAAAAAACAGACATGAGCAGTGTTCCTGGAAGTGCATGACACCCTGAAGTTGTACAAAAAAACCTGAAGGGAATTGAAGACTGAGTTTAATCAACTGGAGTCGATCAGGAAATGTTCAGGTTTAGTCTAGTTCAGGCGGCCGTTATTTTTTTTCTTTTTCTTTTTCTTTTTTTTTTTTGTTCTTGCTATAGGTTTGGTTTATGTCATAAGAAGCAGAAATAGTCGGACTTGGAGTTGAACTGAATTGTTGCTGCAGTTCTCAGTTGTACATAGATTCTTCAACTTTGTTTCAACTCTGCGATTTGTTGTCTTTGGGCTGATGTGGTACAGTTAGGGTCACAAAAGAGAATTTCAACTTAAAAAAAAAAAGAAAAAAAGAAAAAAAAAAAAGGTCAGTTTGGGTTTGCACAGAAATTGATCCAGCCTCATTGACACCCATTAAATGAAGTGAGATGTGCTATGAGCTTGCCATGATGAAAAAGTTGGAGTCATCTTCATCGTTTTCTGACATTTTATGTCCTAAACTATGCATTGCTTGAGAATATCAGCAAGAACCGTGTGGGAGTTAATTTTCTGTCTTTGGCTTCATTAAACGCTCATCTGCATGGTACCTTTTTGTATGAGAAACTGATTTTGTATTTTGCTGCAGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGATTCTCTTATGGCCTTTGTGCCATACGGATTTGTTTGTGCATATGAGCCGATATAACTGCTCCTACCTATGAGCCTTAGTGGCTGCCGACCCTGCATAGGAGGGCATTACCTTGTGCAGAGTTTGTCAGGTGATGGCCATATATTTCTGTCTGTGTTGGTCCTGAGACTTTTCGGACTTCTTGTTGTCATGTTTTCTGTTGGTCAGGGGTAGGAAGTGTGATTTAACACATGTTTTCTCTTTGAAAGCCTCCAATCAAATATTTGGAACTATCTCTTGGCTGCCTCTTACATGCATAACTAGTGATAACTGAT

CDS sequence: >Eucgr.D00028.1 [555 nucleotides] ATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGA

Transcript sequence: >Eucgr.D00028.1 [887 nucleotides] GTTTCTCTCTCATCGCCACAATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGATTCTCTTATGGCCTTTGTGCCATACGGATTTGTTTGTGCATATGAGCCGATATAACTGCTCCTACCTATGAGCCTTAGTGGCTGCCGACCCTGCATAGGAGGGCATTACCTTGTGCAGAGTTTGTCAGGTGATGGCCATATATTTCTGTCTGTGTTGGTCCTGAGACTTTTCGGACTTCTTGTTGTCATGTTTTCTGTTGGTCAGGGGTAGGAAGTGTGATTTAACACATGTTTTCTCTTTGAAAGCCTCCAATCAAATATTTGGAACTATCTCTTGGCTGCCTCTTACATGCATAACTAGTGATAACTGAT

Protein sequence: >Eucgr.D00028.1.p [184 residues] MRRCAALLRRSWTSSGRTGAGGLSRRPQFPLPLPGHADAACRAVAPKAAAAAAFAALSLPRTFSSASSPSPGSSKMHLIKSEEQFDGVLAKIRDESSPAILYFTAAWCGPCRLMSPAIEALNEKYPHVTTYKIDIDQEGIQDKLMELRIDSVPRLHFFSKGQKVDEIVGADIESLEHTMDRLYK

6. Eucgr.D00853.1

Genomic Sequence >Chr04:15391539..15393214 [1676 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTACAGCTTTTTTCCCTGCTTCTTCTCGTACCGTTGCGTCTTCTCCGTCGTAATTCAGAAAAATCTCGACTTGGGTGTCGTCAAAGTTTCGAACTTTTTGCCTCCCGATGACTGCTGCTTGCTGCAAACCCCTGTTTCGGTTTTGAGATTGGGAATTCCCTTCTGGGCTGTGAATTTCGAAGGAGTGGCGTGATGGGTTGGTGTTGATGCAGGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGTAACGCCCAGATCTTGTCTCGGAGTAATTTGTGCAGGAGGACTTGAGTTTAGCTCGTTACATTAGGATGGAATCCATTTTCGGCAGTTGGGAACCTACAGTTTAGACTTGGGATGTCATTGAGATCATTAGGTGTTTATACTCTTTTCTTCTTGTACATAAGCTTGTGACATAATATATGTTGTGAACTGTAGTGTATGAAATTTTTTCTTTTCGTGTCTAGCAAGATTAGAATATGTTTGCTTTTGCTTAGGGTTGAGATTATGATTTTCATTTAAGCAACAAGCGATTTCCCCGACCACTTTGAAAGTTTTATTCCCTTTTGACGACACTGTACTTTCTGCTGCAACTTGAATCTGCTTTGTAGGTGTTTGTCTCCTGAATGTTTGCTTTAGTATTAAAACTACTACACCGTGGAAAACTTGGGAGTTCAGTCTTGATCTTTGGTGGAGCTGTTTCGAATTCTTTGGAAAGCAAGTGAAACTTCCAAAGTAGGACGCATGGTCGCTGAAATTTCTCAGCAGGCGCGATTATCTTTTCCCATTTGTGAGTTAGAATGTCTGTTGTTTTGGATGGTCTCGTGGCACTGAAAGTAACTTAGGCTGTTGATACTGGCACTCTAAGCTTTATAAGTTTGCATTCCAGCATCGATGTCTCTTTTGATATGTAGTTGGGGGGAGAAGAATATATGAAGTATTTTTGTGTTGCAAAGCTTGTCGTCTTGATCTTCCATCGAAGAGCAGAGGAGGCTTATTAGTCAAGATTAGTCTGGCTAACCAATGTGTTTATGCCAACCCTTGCCTATGAGAAAACATCGTTCTTAAGGTTTGCTTTTCGTAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG

CDS sequence: >Eucgr.D00853.1 [624 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG

Transcript sequence: >Eucgr.D00853.1 [624 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG

Protein sequence: >Eucgr.D00853.1.p [207 residues] APGIQKDFTSPTIPQVHIQKWAPPPAFLVLQSDQRRHQPLCLNYNGNSLDASGAGGTERRRRRPGKAPAPALSQISSGQARMEGQYDQQNKSRVVKVDSPESWETCLTQAAAQGCPVVVHFTAAWCMPSVAMNPFVEELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFCTSVA

7. Eucgr.F01604.1

Genomic Sequence >Chr06:21245303..21247353 [2051 nucleotides] GCCGAGCGCGTCCTAATCGTAGAAGCGGCGACACCCCTTGGACGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTATCTCTGCTCTTTCATCTCTCTCCGCCCTTGCGTGGACGGAGCTCTCTTTTCTTGGTCTTTTTTGTACTCTAATTCTCAGTACGGCTGGGTGTCGGTGGGTGGTTTTTTGTTCGACTATGTCTCAGAATCGTGGGGGAATCCTTTTTTGCTACTCGATTGGCCGGGACGACGATACCCTTTTGTTATCATATGCATGCGTGATTTTTTTTTTGCCGTGGATTGCTACGCGATTGGCTCGGTTTTGCGTGGGGTTTGGCTTGTTTTGGTTGTGTTTTTTGACCCACTTCGTGCCGGTTAGGTTATGGGGGTGGTACTGGTGGGTGATGTCGAGGAAAAAGCTTGCTGATGGCTGCTTCCCTTGCCGTGGTTTTAGACAGGAGAGTGTATAGAAATGGGGGGTTTTGCATTTTCATTAGAATTCATTTGGGGGTGCAGAGCCTTAGCAAATGGGTAGGGGACATTGCAGACTAGGATGCAGTGACTGGAGTTCCTATCTGAACGCCTGAACTTGGCTTGCATTGGCTTTCACTTTGCCTTAAATTGGTTAAAAGAATTGTTTCTCCGAGATGGACAAAGCCCTTAGCGGAAGTTCTCTCCGCAATTTCGACCGAAGGGGTATCGGCTATTATGAAGCGAGACTCGTATTAGTTCGATCTATATCCATAGCTCTAGAATTGCATCGAGTAAATTAGCTCCTTGCTCTTGTTCTCTGAAAACAACTCTTTCTGACCTTTGTTAAGTCACTCTCAGCCTTTTCATGCCAGTGACCTTGAAAGAGTTTTTGCCGGTTGCCTTTGTGAGGCAATTCATTAGAAAACTTCTGACTTTTGCGGTATGAGCGTACTAGACCTGAGTCTTCAAATTGGATGACGTGACACATCGCCTTGCAGTATCACAATTCCTATGTGACTGTTTTCAGTGTTTGCTGAAAGACAAGATTTTTTGCCAGGTGGTGGTGGATTTCACCGCTTCATGGTGC

GGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGGTAAGCATGTGCCAAAATCTTTTCTGGCTTTAGAGTTTACTGCAAGTAGTATGGCTAGGCTTCATTTGGCTGAATACTTGGATTATTGCTGCTGTTTTTTCGTCCGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACAGTTGCAGGCGTCGATAAACAAGCACGCGACTGATGCAGTTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGATGGTTGATGTAACTTACGTCAATTGGCATCTATGACATCTTTATTTCGTGGACTGGCCTAAAGTTTGGCTGCATGTTTCGTTGCGCTGAAGTTTAAGTAGGCGCTTTCTTGATTGCGTGGCCGGAAAGTATCTTTTGTGCAGGGTTCAAAGTGTTGGTTGCTGGATCAAATTGACGAAAAAAACACTAGGTTCGTGTAAGTTCCGGTGATGTTACCGGCGTCACCGGAAGACTTGGCCACTGAAGCCTGGCAGTCCGATCGCAGGTTTTCCGACAATCTGGTGTGTTTTCGTCGAGCGCGCGTGTAACTTGGACTGTCTTAATCGATGGCCACCGGCTGGTGCGCATGATTAATTAGGGTTGAGAGAGGTTCTCTCATGTACATATGACTAGAGGTTAAAAACATATAAAGGGTCTGGCGAAAATG

CDS sequence: >Eucgr.F01604.1 [453 nucleotides] ATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTGGTGGTGGATTTCACCGCTTCATGGTGCGGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACATTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGA

Transcript sequence: >Eucgr.F01604.1 [952 nucleotides] GCCGAGCGCGTCCTAATCGTAGAAGCGGCGACACCCCTTGGACGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTGGTGGTGGATTTCACCGCTTCATGGTGCGGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACATTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGATGGTTGATGTAACTTACGTCAATTGGCATCTATGACATCTTTATTTCGTGGACTGGCCTAAAGTTTGGCTGCATGTTTCGTTGCGCTGAAGTTTAAGTAGGCGCTTTCTTGATTGCGTGGCCGGAAAGTATCTTTTGTGCAGGGTTCAAAGTGTTGGTTGCTGGATCAAATTGACGAAAAAAACACTAGGTTCGTGTAAGTTCCGGTGATGTTACCGGCGTCACCGGAAGACTTGGCCACTGAAGCCTGGCAGTCCGATCGCAGGTTTTCCGACAATCTGGTGTGTTTTCGTCGAGCGCGCGTGTAACTTGGACTGTCTTAATCGATGGCCACCGGCTGGTGCGCATGATTAATTAGGGTTGAGAGAGGTTCTCTCATGTACATATGACTAGAGGTTAAAAACATATAAAGGGTCTGGCGAAAATG

Protein sequence: >Eucgr.F01604.1.p [150 residues] MAEEGQVYGCHTVDAWKEQFQKGVESKKLVVVDFTASWCGPCRLIAPIFAEMAKKMPHVLFLKVDVDELQSVATEHSVEAMPTFLLLKDGQIVDKVVGADKEHCCLTVYLVLREKNKPAPMLDALESIWLVSFPWISDTLVCEELSYLQI

8. Eucgr.F01854.1 Genomic Sequence >Chr06:28174385..28176117 [1733 nucleotides] ATACAGCAAGCAGCGAGAACCCCGGAATTTGCTGAGATACCCCGAATAAAGTTTTTGAATTTCGTTCACGGTTATCTGGAGAAACGAGAGGAGAGAAGAGAAGCAAAGAGATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTACGTAATTTCGCTTGCTCTGTCTTCTGATTGATTTTGTAGTATGTGGGTTTGATGGGATTCCGATGTGAGCTCGTGTTCTGTTTTTCGTTCCGGTGCTATGCTTCTTTGTTTTTCTTCCCGCGACTCCTTCGCGCTCGATATTCCTGCGATGGGTTTAGCACGGAGTTGGTTTTCGGTAGTTGCTATGAGAGATTGTGAAGGGCGGAGGCAATGGAAATGGAATGGTGTTTGAATGAATCTTGCTTTGTTTCGAGTTGATTCCACCCCCCCTATCAAGTGTTGGGGAGACTCGCGTTCTTGCGATTCTTTATGGCGAAGCGGATGAACCGAAAGGCCAAATTAAGTGTGCGCTTCATCGATTTCTTGTTTTGCCAGATATCTTCGTACACTGATCTGTACAATTTGCAACATGTTTCGTGCTTCCTAGTACTTTTCTTGACTGCCTGATATCCAATTCCGGGTTCTTAATCTCTTCTTCGGACCTTGGGTGCGGAAGTTTCTGTGCCCATCGAGTTTGCATTCTTCAAAGAGAGCAATTGCATTTTGCATGGAAAGAAGCTTCCGTGTCTGGGTTCTCTATGCTGAGGAATGGGCTTAAACATCGGAATGAGAACTGCTCACTCGAGATGACGTTTCGAAGCTTCATAAGTAAAGTTATCTCTAAAACTGGATATATATATTCACTAACAATTGTAGAAGCTTGCAGAAGCTCAAACCAAAATCATCCCGTTGTTGTTTTCGTCTATAATGTCTGCATTTGTGCCACTATATTGTCAGAAACATGTTGGATAGATATAAACCGCATTGTGGTTAACGCTTGTGCCACAAATTGTGTATGTACTTTTGAGTATTCATGTAAATGATTTGGTCCGTTTGATAGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGGTATAAACCATCTGGAACTTCCTCTTTGCTTACGATAATGCATACTTTGTGGATTACTCCACCTCATTTTCCTGTTATAACGTGTCTTTCTGCTTTGTTATGATGGATGCCACACTGGTAGTACAACTTCTAATTGGGGATTATCTTATACGTGATGAATGCAGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGATACTCTATATCTAGTGGACACATGGCTTGCCGTTGGATTTGACCATAGCATATCTTGGTCATTTCTCTGAAGTAACTCCTGTATAGCTTCAGATGTAATTCCATAGTCCAGACGACTCCACTTTTCAGTCTTTGTATTATATGGTGTTCGATGAATAAAGGCTAGTAAGATCTGTGTGAACTTATCATTTGAGTAATAAAGGCATAATTTTGCAGTTCT

CDS sequence: >Eucgr.F01854.1 [357 nucleotides] ATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGA

Transcript sequence: >Eucgr.F01854.1 [686 nucleotides] ATACAGCAAGCAGCGAGAACCCCGGAATTTGCTGAGATACCCCGAATAAAGTTTTTGAATTTCGTTCACGGTTATCTGGAGAAACGAGAGGAGAGAAGAGAAGCAAAGAGATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGATACTCTATATCTAGTGGACACATGGCTTGCCGTTGGATTTGACCATAGCATATCTTGGTCATTTCTCTGAAGTAACTCCTGTATAGCTTCAGATGTAATTCCATAGTCCAGACGACTCCACTTTTCAGTCTTTGTATTATATGGTGTTCGATGAATAAAGGCTAGTAAGATCTGTGTGAACTTATCATTTGAGTAATAAAGGCATAATTTTGCAGTTCT

Protein sequence: >Eucgr.F01854.1.p [118 residues] MAGEGQVISCHTVDSWNQQLQTGAESKKLVVVDFSATWCGPCRLISPVLDNLARKLTDVIFLKVDVDELRSVAEDWAVEAMPTFIFIKEGAVVDKVVGANKDDLQMKIAKHAAATVTA

9. Eucgr.F02754.1

Genomic Sequence >Chr06:39636801..39638397 [1597 nucleotides] TCGCTCGCTCGCTCTCTTGGTTATTACCATCCACATGCACCCGAAAGCCTTCAGGACCTCACGATCCCCCTCGAGTGTCTATCCACCCACTCCCATTCACGTTCACAGGCTCCTCTAGCTGTCGTTCATCCCGGTGAGCACAGGAAAACGAACGGAAAGAATAGAATAAAGGACGCCCCAAAAGATAACAAAAACAATACTCGGGAGAGACTTCATAGGAATCAGCTCGTTTGGCGAGTGGGAGAGAGACAGACAGACAGACAGAGAGAGGGGAAGAGAATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGGTCAGCTTCTAGTTCATGGAGACCATGTATATTTGCACCGCTCTTTCGTGCCAATGTGATACATATGGGTGCGAGCTAACTCGTGCGTCCTCGAACTCTCTCGCCTTTTTATTTGACTGTTTGAACTTTGGATGCACAAGGAAGATTATATTGAGGATTGTAACAACATAAGCGACTAGTTCTGCTACAAGCCCAACGTTAGAGAGAAAATCACCAAGTATTACCAAATCTATAGTCATCTTCACCCCATCGAGGGTGATGAGTTCGTGGTGCGAGCTGTTTTAGTAATTTCAATCTTATAGTCTACTTTTGAAGCGGACCGACCCATGTTAGGTTTTCCATTAGACGTTGGTTAAAAACTGATCATACAGCGCTAAAACACTGGCTTTCATCCTTACATGTCGGCAGAAATTATGTTTTCACCATCGTCCTATGAACATGGATACTTGGAGTACTCCCTGAAGAGGGGAAGGATAAATTGCCGCAACAGATAATGTGGAAGTGCTTGCTTGACTCGATGTTTGTGCAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCATCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGAATTGAGAGCCTCTCAAAACAATCACTCTTCAGGATTTTGCGTCAGTACTTGTACTACATTACTTGATGTGTTTATAAGAACCCATCACATCATCGTATGTTGTTGTTGTACATGAACATACTGCCGTTTGAAATCTACCGTTTCTTTGTGGGTGAAGAAGAATGGAGATCTCTTTTGGCAAGAGATGTGTTTTAATTAAGATCTGTTCTTTCTCCAGCCACA

CDS sequence: >Eucgr.F02754.1 [567 nucleotides] ATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCATCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGA

Transcript sequence: >Eucgr.F02754.1 [1068 nucleotides] TCGCTCGCTCGCTCTCTTGGTTATTACCATCCACATGCACCCGAAAGCCTTCAGGACCTCACGATCCCCCTCGAGTGTCTATCCACCCACTCCCATTCACGTTCACAGGCTCCTCTAGCTGTCGTTCATCCCGGTGAGCACAGGAAAACGAACGGAAAGAATAGAATAAAGGACGCCCCAAAAGATAACAAAAACAATACTCGGGAGAGACTTCATAGGAATCAGCTCGTTTGGCGAGTGGGAGAGAGACAGACAGACAGACAGAGAGAGGGGAAGAGAATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCA

TCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGAATTGAGAGCCTCTCAAAACAATCACTCTTCAGGATTTTGCGTCAGTACTTGTACTACATTACTTGATGTGTTTATAAGAACCCATCACATCATCGTATGTTGTTGTTGTACATGAACATACTGCCGTTTGAAATCTACCGTTTCTTTGTGGGTGAAGAAGAATGGAGATCTCTTTTGGCAAGAGATGTGTTTTAATTAAGATCTGTTCTTTCTCCAGCCACA

Protein sequence: >Eucgr.F02754.1.p [188 residues] MEQCVQMMSATRGRVLQCCDRPVAFARRGMPNSPTRKGGAVLKKSALNFSLSSSPPPLASSLSVRHQRRSSIICKARDALDEVRVVTDSSWSNLVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIACYKLNTDDCPTIATQYGIRSIPTVLFFKNGEKKESVIGAVPKSTLSATVEKYLDL

10. Eucgr.F03319.1 Genomic Sequence >Chr06:44675869..44678312 [2444 nucleotides] CAAACGCCAGCCAAACACATCCCTCTCCCTCTAGAAAAAGAATCTCTCCACTCTCCGCTTCTTCTTCTTCTTCTTCTTCGTGCCCTTCGCAGTGACGTCTCTTCGCTTCGCCGTTCGCGCCTCCCGGTCCCCCGTCTCCCATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGGTCGGATTCCTCAAGCTCACGCCATTTCTTCCTTTTTTTTTTAATGCTAATGTCAGTGTTTCTGTGATTTTTCTCTCGTTTGTGGAGTTACCTGAACTTGTTCTTCGATTCATTTATCGTCGGTGTATCCGTAGATATGATTTGATTTGATTGCCTGGCCTAGTTCAGTTATGCGGAACTGAAGGCTTAGTATTGGGTCGCACTTAGTCGTGGACGAACTATCCTATGCTATAAGAGATTACACAAAATGATTGCAGTAGGCATAAGAAGTGTCGCCAGAGTTCTCTGTTGATATGTGGATGAGCTCTCTGCTAGACCTACCTTTAGTAATAATGTTTGCGGCGAAAAAAGGATGCCTTAGCTGTGTCCTTGAAGCCAACGAGCCTAATTCTTATTGTTTGTGTAAAAGAAGGCTCCAGTTGTCAACTTTTTGCAAATGAATGACTCGATGCCAAAGAAATTGCACAAGAAAGGTTTGTTTTTCTTGGATACAGTCCTCTCTTGTTAGAGGAAATAGAAATTGTGGTGTACCGATATGGATATATATTATCGTATAATTGCATCCCCTTGCTAATCTACATCATTAATGAGATTATCATAGGTTTTGAGGAAATGAAAACTCTTAGAACTTTAGGGCAATCGTAAATGAAAACTCTTAGAACTTTAGGGCAATCGTCGCCAACAAACTCATTCATAACCAACAATCACTAAAGCAGAACTTGTTGAATGCTTTAGCTTGAGCTCAGCATAAGCACTTTGCAAATCTCTATAGTGCTGCAGTATAGGTAAAACTTCTCTGGAAAGCTCTTCATGGGCACATTCTGAAAATGGAAAAAATTGCAGCCATAACTGGGGATCCGTCATATACTGATGCAACCATAATTTGGGATCTCTTATGTATTGTTCGTGTGCCAAGTATATGCACAAGTTTGCTGTAGAAAACGAGAAATCCTGGTTTTTTAAAGCAAATTTCAAAAGGTTAAGGCCATATCTTGCTTTCTGGGTCTGCATTTTGTTATGTATTAGAGGAACTGAGATGGTCACCACTCTAAAATTGGAAGAGTGATTCAGAAAGAGATATGTTTGAGCATTAACAGTCATTTCTTATTTTTGATGTAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGAAAGTAGTAAGCATGAGATGCCCTTGCAGCAAATAAAGTTAAGCATAACTTTTGTCAAATCTGCATTTTCTCTGTCTGAGGGCTGCATTGTGCGACTTCTGTATAGTGAAGTGGGGCTGTATTATCTACTTGCTTAATGTCAATATCGGCTGTATAACATCATCTGGTGAATTTGGTATCCAGCTCTTCCATTGCTCATATGTGTGTGCATTACCTTTGTGTTTGCAACCTGGTGCCGAAAGTATGTCGGAGCTTCAGTGTTAGCAAAACTTACCTGTTAAAAGAGTAGTAGAGTCTTGATTCTTGAGCTGGTAACCAATATTTCTATATTCAGCTGGACATTACTTAGGAGTTTAGTACATTCTCTGAGGATGATCTTCCTCTTTGTACCACAGTAATTCTAGATCTAGAAGAAGTTGTGCTGTGTCTTCATGAGAATATTCCTGTTGCTTGTGTGCCTTTTGAGAGTTCTAGGAGACTGGTTTTGTGATAATCACCTCTTACGTTAAATGGAGGAAGCTCGCTTCTTGAGTGGGATTTTATTTGTTGGATCTTGTAGGTCTCAGGACTTCAGTTGGTTTAATGCCTGAATGGGATGCATGACTCAGCTTTTCTTAATAA CDS sequence:

>Eucgr.F03319.1 [564 nucleotides] ATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA

Transcript sequence: >Eucgr.F03319.1 [1325 nucleotides] CAAACGCCAGCCAAACACATCCCTCTCCCTCTAGAAAAAGAATCTCTCCACTCTCCGCTTCTTCTTCTTCTTCTTCTTCGTGCCCTTCGCAGTGACGTCTCTTCGCTTCGCCGTTCGCGCCTCCCGGTCCCCCGTCTCCCATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGAAAGTAGTAAGCATGAGATGCCCTTGCAGCAAATAAAGTTAAGCATAACTTTTGTCAAATCTGCATTTTCTCTGTCTGAGGGCTGCATTGTGCGACTTCTGTATAGTGAAGTGGGGCTGTATTATCTACTTGCTTAATGTCAATATCGGCTGTATAACATCATCTGGTGAATTTGGTATCCAGCTCTTCCATTGCTCATATGTGTGTGCATTACCTTTGTGTTTGCAACCTGGTGCCGAAAGTATGTCGGAGCTTCAGTGTTAGCAAAACT

TACCTGTTAAAAGAGTAGTAGAGTCTTGATTCTTGAGCTGGTAACCAATATTTCTATATTCAGCTGGACATTACTTAGGAGTTTAGTACATTCTCTGAGGATGATCTTCCTCTTTGTACCACAGTAATTCTAGATCTAGAAGAAGTTGTGCTGTGTCTTCATGAGAATATTCCTGTTGCTTGTGTGCCTTTTGAGAGTTCTAGGAGACTGGTTTTGTGATAATCACCTCTTACGTTAAATGGAGGAAGCTCGCTTCTTGAGTGGGATTTTATTTGTTGGATCTTGTAGGTCTCAGGACTTCAGTTGGTTTAATGCCTGAATGGGATGCATGACTCAGCTTTTCTTAATAAC

Protein sequence: >Eucgr.F03319.1.p [187 residues] MAAVLESLAVPRSSGAASAAALSPVASASSLAPTAGRRRSATFPQASGLRIGPVSVARSLRSPSQRPRRAPAVVCEAQDTAVEVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL

11. Eucgr.F04223.1 Genomic Sequence >Chr06:52957701..52958321 [621 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTAATGTACATCCCCCATAGATTTGGAGCAATGATACCTGTTCTAATAAATCTTTGAGCAACTTGATTGGCATAATACTTATAATTTGAGCTTTTGTCCCCAGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTAAGTCTTATCTTTTTCACCTTTGCTATCATGTGGAAATTTTATTTGCTAATTTCTCATAATTATTATGTCAGTAAAGGCTCATAAAATTTTTAGATACTGTGATGAGATGCCTTAGATATCCTAATTTGAACAAAAACCTGCAGTCACAAGTTTTTTGGCAATTTCAATCTTTTATGATGTGAAAGGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA

CDS sequence: >Eucgr.F04223.1 [330 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA

Transcript sequence: >Eucgr.F04223.1 [330 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA

Protein sequence: >Eucgr.F04223.1.p [109 residues] VEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPIFNEVSIRLKDTIQVVKIETEKYRSITHLYHGKPFERFVHGELWKEYLHFAKKAQTPLEMYIGTCGMENL

12. Eucgr.F04229.1 Genomic Sequence >Chr06:53013812..53017385 [3574 nucleotides] CCAGCTCCCTCCCTCCGCGAATCCACGCGCGGACGAGACGACGACGCAGCCGGGGGGAAGATATTTCTCTTCGATTTATCCAAAAAAGGAAGAAGGAAGAAGGAGATTTGGAGAGCTCGTGGTAGTCGTTCTTCGTTCGAGTCCCTCGTTTCCATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTAACGCCTCTCTCCGGGATTCGTTGTTTTTTTTTTTTTTTTTGCAGTGTTGCTCTGAGCTGTGGCGGAACGCGTGCTCGCCGGAGCGCGGGCTCTGTCTTGTCTGGTGCTCACTTGATGTTTGAAATATATGACTGGAATTGGACGTCTCTCTCTCTAATTTAGCTTGGCCGTGGCTTGCTTCTCTTGTTACAAGTATTCGGTGCTTGTGGTTTTGTTATGCTCTGGTGTGTATGTTCCGCCGGCATCGACATCCGGTCTTAGTGTGCAGTGGAGCTTTGTTGGGTCGATAGAAGTGTTGGTATGGTGGGTAAATCATACGAGCGGTCATTCTACGTTGGGCAAATTTTCATATTGCCTGCTTAACCTCAATTTTATCGGGGGGATTATTATGTGTTACGTCTTCATTCTATTTTATCATTTAGTTAGCTATATTTTTCAATAAATAATTGAATGATTTGACAATCTACACAGCTTGTGTTGCTATTTGCGTGCTGCCTGGCATTGCACTTGCCGTGGTTTTCCCTACTAAACCCATAGTGATTGTTTCCTAATTGTAATGAACGTGCTTTAGGAGGTGACCATGGACAATGTCATGTCGTGCTTGGCCAATCTGCATCTATTATAAAAAAAAAAATGCCATGTCATGCCGGGTCATTCATCTGCTTTCCACCAGTCCCGTGTCTTTTTCTTTACTAGATAAATTCTGTCATTACTTGGAGCATATCCTTGGATTGACCTGTTTCATATAATTCATACAAATGCATATCTGCCTCCTCAAGCAAAGAAGACAGATTTTGATGGTTTCATCATTTTGCATTGGACAATGCAACCTATAAATGATCTGTCTAGAAGAAAACAAACTGGTGAAATTGGACCAGTTGCTGTGTTATGAGGAGTTTGCTCATTTAATGTATGAGGAATTTTACATTCTCATGTTAGGATCTCATCTGAATCTTGAAGCATATTGGTGAAAGTGATATAGAGCTATAATGAACAACACTTTTAGAAAGTTAGGAGTAAGGCCTACAATGGCATCTTTGTAAAGCTTCTTTAGGGCAGGCCAGGGGTTAACCTATACCACACGAACTCTTAGCAGGAGTTGATTTTGTACTTGTCATCACAAACAACGACAAACAACTGTAGACCTTATCCTACTAGATGGGAGTTTTTATATATGTTGGTCTACTGGACGATTCTAGTATGTTAATATCTTTCTATGTAATTGAAGAGAGTGGGAGTGAAAGAGACCTACTTAGCTCTATCTTTATATATTTCCTCCTAATCAGTAAGTGCATTTATCCATTGTTATATGTCGTGCAATTTTTCCCCTTATTTTTTGTCTGCATCCTGTTTACTGCTGTTAATGATAAAACGTGTTTTGCTCTCCTTGTACTCCTTTACGCTAGTTATAGCATATGTTCTTTATTTAGTTGGCTTCTTCCTTTGATCTGTTGGAATAAACTTTATGTTCCTCTTTAATAAGTA

GCCTCTTTTGGACTTTATTAATATGGTTAAAGGAAGTATATGTGCTTCCTCTTGTCTCTGTTGGACCATTTGGTGACATTATTACTTTGATCTTTGTTTTGTAGATTAGAGACGTCTACTTACCTGCATCCCTTGTTTTTTACAGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTAATGTACATCCTCCATAGATTTGTATCAATGATACCTGTTCTAATAAATCTTCGAGCAACTTGATTGGCATAATACTTATAATTCAAGCTTTTGTGCCCAGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGTTTTATCTTTTTCACCTTTGCTATCATTTGGAAATTTAATCTGCTAAGTTCTTGTAACTATTATGTTAGTAAAGGCTCATAAAAAGTTTTTGATACTGTGATGAGATGCCTTAGATATCCTAATTTGAACAAAAACCTGCAGTCACAAGTGTTTTTGGCAATTTTAATCTTTTATGATGTGAAAGATTAAGGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCACAGACAGCCCTTGTAATGTATATAGGCACTAAGGCCCCTCTTGTGGCATGAAGAATCTATATTGACCAATAATCAGTGGACACCCTTCTCCTCCTAAACTGTTTTTGACTGGGGAATTCCATCCCACTTCATCATTACTCTCTCGCATAACATGGAACCGGCAATGAAACCATGATGAAGCACCAACATGTTTCTACATAATAACCGATGATAAATATGCACAAACTGCATAAGTCTTCAACAGTGATCAATGAAAGGCCTTCCCTTTGTAGAGCTTGACTGTCGTGGAAAACACAGCTTCCCTAGTTGTTAGGTTGCTGCAACCATGTCGCTGCAATCCATGCATAGTAAGTGATACTTCTTTTAGCAATAGGCAGGGGGTATTCCTATAAATTTTCTGTGAAGGACATGGTTGCCGGCTCAATGCAGAAATGGTAATAACTGATGGCCATCACCTAAGATTTATGCATTATTCTGTGGTCTTTGAATGTTATTTAATCGGAAGTTAGGTTGATTCTCATTTATAATTTAACTGTAAGATTGGGTTGTGAATTTTTTCTGATGTTCAATTGCTTGCAACTTATACAGTTTTAAGATGTTTTAATCATCTGCCCTTATCTTAATTGAGCTATTTTCAATTATCAGGAGGGTGCTCTGACGGCTGATCAACTGATCCAGCGGATTGAGGATTCACTGAAAGTTAAGCAATAGTTTTGGTGAGCCCTAGTTATTCTTCTATTGCTTCCATTGTAGACATATCATGAAAACTGTCCTTTCTCAAATCCTCCAGAATATTGCAATTTTCATTCTAGAATGATAATTGGTGGCCTCGGCCTTGTTATATGAACTTTGAAGTGTGCATAGGAAGTTTTATTCTCCTCTTTCCATTTTTCCCCATCCTTGAACAGCCACTCGCCCAAGAGGTCATGATTTATGGTAACATTGTTCATCTGTGAAAATTGGGTAATTAGACCTAAACTTAAAGGGAATTGAGAGGAGTAAGTTACAT

CDS sequence: >Eucgr.F04229.1 [459 nucleotides] ATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGGTGCTCTGACGGCTGA

Transcript sequence: >Eucgr.F04229.1 [956 nucleotides] CCAGCTCCCTCCCTCCGCGAATCCACGCGCGGACGAGACGACGACGCAGCCGGGGGGAAGATATTTCTCTTCGATTTATCCAAAAAAGGAAGAAGGAAGAAGGAGATTTGGAGAGCTCGTGGTAGTCGTTCTTCGTTCGAGTCCCTCGTTTCCATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGGTGCTCTGACGGCTGATCAACTGATCCAGCGGATTGAGGATTCACTGAAAGTTAAGCAATAGTTTTGGTGAGCCCTAGTTATTCTTCTATTGCTTCCATTGTAGACATATCATGAAAACTGTCCTTTCTCAAATCCTCCAGAATATTGCAATTTTCATTCTAGAATGATAATTGGTGGCCTCGGCCTTGTTATATGAACTTTGAAGTGTGCATAGGAAGTTTTATTCTCCTCTTTCCATTTTTCCCCATCCTTGAACAGCCACTCGCCCAAGAGGTCATGATTTATGGTAACATTGTTCATCTGTGAAAATTGGGTAATTAGACCTAAACTTAAAGGGAATTGAGAGGAGTAAGTTACAT

Protein sequence: >Eucgr.F04229.1.p [152 residues] MAISLSASSIPRLSGENPAASSSMSPLRLRLPAGARGFGGGGRRISVNSKPRGFSLVVEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPILNEVSIRLNDTIQVVKIDTEKYPSIADKYKIEALPTFIIFKDGKPFERFVRCSDG

13. Eucgr.G03224.1 Genomic Sequence >Chr07:53045862..53048473 [2612 nucleotides] ATCTCCTTCTCTATCTCTATCCAACATAGGAAATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGGTACGTTACCATGTTCGATTGCGGGTCTCTTTTGTTCCTATCAGTGCTTACATGAATATGTGTAATTCCGAATTTTTCGGTGGAAAAGTGGAAATTCTTGAATGCCGGATTAAGATAATACGAGCAGGTAGGGGAGCCATCTGATTATGGAATTTGGAACTTGGGATTTCTCCCTTGTTAGCCTATGAAAAGGGAAAAAATTATTATCTTTAGTGAGCTGATATATAGCCGCGTTTTCATTTAAATTGTATGGTTGGTTTTGCTTGGGCTTGGGGCGAATTACGTGGCTGGTCTTTGGCAGACTGTACAATCTTTTACATTGATGTGTTTCTTCATTTGGTTTGGAAGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGGTAGGTTCAAATCTGATGTCTTGTTGTGGGTTAATTTCAATCTCGAGTCATCTCTGTTTTTATTTTGATTAATTACTCTCATTTACGTTCTTTGCGGAGGGAAATATATTGTTCCATTATTGGGAAGATCATGGCTGTAGATGCTACAAGTATGTTGCCTTTTAATTTTTTAGCAAGTTAGTGCCAGCTATTCTCAGAATGGCAATGCTCTTCGATGAATTGGTTTCTATTGGGAGTTTCTTTTATTGATATACCACTTCAACAGAAGCAAAGCATTCATGATAGACCTGAATCGAGAGGCATGCTGATTAAATATCAGTTCATTGGCTTTTATAAATGCTTTTGATCGGTCTCAAGATTGACATCTTCCCTTAGTAAGGCAACATTTTCGATTTCTCTAGTTGCTGTATTGTCTTCCCCATTTTTCTCCCCTTGACAGGCTTGGGGACAAGATACTTATTTATGTCCAAGCTACTTCAAATTAGTGAATAGTTT

ATAAGATGCTTGCTACAAGTTTCATTGAGGTTAGGACCAAATGCTTCGATTGATTTCCTATTGCAGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTAATAATTGCCATTGATACTAGTCGGATACCTTTTCTTATGATTGTTGCATTCAAACTCTTGGCTTGAGATCTCCATCAATCTGGTGATATCATAAGACACTTGATGTCAGTACCCTTCTCTTGGTCCATAAATGTTGTTTAATGACAAGTGGAAACAGCTTTTCATTGAAAACCTTGCTAGGTTATGAGGCTCCTCTTATTAAACTGCTCCTTTCTCCCCCTTTTTGCTGTTAAGTCAAAAGAATTAAAAATGATTTGCTAGATTTTTTCAGAAATGAATATAAATTTTGATGAATCAAGATTCAGGACAAGCTAAGGTCAGTTAATCTCCAGTCGAAAAAAAAAATTGGCTGCTTATGAATTTCATTTGAAACTCCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGAAGGCATCAGGAAAATGATTGATAAAATGTCTTCTAGGATTTAGAGACAAAGCTGCTCCAGCTGCTCCAGATCCAATGTGCGATTTTGCTCTGTGATATCCTTTTAATATGAAGGTAGGTATAGGCCATTTGATCTGGAGTTGACGACCTTTTGTTGTTATACTTGATGAACTAGATCCTAAACTTAGGAGGTTTGGGCATTCAGCCCAATGGAAGGCGTGGCCCCGGAATATTGGTTGGTTGTATTTTGCATCTGGCCATTAAGATCTATATAGTAACTAGGGACAGCAACAATCTTTAAGGTAGTTTAGATAGTTTAATATGCAATTTGAAGATTGCTTTTACATCCCGGCAGATACCGGATAAATCATGCTCTCTGTTTTGCTTGTTTAATTCCCGGCAGATACCAAAATATTGTTAATTGCTCTGGGTTAGAGGAAATTACTACTAGATCTGCTTATTTTGCACTGAAATGAATCTCTGGTTCAAAATGAGCGGATATGAGTTTCTCAAAATGTTGTTGTTATTAGTGGACGACTGGGGAGATGGAATGCTCATCTAGCTTGAGATCAGTTGTATGCTGAGCAGGGAAATGGCACATGTCGGCAAGTGTACGACCTGATGACGCTGATGTAGGAACCACTGGTACTGGATATTAATGGCTTGCTTATCAAAGTGTAAGTGCAATTGAATTGCCATACTTAAGAGTCTGTTGGATGTATGGTTTACT

CDS sequence: >Eucgr.G03224.1[561 nucleotides] ATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGA

Transcript sequence: >Eucgr.G03224.1 [1322 nucleotides] ATCTCCTTCTCTATCTCTATCCAACATAGGAAATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGAAGGCATCAGGAAAATGATTGATAAAATGTCTTCTAGGATTTAGAGACAAAGCTGCTCCAGCTGCTCCAGATCCAATGTGCGATTTTGCTCTGTGATATCCTTTTAATATGAAGGTAGGTATAGGCCATTTGATCTGGAGTTGACGACCTTTTGTTGTTATACTTGATGAACTAGATCCTAAACTTAGGAGGTTTGGGCATTCAGCCCAATGGAAGGCGTGGCCCCGGAATATTGGTTGGTTGTATTTTGCATCTGGCCATTAAGATCTATATAGTAACTAGGGACAGCAACAATCTTTAAGGTAGTTTAGATAGTTTAATATGCAATTTGAAGATTGCTTTTACATCCCGGCAGATACCGGATAAATCATGCTCTCTGTTTTGCTTGTTTAATTCCCGGCAGATACCAAAATATTGTTAATTGCTCTGGGTTAGAGGAAATTACTACTAGATCTGCTTATTTTGCACTGAAATGAATCTCTGGTTCAAAATGAGCGGATATGAGTTTCTCAAAATGTTGTTGTTATTAGTGGACGACTGGGGAGATGGAATGCTCATCTAGCTTGAGATCAGTTGTATGCTGAGCAGGGAAATGGCACATGTCGGCAAGTGTACGACCTGATGACGCTGATGTAGGAACCACTGGTACTGGATATTAATGGCTTGCTTATCAAAGTGTAAGTGCAATTGAATTGCCATACTTAAGAGTCTGTTGGATGTATGGTTTACT

Protein sequence: >Eucgr.G03224.1.p [186 residues] MGLLQIHSPIAVFLSKPVSSSHSKPPRLPPFQDSTRNFGQSSLFSSSPGIKDRVFTLSTAPRKLLCTPPQGKHVREDYLVKKLSAQEVQELVRGERNVPLIIDFYATWCGPCILMAQELEMLAVEYENNAMIVKVDTDDEYEFARDMQVRGLPTLYFISPDPNKDAIRTEGLIPIQMMRDILDNEM

14. Eucgr.H01629.1 Genomic Sequence >Chr08:19303645..19306634 [2990 nucleotides] TTGCCATTCACTCGTTGACGAGAACTAGTACTGCCACTCTTGCTCGCTCAGCCATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTACGTGCTTCCTCTCGCTGATCCCATCCTCATCTCTCTTTTCGTAAGTTCTTTCTTGCTGTCTGTATAATGCGGTAACCGTTAGTATCTCTAGGATAAGGAATTGATTGTTGTTGTTGTTGTCGTCTTTTGTGACATTCGTGGTATTTCGGGTCGGGGCTCTTAAGGAATGCAATCTTTTCACTTTAGAGGAAAGATTAGTGTTTCTGTGACCTGTTCTCTTGCAATATTATGGAGTTGCGAGATGCTCTTGAAAGGGTTCCTTTATCGGGTGTTGAGATTGTTGATCCACTACCTGGGGAAAGTTTGAGATGGCTTGTGAAGTTGGACTGGTGGTTGCTGGGTCGTTTTGGAGACGGGAGTTTCCATCATGCTAACTAGGATTCTCTATACTAGATGAAGTTTGAAAGCGTGTTCTCTATCTACGGGTTTTGCTCCTTCTGAGTGGTGAGCTGCTGATGAACCTATTTGAGACCAGTTGCTTCTAAAGGAGTATCCCCAGAATTCATTTTGCCCTCTAACTTGATAATTTAAAGAAGCAGCTCAGACAAGGTAGTCAGATTGGTTGCTGGAAACTTAGGATGGATATCCATAATGGTTTGGCCTTCTCTTGTTTGTTCTTGTCTATAATGCTGTTTGTTTATGTAGATACCGCAAGAAGCATTGAATGAGCCTCATAGAAGGATTTTCAGATTACAGCCTGATGATCTCGGTAGAATCAGAACACCATTAATCCAAAAAAGAAACTAAACGTGTCAGGTCTCATGAAAGTTGCAACAAGAAATTCTCCTTTAACATTATCTTGGGTGCTGGTTTTGCTGGCCAATTTCTTATATGGTTTGTGGTTGG

TAGTGTTTTGTAGCAATCAATTTCAGTGTTTTGTAATTATCAAAGAACATGTTGGGACTGTGTTTAATGACTCGTCCCTTTTGCTGTTTACATTTAAGAATATCCTATCTGTGTCTCTGCCTCTTGTCTGCAGTAGTGCAATGTGCAAATTTATCTGCCTAAGAAAAGAGCAACTTTGTTTTGCATGTGTATCTGAGGCAGCATGCCCTGGTACTTGCATGTTCCTTTTCAGTTTCTTTGTTTGAATAGGACTTTCATTTCTGTTGAGCACCTCTGTTTCACAAGGCTACTGGTACTTATGGAATAAGTACCTTTCATATATCTTTTTATAAACTTCAAGTTAAGTGGTCATGCTTATTATTATTTTTTTGGTAAGTCGTCATGCTTATTATTCAAGTAGTCTATATTCAAAAAAAAAAAATCTCGTTTCAAAATGTCTATAGATTATTATTGTGCTGATTCTGATGAATGTGACCAAATCTATGAACTACCTGTCTGGCCTTTTCCTCTGCTTCATTTTGACTGCTTGAAAATTGCAGATTTCTTGAAACTCAATACATATTGTACATGACAAATCACAAATTAGATCCAGCTAACTATCATGGGTCGCTTCAAGTTCCCAACTTCTGACCTTAGATCTTTGCTGGAGTTGTAATAAATTGTAATTTCTCTCGCTTTGAACAACGGTACCATATATTTTTTACTTCTCCTATCTTTGGAGAATGTAAGAAAGTTTGTACCGTAGATATCACCTTGAAGGACATTAATAAGGTGCTGCATTATTAACATAGATCCCTGGAATATGTGGCCCCTATCTAATTCCATCTCCTCTCTATTTTTCAAAGTACACGTATGCCACATTCAACTGTATGTAGTCATAAAAGGCCCGGTTTGCTTTCAACTTCTTGTGTGCTGTGTCTTTCGTCTACTGTGTTGCTGCTTCCCAGACTTCATTTGCATAAATACATGAGAGTGCTTGATAGCATATGCATGTATCAATTCCTCTAGATGCTGAGTTCTTGTGCACTCGCTTCCACTCATGTACATGTCATTGTGGTGCTAGCCTCACATTTCTCTAGGAGTCATTCTTATTGAGTTTGGGAATTAATAAGATTTAGACTTTTTCTTCACTTGTCTGATTCTAATGGTTGATATTTCTTGATCGATAATTTAATAGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGGTATATTCTTGCCACCCCCAAGAAAATGAAGAACCTCCTCCCCTCTCTCTCTCTCTCTCTCTGAGATTTCTTTGTTTTCCTTTTATTTTCTGGGAAAACTTGAGGGCAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGAAGAAGGCCCTCTTTTGCGACTGTTGATATAGTACCATCGCAACTTGTCGACCTCAAATCCGATGCTCTTCAATTAATCTTATCGAAAGTGAATCTATTGAATTCAATGTCTGGTATAAGGACGAGTGTGGTAATTATTGCACTCTTCTCATGGATGATGATTTTGTGAAATTTCCTTCCTCAATGGCCTTCCCGGCTCCCAATTCCCACGCCCGGAGAATCACTTGCTATTATCTCAACCAAGC

CDS sequence: >Eucgr.H01629.1 [558 nucleotides] ATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGA

Transcript sequence: >Eucgr.H01629.1 [855 nucleotides] TTGCCATTCACTCGTTGACGAGAACTAGTACTGCCACTCTTGCTCGCTCAGCCATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGAAGAAGGCCCTCTTTTGCGACTGTTGATATAGTACCATCGCAACTTGTCGACCTCAAATCCGATGCTCTTCAATTAATCTTATCGAAAGTGAATCTATTGAATTCAATGTCTGGTATAAGGACGAGTGTGGTAATTATTGCACTCTTCTCATGGATGATGATTTTGTGAAATTTCCTTCCTCAATGGCCTTCCCGGCTCCCAATTCCCACGCCCGGAGAATCACTTGCTATTATCTCAACCAAGC

Protein sequence: >Eucgr.H01629.1.p [185 residues] MALQLSLSASSSLRSQNSVPCLSSSGSSSSSSAISSSRWCWLGCKNVSLLRAGGNVGRGGNGVVVKCSVDTTGVYTVGTVTDVDKDTFWPIVNSAPDKTVVLDMYTQWCGPCKIIAPKFQELAEKYLDVVFLKLDCNQENKPLAKELGIRVVPTFKILKGGKIVKEVTGAKFDDLLLAIDTVRSS

15. Eucgr.I01912.1

Genomic Sequence >Chr09:29105284..29106504 [1221 nucleotides] AGTGACGCATATATTCTCCTTTATTCGTGGCGTAAGACCCGCAAAAGTCATAACCAGCTCTGTGCATGGTGCCGTCGGTTGGAAATTCGCAACAAAAAGAGGATGCACCATCGTTGAGGATAGCCATGATCAGTACCATGAAGGGTGGAAAATCGAACGCCAGATGAGGGCCGGCAACGTGAATCCGCGCAAAGGACGAAATATAAAAGCGGGGGAAAAGAGAGAGCTGCTCAAGCATCGTAGCGCATTGGCTTAAGTTGCTACTTGTGAATTTGGTAGATTGCGAGCAACCATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGGTAAGGCTTGACCTCCGATCTCCTTCTTCCAGAATACGACTGAGCGTCTGGTGTTCTTCAAAACTGACGTGCTTGCGGGTTGCATCTGGGGAAAAAAGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGTACGTGAACTCCGCTCTCTTCCGCTCTCTGTTTTCAGATTCTCTTTTGTTGCCGGACAACGTCGAATTCGAGCTGATTTTTCCCCTCTCTCTCTCTCTCTCCCCTTCTGTGTTTGCGGCAACGGCGAAATCTCGCAGGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGAGTTCGATTCTTTTGCTCTTCTTCTTCTTCATGGGGAAAACAAGAGAGAGAGTTTTTATTGTATCTTCAGTTCGACTATCGCGCGCGAACGTTTGCTTTACCTGAATTGCGAAGCATTAGGAGAATGTTTCATGTTTGATCTGGTGTGTAACGTCTGAACTTGTCTCATGCTAATTCTAACGTTGGCATTATATCGATGTTTCGAGTTCTCGTTCGA

CDS sequence: >Eucgr.I01912.1[477 nucleotides] ATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGA

Transcript sequence: >Eucgr.I01912.1 [985 nucleotides] AGTGACGCATATATTCTCCTTTATTCGTGGCGTAAGACCCGCAAAAGTCATAACCAGCTCTGTGCATGGTGCCGTCGGTTGGAAATTCGCAACAAAAAGAGGATGCACCATCGTTGAGGATAGCCATGATCAGTACCATGAAGGGTGGAAAATCGAACGCCAGATGAGGGCCGGCAACGTGAATCCGCGCAAAGGACGAAATATAAAAGCGGGGGAAAAGAGAGAGCTGCTCAAGCATCGTAGCGCATTGGCTTAAGTTGCTACTTGTGAATTTGGTAGATTGCGAGCAACCATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGAGTTCGATTCTTTTGCTCTTCTTCTTCTTCATGGGGAAAACAAGAGAGAGAGTTTTTATTGTATCTTCAGTTCGACTATCGCGCGCGAACGTTTGCTTTACCTGAATTGCGAAGCATTAGGAGAATGTTTCATGTTTGATCTGGTGTGTAACGTCTGAACTTGTCTCATGCTAATTCTAACGTTGGCATTATATCGATGTTTCGAGTTCTCGTTCGA

Protein sequence: >Eucgr.I01912.1.p [158 residues] MGSFLSRLLRALGLGPRAPAAAPATTVSTDSPSQSSSSDSPPRHSRVQALHSTPPWQLHFNTVKETPKLMLIDFTASWCGPCKSMQPVVDAMASKFTDVDFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRLVGASKDELERKIQKHRGLVPTR

16. Eucgr.I01913.1 Genomic Sequence >Chr09:29110832..29112055 [1224 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGGTAGGGGTTGGAAAAAGATTCCCTCCTCACGGGGGGCTCGCCAAGGACCCTTTACCGGGATTCCTCGCCCCCTGGCATGAGAAGAGGAGGTTGACCACTTAGATGCGAGGCTAAACCTCTTCAATGAAGGTTCCGAACCCCCAAAAGGGGCTCGGGTGGTGGCGACACCTACCCCTCTTAGTTTTACGTTGGAGGGACCTCGCAAAGCGCGGGCGACGTTGGATCAGTTGGGCACCCCCATTAGGGGGGGCCGTCATTTTTAGACCTTAGATCAATTGGGAACCCCCACCTTAGGGATTCCCCCGTCATTTCTAAGGAAGGACCTGTTCAGGTCCATTTTAGGGCAAAATTATCCTCTAATTTAATCAAGAAGATCCTGCCTAAAAACACGAACACCTAAATCCCAGCTGTCCATAATCCAATAGCCTCTCCGACTTCCCTTTCTGCTCATTCCTCCCCACCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGGTAAGGCGGCTGTAGACCCCTGAAACCCCTCTCCCCTCCTTCGGATCTCCTCCTCCTCCTCCTCCTCCTCCTCCTTCTTCCCCGGAATGCGATTGAGGCTGTCCGGCGTCCTTCGAAACTGACTGTGCTTGCGGTTTGCGATTTCTTGTGGGGTGGAGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGTACGTCGACTCCGCCCTCTGCCTTTAGGGTTTTTTTATAATTGTTGGCCGGCGATGTGGGATTCGAGCTGATTTTGCTCTCTCCTTCTGTGTTTGTTGTGGCGATGGTGAGATCTTGCAGGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA

CDS sequence: >Eucgr.I01913.1[480 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA

Transcript sequence: >Eucgr.I01913.1 [480 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA

Protein sequence: >Eucgr.I01913.1.p [159 residues] MTTRKGWVQPAKQSERSSCHGLLPLQPPRSSGRRRLAGIVVGAFPRPGVPLHPAVAAPLQQSQGYLPIAKMVIDFAASWCGPCRMMEPAVSAMASKFADVEFAKIDVDELSDVAREFSVQAMPTFVLVKKGKEVDRIVGAKKDELERKVQKHRALMASS

17. Eucgr.I02383.1

Genomic Sequence >Chr09:34231097..34233464 [2368 nucleotides] GCGCAGGAAGGCGGTTTTCCATCAATAACGTGGTCACCTTCTCTCCTTCTCCCTTCATCATTCTTCCTCCTTCCTTCTTGTGCGTGCGCGTGTTCGTGAGTGAGAGAGAGAGAGAGAGAGATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGAGAAATTTTCGGATCCTTTTCATGCGTTCTGCACATGAATCTGGCGTTGTCGATGCGATATGCTGTCATCTAGTTCGCTTCCGTTTGTGCAAGTAGTCGTAGCAAATGGGCATGGCGTTCGACGAAATGCAATCTCGAGCCGGCTTCCGAGGCGATGGTTTGTCTTTGATACTTCTGGATCGGCCGCGCATTCGTTTGCGGTCCTTTTTTTTTTTTTTTTTTTACTTTTTGGCCCCGGCCGGGACGAACGAAACCTAATCGGTGGAACGGAGAAAAAGAAAAAAAACATCAGAATTCAGAAAGAGGCACGTTGATCTGAGCAATGACGCTGACAGGGAAGAGAAGCAATGCTTTTCAAGGAGATTATCATCAACTTTCATCGTTCAGACTTAGTGTTGTTCGATAAGACTTTTTTTTTCGTTTTTTTTTCCCGAAATCATATGTGATGGGAACGGGATCTGGAGGCGACGGCTGCGGGTTGGAAGGTGGCGGGCCGGCTGTGGCGGGAATGGGGTGGCGATGGTGGCGGCGGCGGGGATGGAGGAGGATGGCTGGCTCGAGGCCGAGGAAGAGAGAGAGAGCGCAGAGATCGTGCGGGTTCGGCTGTCCTTGCTTATTAGGGTTTTTATGTGCTTAGCTGTAAATTGACAGGCAGTGCGTTAAAGTGTGAATGGCTTGCCGCGTCGGCTACATAACCTCCTCCCGAATATGATTCACTTGTTTGAAATGCCACAAACAGTCTGTCGCAACACTTAGTATGCCGAAGTTGTGAATAGGGGTTGATGGCATTTTACCTGAGTTTATAATGCGGCGCCATGTCTGGCCAACTCGCTGAGCATAGGACGGGAAGAATACTCGGTACATAGTTCCCCGTTGTTGATTAGGTTGCTTGGTTGATCGTTCTCCTTTTGGACTATCTTAAGTTTTGCTTGTAACCCAAGTAAATCTCGCAAGAAAAGTGATTCTTTTCGCTAAATAGAATCATACTTAAGTCATCTTTTTACTCTCGTGTGAAATCAAGGGGGAGAAATTTGTTCATATCACTCTCCTTTTCTTTTGAATTCTATTTTCTCATGAAGAAAGTACATGCATTGCTTCTCTACTAGTACTAAAGAGGAGCTGGCTGAGTCATAGTTTATGACTAGTGTTGTTGTATGGCTTTCGAAGGTAAATACTCTGATTTTTTATGGCAATATCAGCAGTCTGCCAGTGAATTCTTAATAGCAGGTGATTTTGTTTGGGTTATTATATTTCTTTCAGTATAATTTGGTGGAAGAATGAGCAAATGGGTCAGTGTGGCTGATTAAGCTCTTTGTGTTCATGAGCTATTGAACTGCCAATTAACAATTTCCAGGATGTTTCTGCTGTAGCGTCTCATTTTATAACGCCACTAGTTTCGGTGATGAATTGGTCAGAATTGAAATGCATATGATGATCACCGAGTTTGTTTGTTTCTTTTTTGTTTGAAACAGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGGTAAAATAATCCGAGGACTACATTTCCAGGGCTATATGAATGATGGAAATTTGTCTTAATAGATGACAGCCTAGCTGTCTAAGTTCTGCTCTGCAAGTATTGTTGAACTCGTGAAGGAATGACTTTCCATTCTTTTGCAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAATCATTATATAAATGCTATCAACCAAGCTACATACAGTCTCTCTTTCTTTCTTTTAAGGAGTTGCATGCAGTGTCCCTTTGATGTTATGAGATTGCTTTGAATCTGGTTTTCAGTAGACATGCCTGTCTACATTCACCGCGTCGAATGTCTCACAGCACCTTACGTCCATCTCTGTAGAATTGTGATTCCCAAGCAAAAATAACACATATCATGCTACTTTGGGAGTATTTAGGATGAGGAAATAATGTATGGCAAGTCTCATGCAGATAGTGTTATAAC

CDS sequence: >Eucgr.I02383.1[354 nucleotides] ATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAA

Transcript sequence: >Eucgr.I02383.1 [753 nucleotides] GCGCAGGAAGGCGGTTTTCCATCAATAACGTGGTCACCTTCTCTCCTTCTCCCTTCATCATTCTTCCTCCTTCCTTCTTGTGCGTGCGCGTGTTCGTGAGTGAGAGAGAGAGAGAGAGAGATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAATCATTATATAAATGCTATCAACCAAGCTACATACAGTCTCTCTTTCTTTCTTTTAAGGAGTTGCATGCAGTGTCCCTTTGATGTTATGAGATTGCTTTGAATCTGGTTTTCAGTAGACATGCCTGTCTACATTCACCGCGTCGAATGTCTCACAGCACCTTACGTCCATCTCTGTAGAATTGTGATTCCCAAGCAAAAATAACACATATCATGCTACTTTGGGAGTATTTAGGATGAGGAAATAATGTATGGCAAGTCTCATGCAGATAGTGTTATAAC

Protein sequence: >Eucgr.I02383.1.p [117 residues] MAEEGQVISCHSAESWSEQIAKSNESDKLVVVDFTASWCGPCRFIAPFLAELAKKFPNVLFLKVDVDELKTVAQEWAVEAMPTFMFVKGGKIVDRVVGAQKDQLQMTLAKHMATASA

18. Eucgr.J00880.1 Genomic Sequence >Chr10:9524711..9528067 [3357 nucleotides] TCCAGCCACGAGTCAAAGACTCAGATTCTCTCCCTCCCTCTCTCTCTCTCTCTCCACGGAAGCGAATCCGCCATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGA

CGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGTCTTCAAATCCTCTCCAATCCTCTCTCTCTCTCTATCTCTCTCTTCTGCGATTGAATTTCGTGATTCTTAGCTTTCTCTCGGCTTCATTCTGATTGGATTTCAATACTTACGTGCGTCTGTTTATGTTGACTTGAGCATCAGTTCTATATACCATCCAGCAGTTGACTGTTAGCAGACCGTTTTAAGCTGTTAGATTGATTGGCATTTGTTTCGCGTGATGCTTTTCATGGTATGGGAACCAAAGGTTCTGTGTTTTAAGGCTTCTCTCACTTGTTGTTTCCATCTCGAATGAATGACTGCGACGGGAATGTTAGAGCATTTTCAACTCAACTGGCTCAAGCTTTTTAGATTAGGGAGAGGGTTCCCTAGTAATAGTACGGACGCCATTAACCATATAACTTAGAGGCCGTCCAGAAGTTTGAATGACTTCCATCCTCATCTCATCCTTTTGTTGATTCTGGGTTGCAATCTCCTCAGCTTAAGTGACATGAGGATTTAAACTAGTCTGTGATGATGAATCGCTGATGCAAGATAAGTGACATGAGGATTTAGGTCCCCTTTTGAGTATTGAGGTAGCTCTGATTTTTCCGTTGCCTTTCTTTTCCTTAATTGTTCTCCCGTTGTTCTTCTTTCCACTTTATACCATCTGCTCTTAGCTATGATGGTTAAGCATTTTTTTTAACTTTTCTCTTGTATTCATATGGACGTTGAGGACCATAATTGGACACTATAATTTGTGATCTAAAAGCTAATTCTTTTTTTTACTGAACTGTCATGATTGCGTCCCTTTAATTTCTGGGGAGGTGGCAGCTTGGAGATGTGTTCCCTTAACCTTCTAGTGTAATGTTTTGCCAATTCATTAGGAACTAATTCCTGGATACCGTGTCAAGTTTTGACTTCGATCATTCATGTAAAATCAGATACTACCGTGTAAGCCAGCTTTTGGGAAGATATTTTCCACTTCTTTTCTTAAAATTTAGCCTCTCCTTACCCTCCATTTTTCAGCTACTCGATATCTTCATGAACAATTCGCCTCTTTTCTGTTGCTTAATTGCACAAACTGGCAGTCTCCATTGAGTGGAACCTTGTCAAATTTTTGTTGGCATGGTGAGAAAAAAATAGAGGGAAAAGCTGCTGATAAACACAGTCTAGGTTTTAAATGTTCAAGCTGTTAGGAATTGTTATGTCTTAATACTTTCCCTCAGAAAAGTTGGTTAACATCACCGATAGATTTCTGCTTTCTGTTGTTGTACTTTTAGGTGGCAATTACAATGGCAAAACGAAGATGCTAATTCATGACATGTATCGTAATGCGATCAGTCGAATTAGGATTCCTCTGATGGGTAAGTTGATTAAAGGAGTCCCTGTGTTTTTCTTTGTTATATTGTAAGCTGGTCTTTGTTGGTTCGGATTAATACAAGGCATGCATACAAAGAAACACCAATTCCTGCAATTTCTTTGTGTCATTCACTTGTTAGCAAGAAGCCTGTTCAGCCTAGCCTTTGAGCATGTTTGAGATCTATAGATAATCATCAACTTGGGTTTGTTTGAAAGTCAATGTCAGTGTGTTAATTACTGTCAACTTCTAAGGAAAGATGAGCCTTTACCTGCACCATGGTGCTCCAACAAGTAATTTTAGAAGAAATGGCGATATATCTGAGATCAGATTTGTTGGCAGATTTAAAGCATGCTAAAATCTTATGCTGGTTGGTTGCCATTTTGTTAGATTGTTTCTATGGTTTACTGCATGCCACTTTCTTTTTCATACAAATTGTATCACGGGACTCTTTTTTTCCATCAACTGTAGCATGGAACTATGTTTCCCTTGATTAATATTCATGGGAATCTTTTACTTGAAATGAGGCTCTTACCTAAGATATTCACACAAGAATGTGTTTTTCCAATCTCTGAGGTGCTTCAATTAATTATTCTGAAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAATGACCTTTGGATTTTTGCATATGACAAGCCAACTGCCTTATCCTTGTGTGTCTTTGCTCAAGCAAGTTTCTTCCTTCTACCAGTCAATTCTGGAAACAGATATTGGTATGAATGTGCAGTCTCTTCCGTTCATTTTGTTCTGTTTGCAAGCCAAGATGATCACATCGCGACTTTTTGAAGTCAATGGGGTTGATGATCCAGGGTTGTGGGCTTTTTGCTACTTCCTTTGTGCTGTGCAGTAAACAGAACTCTTTGCTAGCTTCTTGTGACATGATAATATTTTAATTTATCACAAGAAAAATGTGTTGTTCGAATGTATCATAGTTACTATTACAGCATTGTTGTACTGCTGGCATGATAGAGGTGGCAGGCTGTGTACTGCATTTGACATTAATATATCTGCAGATATGTAAGACTTCAGAGTGAGTTTATGGCTGTCTCTCATGCGACGGTGTCCTACCAAGTTGATTGAGAAGTTAATTAATTGCCAAAGGCAGTTCTGCTAACATTTCTGATTTTTTATGACCAAAAGAAAAAGAAAAAAACTTTTAGGATAGTCTTTGTTTTTTTTGGTAAGGCTTTTAGGATAGTCTTTGTTCTAACGTCTCTAATCCACAGTTTCACCACTTCCTTGCAGCCTAAGTGGAATTAATCATCAATTTTTACTTTTTCCGGCTAAGATCATGCCATCGGGTTAATCAATTTGATGGAGAAAAGATTACAGTCGGTATAAGTATCGCAGGAAGAATGGCATATCTTCTTGTTATTTTGCGGTTCTTGCAAGAATGGCATATCTTC

CDS sequence: >Eucgr.J00880.1[549 nucleotides] ATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGACGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAA

Transcript sequence: >Eucgr.J00880.1 [1419 nucleotides] TCCAGCCACGAGTCAAAGACTCAGATTCTCTCCCTCCCTCTCTCTCTCTCTCTCCACGGAAGCGAATCCGCCATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGACGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAATGACCTTTGGATTTTTGCATATGACAAGCCAACTGCCTTATCCTTGTGTGTCTTTGCTCAAGCAAGTTTCTTCCTTCTACCAGTCAATTCTGGAAACAGATATTGGTATGAATGTGCAGTCTCTTCCGTTCATTTTGTTCTGTTTGCAAGCCAAGATGATCACATCGCGACTTTTTGAAGTCAATGGGGTTGATGATCCAGGGTTGTGGGCTTTTTGCTACTTCCTTTGTGCTGTGCAGTAAACAGAACTCTTTGCTAGCTTCTTGTGACATGATAATATTTTAATTTATCACAAGAAAAATGTGTTGTTCGAATGTATCATAGTTACTATTACAGCATTGTTGTACTGCTGGCATGATAGAGGTGGCAGGCTGTGTACTGCATTTGACATTAATATATCTGCAGATATGTAAGACTTCAGAGTGAGTTTATGGCTGTCTCTCATGCGACGGTGTCCTACCAAGTTGATTGAGAAGTTAATTAATTGCCAAAGGCAGTTCTGCTAACATTTCTGATTTTTTATGACCAAAAGAAAAAGAAAAAAACTTTTAGGATAGTCTTTGTTTTTTTTGGTAAGGCTTTTAGGATAGTCTTTGTTCTAACGTCTCTAATCCACAGTTTCACCACTTCCTTGCAGCCTAAGTGGAATTAATCATCAATTTTTACTTTTTCCGGCTAAGATCATGCCATCGGGTTAATCAATTTGATGGAGAAAAGATTACAGTCGGTATAAGTATCGCAGGAAGAATGGCATATCTTCTTGTTATTTTGCGGTTCTTGCAAGAATGGCATATCTTC

Protein sequence: >Eucgr.J00880.1.p [182 residues] MDGAALVSSSGVLFPPSLPPARLATALSAAAGCRFAPPPRSSFRTWRSGAGVAPVRKSARRCGAAVGGGGITEIDESQFPETVLKSDRPVLVEFVANWCGPCRLISPAMEWLAQEYKERLIIVKIDHDANPKLIEEYKVYGLPALILFKNGKEVPESRREGAITKVKLKEYLDSLLDSISVA

19. Eucgr.J02387.1 Genomic Sequence >Chr10:28963917..28966304 [2388 nucleotides] GCTCGACAAGATCCTCGGAATCGACGAGGAGCAAACAGCAGCAGCAGAAGAGGTTTCCAGCTGTCGCGAGGCGGCTAGTGTCGTGCAGTGCAGGGAGCGAGAATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTACCATCTTCTTTGTTTCATCTCTCTCTCTCTTTCCGTCCCTTCGTTTGCTTTCGTTTCGTTCGCGTTTGCGCTTTGATGTCCGGGACTGGCGGCGTTTTTTTTGGTTGGCTTTTTGCAACTCCGGATGCGTGATCTTCCGGCTGTCGAGGTTGCGTGTTACGGGTTCTCTTTGTTTTTGTTTTGGATTTGGCCGTGGCTCGGTTGATCGTCGCGAAAGGCGAGGCGTTGACTTCGATTTAGACGTGCCCGATTCGTGGATGGATTCGTACATGAACGAGAAAAGTGATTTCGAGTCGTGATTCGAGTGCCTGCTCTGATCGGGTTCGTCTGGTTGCACGTTTAATTTCCACCGGAAGCGGTGTGATTATCTACGGAGATGAGAAAACCCCCCGAATTGACGTGACTCTTGTTGAGTTTCTTCAGGCGGAAGATTCACAAGCCGTCTACATACGCGTGCATTTATGCAAATTTATCTGATTTTCCGGGGTTGTTCGTGGTTCGGCAACTATATCTTATGTAATTGTCAAGTGAACTGCTTTGTGGACCCTAGCTCGTGAGGGGGTTTGCTTCATCAACTGGGTTTTGATTTTTTATAGCTGCGGTTTCTCCAATAAGCCCTGCACTGGTTTGGCTTGAGAGCAGTGGTCGAAAAGGGGGCATATCTATAGATTTATACAGGTTCGGCCTACGACCGACCACATGGAAAATAGTGGCTTGATGTTACGTCGTAACCCACGATAATAATTCTTGCTGTAGGCAATGATATTGGATAGACCGCTTCCTCGATTGGACTGTTCTTGTATTTTTTCTCTGTTATTTTTCTTTTGATGGAGACATACTTCTTTTAACTTTGTTTTAAGCGAATAATGATATCTTCCGCGATAGGACCAAGTCCACGGTGGGAAACAAAAAGAAAACATGCGCTTGAGGAGCTTTCGTCTTTAAGTTAGACATGACGAAAAGAAGTGACAACTAGAGGTCAAGGCACAGTGGAAATTTTGAGTCTTGATGAGGAAAACTACGATGGGAAGTGGCTTGCAATTGATAAGCTGTTATCTAAGGAAAAATATTACTGTATATTTGTGCGATGAACACGGGATCACACTCCTTTTCTTAGTTGATTTGTGCTGATGTTCGATGCCCGTGTGATTAGTCACGGCAATTTCCCTTTCTAGGATCAAATCGGTTGGTTGCTAGTAGTCCTTACCATGTCATGCCACAGAAATACCTGAAAAACAGGTCATTTGACGTTCAACAAAGACAGAACTGAAGTCCCATGCCATTGCCATTGGCATATTTTGAACTGCAGATTTCTCCAACATGCCAATTCATGGATGACCTACTACTCTATCATCCAGCTTGATTTTAGATGTCCTCCCTGGACATTGAGGCGATAGAATGTTGTGTCAAAGTCATACTGTCTCCCAGTTCTTCTTGCACTTGTACAGAATATGGCCACCCTTCCAATTTAGTTTTCTAGAAGTGATTTACAGGGTGTTGTGACAGGCGACTAGCTTCCAACAAATCGATTTAAAATTCAAGGCCGAGCCGACCGTTCTTTATTTTTCCTGCATTAAAGCTCTGGGTCCAGTTTCAGATTCTCATCGATAACGATTGCTACTTTAATTAATGCAGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGGTAAATATAAAATTCCATCCCATGCGGAACTAAGATTGTTTCCCCAATTCCCCCATCCTTCCTGTGCAGTTAAATCACGGACTAATTACTTGTGTCTTTGCAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAATCACGCGGGCTCTGCGGGCTCCGCAGTTGTCTTTGAAGGACTCTTTGGAACAAGCTGAAATCCGCAGTGATATATTATAAGCGCCATATGTTATGTTGAGATTCTTATGTCTGCAGCATGGAGTGATTTTAGTGGAACTTTACAATCATGATGAATAAAACATAAGGAATTGATGGCGATTTCTG

CDS sequence: >Eucgr.J02387.1[360 nucleotides] ATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAA

Transcript sequence: >Eucgr.J02387.1 [647 nucleotides] GCTCGACAAGATCCTCGGAATCGACGAGGAGCAAACAGCAGCAGCAGAAGAGGTTTCCAGCTGTCGCGAGGCGGCTAGTGTCGTGCAGTGCAGGGAGCGAGAATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAATCACGCGGGCTCTGCGGGCTCCGCAGTTGTCTTTGAAGGACTCTTTGGAACAAGCTGAAATCCGCAGTGATATATTATAAGCGCCATATGTTATGTTGAGATTCTTATGTCTGCAGCATGGAGTGATTTTAGTGGAACTTTACAATCATGATGAATAAAACATAAGGAATTGATGGCGATTTCTG

Protein sequence: >Eucgr.J02387.1.p [119 residues] MASSEEGQVIGCHTVGAWTEQIQKGNEPDQLVVVDFTASWCGPCRFIAPFLAELAKKFPAVLFLKVDVDELKQVAQEWAVEAMPTFIFVKGGKVVDKVVGAKKDDLQQTIGKHVATASA

20. Eucgr.K01294.1 Genomic Sequence >Chr11:16362073..16366652 [4580 nucleotides] GGGCAAGAAAATGTTTTGCGAGTTTTCAAACCGGCAAGGTTGACGGTTTCGAGAGGCTTGTCAATCGTAGGCAACGAACGTCGGTGGGGCCGTTTCTGGATTATCTTATGGGGAAAGTATCGAGCTCGACAAACCAAACTCGGCAACTACCCTTTCCTTTCGTCGGGTTAGCATCCGAATTCGTCAACCTGGGTCGCGTTGCTTGCTTCTGCAAAAGGCAAAAGCGAAAATCCCCACTTCCTTGCCGGAGTTTCCATCGCAACCCCACGAGGCGAATCGAACCGAGCACGCTCCATTTCGTCGAGTCCGTCCGTCCGTCCGTCCGGGTTGGTCTTGGCCAAGATTCGGAGGCTCGAGCGTCGCCCGAGTTCGCGGCTGCGGCAGTACCCGTCTTGAAATCCGACGCTTCGGCGACTCCGCTGCTGCTCCGCTGGTAGACCGGCTTGTGAGGGAACGAACCTCCCCGCGGTTTCTGGGTTTGTTTTTCTGCCGAGCGAGAAAGGGTTGTTTCGGTTGTCGTCAGGTGGGTCAGTCGTGCGTGCTCGCTAATGCTGAATCTTGAATTCCTTCGTTTTCGTTTCGAGTTCGTGTGGTGTGTCGGATGAGTCGTGGGGATTTGGAGTCTCGCGAGTGTGAAATTTTCATCGATTGTTGTGACTTCTCGAACGAGCCGAAGCAGGAGGTGATTGTTTTTGTATTCGCGTTCTTGATTGATATAGATAGCGAGCTCGTTTATCGCATTGTTAATCTGCGTTTTCCTTTTCTAGAGATTTTTTTATGGGGTTCGTGTCTTACTTTCTTGGGTGAAATCAGAGAGAGAAGTTTGTGAGGTTTTGAAAAAGAATATTCTTTGATGTGTGGAAAGCATTCAAGAGTATTCAAGAGTCAACTTAC

TATCCAAAAAAGATGAGATTTTTAATGCTCGACAGCATTTATGCTCCCCAACATCTACTTTTTGCTAAAATAAAGAGTGGGGGGGGGGCGGCGGTTTTTGGAATGATACATGATAGAACTTTGAAGAATCAGGACTTGACTTGAGCGGCCCCTCCAATTAGCAGGTTTTGCAAGTGTCAAAATGGTTTCGTCATTCGTAAAGCCGAGTTTACAGTTTCCATTTCAAGCATAATTGCCCTGTGAAGTTTCCAGGACCTTGAAAATGTGAGCTCAGATTAGAAACTATGAAATTTTCAATGTTTCAGCCTTGGAGGTTTCTCTAGGCAATGATCGCGCTAACTCTTTTCTTCGAATTGCTTTTGTTAAACTTGGTTTCCATGTTTGTTCGACGAGAACCACCCAAGTAGCTTAATGGATGCTTAAGAATCTTTACTCTGGCAAATGCTATACTTTTTGGGTGCCACAAGGAATTTGTTTCCTCTCACTTCCTCTCAGCTTAATCCAACTCCTTGGCATGCGCTTAAATGGTCTAGAATGCTCTAGTTTGTCTACCAATTTATTGAGGTGTCTAATTCATTTCCTTTGTATCTTATTGGTTTAATATGTAGCCTTGGATTCGATAATTATTTTTCTTTTTTATGTGTACTGATAGGTTTTCTGCTGCTTTGTTTGTCAGGGTCCTTTTGTGTCTTAAGTATTGCAACTCCATTCCTGATACATCATCATGGGACAGTGTTACCCAAAGGTAAGTTTTTCATGGGATTAGCTAAAACGATTGATGGAATGGAATCTAATTTAGTCACAAGTTTGGCTCTTCAATCTGGGAAAGTTATTAAACCTGTCATCACATTTTTCATGTGATATAATAGCATTTAAGTGAGAAGAAACCTTTTCTTTGTAGTTATCTAATATCATGCATGTAATCATATTGAATAGCAGTCAAATTTATCTATCATTGCTAACTACAAAGTAAAAACAAATCGAGGTTATATGCATTTGCCTGCTTAATCTGCGGGGTATGCACTCAGTTTAAAAGTCCATGTTCGTTAGGTGCTTTCTTGGTGCACCTTTGGAAGGCTGCCTGTTAAGCATCTGCTGATCAGCCGCGTGTAGCAAATTTTGTCCAAAATAGTGCATATTGAAAATACATGTCCTGGTTTCGCTACATGTGTGCTCGCATCGTGTTTACATGTTTTTTTTCCCTTGATGAACCTCGTATCAGCACACTGGGTGAGATGGGGGAAGGCAGGGTTGTGAGAAGTCGAACTCCTAGCCTGTGTAAAATTTGTGGGAATTTACTGACCTGATGAAACTAACATCGAAAAACTTCCCCACGGCAACATTAGTTGTGGTTTTAATGCGCCATTCAATCCATCAATTTCAACTATTTTATCCATCACCTTGCTTTTGAATGCATGGATGTGATTCTTCCAATGGAAATAATGGATACATAATCCTTCTGAAGGACTTGAATTGCCTGCAAAAGACAGCTGATAACTGTCGCTTTCAAACTGAGCATATGTCAAAGGCCTGAGGTGAAGAGAATGTACTATGGACAATTTCAGCGGATACCAGATGTCATGACACATGACCATTGGAAAATTTACTTTGTGAATTGAAACACTTTTTGGAATGATCACTATGGCCTTTCAATTTCATGGGAAAAATTTTGCCCTAAGCCAATGGCTGAATAGGTAATTCATAAAATCTCACTACAATCGAGATACTAGTAATGCAATGCGGACTTTAGCTCTTTGAACCACCACATAAAAAGGGAATGGTGGTCTGTGGGTTGTGCTGAATGGTTGACAACAGGATATTTACTGATCATCAACAGCCCTGGGTAATACTGGTTTTTCCGTAGCCACACACCTAAAGGTGCATTCATGATGTCATAACCTAATCTAGACTCGTGTCTTGCTTATTTCTAAAGCCCTTATCACATGTGCAATTCTTGTAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTAAGTACTCTGCAGCTGCTTTTAGAAGTGTTTCATGAGCAAAATTAACACAATGCTAATTAGTTTGATTTTTATGAGGTATGTTGGGAAAAGATTTTGTTTGAGCAATTGTCAAGCATCACATCAGCAGATCATTTTTTTTAGGTTGCAAATTTAACTTATAATTATTTGTATTAGGTAGCATGCCTAATTATGTCTTTCGGCATTTTCTCTTTTGGTTGAATATGCTCAAATAAGATGTTCTTTACTGCATCAGTTAGGCCCCAATTTTATGAACAGTCTCAGAGCTGTGCTTCTCGCATAAGAATACCATGGGAGACTAAATTGTATTTATCCGAATATTCTTGAATTTGCATTGGTTTCTAATTTAATTGGATTTCTGTGCAGGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGTAAGCAATGAAACCTACTTATTTGCCTTAATCCTTAATTCCAACCGCTTAGCCTAAACAACAAACACATGCTCATGCAGTCGTCTTCAAAGTTTTCTTCCACTTTAGCCCTTAAACTGAAAGCAGCAAGTGCACAAGTGTTCACAATACATGAAAAGTAAAACACAAATAAGGATAAGAAAGGCAAAGTACATTCCATTAGGGGTTATTGAAATTTAGTGGAATTTGCAGACAGGTCACTGATTTTGATTTCAGTCGGCCAATATACTAACTTTTCACTTTTTTGCAACTGATACGCTATGGCTGGAATGAAATCTATTTTCTGTCGAGCGCTATCGTCAATGCCCACATGGCAATTACATGGCATCTAGAAAATTGTCACATATCTGCCATGTCAGTACTTTGCCAAAAAATTGTTGGATTCCGGTCAGAGTACATATGTTGTAAAAACTCGAAAGGCTAGTGCATTTGGTGATCGAAGTTAAAAGTTCAATGATTTGATTGCCAGTTCCACCAAGTGATCCGTGATCTATTCATGCAGAAAAACAGGAGTCACATAGCATCGTGATCATCATATAGAACAATCGACAATGTTTGTTGTTCTTCTCCACTTTCCCGTGTAAAATGCATTGATGATTTTGAACTTATGCAGGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAGACACGAATTTGTAATCGGTTGTCAGTGTGCGCGCGTCTATTTGGATCCTCTGTGTATGTGTGTATTTGGGATCCTTTCTTCAGCAGGTGCAAGGGGACCCTTTTCTTTTGCTTTCTTTTTTTGTGATTATTCTGATTCCTACTCATGAAATTCTCTGCTCCTAAATCTTTTGGCTTGGGATGTGTTTTTGTATATATGAGTATGACCGCGTGCTATTCTGGAAAAAATGTTTGCATTGTGTTCAAAACGTTGGTTCTGGTGTAAAAGATGTCTAGTCCTCTGGTTGCCTCTATT

CDS sequence: >Eucgr.K01294.1 [414 nucleotides] ATGGGACAGTGTTACCCAAAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAG

Transcript sequence: >Eucgr.K01294.1 [1279 nucleotides] GGGCAAGAAAATGTTTTGCGAGTTTTCAAACCGGCAAGGTTGACGGTTTCGAGAGGCTTGTCAATCGTAGGCAACGAACGTCGGTGGGGCCGTTTCTGGATTATCTTATGGGGAAAGTATCGAGCTCGACAAACCAAACTCGGCAACTACCCTTTCCTTTCGTCGGGTTAGCATCCGAATTCGTCAACCTGGGTCGCGTTGCTTGCTTCTGCAAAAGGCAAAAGCGAAAATCCCCACTTCCTTGCCGGAGTTTCCATCGCAACCCCACGAGGCGAATCGAACCGAGCACGCTCCATTTCGTCGAGTCCGTCCGTCCGTCCGTCCGGGTTGGTCTTGGCCAAGATTCGGAGGCTCGAGCGTCGCCCGAGTTCGCGGCTGCGGCAGTACCCGTCTTGAAATCCGACGCTTCGGCGACTCCGCTGCTGCTCCGCTGGTAGACCGGCTTGTGAGGGAACGAACCTCCCCGCGGTTTCTGGGTTTGTTTTTCTGCCGAGCGAGAAAGGGTTGTTTCGGTTGTCGTCAGGGTCCTTTTGTGTCTTAAGTATTGCAACTCCATTCCTGATACATCATCATGGGACAGTGTTACCCAAAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAGACACGAATTTGTAATCGGTTGTCAGTGTGCGCGCGTCTATTTGGATCCTCTGTGTATGTGTGTATTTGGGATCCTTTCTTCAGCAGGTGCAAGGGGACCCTTTTCTTTTGCTTTCTTTTTTTGTGATTATTCTGATTCCTACTCATGAAATTCTCTGCTCCTAAATCTTTTGGCTTGGGATGTGTTTTTGTATATATGAGTATGACCGCGTGCTATTCTGGAAAAAATGTTTGCATTGTGTTCAAAACGTTGGTTCTGGTGTAAAAGATGTCTAGTCCTCTGGTTGCCTCTATT

Protein sequence: >Eucgr.K01294.1.p [137 residues] MGQCYPKNQMHGDDSDEHVEFAGGNVHIVTTKESWDQKLSEANKDGKIVLANFSATWCGPCKMMAPFYSELSEKHSSILFLVVDVDELTEMSTSWDIKATPTFFFLRDGQQIDKLVGANKPELQKKITAILDS

21. Eucgr.L01943.1 Genomic Sequence >scaffold_464:25131..26597 [1467 nucleotides] TGCATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGTAACGCCCAGGTCTTGTCTCGGAGTAATATGTGCAGGAGGACTTGAGTTTTAGCTCGTTACATTTGGATGGAATCCATTTTCGGCAGTTGGGAACCTATAGTTTAGACTTGGGATGTCATTGAGATCATTAGGTTTTTATACTCTTTTCTTCTTGTACATAAGCTTGTGACATAGTATATGTTGTGAACTGTTGTATATGAAATTTTTTCTTTTCGTGTCTAGCAAGATTAGAATATGTTTGCTTTTGCTTAGGGATGGGATTATGATTTTCATTAAAGCAACAAGCGATTTCCTCGACCACTTTGAAAGTTTTATTCCCGTTTGACGACTCCGTACTTTCTGCTGCATCTTGAATCTGCTTTGTTGGTGCTTCTCCTGAATGTTTGCTTTAGCATTAAAACTGCTACACAGTGGAAAACTTGGGAGTTCAGTCTTGATCTTTGGTGGAGCCGTTTCGAATTCTTTGGAAAGCAAGTGAAACTTCCAAAGTAGGACGCATAGTCGCTGAAATTTCTCAGCAGGCGCGATTATCTTTTCCCATTTGTGAGTTAGAATGTCTGTTGTTTTGGATGGTCTCGTGGCACTGAAAGTAACTTAGGCTGTTGATACTGGCACTCTAAGCTTTATAAGTTTGCATTCCAGCATCGATGTCTCTTTTGATATGTAGTTGGGGGGAGAAGAATATATGAAGTATTTTTGTGTTGCAAAGCTTGTCGTCTTGATCTTCCATCGAAGAGCAGAGGAGGCTTATTAGTCATGATTAGTCTGGCTAACCAATATGTTTATGCCAAGCCTTGCCTATGAGAAAACATCGTTCTTAAGGTTTGCTTTTCGTAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAGTAACGGCTTCTTGCCCCCCGACGGGGACGTCACTGTACATTTCGGTCTTCCTAAGATTTGTGGTCTGAGTCTGCCATGGTGTCGGCATTTGCGAGCATGTTGTTTGTGAATTTGTCTTGTGGTATATCGATCCGGTAAGTGTCAAATGTCTTAATGGTGGTTTACCACAAGTATTCATACCTTGGTCTTTGGAGTTTCATCGACAGCATTCATCCTGTGCACATCTCTGTTCTTTGCTGTTCGAGTTTTTAGACCATCTTGTCTAAGATAAATTGTTGACATTGAAGTGTTTCGTCCATTGTTAATTCGCGTCAACATGACAGAACAGGGTATATACTTGAATTCTGTATACGGTACAATCACTAGAAATTTGAACTGA

CDS sequence: >Eucgr.L01943.1 [246 nucleotides] ATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAG

Transcript sequence: >Eucgr.L01943.1 [628 nucleotides] TGCATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAGTAACGGCTTCTTGCCCCCCGACGGGGACGTCACTGTACATTTCGGTCTTCCTAAGATTTGTGGTCTGAGTCTGCCATGGTGTCGGCATTTGCGAGCATGTTGTTTGTGAATTTGTCTTGTGGTATATCGATCCGGTAAGTGTCAAATGTCTTAATGGTGGTTTACCACAAGTATTCATACCTTGGTCTTTGGAGTTTCATCGACAGCATTCATCCTGTGCACATCTCTGTTCTTTGCTGTTCGAGTTTTTAGACCATCTTGTCTAAGATAAATTGTTGACATTGAAGTGTTTCGTCCATTGTTAATTCGCGTCAACATGACAGAACAGGGTATATACTTGAATTCTGTATACGGTACAATCACTAGAAATTTGAACTGA

Protein sequence: >Eucgr.L01943.1.p [81 residues] MPSVAMNPFVRELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFRTSVA

22. Eucgr.L03049.1 Genomic Sequence >scaffold_1873:600..1564 [965 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGGTTCGTTTTTTTTTTGATACAGTCCTCTCTTGTTAGAGGAAATAGAAATTGTGGTGTACCAATATGAATATATATTATCGTATAATTGCATCCCCTTGCTAATCTACATCATTAATGAGATTATCATAGGTTTTGAGGAAATGAAAACTCTTAGAACTTTAGGGCAATCGTCGCCAACAAACTCATTCATAACCAACAATCACTAAAGCAGAACTTGTTAAATGCTTTAGCTTGAGCTTGGCATAAGCACATTGCAAATCTCTATAGTGCTGCAGTATAGGTAAAACTTCTCTGGAAAGCTCTTCATGGGCACATTCTGAAAATGGAAAAAATTGCGACCATAACTGGGGATCTGTCATATTCTGATGCAACCATACTTTGGGATCTCTTATATATTGTTCGTGTGCCAAGTATATGCACAAGTTTGCTGTAGAAAACGAGAAATCCTGGTTTTCTAAAGCAAATTTCAAAAGGTTAAGGCCATATCTTGCTTTCTGGGTCTGCATTTTGTTATGGATTAGAGGAACTGAGATGGTCACGACTCTAAAATTGGAAGAGTGATTCAGAAAGAGATATGTTTGAGCATTAACAGTTATTTCTTATTTTTGATGTAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA

CDS sequence: >Eucgr.L03049.1 [351 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA

Transcript sequence: >Eucgr.L03049.1 [351 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA

Protein sequence: >Eucgr.L03049.1.p [116 residues] MNDVMPKKLHKKVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL

ANEXO 3

Dados brutos de expressão genica

__________________________________________________________________________

Tabela 1: Expressão tecido específica da Eucgr A00783.1, Tiorredoxina H9.

GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE

Amostra de tecido Xilema imaturo 6.371

Amostra de tecido Folha madura 3.739

Amostra de tecido Floema 7.079

Amostra de tecido Shoot Tips 2.728

Amostra de tecido Xilema 0.863 Baixa Baixa

Amostra de tecido Folha jovens 4.641

Tabela 2: Expressão tecido específica da Eucgr A01813.1, Tiorredoxina M2.

Amostra de tecido Shoot Tips 35.095 Alta

Amostra de tecido Xilema 13.384 Baixa

Amostra de tecido Folha jovens 55.375 Alta Alta

Tabela 3: Expressão tecido específica da Eucgr B01424.1, Tiorredoxina F.

Amostra de tecido Folha madura 0 Sem expressão Sem expressão

Amostra de tecido Shoot Tips 0.106 Baixa

Amostra de tecido Xilema 0.039 Baixa Baixa

Tabela 4: Expressão tecido específica da B02586.1, Tiorredoxina H7.

Amostra de tecido Xilema imaturo 0 Sem expressão Sem expressão

Amostra de tecido Floema 0 Sem expressão Sem expressão

Amostra de tecido Xilema 0 Sem expressão Sem expressão

Tabela 5: Expressão tecido específica da Eucgr D00028.1, Tiorredoxina O1.

Amostra de tecido Xilema imaturo 0.254 Baixa Baixa

Amostra de tecido Floema 16.915 Alta

Amostra de tecido Folha jovens 0.506 Baixa

Tabela 6: Expressão tecido específica da Eucgr D00853.1 Tiorredoxina CXXS1.

Amostra de tecido Xilema 123.363 Alta

Tabela 7: Expressão tecido específica da Eucgr. F01604.1, Tiorredoxina H2.

Amostra de tecido Xilema imaturo 28.017 Baixa Alta

Amostra de tecido Folha madura 408.017 Alta

Amostra de tecido Xilema 97.793 Baixa Alta

Amostra de tecido Folha jovens 690.95 Alta Alta

Tabela 8: Expressão tecido específica da Eucgr F01854.1, Tiorredoxina H1.

Amostra de tecido Folha jovens 370.373 Alta

Tabela 9: Expressão tecido específica da Eucgr F02754.1, Tiorredoxina M2.

Amostra de tecido Folha madura 75.657 Alta Alta

Tabela 10:Expressão tecido específica da Eucgr F03319.1.1, Tiorredoxina M4.

Amostra de tecido Xilema imaturo 2.316 Baixa

Amostra de tecido Xilema 6.313

Tabela 11: Expressão tecido específica da Eucgr F04223.1, Tiorredoxina y1.

Amostra de tecido Xilema imaturo 95.319 Alta Alta

Tabela 12: Expressão tecido específica da Eucgr F04229.1, Tiorredoxina Y1.

Amostra de tecido Xilema imaturo 73.044 Alta

Amostra de tecido Shoot Tips 31.742 Baixa Alta

Amostra de tecido Folha jovens 35.01 Baixa Alta

Tabela 13: Expressão tecido específica da Eucgr G03224.1 Tiorredoxina.

Amostra de tecido Xilema imaturo 0.824 Baixa

Tabela 14: Expressão tecido específica da Eucgr H01629.1,tiorredoxina F1.

Amostra de tecido Xilema imaturo 0.306 Baixa Baixa

Tabela 15: Expressão tecido específica daEucgr I01912.1,tiorredoxinaH2.

Amostra de tecido Folha madura 7.778 Baixa

Amostra de tecido Xilema 89.051 Alta Alta

Tabela 16: Expressão tecido específica da Eucgr I01913.1, tiorredoxina H2.

Amostra de tecido Folha madura 49.491 Baixa Alta

Amostra de tecido Floema 163.183 Alta Alta

Tabela 17: Expressão tecido específica da Eucgr I02383.1, tiorredoxina H.

Amostra de tecido Folha madura 18.047 Baixa

Tabela 18: Expressão tecido específica da Eucgr J00880.1 tiorredoxina X.

Tabela 19: Expressão tecido específica da Eucgr J02387.1 tiorredoxina H1.

Tabela 20: Expressão tecido específica da Eucgr K01294.1 tiorredoxina H9.

Tabela 21: Expressão tecido específica da Eucgr L01943.1 Tiorredoxina.

Amostra de tecido Xilema 140.246 Alta Alta

Tabela 22: Expressão tecido específica da Eucgr L03049.1 Tiorredoxina.

Amostra de tecido Floema 1.849 Baixa

Amostra de tecido Xilema 2.442

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO … · Genomas de árvores tem sido...

Documents

Transcript of MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DO RIO … · Genomas de árvores tem sido...

Ricardo Mateus Sistema de informação de armazenamento e … · Atualmente existem já centenas de genomas sequenciados e com o aparecimento de novas técnicas de sequenciação

Montagem e análise de genomas a partir de metagenomaseach.uspnet.usp.br/digiampietri/bibtex/2014_MonografiaVivian... · das de modo a identiﬁcar a similaridade entre os genomas

Montagem e análise de genomas a partir de metagenomas

Relatório de publicações - Centro de Genomas

Metodologias para Construção de Genomas

Genes y Genomas · Genes y Genomas ¿Qu ées un gen y como se organiza su estructura? Dogma central de la Biolog ía ... Operones organización que lleva la información de varios

Estrutura e Evolução dos Genomas Embrapa

UNIVERSIDADE FEDERAL DE OURO PRETO Programa de Pos …‡ÃO... · nu´mero de genomas sequenciados (escala da esquerda), bem como na capacidade de produ¸ca˜o de dados de bases

RICARDO DE NARDI FONOFF - teses.usp.br · 4.3.1 limpeza e montagem dos contigs das sequÊncias resultantes das pontas dos bacs sequenciados..... 73 4.3.2 limpeza e montagem dos contigs

Análise do pangenoma de Streptococcus pneumoniae e ... · ados e anotados dispon veis no GenBank e 49 genomas sequenciados pela Unidade de Microbiologia Molecular e Infe˘c~ao. Estes

Genes y genomas. • Estructura del genoma eucariota ... · Los genomas varían en tamaño, número de genes, y densidad genética • El genoma de las bacterias y archaeas varian

GENOMAS - cbsflab.comcbsflab.com/wp-content/uploads/2017/03/genomas-parte-1.pdf · O número total de genes é conhecido para algumas espécies Em eucariotos parece não existir uma

15/02/200116/02/2001 GENOMA HUMANO Projetos Genomas.

Organização Gênica dos Seres Vivos Genes e Genomas de Procariotos e Eucariotos Prof. Henrique Santana Costa, M.Sc.

Análise de genomas e transcriptomas Prof. Dr. Francisco Prosdocimi.

Rearranjo de Genomas: Uma Coletânea de Artigos Zanoni Dias Orientador: João Meidanis

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO … · obtidos diretamente do GenBank (dados públicos dos genomas sequenciados das espécies). x LISTA DE TABELAS Tabela 1. 4 Apresentação

Ancoragem de genomas incompletos em genomas completos€¦ · Ancoragem de genomas incompletos em genomas completos Andr¶e Chastel Lima Disserta»c~ao de Mestrado Orienta»c~ao:

KEGG: Enciclopédia de Genes e Genomas de Kyoto Talles Eduardo Ferreira Maciel Orientadora: Juliana Lopes R. Fietto.

GENOMAS Prof. José Ferreira dos Santos Depto. de Genética UFPE.