Post on 13-Aug-2020
MINISTÉRIO DA EDUCAÇÃO
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
PRÓ-REITORIA DE PÓS-GRADUAÇÃO
UNIDADE ACADÊMICA ESPECIALIZADA EM CIÊNCIAS AGRÁRIAS - UAECIA
ESCOLA AGRÍCOLA DE JUNDIAÍ - EAJ
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIAS FLORESTAIS
CARACTERIZAÇÃO ESTRUTURAL E FUNCIONAL DOS GENES DE TIORREDOXINA EM
Eucalyptus grandis
VITÓRIA RÉGIA ALVES CAVALCANTE
Macaíba/RN
Janeiro de 2019
ii
VITÓRIA RÉGIA ALVES CAVALCANTE
CARACTERIZAÇÃO ESTRUTURAL E FUNCIONAL DOS GENES DE TIORREDOXINA EM
Eucalyptus grandis
Dissertação de Mestrado apresentada ao Programa de
Pós-Graduação em Ciências Florestais da
Universidade Federal do Rio Grande do Norte, como
parte das exigências para obtenção do título de Mestre
em Ciências Florestais (Área de Concentração em
Ciências Florestais - Linha de Pesquisa:
Biodiversidade, Conservação E Uso Dos Recursos
Genéticos Florestais).
Orientador:
Prof. Dr. Paulo Sérgio Marinho Lúcio
Macaíba/RN
Janeiro de 2019
iii
Universidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Catalogação de Publicação na Fonte. UFRN - Biblioteca Central Zila Mamede
Bezerra, Vitória Régia Alves Cavalcante.
Caracterização estrutural e funcional dos genes de Tiorredoxinas
em Eucalyptus grandis / Vitória Régia Alves Cavalcante Bezerra. -
2019.
70 f.: il.
Dissertação (mestrado) - Universidade Federal do Rio Grande do
Norte, Unidade Especializada em Ciências Agrárias, Programa de Pós-
Graduação em Ciências Florestais. Macaíba, RN, 2019.
Orientador: Prof. Dr. Paulo Sérgio Marinho Lúcio.
1. Eucalipto - Dissertação. 2. Análise in silico - Dissertação.
3. Genoma de árvore - Dissertação. I. Lúcio, Paulo Sérgio Marinho.
II. Título.
RN/UF/BCZM CDU 528.776
Elaborado por Ana Cristina Cavalcanti Tinôco - CRB-15/262
iv
CARACTERIZAÇÃO ESTRUTURAL E FUNCIONAL DOS GENES DE TIORREDOXINA EM
Eucalyptus grandis
VITÓRIA RÉGIA ALVES CAVALCANTE
Dissertação julgada para obtenção do título de Mestre em Ciências Florestais (Área
de Concentração em Ciências Florestais - Linha de Pesquisa: BIODIVERSIDADE,
CONSERVAÇÃO E USO DOS RECURSOS GENÉTICOS FLORESTAIS).
Banca Examinadora
________________________________________________
Prof. Dr. Paulo Sérgio Marinho Lúcio
UAECIA/UFRN
________________________________________________
Prof. Carlos Alfredo Galindo Blaha
DBG/UFRN
Examinador interno
________________________________________________
Prof. Dr. Glauber Henrique de Sousa Nunes
PPGFITO/UFERSA
Examinador externo ao programa
Natal/RN
Janeiro de 2019
v
AGRADECIMENTOS __________________________________________________________________________
Agradeço,
À Deus primeiramente por ter colocado essa oportunidade em minha vida em uma
época que eu não esperava mas que foi o período que eu mais precisava.
Ao professor Dr Paulo Marinho, professor e amigo que fez o convite para que eu
embarcasse com ele nessa nova jornada. Por acreditar no meu potencial e por ser muito mais
que um orientador.
À minha filha Maria Eduarda que apesar da minha ausência em alguns momentos
soube compreender de uma forma única que só ela sabe demostrar e derreter meu coração.
Aos meus pais Lenildo e Ivani que são meu alicerce e meu porto seguro. Sempre estão
ao meu lado apesar da distância geográfica mas me apoiam, acreditam em mim e fazem o
possível para me ver bem e feliz.
Aos meus amigos do mestrado que contribuíram com apoio e ajuda mútua ao longo
desses 2 anos. Às minhas melhores amigas que torcem pelo meu sucesso
À todos os professores que contribuíram com seus conhecimentos durante o
mestrado.
À Capes e Fapern pela ajuda financeira.
Ao núcleo de processamento de alto desempenho (NPAD) da UFRN por disponibilizar
os recursos necessários para a realização das análises de bioinformática.
À Abidã, Isabel, Matheus alunos de graduação de Engenharia Florestal e João aluno
de graduação de Ciências Biológicas pela ajuda realizando e acompanhando cada passo no
laboratório.
À Fabiana colega de mestrado e de laboratório que se disponibilizou a ir a campo fazer
as coletas.
À Diego, doutorando da bioquímica, pelo tempo disponilizado e a ajuda fornecida.
À Thiago Guimarães, que chegou na reta final, mas que teve uma importância
relevante demostrando compreensão nos momentos em que não estive presente e
companheirismo. Além da paciência nos momentos de estresse.
E por último mas não menos importante apesar de todo o desenrolar da minha vida ao
longo desses 2 anos, agradeço à meu ex marido que me incentivou a estudar e fazer a
seleção. E a minha ex sogra Luzia que toda vez que foi necessário se disponibilizou a ficar
com minha filha para que eu conseguisse cumprir as exigências do mestrado a cada semestre.
vi
RESUMO
_______________________________________________________________________
Genomas de árvores tem sido sequenciados nos últimos dez anos e constituem
uma fonte de informação de base para o estudo de famílias multigências em
plantas. A genômica comparativa, uma vez disponibilizadas as sequências
completas dos genomas em bancos públicos, é uma ferramenta potente para
progredir com o estudo da caracterização funcional de genes. Neste trabalho, o
interesse se concentra nos genes que codificam Tiorredoxinas (Trxs) e considera
a diversidade, estrutura e expressão desses genes no genoma de Eucalyptus
grandis. Para tanto, ferramentas de bioinformática em plataformas de domínio
público (Phytozome; Eucgenie; NCBI; PREDOTAR) foram utilizadas para
identif icar as sequências codantes e validar dados, e programas específ icos
(MEGA7, BEAST3) foram empregados para caracterizar a estrutura e expressão
in silico dos genes. Ensaios de RT-PCR foram realizados para 4 genes de
tiorredoxinas citoplasmáticas a partir de tecidos de folha, f loema, xilema,
meristema apical e plântulas para confirmar a expressão observada in silico.
Foram identif icadas 22 Trxs com sítio ativo com motivo característico
confirmando a existência de todos os representantes dos três principais grupos
ja definidos em plantas, plastidiais (m, f, x, y, z) citop lasmáticas (h), e
mitocondriais (o) no genoma do eucalipto. Observou-se, no entando, diferenças
quanto ao número de genes por grupos em comparação com outros genomas de
árvores já feitos como o de Populus trichocarpa e Vitis vinifera. A expressão
desses genes de tiorredoxina mostrou-se, para alguns genes homólogos,
divergente do que fora observado em Arabidopis thaliana sugerindo uma
especificidade de função em eucalipto, a exemplo do gene Eucgr.F01604 que
codifica uma Trx citoplasmática h1 com forte expressão em tecidos condutores.
As análises por RT-PCR reforçam o que fora visto com as ferramentas da
Bioinformática e a abordagem aqui empregada envolvendo a análise estrutural e
funcional através do perfi l da expressão gênica contribui significativamente para
progredir na elucidação da função das Trxs em plantas, sobretudo em genomas
de árvores.
Palavras-chave: bioinfomática, análises in silco, genoma de árvore.
vii
ABSTRACT
__________________________________________________________________________
Tree genomes have been sequenced over the last ten years and constitute basic information
for plant gene characterization. Comparative genomics once complete genome sequences are
made available in public data is a powerful tool to enabe progress within the study of gen
function. In this work the interest is concentrated in the genes coding for thioredoxins and
considers the diversity, structure and expression of these genes in the genome of Eucalyptus
grandis. Bioinformatics tools on public domain platforms (Phytosome; Eucgenie.org; NCBI;
PREDOTAR) have been used to identify the coding sequences and to validate data and
specific softwares (MEGA7, BEAST3) were employed to characterize the structure and in silico
expression of the genes. RT-PCR assays were performed for 6 cytoplasmic thioredoxin genes
from leaf tissue, phloem, xylem and apical meristem to confirm the expression observed in
silico. Twenty-one thioredoxins with a characteristic active site were identified, confirming the
existence of all three major groups already defined in cytoplasmic (h), mitochondrial (m, f, x,
y, z) and cytidine plants in the eucalyptus genome. Differences in the number of genes per
group were observed in comparison with other genomes of already grown trees such as
Populus trichocarpa and Vitis vinifera. The expression of these thioredoxin genes was shown
to be divergent for some genes observed in A. thaliana, suggesting a function specificity in
eucalyptus, such as the Eucgr.F01604 gene coding for a h1 cytoplasmic Trx with strong
expression in conducting tissues. RT-PCR analysis validate Bioinformatics and the approach
employed here involving structural and functional analysis through the profile of the gene
expression contributed significantly to progress in elucidating the function of Trxs in plants,
especially in tree genomes.
Keywords: bioinformatics, in silico analysis, tree genomes.
viii
SUMÁRIO
__________________________________________________________________________
Página
1.0 INTRODUÇÃO ................................................................................................................ 1
2.0 REVISÃO DE LITERATURA ........................................................................................... 3
2.1. Sistema Tiorredoxina .................................................................................................. 3
2.2. Tiorredoxinas em genoma de árvores ........................................................................ 8
2.3. Tiorredoxinas do eucalipto ........................................................................................ 10
2.4 Tiorredoxinas e interesse biotecnológico .................................................................. 11
3.0 MATERIAL E MÉTODOS .............................................................................................. 13
3.1 Análise in silico..............................................................................................................13
3.2 Ensaio de RT- PCR.......................................................................................................14
4.0 RESULTADOS E DISCUSSÃO ..................................................................................... 16
4.1. Sistema Tiorredoxina...................................................................................................16
4.2. Tiorredoxinas em genoma de árvores ...................................................................... 19
4.3. Tiorredoxinas do eucalipto ........................................................................................ 20
4.4 Tiorredoxinas e interesse biotecnológico .................................................................. 23
4.5 Tiorredoxinas e interesse biotecnológico .................................................................. 26
6.0 CONCLUSÕES ............................................................................................................. 28
7.0 LITERATURA CITADA .................................................................................................. 29
ANEXO 1 Sequências de Tiorredoxinas das cinco espécies de plantas (Eucalyptus grandis,
Jatropha curcas, Populus trichocarpa, Vitis vinifera, Arabdopsis thaliana usadas para a
construção de árvores filogenéticas. ................................................................................... 37
ANEXO 2 Seqûencias genômicas, gênicas, codantes e protéicas ....................................... 44
ANEXO 3 Tabela com dados brutos da expressão gênica retiradas do Phytozome ............. 65
ix
LISTA DE FIGURAS __________________________________________________________________________
Figura 1. Alinhamento peptídico parcial com sequência de tiorredoxinas típicas de Eucalyptus
grandis ................................................................................................................................. 20
Figura 2. Árvore filogenética evidenciando os diferentes grupos de tiorredoxinas em cinco
espécies de plantas. ............................................................................................................ 22
Figura 3. Mapa de expressão dos transcritos de tiorredoxinas típicas de Eucalyptus
grandis....................................................................................................................................25
Figura 4. Expressão gênica por RT-PCR semi-quantitativa em tecidos de E.
grandis....................................................................................................................................26
Figura 5. Análise de co-expressão dos genes de Trxs evidenciando as dez vias mais
relevantes...............................................................................................................................27
x
LISTA DE TABELAS __________________________________________________________________________
Tabela 1. Sequências dos primers obtidos com software Primer 3 e utilizados nas
amplificações das tiorredoxinas citoplasmáticas....................................................................15
Tabela 2. Tiorredexina típicas de Eucalyptus grandis na plataforma Phytozome
................................................................................................................................................17
Tabela 3. Diversidade numérica de Tiorredoxina típicas em cima espécias
vegetais..................................................................................................................................19
xi
LISTA DE ABREVIATURAS __________________________________________________________________________
A: Alanina
ATP: Adenosina trifosfato
AGPase : enzima ADPGcl pirofosforilase
AtACHTs: tiorredoxinas atípicas Cys His – rich
C: isteína
cDNA: DNA complementar
CITRX: Cf-9 tiorredoxina interação
DNA: ácido desoxirribonucléico
EST: marcador de sequência genética expressa
FBPase: Frutose 2,6 - bifosfato
Fdx: ferredoxina
FOREST: Eucalyptus spp EST Project
FPKM: quilo base de exóns por milhões de reads mapeados
FTR: ferredoxina tiorredoxina redutase
G: glicina
GFP: proteína verde fluorescente
H2O2: peróxido de hidrogênio
KDa – quilo Dalton
Ids: sistema de detecção de intrusão
K: Lisina
KEGG: Encicopledia de genes e genomas de Kioto
FLN: Flightin
MDH – Malato desidrogenase
NADP – Dinucleotídeo de nicotinamida e adenina
NADPH – Dinucleotídeo de nicotinamida e adenina fosfato
NCBI – Centro Nacional de Informação e Biotecnologia
Nrx: Nucleorredoxina
NTR – tiorredoxina redutase dependente de NADPH
O2: oxigênio
OH: hidroxila
P: Prolina
PCR: reação em cadeia da polimerase
PFAM: banco de dados de família e proteínas
PKC: proteína kinase interating cousin
xii
PPI: Protein-Protein interacion network
PRX: Peroxirredoxina
TCA: ácido tricarboxílico
TDNA: DNA de transferência
Trx: Tiorredoxinas
TrxH: Tiorredoxina heterotrófica
Trxs-like: Tiorredoxinas similares
R: Arginina
RNA: ácido ribonucléico
RNR: ribonucleótideos redutase
ROS: espécie reativa de oxigênio
RT – PCR: reação da transcriptase resversa seguida de reação em cadeia da polimerase
S: Serina
S-S: Ponte dissulfeto
S-H: Sulfridílico
W: triptofano
Y: Tirosina
1
1. INTRODUÇÃO
________________________________________________________________________
Tiorredoxinas (Trxs) são enzimas ubíquas, presentes em todos os organismos, e
responsáveis, principalmente, pela manutenção do estado redox nas células. Eles foram
descobertas inicialmente em Escherichia coli (LAURENT et al., 1964; HOLMGREN et al., 1985)
como doadores de hidrogênio para a Redutase de Nucleotídeos (RNR), importante enzima que
participa da síntese de nucleotídeos indispensáveis à replicação do DNA. Essas pequenas
proteínas, com cerca de 14kDa, possuem um sítio ativo característico e com motivo WCGPC
preservado e foram caracterizadas como agentes redutores por reações redox abrindo as
pontes dissulfeto de outras proteínas. No mecanismo de reação o ditiol, presente no sítio
protuberante das Trxs graças as suas duas cisteínas presentes, convertem o dissulfeto (S-S)
em sulfidrilo (SH). Esta função foi então sendo esclarecida e expandida para inúmeras
proteínas alvo a medida que outras Trxs foram sendo estudadas em outros organismos o que
levou à caracterização de muitos dos seus alvos específicos. Elas foram então caracterizadas
como agentes pós-traducionais que modificam e regulam a atividade de fatores de transcrição,
proteínas de replicação viral, bem como de proteínas envolvidas com a mobilização de reserva
em sementes (MEYER et al., 2012).
Em plantas, as Trxs foram inicialmente estudadas e identificadas como proteínas
ativadoras de duas enzimas importantes do ciclo de Calvin-Benson, FBPase-Fructose 1,6-
bisfosfatase (GÜTLE et al., 2016) e MDH-malato desidrogenase (JACQUOT & BUCHANAN,
1981). Neste sistema, as Trxs f e m, assim denominadas, são elas mesmas reduzidas pela
FTR-Ferredoxina tiorredoxina redutase dependente de FDX (WOLOSIUK & BUCHANAN,
1977; BUCHANAN et al., 2002), constituindo o primeiro sistema tiorredoxina descrito. A
complexidade e abundância de Trxs em plantas se revelou surpreendente à medida que
projetos de sequênciamento sistemático de genomas foram sendo feitos. Neste contexto,
sobretudo com o genoma de Arabidopsis thaliana, revelou-se uma diversidade de Trxs
surpreendente sendo elas então classificadas em função de sua localização na célula como
cloroplásticas, citoplasmáticas (REICHHELD et al., 2002) , mitocondriais (LALOI et al., 2001)
e, mais recentemente, nucleares (SERRATO et al., 2013). Para estes três últimos tipos os
agentes redutores das Trxs, são as Tiorredoxinas Redutases dependentes de NADPH (NTR)
constituindo o segundo sistema completo (JACQUOT et al., 1994). Nos cloroplastos, foram
ainda identificadas outras Trxs chamadas x (BERNAL-BAYARD et al., 2014) y, z (ARSOVA et
al., 2010; CHIBANI, 2011), e as consideradas atípicas CDSP32, Lillium (CAIN et al., 2009),
Picot (ISAKOV et al., 2000), Clot (MEYER et al., 2009), HCF164 e CITRX (RIVAS et al., 2004).
No citoplasma, foram descobertas as Trxs denominadas h (heterotrófico), mais próximas
evolutivamente às Trxs animais.
2
A partir do momento que outros genomas de plantas foram sendo publicados, e eles
são mais de 100 atualmente (MICHAEL & JACKSON, 2013), uma grande quantidade de dados
e de sequências nucleotídicas tornou-se disponível.
O objetivo geral deste trabalho é caracterizar de forma estrutural e funcional os genes
que codificam as tiorredoxinas em eucalipto. Especificamente, pretende-se identificar os
genes e sequências protéicas disponibilizadas com o projeto de sequenciamento do genoma
do Eucalyptus grandis, recentemente publicado por Myburg et al (2014). Validar os dados
obtidos com o primeiro transcriptoma da planta realizado no Brasil pelo projeto FORESTs –
Eucalyptus Genome Sequencing Project Consortium (VICENTINI et al., 2005) e realizar uma
análise com enfoque em genômica comparativa das Trxs presentes no genoma de árvores
cujos dados já estão disponíveis, bem como, quantificar a expressão gênica in silico e
confirmar a expressão de genes de Trx h com maior potencial tecido específicos por ensaios
de RT-PCR. Obtendo -se assim um amplo repertório estrutural e de diversidade de genes em
eucalipto.
3
2. REVISÃO DE LITERATURA
__________________________________________________________________________
2.1. SistemaTiorredoxina
Tiorredoxinas são enzimas envolvidas na manutenção do estado redox nas células e
presentes em todos os organismos. Elas foram identificadas inicialmente a partir de extratos
da bactéria Escherichia coli (LAURENT et al., 1964; HOLMGREN, 1985) em experimentos
com abordagem em bioquímica clássica, purificação e realização testes enzimáticos, como
sendo doadoras de átomos de hidrogênio para a enzima Redutase de Nucleotídeos (RNR),
uma enzima chave da síntese de nucleotídeos. Esta atividade enzimática foi em seguida
caracterizada pela presença de duas cisteínas no sítio ativo característico CXXC onde, nele,
o par de cisteínas forma um ditiol e é responsável pela quebra de pontes dissulfeto de uma
vasta quantidade de proteínas alvo.
São enzimas de baixo peso molecular, 14 kDa aproximadamente, e definidas como
redutoras em contraponto às enzimas Dissulfeto Isomerases que são agentes oxidantes
(HOLMGREN, 1985). Quando em estado reduzido, este sítio ativo e protuberante encontra-
se em estado conformacional pronto a doar hidrogênios a proteínas portadoras de pontes
dissulfeto ativando-as (MEYER et al., 2009). A reação ocorre pela abertura das pontes
dissulfeto alvo com o ataque da ponte dissulfeto pela porção N-terminal da primeira cisteína
do sítio liberando um tiol livre e formando uma ponte dissulfeto com a segunda cisteína do
alvo. Então, a porção C-terminal do sítio CXXC quebra a ponte dissulfeto da proteína alvo
reduzindo-a. Este sítio catalítico, composto em muitas Trxs por sequências consenso de
aminoácidos WCGPC, mostrou-se ser altamente conservado nas demais Trxs purificadas em
seguida a esses experimentos iniciais. Ele constitui o principal motivo peptídico de
identificação dessas proteínas nas plataformas digitais de análise de sequências genômicas
tais como PROSITE (SIGRIST et al., 2012), entre muitos outros.
Ao longo dos últimos 40 anos, inúmeras tiorredoxinas e genes que as codificam foram
estudadas. Em diferentes abordagens, bioquímicas e genéticas, essas proteínas tiveram suas
atividades enzimáticas estabelecidas e o que se chamou de sistema tiorredoxina foi sendo
caracterizado. Neste sistema, responsável pela redução das diferentes Trxs, foram primeiro
identificadas as proteínas redutoras de Trxs tanto em tecidos fotossintetizantes, nos
cloroplastos, quanto em tecidos heterotróficos, no citoplasma. E observou-se que, em plantas,
os sistemas e a diversidade de Trxs é surpreendentemente mais complexo do que nos demais
organismos não fotossintetizantes (GEIGENBERGER et al., 2017).
Em vegetais foi caracterizado inicialmente o sistema tiorredoxina que envolve uma
Ferredoxina Tiorredoxina Redutase - FTR (WOLOSIUK & BUCHANAN, 1977; BUCHANAN et
4
al., 2002; JACQUOT et al., 2009) como ativadora de dois tipos de Trxs, f e m, enzimas assim
denominadas por ativarem respectivamente duas enzimas presentes nas reações da
fotossíntese, a FBPase-Frutose 1,6 bifosfatase (GÜTLE et al., 2017) e a MDH – Malato
desidrogenase (JACQUOT & BUCHANAN, 1981). Com o sequênciamento do genoma de
Arabidopsis, também foram identificadas nos plastídios além das m e f já citadas, as Trxs x,
y, CDSP32 e Lilium totalizando 6 tipos contendo respectivamente 4, 2, 1, 2, 1, e 5 membros
(MEYER et al., 2009). Estas são então reduzidas pelo denominado sistema Fdx/Trx em que
atua a Ferredoxina Tiorredoxina Redutase - FTR.
A diversidade e complexidade de Trxs nos cloroplastos é relevante. Neste
compartimento celular ocorre a fotossíntese e a manutenção do estado redox é de
fundamental importância porque ocorre a geração de espécies reativas de oxigênio ROS (O2,
O−2O2−,H2O2, e OH). Uma das respostas mais comuns a estes compostos é formação de
pontes dissulfeto. As Trxs, como descrito, são portadoras de duas cisteínas no seu sítio ativo
e formam um ditiol que quebra pontes dissulfeto de outras proteínas num mecanismo de
sinalização redox. A disponibilidade de mutantes de inserção bem como a utilização de
plataformas de proteômica levaram a uma precisão melhor na caracterização funcional das
tiorredoxinas do cloroplasto além de indicar fortemente a atuação dessas proteínas também
em tecidos heterotróficos como a raiz. As Trxs m e f foram as primeiras a serem estudadas e,
portanto, há mais informações sobre elas do que as recentes x, y e z.
Em Arabidopsis thaliana existem 4 Trx m e 2 Trx f. Ocorre aqui uma divisão de trabalho
quanto a atividade enzimática (SERRATO et al., 2013). A função dessas Trxs in vivo vem
sendo esclarecida mais recentemente (GEIGENBERGER et al., 2017). O uso de mutantes de
inserção de Arabidopsis que tem seus genes que codificam as Trxs f1 e f2, mutantes únicos
ou duplos para os dois genes, mostraram um relação direta entre esses genes e a síntese de
açúcares por ativação da enzima ADPGcl pirofosforilase (AGPase). Ainda, que a f1 age em
sincronia com a TRX atípica ACHT4 que inativa a AGPase pela oxidação de suas cisteínas
regulatórias. Já as do tipo m apresentam comportamento funcional mais diverso. Elas
correspondem a 70% das Trxs do cloroplasto sendo que m1, m2 e m4 se acumulam nas
mesmas proporções enquanto que m3 é menos abundante. A Trx m3 está relacionada ao
transporte intercelular e manutenção do meristema, m4 tem função regulatória no ciclo de
transporte de elétrons durante a fotossíntese. Mutantes para m1 e m2 não mostraram
alterações quanto à fotossíntese ou crescimento em condições de luz normais. No entanto,
os parâmetros fotossintéticos foram alterados em condições de luz flutuante nestes mutantes
devido a inabilidade dessas enzimas em atuarem sobre a Malato desidrogenase.
As Trxs do tipo x foram descritas pela primeira vez em 2003 por Colin et al (2003).
durante o sequênciamento de Arabidopsis thaliana. Trata-se de uma Trx cloroplástica, de
origem procariota, que foi identificada e para qual foram produzidas proteínas recombinantes
5
e plantas transgênicas com genes de fusão com a GFP. Observou-se que sua ação
enzimática é insuficiente para ativar a FBPase ou a MDH. Sua localização celular no
cloroplasto foi confirmada pela observação da expressão das proteínas de fusão com genes
do tipo repórter. A Trx x foi capaz, no entanto, de ativar uma 2 Cys peroxirredoxina (Prx) o
que associou esta Trx x a uma atividade à resposta ao estresse oxidativo, já que esta Prx tem
esta função. Os mutantes para Trx x realizam fotossíntese normalmente e a fixação de
carbono não foi alterada (BERNAL-BAYAL et al., 2014).
Em 2010, foi identificada a Trx z em dois trabalhos independentes (ARSOVA et al.,
2010; MENG et al., 2010). Presente no cloroplasto, ela se distingue das demais tanto pela
estrutura quanto pela função. No trabalho do grupo de Arsova, observou-se, em mutantes
“knockout” de Arabidopsis thaliana para este gene, um fenótipo albino severo além de
apresentarem uma inibição no crescimento de seus cloroplastos. Neste mutante, outros genes
dependentes da ação da RNA polimerase PEP também tiveram sua expressão diminuída.
Foram então identificadas duas proteínas alvo da Trx z neste contexto, FLN1 e FLN2, que
constituem na verdade membros da família de pfkB-carboidrato quinase e que apresentam
resíduos de sisteínas mediando a interação Trx z - FLN. Igualmente, observou-se que o
estado redox de FLN2 é alterado pela ação da Trx z. Concluiu-se então que esta tiorredoxina
tem uma função diretamente ligada a FLN bem como ao funcionamento da regulação da RNA
polimerase PEP no cloroplasto. O gene AT3G06730 que codifica esta proteína em
Arabidopsis thaliana encontra-se no cromossomo 3 e contém 4 éxons. A proteína apresenta
o sítio ativo típico WCGPC e tem expressão gênica em 22 estruturas da planta e em 13 fases
de desenvolvimento. Recentemente, Díaz et al (2018) demonstraram que a proteína PRIN2,
que apresenta uma regulação do tipo redox, é indispensável ao funcionamento da RNA
polimerase PEP e depende da ação da Trx z para ser reduzida e por conseguinte funcional.
As Trxs do tipo z foram identificadas no genoma de Populus trichocarpa onde exercem além
da função reguladora da transcrição nos cloroplastos, também uma função na resposta ao
estresse oxidativo (CHIBANI et al., 2011).
Em compartimentos celulares não fotossintetizantes foram caracterizadas as Trxs dos
tipos h no citoplasma (JACQUOT et al., 1994; REICHHELD et al., 2002; NIKKANEN et al.,
2014). Em A. thaliana 10 do tipo h foram descritas. As Trxs h, assim chamadas por se
encontrarem em tecidos heterotróficos, são as mais abundantes. Evolutivamente são mais
próximas àquelas encontradas em animais. Elas foram alvo de inúmeros trabalhos de
caracterização funcional nos últimos 15 anos com o emprego de todas as ferramentas
técnicas disponíveis na biologia molecular. Observou-se, principalmente com uso de mutantes
de inserção em A. thaliana, que elas não são indispensáveis à vida da célula podendo ser
substituídas funcionalmente pelas Glutarredoxinas (REICHHELD et al., 2007). Estas são
enzimas da grande família das redoxinas onde também se incluem as proteínas Dissulfeto
6
Isomerases. Todas, as do tipo h, são reduzidas pelo segundo sistema descrito que envolve
uma NTR, tiorredoxina redutase dependente de NADPH.
A questão interessante sobre as Trxs h é a dificuldade em determinar suas proteínas
alvo. Isto se deve seguramente à simplicidade do sistema redox e à multiplicidade de genes
onde uma Trx pode ser substituída por uma outra. Há uma redundância funcional neste caso.
No entanto, esforços têm sido feitos no sentido de identificar essas proteínas alvo. Sabe-se,
por exemplo que a Trx h5 apresenta uma resposta ao ataque por patógenos, no caso a
Pseudomonas syringae e que sua ação se deve à interação com o fator de transcrição WRKY
(LALOI et al., 2004). Trx h3 confere tolerância ao choque térmico e aumenta sua tolerância
em A. thaliana exercendo uma atividade do tipo chaperona (PARK et al., 2009). Trx h1 pode
estar relacionada com o reparo de DNA conforme foi sinalizado pelo uso de mutantes para
este gene em Chlamydomonas que mostraram-se sensíveis a agentes mutagênicos (MEYER
et al., 2009).
O terceiro tipo de Trx identificado, além das citadas cloropásticas e citoplasmáticas,
são as mitocondriais denominadas o. A primeira Trx o foi clonada por Laloi et al (2001). O
sistema é mais simples do que o citoplasmático e é composto por duas Trxs. Trxo1 é a mais
abundante e presente na mitocôndria enquanto que Trx o2 é expressa em nível muito baixo.
Recentemente, esforços foram feitos com uso de mutantes para os dois genes e foram enfim
esclarecidas importantes funções dessas proteínas nas mitocôndrias (GEIGENBERGER et
al., 2017). Sabe-se agora que essas proteínas exercem função relevante sobre proteínas do
ciclo do ácido tricarboxílico (TCA), da fotorrespiração, do transporte de elétrons, da síntese
de ATP, transporte através de membrana, tradução, e síntese de hormônio. Isto com base em
experimentos de proteômica. O aprofundamento do estudo sobre as proteínas do ciclo do
TCA comprovou a função delas na desativação da sucinato desidrogenase e da fumarase
mitocondrial. Para as Trxs o, o sistema tiorredoxina funciona também com as mesmas sendo
reduzidas pelas tiorredoxinas redutases NTRB e NTRA.
O último sistema identificado em plantas, e que constitui um quarto e novo grupo, foi
descrito para as Trxs presentes no núcleo, as nucleorredoxinas-Nrx. Elas já haviam sido
descobertas em mamíferos por Kurooka et al (1997), trabalhando com ratos, porém seu
agente redutor permanecia desconhecido. Marchal et al (2014), num trabalho envolvendo
todas as ferramentas moleculares disponíveis, tais como produção de proteínas
recombinantes, testes enzimáticos, complementação na levedura, western blot,
imunodetecção e RT-PCR, caracterizaram em Arabidopsis thaliana este novo sistema
tiorredoxina nuclear. A partir dos dois genes de nucleorredoxina já descritos, Nrx1 e Nrx2, e
das tiorredoxinas redutases NTRA e NTRB, eles foram capazes de demonstrar in vitro e in
vivo, através de mutantes de inserção, que NTRA é o agente redutor das Trxs do núcleo em
plantas. Aqui também se dirimiu a dúvida quanto a compartimentação das nucleorredoxinas
7
como sendo efetivamente encontradas nesta organela. Nesse trabalho, um exaustivo esforço
em bioinformática também permitiu evidenciar a existência dos três subgrupos de Nrxs
presentes em plantas. No entanto, as duas Nrxs de Arabidopsis estão presentes somente nos
sub-grupos I e III (MARCHAL et al., 2014; Martins et al., 2018).
Ainda sobre a versatilidade, plasticidade e abundância das Trxs, há que ser ater
àquelas consideradas atípicas. Aqui se incluem as do tipo CDSP32, Lilium, TDX, Clot, CITRX
, HCF164 e Picot.
A Trx-like CDSP32 foi identificada inicialmente por Rey et al (1998). Trata-se de uma
proteína cloroplástica de Solanum tuberosum, de 23kDa, localizada no estroma de plantas
submetidas ao estresse hídrico. Foi assim denominada "chloroplastic drought-induced stress
protein" e não apresentava homologia com nenhuma proteína conhecia. A proteína obtida a
partir de uma biblioteca de cDNA mostrou-se ter 243 amino ácidos e ter uma atividade
tiorredoxina na sua porção c-terminal (122 resíduos) com sítio ativo característico CGPC. Ela
está então diretamente relacionada à resposta ao estresse hídrico e com a proteção dos
grupos tióis.
As Trxs do tipo Lillium, também presentes nos cloroplastos, foram identificadas por
Cain et al (2009) em Lilium longiflorum por homologia de sequência. Elas se constituem em
três grupos distintos conforme seus sítios ativos. No primeiro podem ser GCGGC, GCAGC,
SCGGC, ou RCGGC. Elas não estão presentes em musgos, algas ou cianobactérias o que
sugere um aparecimento evolutivo depois da separação entre musgos e angiospermas. O
segundo grupo contém os sítios WC[G/N/A][A/S]C. Em Arabidopsis há 5 genes que codificam
estas Trxs Lillium e que foram recentemente denominadas AtACHTs (atypical Cys His-rich
Trxs) por NIKKANEN & RINTAMÄKI (2014). CAVALCANTE et al (2018) realizaram estudos in
silico e identificaram as Trxs do tipo ACTH em Eucalyptus grandis. Neste trabalho observou-
se a presença de 6 genes com expressão em tecidos jovens e em folhas adultas. Ainda não
há dados quanto as possíveis proteínas alvo para estas Trxs.
As TDXs-tetratricoredoxin foram clonadas e estudadas inicialmente por Vignols et al
(2003). São proteínas com dois domínios contendo um deles de chaperonas associados com
um motivo tiorredoxina na porção C-terminal e encontradas somente em plantas vasculares.
Elas interagem com Ssb2, uma chaperona HSP70 através do domínio HIP da AtTDX e do
domínio ATPase da chaperona. Elas estão presentes em outras plantas como o Populus, além
outros genomas recentemente clonados. Os mutantes para o gene são viáveis mostrando que
não são indispensáveis à vida celular tendo suas funções provavelmente realizadas por outras
proteínas.
ATrx-like do tipo Picot - protein kinase PKC-interacting cousin of thioredoxin (ISAKOV
et al., 2000) é citosólica e apresenta um motivo proteico conservado WCDAS. Ela foi
descoberta inicialmente em células humanas e apresentam na sua porção N terminal um
8
motivo tiorredoxina sem o sítio ativo característico. Ela intermedeia, no entanto, a ligação com
PKC. Neste C-terminal o domínio Trx conservado se repete em vários outros organismos. Em
plantas elas estão diretamente relacionadas às glutarredoxinas.
CITRX (Cf-9-interacting thioredoxin) são tiorredoxinas like descritas por Rivas et al
(2004). Elas foram identificadas e relacionadas à resistência em tomate como associadas ao
gene Cf-9. Na verdade CITRX é inativada pela ação de vírus e ativa, por sua vez, a reação
de defesa de Cf-9.
HCF164 é uma Trx do cloroplasto que se encontra ancorada na membrana dos
tilacóides (LENNARTZ et al., 2009; MOTOHASHI & HISABORI, 2006). Esta Trx like foi
descoberta a partir da análise de um mutante de inserção de Arabidopsis thaliana que
apresentava "high chlorophyll fluorescense phenotipe (hcf164 mutant)" em condições de
fotossíntese normais, o que sugeriu uma falha no transporte de elétrons. Observou-se que
esta Trx é de fato uma proteína de membrana com dois motivos CXXC, um na porção C
terminal e outra na porção C terminal. Ela seria então responsável pela transdução de sinal
no lúmen do tilacóide.
Clot Trxs são também proteínas atípicas presentes no cloroplasto cujas funções ainda
não foram bem esclarecidas. Elas são homólogas as proteínas clot de Drosophila envolvidas
na síntese de drosopterinas, pigmentos presentes nos olhos desses insetos. Em Arabidopsis
há um único gene clot mas já foram identificadas em uma grande variedade de plantas cujos
genomas foram sequênciados (MEYER et al., 2009).
As Trxs Picot foram identificadas em 2000 (ISAKOV et al., 2000) e estão envolvidas
na ativação dos fatores de transcrição AP-1 e NFkB. A proteína tem um domínio tiorredoxina
na sua porção N terminal seguido por dois domínios repetitivos em tandem e altamente
conservados.
2.2. Tiorredoxinas em genomas de árvores
O estudo sobre os genes de Trxs em plantas progrediu muito com o sequênciamento
do genoma de Arabidopsis thaliana. A grande maioria dos genes desta vasta família
multigênica foi e vem sendo caracterizados graças aos mutantes de inserção de Arabidopsis
bem como pela a disponibilização das sequências. A importância desta planta modelo é
inquestionável. No entanto, à medida em que novos genomas de plantas passaram a ser
sequênciados, e especificamente no caso das Trxs, observou-se que genomas mais
complexos, diversos do genoma de Arabidopsis, apresentavam uma complexidade gênica
significativa, duplicações gênicas e ricas particularidades (MEYER el al., 2009). O
sequênciamento de genomas de árvores e a disponibilização de seus dados, por exemplo,
representa um grande interesse neste estudo sobre a diversidade e função das Trxs.
9
O primeiro genoma de uma árvore a ser sequênciado foi o de Populus trichocarpa
(TUSKAN et al., 2006), o Álamo, planta comum em florestas do hemisfério norte. Neste
genoma de 410Mb, considerado de pequeno tamanho uma vez que corresponde a 4 vezes o
tamanho do genoma de Arabidopsis, foram identificados cerca de 45000 genes. A
contribuição deste trabalho de genômica comparativa em que foram utilizados dados de
outras plantas, foi a identificação dos genes diretamente envolvidos com o desenvolvimento
da madeira, crescimento perene, transporte de nutrientes, movimento da água e resistência a
pragas. Observou-se, igualmente, dois eventos de duplicação no próprio genoma. O foco
neste trabalho foi dado à caracterização dos genes envolvidos com a síntese da lignina e da
hemicelulose, principalmente. Mostrou-se que, embora estes genes estejam presentes em
Arabidopsis, no Álamo estão muitas vezes duplicados e, em geral, em maior número.
A disponibilização desses dados, bem como dos dados obtidos com o genoma de Vitis
vinifera, também um genoma de árvore, além dos genomas de Sorghum bicolor, do musgo
Physcomitrella patens, das algas Chlamydomonas reinhardtii e Ostreoccocus lucimarinus, e
das cianobactérias Synechocystis e Nostoc puntiforme, permitiu a Chibani et al (2009) uma
análise muito precisa da família multigênica de tiorredoxinas. Neste trabalho, observou-se um
aumento na complexidade no número de Trxs. P. trichocarpa codifica 49 genes incluindo Trxs
típicas, atípicas ou “Trxs-like”, e as bem estudadas tiorredoxinas redutases. Observou-se
duplicações nos genes que codificam as classes m, h e de nucleorredoxinas. Ainda neste
trabalho um enfoque detalhado foi dado às classes de Trxs-like chamadas Clot,
nucleorredoxinas e àquelas dos tipos Lilium que até então não haviam sido bem descritas.
Uma análise comparativa neste artigo entre o genoma do Álamo e de demais plantas
quanto ao número, tipos, sub-grupos e grupos de Trxs mostrou-se muito interessante. Quando
se considera o número de Trxs, Arabidopsis thaliana dispõe de um total de 41 genes entre
típicos, atípicos, de multidomínio e de redutases. O Álamo tem 49 genes. As diferenças
ocorrem sobretudo com relação ao número de Trxs m, 8 em Álamo e 4 em Arabidopsis, Nrxs,
7 em Álamo e 2 em Arabidopsis, por exemplo. Ainda quanto ao número observa-se, de uma
maneira geral, que o número de redutases permanece igual entre as duas plantas. O mesmo
pode ser dito com relação àquelas Trxs atípicas como HCF164, Clot e CiTrx que mantém o
mesmo número de um gene por genoma nas duas plantas.
A medida em que esta comparação se expande para outras plantas citadas como Vitis
vinifera, Oriza sativa, Sorghum bicolor há um decréscimo nesta ordem de um total de genes
de 35, 34 e 33 genes. Há, no entanto, uma manutenção numérica entre álamo e Vitis quanto
às Nrxs, de 7 genes para cada ao contrário de 2 genes em Arabidopis thaliana.
Este artigo de Chibani et al (2009) é pioneiro no sentido de trazer uma análise
detalhada sobre a família Trx em um genoma de árvore. No entanto, nos dados já disponíveis
10
em bancos de dados de sequências, várias Trxs podem ser acessadas como, por exemplo,
em Jatropha curcas, entre outras plantas lenhosas cujos genomas já foram publicados.
2.3. Tiorredoxinas do eucalipto.
Em eucalipto o estudo dos genes de Trxs começa com a análise in silico do primeiro
transcriptoma da planta. Este trabalho, feito pelo consórcio FOREST-Eucalyptus Genome
Sequencing Project Consortium/FAPESP (VICENTINI et al., 2005), propiciou a primeira
identificação de genes que codificam essas enzimas na planta. A análise de “data-mining” foi
aberta para diferentes grupos de pesquisa no Brasil através da submissão e aprovação pelo
consórcio de projetos envolvendo diferentes genes de interesse.
Neste contexto, Barbosa & Marinho (2005) identificaram, a partir de sequências
correspondentes a transcritos (reads),15 proteínas que potencialmente com base na tradução
feita a partir desses “reads”, codificam Trxs. Foram então identificadas sequências para 7 Trxs
h, 4 Trx m, 2 Trx f, 1 Trx x e 1 Trx y. Não foram identificadas as Trxs o e z já vistas em A.
thaliana naquele momento, bem como não foi objeto da análise as tiorredoxinas redutases.
Há que se ressaltar que lidava-se com um transcriptoma onde as sequências disponíveis
correspondiam a exomas das diferentes bibliotecas que compunham o projeto. Nelas não
necessariamente estavam disponíveis os “reads” correspondentes à totalidade de Trxs. Essa
análise preliminar mostrou que, no eucalipto, a complexidade de grupos e subgrupos de genes
observada em A. thaliana estava também bem representada. Alinhamentos múltiplos de
sequência confirmaram a disposição do sítio ativo característico das proteínas deduzidas
reforçando a análise. Ainda neste trabalho, foi identificada igualmente uma sequência de Trx
atípica TDX. Árvores filogenéticas comparando as Trxs do eucalipto com as de Arabidopsis
confirmaram a disposição das mesmas por grupos em função da localização na célula.
Barbosa & Marinho (2005) também traçaram, com base no número total de “reads” de
cada transcrito, um perfil do que seria a expressão desses genes em diferentes tecidos. Isto
com base nas 13 diferentes bibliotecas de cDNA que deram origem ao FORESTs. Elas foram
preparadas com tecidos de calos, folhas jovens, adultas, flores, frutos, raízes, plântulas,
plantas expostas a patógenos entre outras. Os resultados obtidos mostraram que, em geral,
as Trxs do Eucalipto se expressam preferencialmente em tecidos jovens, sobretudo as do tipo
h. Algumas delas poderiam ter uma expressão tecido específica e é o que se observa para
alguns genes mais presentes em bibliotecas de botões florais. Elas são identificadas em
bibliotecas de folhas jovens, plântulas em desenvolvimento, por exemplo. As do tipo
cloroplásticas estão presentes em bibliotecas de folhas adultas.
11
Este trabalho inicial, feito com base nos dados do primeiro transcriptoma, foi de
importância significativa porque mostrou, com base em ferramentas de Bioinformática usuais
e aceitas, a complexidade e a multiplicidade das Trxs no eucalipto naquele ano de 2005, com
base em análises comparativas com os genes disponíveis no momento. No entanto, se
consideramos igualmente que se tratava de uma análise de genes expressos a partir de
diferentes bibliotecas, onde tem-se somente o produto da expressão dos genes, há que se
constatar que outros genes não expressos nas condições estudadas certamente poderiam
não ter sido identificados como já mencionado acima. A verificação destes dados requer o
acesso aos dados do genoma de Eucalyptus grandis publicado em 2014 (MYBURG et al.,
2014).
Neste genoma, a prioridade de análise dos genes foi dada àqueles que participam da
formação da madeira. Não obstante, na seção que trata da sintenia com os genes de P.
trichocarpa, 5 genes que codificam Trxs, entre 894 averiguados no trabalho, foram
identificados. São os genes Eucgr.C00122.2, Eucgr.C00603.1, Eucgr.C00663.1,
Eucgr.C00774.1, Eucgr.C03890.1. que podem ser acessados nos arquivos suplementares em
anexo ao artigo publicado na revista Nature (MYBURG et al., 2014).
2.4. Tiorredoxinas e interesse biotecnológico
Hiroyuki Yano, em artigo publicado na revista Molecular Plant (YANO, 2014), traça um
perfil bastante preciso das potencialidades biotecnológicas das tiorredoxinas. O princípio
básico deste interesse aplicado está no próprio funcionamento da reação de abertura de
pontes dissulfeto de outras proteínas. Parte-se do princípio, por exemplo, que as Trxs podem
ser utilizadas como antialérgicos. Isto diz respeito a degradação de proteínas de reserva na
semente, em grãos, durante a germinação. As proteínas de reserva estão estocadas em
corpos protéicos compactos e enlaçados por pontes dissulfeto. São as Trxs que
descompactam estas estruturas quebrando suas pontes dissulfeto. Ressalta o autor que
quando se ingere grãos as proteínas são digeridas com proteases, mas não se
descompactam bioquimicamente estas estruturas. Neste caso podem ocorrer problemas
alérgicos uma vez que a região em torno da ponte dissulfeto torna-se resistente a proteases
e essa proteína pode se tornar um agente potencialmente alergênico. As Trxs podem então
quebrar estas pontes dissulfeto e disponibilizar as proteínas tornando-as não alergênicas.
Uma outra abordagem já realizada no uso biotecnológico das Trxs consiste na
obtenção de plantas transgênicas superexpressando ou suprimindo os genes de Trxs. No
trigo (LI et al., 2009), por exemplo, plantas transgênicas foram produzidas superexpressando
a Trx h5 e a massa do pão produzido a partir desses transformantes mostrou-se menos
alergênica. Igualmente, os mesmos autores mostraram que repressão da Trx h9 por uma
12
construção antissenso retarda a germinação da semente em até uma semana evitando assim
o fenômeno da germinação precoce ou brotação pré-colheita (PSH-pre-harvest sprouting).
Outros exemplos podem ser citados como a superexpressão de Trx h5 em cevada
tornando a cerveja de melhor qualidade e a planta menos alergênica (CHO et al.,1999; WONG
et al., 2004); a superexpressão de Trx f em tabaco produzindo maior acúmulo de amido nas
folhas e possibilitando a produção de biocombustíveis (SANZ-BARRIO et al., 2013);
superexpressão de TDX em Arabidopsis levando a um aumento da tolerância a altas
temperaturas (LEE et al., 2009).
13
3. MATERIAL E MÉTODOS
________________________________________________________________________
3.1 Análise in silico
As análises in silico foram realizadas em seis etapas: identificação das sequências
codantes para tiorredoxinas; construção de alinhamentos múltiplos de sequências protéicas;
construção de árvores filogenéticas; análise da expressão gênica; análise; análise de
interação entre proteínas e localização celular. O software Primer 3 (1996 – 2019) foi utilizado
para fazer a escolha de primers para os ensaios de RT-PCR.
Para a identificação de sequências de Trxs três bancos de dados foram utilizados. O
primeiro a partir do link de acesso ao genoma disponibilizado no próprio artigo do genoma
eucalipto. Os dois outros foram o banco de dados que reúne genomas de plantas, o
Phytozome e o banco de dados específico para eucalipto o Eucgenie (EUCGENIE, 2011 -
2018). No GenBank as buscas foram feitas via National Center for Biotechnology Information
(NCBI, 1988) através de alinhamentos utilizando o programa BLAST, em que sequências de
nucleotídeos de tiorredoxinas de Arabidopsis thaliana foram usadas. Nos demais bancos de
dados específicos, Phytozome e Eucgenie, empregou-se uma busca textual com a palavra
"thioredoxin".
Os alinhamentos múltiplos foram feitos inicialmente com programa Clustal Omega
(LARKIN et al., 2007) abrigado no site do European Bioinformatic Institute (EMBL, 1974). O
software Clustal também foi utilizado para alinhar as sequências das proteínas levantadas
anteriormente no transcriptoma contra as proteínas homólogas encontradas durante a análise
in silico no presente trabalho. Em anexo 1 encontram-se as sequências utilizadas para fazer
os alinhamentos. Após a obtenção dos alinhamentos de sequências selecionadas foram
construídas árvores filogenéticas utilizando o programa MEGA 7 (TAMURA et al., 2007).
Nestes experimentos também foram empregadas sequências de Populus trichocarpa, Vitis
vinfera e Arabidopsis thaliana, retiradas do material suplementar do artigo do genoma de
Populus trichocarpa, além das sequências do eucalipto.
O programa BEAST2 (2014) foi utilizado para fazer as árvores filogenéticas. Antes da
obtenção da árvore final fez -se necessário avaliar o modelo mais adequado. O modelo com
melhor aplicação para esse caso foi o LG+G+I. Neste caso, domínios de Trxs foram deduzidos
a partir de alinhamentos do CDD, utilizando alinhamento SEED (10 sequênias) como guia
para alinhar as 22 sequências de Trx de interesse com a utilização do programa MAFFT
(2013) . A topoligia das árvores foi visualizada com o software figtree.
14
A localização celular foi feita usando o software PREDOTAR (SMALL et al., 2004),
submetendo-se todas as sequências proteícas encontradas e deduzidas diretamente na
plataforma online.
A expressão dos genes foi analisada usando dados públicos disponíveis na plataforma
Phytozome considerando os índices de FPKM (quilo base de éxons por milhões de reads
mapeados).
O software STRING (2017) foi o meio utilizado para realizar a análise de interação
entre proteínas, utilizando parâmetros pradrões, default. A implementação deste recurso foi
possível numa abordagem comparativa uma vez que não há sequências de eucalipto
disponível neste banco de dados. Neste sentido, empregou-se uma estratégia de utilização
das proteínas homólogas, às Trxs de eucalipto presentes no genoma de Populus trichocarpa.
Inicialmente foram coletados os dados de genes co-expressos para a Tiorredoxina no banco
de dados específico para vegetais, Phytozome (PHYTOZOME, 1996 – 2017). Como ainda
não existe dados para a construção de redes para E. grandis, tivemos que identificar os genes
ortólogos para uma espécie próxima, a P. trichocarpa, para isso utilizamos os dados de
cruzamento de identificadores do Phytomine e em seguida obtivemos os identificadores no
Europian Molecular Biology Laboratory (ENSEMBL, 1996 – 2018) através do plantgenie. Uma
vez identificados os IDs, eles foram submetidos ao programa para interação de proteínas
(STRING, 2017) para a construção da rede de interação proteína-proteína (Protein-Protein
interacion network - PPI) sob as informações de Textmining, Experiments, Databases e Co-
expression, com o valor mínimo de escores combinados de 0.7, definido pelo programa como
sendo de alta confiança. Os dados da rede foram importados no R e a rede foi editada
utilizando o pacote RedeR (CASTRO et al., 2012). As análises de enriquecimento para termos
do KEGG pathway e do PFAM foram realizadas pelo STRING.
3.2 Ensaios de RT-PCR
Os estudos de RT-PCR foram realizados em 4 etapas que consistiram em: extração
de RNA total de tecidos de E. grandis (plântulas) e de E. urograndi (folhas adultas, folhas
jovens, xilema, floema e meristema apical); preparação de cDNA total com as amostras de
RNA de plântulas; amplificações de PCR com primers específicos para as tiorredoxinas h;
análise dos produtos de PCR em gel de agarose sob eletroforese.
A extração de RNA total foi feita com Trizol (Invitrogen 15596026) seguindo protocolo
clássico do fabricante. As reações de RT-PCR foram feitas com o kit Promega AccessQuick
RT-PCR system (A1701) cuja característica é a realização da transcrição reversa e da reação
de PCR em um único tubo. As condições de PCR padrão, feita em termociclador Techne TC-
15
512, foram as recomendadas no kit consistindo na seguinte ciclagem: desnaturação inicial a
95o, 2 min, seguida de 30 ciclos de PCR contendo desnaturação a 95o, 1 min, anelamento a
55o, 30 seg, extensão a 72o, 1 min, seguido extensão final a 72o, 4 min. Os primers utilizados
para as amplificações são os descritos na tabela abaixo.
Tabela 1. Sequências dos primers obtidos com software Primer 3 e utilizados nas
amplificações das tiorredoxinas citoplasmáticas e do controle interno de normalização
(actina).
Genes Sequência 5’ - 3’
I01913.1 AGT TCA GTG TGC AGG CAA TG
AGC AAA AGG GAT CGA ACT CA F01854.1 ACA CCG TCG ATT CTT GGA AC
ACA CCG TCG ATT CTT GGA AC
F01604.1 AGA AGA TGC CCC ATG TTT TG
ATC GGA GCC GGT TTA TTT TT
I02383.1 AGC TGG TGG TTG TCG ATT TC
GAT CCT TCT GGG CTC CTA CC I00241.1 AGG ATA TTC AGC CCC TCG TT (actina)
TGG GCT TCA TCA CCA ACA TA
Os produtos de PCR foram analisados em gel de agarose 1,5% em equipamento de
eletroforese com cuba submarina runVIEW Cleaver. O tampão de depósito das amostras foi
acrescido de 2l de GelRed Biotium para a marcação do DNA. Após a realização da corrida
os géis foram visualizados em transilumidandor Hoefer e fotografados em equipamento de
fotodocumentação Cleaver.
16
4. RESULTADOS E DISCUSSÃO
__________________________________________________________________________
4.1. Trx de E. grandis: Diversidade
Foi definido como classificação das Trxs de plantas aquela utilizada por Chibani (2009)
que considera 4 grupos. AS Trxs típicas, de baixo peso molecular e com sítio ativo clássico
CXXC/S, as Trxs atípicas com domínios protéicos únicos, Trxs like, por exemplo, as Trxs
atípicas com domínios múltiplos, TDX, e as tiorredoxinas redutases que são redutoras nos
diferentes sistemas tiorredoxinas descritos.
Neste trabalho progrediu -se na caracterização dos genes de tiorredoxina em eucalipto
a partir de uma abordagem em Bioinfomática e em Biologia Molecular. Com o objetivo de
aprimorar a análise das sequências a partir do genoma complete de Eucalyptus grandis tanto
do ponto de vista estrutural como expressão gênica da planta. Com a mineração de dados
constatou -se que o genoma de Eucalyptus grandis codifica mais de 50 Trxs entre típicas,
atípicas, ditas de domínio único ou aquelas de múltiplos domínios.
O principal interesse foi pelas Trxs típicas, ou seja, aquelas com sítio ativo
característico CXXC/S e de baixo peso molecular em torno de 14kDa. Os resultados mostram
que, no eucalipto, todos os representantes dos sete tipos de Trxs descritos (m, f, h, x, y, z e
o) estão presentes no genoma e, que, em termos de números de genes, conforme tabela 2,
são de 4 , 2 , 9, 1, 2, 1, 1 respectivamente, além de 2 com sítio CxxS.
17
Tabela 2. Tiorredoxinas típicas de Eucalyptus grandis identificadas na plataforma Phytozome
a partir de busca indeireta por palavra – chave “thioredoxin” e classificadas através do sítio
ativo conservado, número de aminoácidos, número de identificação para o Locus e da
localização celular.
Identificação Tipo Locus Cromossomo Aa Localização
Sítio
ativo
Eucgr.A00783.2.p h2 Eucgr.A00783 Chr01 148 P/M/C WCGPC
Eucgr.A01813.1.p m2 Eucgr.A01813 Chr01 193 P/M/C WCGPC
Eucgr.B01424.1.p f2 Eucgr.B01424 Chr02 332 P WCGPC
Eucgr.B02586.4.p h2 Eucgr.B02586 Chr02 165 C WCGPC
Eucgr.D00028.1.p o Eucgr.D00028 Chr04 184 M WCGPC
Eucgr.D00853.1.p CxxS1 Eucgr.D00853 Chr04 207 C WCMPS
Eucgr.F01604.2.p h1 Eucgr.F01604 Chr06 150 C WCGPC
Eucgr.F01854.1.p h(5Pt) Eucgr.F01854 Chr06 118 C WCGPC
Eucgr.F02754.1.p m(5Pt) Eucgr.F02754 Chr06 188 P/M/C WCGPC
Eucgr.F03319.1.p m(4Pt) Eucgr.F03319 Chr06 187 P WCGPC
Eucgr.F04223.1.p y Eucgr.F04223 Chr06 109 P WCGPC
Eucgr.F04229.1.p y Eucgr.F04229 Chr06 152 P WCGPC
Eucgr.G03224.1.p z Eucgr.G03224 Chr07 186 P WCGPC
Eucgr.H01629.1.p f1 Eucgr.H01629 Chr08 185 P WCGPC
Eucgr.I01912.1.p h2 Eucgr.I01912 Chr09 158 C WCGPC
Eucgr.I01913.1.p h(2Pt) Eucgr.I01913 Chr09 159 C WCGPC
Eucgr.I02383.1.p h1 Eucgr.I02383 Chr09 117 C WCGPC
Eucgr.J00880.2.p x Eucgr.J00880 Chr10 182 P WCGPC
Eucgr.J02387.1.p h(2Pt) Eucgr.J02387 Chr10 119 C WCGPC
Eucgr.K01294.1.p h9 Eucgr.K01294 Chr11 137 P/M/C WCGPC
Eucgr.L01943.1.p cxxs Eucgr.L01943 scaffold_464 81 C WCGPC
Eucgr.L03049.1.p m3 Eucgr.L03049 scaffold_1873 116 P WCGPC
PMC, Plastítios, Mitocondrias, Citoplasma; Pt, Populus trichocarpa
Barbosa & Marinho (2005), analisando o primeiro transcriptoma de eucalipto
identificaram 7 h, uma delas com sítio CXXS, 1 x e não identificaram as Trxs dos grupos z e
o. No mesmo trabalho, 4 m e 2 f foram identificadas. Com relação a ausência de transcritos
para as Trxs o e z, é fácil deduzir que, muito provavelmente, as bibliotecas empregadas
naquele transcriptoma não continham transcritos para estes genes que ora podem ser
encontrados no genoma de E. grandis. Sabe-se que estes genes são transcritos em níveis
baixos de expressão porque implicados em situações mais específicas como a resposta ao
estresse oxidativo e, portanto, não de forma constitutiva (LALOI, 2002; CHIBANI, 2011). Há
que se ressaltar, também, que estes dois tipos de Trxs foram os últimos a serem identificados
(MEYER, 2012) quando da disponibilização do genoma de A. thaliana. Já com relação às Trxs
m e f, envolvidas nas reações do cliclo de Calvin-Benson (BUCHANAN, 2002), então
18
abundantes em termos de transcritos, os resultados se repetem entre o que observamos aqui
quanto a número de genes, 4 e 2 respectivamente, e que foram relatados anteriormente. A
presença de 9 Trxs h e não 7 como visto por Barbosa & Marinho (2005) também se explica
pelos níveis de transcritos mas também pela redundância desses genes que tem sido alvo de
muito interesse ao longo da última década (JACQUOT, 1994). É inclusive interessante
observar que mesmo em um transcriptoma realizado com limitações técnicas maiores, e
somente com a análise dos transcritos em 5’(ESTs), 7 delas já foram identificadas à época.
Isto mostra provavelmente a plasticidade deste grupo de Trxs que atuam preferencialmente
no citoplasma. Com relação às Trxs h de sítio CXXS, o genoma apresenta duas delas
enquanto uma só havia sido encontrada na abordagem de data-mining anterior.
Aqui também se observa que o conjunto básico de genes de Trxs visto em A. thaliana
durante a análise do genoma na linhagem verde assim definida por Meyer (2009), se mantém
no genoma de E. grandis como nos demais genomas de plantas estudadas. No entanto, o
número de genes e consequentemente de proteínas se altera como se pode observar nas
análises de genômica comparativa. Muito provavelmente, como ressalta Meyer (2009)
ocorreram ao longo da evolução das plantas duplicações gênicas o que talvez se explique
aqui pela localização de alguns genes nos mesmos cromossomos (Tabela 2).
Tomando - se ainda esses dados numéricos quanto aos genes de Trxs em E. grandis,
observa - se, como demonstrado na tabela 2, que esta situação de diversidade de tipos de
genes dentro da sub-família de Trxs típicas, se repete em outros genomas de plantas arbóreas
sequênciados. P. trichocarpa, por exemplo, em que Chibani (2009) estudou toda a família
multigênica de tiorredoxinas, apresenta uma situação similar ao que vemos em E. grandis à
diferença de apresentar, o Álamo, 8 genes de Trxs m uma situação incomum. Esta análise,
no entanto, vai se aprimorar com o sequênciamento de outros genomas de árvores o que vem
sendo realizado, e permitirá lançar mais hipóteses sobre a diversidade numérica de genes de
Trxs nesses genomas.
19
Tabela 3. Diversidade numérica de Tiorredoxinas típicas e conservação dos grupos de Trx em
cinco espécies vegetais, inclusive Eucalyptus grandis, com base em dados de sequências
publicadas ou disponibilizadas em bancos de dados públicos.
Eucalyptus
grandis
Jatropha
curcas
Populus
trichocarpa
Vitis
vinífera
Arabidopsis
thaliana
Trx h 9 7 7 5 8
Trx cxxs 2 2 3 1 3
Trx o 1 1 1 1 2
Trx m 4 1 8 3 4
Trx x 1 - 1 1 1
Trx f 2 1 1 1 2
Trx y 2 1 2 1 2
Trx z 1 1 1 1 1
Modificado a partir de CHIBANI et al (2009).
4.2. Conservação dos domínios e motivos das Trxs
Alinhamentos múltiplos foram realizados com as sequências protéicas de Trxs
deduzidas para melhor caracterizá- las estruturalmente e evidencias domínios conservados.
É o que se mostra na figura 1 permitindo a visualização das sequências de aminoácidos das
proteínas essencialmente na parte onde se identificam motivos característicos das Trxs como,
por exemplo, o centro ativo conservado WCGPC/S. No alinhamento observa – se, igualmente,
entre as 22 sequências, aquelas que codificam as do tipo h com sítio CXXS, Eucgr.D00853.1.
Eucgr.L01943.1 a última estando incomplete a partir do sítio ativo. As demais sequências
estão completes e são disponibilizadas em arquivos anexos.
20
Figura 1. Alinhamento peptídico parcial com sequência de tiorredoxinas típicas de Eucalyptus
grandis realizado por software T-COFFE abrigado na plataforma CLUSTAWL do EMBL
European Bioinformatic Institute, evidenciando os domínios conservados com destaque para
o sítio ativo WCGPC.
4.3. Filogenia Estrutural
A construção de árvores filogenéticas em abordagens como esta voltada à
caracterização estrutural e functional de genes é frequentemente usada. Ela permite inferior,
a partir de outras sequências de genes ortólogo já plubicados e bem caracterizados
experimentalmente, a provável função cellular dos genes alvo de um estudo. Neste context,
procurou-se aqui realizar não uma análise filogenética mas confirmer a identificação dos
genes por anotação automática dos diferentes tipos de tiorredoxinas. Nesta análise
comparativa utilizamos sequências homólogas às Trxs de 4 diferentes espécies de plantas,
A. thaliana, V. vinifera, P. thicocarpa e J. curcas. Esta escolha se deu utilizando A. thaliana
como modelo, planta que reúne a maioria dos dados publicados sobre Trx, e as demais por
21
se tratarem de árvores tendo sido o Álamo o primeiro genoma de árvore a ser sequenciado
(TUSKAN et al., 2006). Os resultados desta análise filogenética apresentados na figura 2
permitiram o agrupamento de todas as sequências de tiorredoxinas neste trabalho com seus
ortólogos potenciais nas demais espécies.
22
Figura 2: árvore filogenética gerada com o programa BEAST3 evidenciando os diferentes tipos
de tiorredoxinas de E. grandis agrupados com seus ortólogos potenciais em P. trichocarpa, V.
vinifera, J. carcass e A. thaliana.
*Tiorredoxinas de Eucalyptus grandis
23
4.4. Padrão de Expressão de Trxs de E. grandis em diferentes tecidos
O estudo da expressão dos genes de tiorredoxina neste trabalho foi feito com base
nos dados de RNA-Seq disponibilizados após o sequenciamento do genoma de E. grandis.
Estes dados brutos em FPKM estão disponíveis em plataformas de domínio público
(https://eucgenie.org/) e foram utilizados para gerar o mapa de expressão apresentado a
figura 3. Neste contexto foram utilizadas as sequências que codificam as Trxs típicas com sítio
ativo característico e conservado. Trata -se consequentemente das 22 sequências
codificantes para Trxs m,f h, o, x, y e z além das CXXS.
Os genes em questão foram analisados com base nos perfis de expressão individuais
em relação a seis diferentes bibliotecas contend transcritos de tecidos de floema, xilema
imaturo, xilema, folhas adultas, meristema apical e folhas jovens. O perfil de expressão geral
em eucalipto, considerando todos os genes, condiz com o que é explicitado na literature em
relação as Trxs (MEYER et al., 2009) e que justifica sua classificação em função da atuação
na célula. Há uma nítida diferença de expressão em função dos tecidos estudados e os
diferentes transcritos mesmo que algumas generalizações possam ser feitas.
O perfil da expressão em tecidos condutores, por exemplo, é mais discrete do que nos
tecidos de folha ou meristema para a maioria dos genes slavo algumas exceções para o grupo
das tiorredoxinas h que apresentam um perfil mais variado. As Trxs f, por exemplo, atuam
nitidamente em tecidos fotossintetizantes de folha adultas , o que já era esperado devido a
dua atuação já bem caracterizada em tecidos fotossintetizantes. O mesmo pode ser ditto para
as Trxs m que também atuam em tecidos fotossintetizantes.
Na literatura a expressão gênica das tiorredoxinas do eucalipto em transcriptomas
realizados com RNA-seq aind não foi relatada, este é o primeiro trabalho com este enfoque.
Vining et al (2015) analisa o transcriptome da planta a partir de órgãos florais mas estes
tecidos não estão presentes neste trabalho. No entanto, um amplo estudo foi realizado por
Belin et al (2014) em A. thaliana analisando dados de RNA-seq para todos os genes de
tiorredoxina da planta. A partir deste trabalho com as Trxs de A. thaliana algumas
considerações relevantes podem ser feitas em relação aos resultados obtidos aqui.
Se forem considerados individualmente os diferentes grupos de tiorredoxinas no nosso
estudo pode -se afirmar que as 4 Trxs plastidiais m se expressam predominantemente em
tecidos de folha adulta, assim como visto em A. thaliana. Nesta planta a Trx m3, no entento,
tem baixa expressão e é constitutive nos tecidos analisados. O gene Eucgr.L03049 que
corresponde a esta tiorredoxina em eucalipto tem forte expressão em folha adulta, em
comparação com as demais 3 Trx m, o que poderia lhe conferir uma possível especificidade
de função em genomas de árvore. O mesmo padrão de expressão pode se observer para as
duas f de eucaliptp que estão significativamente presentes em tecidos de folhas adultas
24
fotossintetizantes. As também plastidiais x, y e z de eucalipto, tem expressão mais discreta
do que as m ou f nos tecidos estuados. Há predominância de transcritos para estas Trxs
plastidiais nos tecidos de folhas maduras ou jovens ressaltando-se a inexistência de valores
para a Trx z em folha adulta. Esta tiorredoxina de fato é particular tendo função mais
específicas nas proteínas alvo FLN1 e FLN2 (ARSOVA et al., 2010; MENG et al., 2010). Isto
provavelmente explicaria a ausência de transcritos na biblioteca estudada. Em A. thaliana
Belin et al (20014) menciona uma forte expressão da Trx z em tecidos do ovário o que reforça
o seu caráter mais específico.
A Trx o de eucalipto tem discretae constante expressão nas seis bibliotecas
analisadas, o mesmo observado em A. thaliana, reforçando seu caráter mais generalista
recentemente elucidado (GEIGENBERGER et al., 2107).
As Trxs CXXS em eucalipto apresentam interessante padrão de expressão mais
nitidamente forte em tecidos condutores embora também presentes em tecidos de folhas
jovens ou adultas. Elas se destacam das demais quanto a esta especificidade pelos tecidos
condutores sugerindo também funções específicas. Em A. thaliana CXXS2 é fortemente
detectada em grãos de de polen Nelin et al (2104).
As 9 Trxs h de eucalipto apresentam expressão gênica em todos os tecidos estudados
e que pode ser caracterizada em dois grupos. Há aquelas cuja expressão é mais discreta e
uniforme nas seis bibliotecas, são as Eucgr.J02387, Eucgr.A00783, Eucgr.I01912,
Eucgr.B02586 e Eucgr.K01294, num crescente de produção de transcritos. E um segundo
grupo formado por 4 Trxs, as Eucgr.I02383, Eucgr.I01913, Eucgr.F01854 e Eucgr.F01604 cuja
expressão é nitidamente mais abundante que todas as demais h e inclusive maior do que
todas as Trxs aqui estudadas. Esta divisão de trabalho de caráter funcional em se tratando de
um genoma de árvore pode ser de grande interesse. Por exemplo, os genes cuja expressão
é mais abundante são Eucgr.F01854 e Eucgr.F01604, o primeiro com menor expressão em
tecidos condutores mas com forte numero de reads em tecidos de folhas, jovens ou adultas.
E o gene Eucgr.F01604 apresenta fortíssima expressão em todas as seis bibliotecas
sugerindo um atuação importante no crescimento da planta, na sua expansão vertical até
porque implicado supostamente no transporte em tecidos condutores.
Em A. thaliana, no trabalho de Belin et al (2104), esta Trx se expressa em vários
tecidos mas o trabalho não contempla bibliotecas de tecidos condutores como aqui, o que
reforca a condução de experimentos complementares.
25
Figura 3. Mapa de expressão dos transcritos de tiorredoxinas típicas de E. grandis em
diferentes tecidos (Floema, Xilema imaturo, Xilema, Folhas Adultas, Meristema Apical, Folhas
Jovens), a partir de dados obtidos no programa R.
26
4.5. RT- PCR
Neste sentido, realizou-se experimentos preliminares de RT-PCR para estudar com
mais detalhe e em laboratório a expressão de alguns desses genes que parece ser mais
relevantes em tecidos de plantas arbóreas. Foram escolhidos então os quatros genes que
codificam Trx h, Eucgr.I02383, Eucgr.I01913, Eucgr.F01854 e Eucgr.F01604, inclusive,
conforme o que fora observado in silico (Figura 2).
Figura 3. Expressão gênica por RT-PCR semi-quantitativa em tecidos de E. grandis: JF, folha
jovem; MA, meristema apical; X, xilema; FL, floema; PL, plântulas. F00241.1, actina.
Para um maior refinamento da caracterização das Trx h em árvore, foi escolhido o
gene Eucgr.F01604, cuja expressão é mais importante para realizar uma análise de co-
expressão in silico. As plataformas utilizadas produziram uma rede de co-expressão deste
genes a partir de seus ortólogos em P. trichocarpa que é mostrada na figura 4.
Nela observa-se que, a princípio, foram identificados 1359 genes co-expressos com a
Trx h F01604, sendo que somente 530 proteínas foras associadas a esses genes para formar
a rede em Populus trichocarpa. Já em relação a PPI, obtive -se uma rede representada na
figura 4. Na imagem os nós representam as proteínas e as arestas são as conexões entre os
nós. Na figura, temos duas representações da mesma rede, do lado esquerdo são
apresentadas as vias do KEGG e do lado direito os as famílias proteicas enriquecidas da base
do PFAM. Com relação às vias do KEGG, foram selecionados as 10 vias mais relevantes de
acordo com o P valor ajustado (BH), os nós foram coloridos para distinguir a qual termo eles
pertenciam, destacando as vias relacionadas a Ribossomo, transporte de RNA e também de
reparo por excisão de bases. Já para o PFAM, também foram selecionados as 10 famílias
mais relevantes ranqueadas por P valor ajustado. Observa-se que a maior parte das famílias
27
proteicas co-expressas na rede é a das Tiorredoxinas, seguidas pelas Glutarredoxinas
confirmando o que ja fora consistentemente comprovado por vários autores a começar pelo
trabalho de REICHHELD et al (2007) com o emprego de mutantes em A. thaliana. Os
resultados sugerem fortemente que a investigação in plantae é indispensável para melhor
caraterizar estes genes e aprofundar, por exemplo, sua relação com as vias de reparo do DNA
por excisão de bases.
Figura 4. Análise de co-expressão dos genes de Trxs evidenciando as dez vias mais
relevantes. A esquerda utilizando dados do PFAM e a direita dados de KEGG.
28
5. CONCLUSÕES
__________________________________________________________________________
Os dados aqui apresentados e que se restringem as Trxs definidas como típicas,
aquelas com sitio ativo único e conservado CXXC, de baixo peso molecular, confirmam a
complexidade numérica e de grupos já observada no primeiro transcriptoma do Eucalipto.
Foram identificados genes para todos os grupos, plastidiais, citoplasmáticos e cloropásticos,
já definidos quanto a localização celular. A análise do genoma complementa as informações
com o conjunto de genes de Trxs inclusive com a do tipo z, o e duas h ainda não identificadas
em abordagem anterior. O Eucalipto apresenta 22 genes de tiorredoxinas típicas. A análise
filogenética desses genes com sequências de outras três árvores, P. tricocharpa, V. vinífera
e J. curcas permitiu a identificação e o agrupamento dos genes nos seus diferentes tipos
confirmando sua identificação por homologia nas plantas estudadas. Todos os genes aqui
identificados se agruparam dentro do que se previa quanto aos tipos de Trxs. A distribuição
numérica de genes por grupos no eucalipto se assemelha ao que fora relatado para P.
trichocarpa ressaltando-se, no entanto, a manutenção de 4 genes de Trx como em
Arabidopsis thaliana, m ao invés de 8. O grupo mais abundante em genes é o das Trxs h,
com 9 genes, um a mais do que no Álamo. Este perfil numérico comparativo entre os genes
de Trxs de outras três árvores analisadas não permite generalizações absolutas. Há
especificidas para cada genoma quanto ao número de genes mas permanece a existência de
representantes de todos os grupos. O estudo de expressão gênica com base em dados
normalizados de FPKM, obtidos por RNA-seq em plataformas como o Phytozome, permitiram
a elaboração de mapas de expressão com interessante padrão. A análise desses dados
confirmou o que ja havia sido visto em Arabidopsis thaliana quanto a atuação das tiorredoxinas
em diferentes tecidos mas revelou perfis de expressão únicos ainda não reportados até então.
É o caso, por exemplo do gene Eucgr.F01604 que codifica uma Trx h1 com forte atuação em
tecidos condutores além de relevante expressão em tecido de folhas jovens. Esses resultados
reforçam a já bem definida atividade enzimática tecido específica para muitas das
tiorredoxinas, bem como confirma, por outro lado, o caráter de atuação também mais
generalista para talvez a maioria das tiorredoxinas em plantas.
29
6. LITERATURA CITADA __________________________________________________________________________
ARSOVA, B.;HOJA, U.; WIMMELBACHER, M.; GREINER. E.; USTÜN, S.; MELZER, M.;
PETERSEN, K.; LEIN, W.; BÖRNKE, F. Plastidial Thioredoxin Z Interacts With Two
Fructokinase-Like Proteins In A Thiol-Dependent Manner: Evidence For An Essential Role
In Chloroplast Development In Arabidopsis And Nicotiana Benthamiana. Plant Cell. v. 22,
p.1498-1515, 2010.
BARBOSA, A. E; MARINHO, P. In Silico Analysis Of Eucalyptus Thioredoxins. Genetics
And Molecular Biology, v. 3, p. 539-547, 2005. Suplemento..
BELIN, C.; BASHANDY, T.; CELA, J.; DELORME-HINOUX, V.; RIONDET, C.; REICHHELD, J.
P. A comprehensive study of thiol reduction gene expression under stress conditions in
Arabidopsis thaliana. Plant Cell Environ. v. 38, p. 299-314, 2015.
BERNAL-BAYARD, P.; OJEDA, V.; HERVÁS, M.; CEJUDO, F. J; NAVARRO, J. A.;
VELÁZQUEZ-CAMPOY, A., PÉREZ-RUIZ, J. M. Molecular Recognition In The Interaction
Of Chloroplast 2-Cys Peroxiredoxin With NADPH-Thioredoxin Reductase C (NTRC) And
Thioredoxin X. Federation of European Biochemical Societies Letters. v. 588, p. 4342-
4347, 2014.
BEAST: Disponível em: www.beast2.org. Acesso em: 07 de agosto de 2018.
BUCHANAN, B. B.; SCHÜRMANN, P.; WOLOSIUK, R. A.; JACQUOT, J. P.T he
Ferredoxin/Thioredoxin System: From Discovery To Molecular Structures And
Beyond.Photosynth Research. v. 73, p. 215-222, 2002.
CAIN, P.; HALL, M.; SCHRÖDER, W. P.; KIESELBACH, T.; ROBINSON, C. A Novel
Extended Family Of Stromal Thioredoxins. Plant Molecular Biology. v. 70, 273-281,
2009.
CASTRO, M.A. ;WANG, X., FLETCHER, M.N.; MEYER, K.B.; MARKOWETZ, F. “RedeR:
R/Bioconductor package for representing modular structures, nested networks and multiple
levels of hierarchical associations.” Genome Biology, v. 13, 2012.
CAVALCANTE, V. R. A e MARINHO, P. Tiorredoxinas Típicas Codificadas Pelo Genoma
De Eucalyptus Grandis. X Simpósio Brasileiro de Pós – Graduação em Ciências Florestais
(XSIMPÓS). Anais. Natal, p. 1494 – 1498, 2018.
30
CHIBANI, K. TARRAGO, L.; SCHÜRMANN, P.; JACQUOT, J. P.; ROUHIER, N.
Biochemical Properties Of Poplar Thioredoxin Z. Federation of European Biochemical
Socieries Letters. v. 585, p. 1077-81, 2011.
CHIBANI, K.; WINGSLE, G.; JACQUOT, J. P.; GELHAYE, E.; ROUHIER, N. Comparative
Genomic Study Of The Thioredoxin Family In Photosynthetic Organisms With Emphasis
On Populus Trichocarpa. Molecular Plant. v. 2, p. 308-22, 2009.
CHO, M. J.; WONG, J. H.; MARX, C.; JIANG, W.; LEMAUX, P. G.; BUCHANAN, B. B.
Overexpression of thioredoxin h leads to enhanced activity of starch debranching enzyme
(pullulanase) in barley grain.Proceedings of National Academy of Sciences U S A. v. 96,
p. 4641-6, 1999.
CLUSTAL OMEGA. Disponível em: https://www.ebi.ac.uk/Tools/msa/clustalo/. Acesso em: 12
de março de 2018.
COLLIN, V.; ISSAKIDIS-BOURGUET, E.; MARCHAND, C.; HIRASAWA, M., LANCELIN,
J. M.; KNAFF, D. B.; MIGINIAC-MASLOW, M. The Arabidopsis Plastidial Thioredoxins:
New Functions And New Insights Into Specificity. Journal Biology Chemmistry. v. 278,
p. 23747-52, 2003.
DATABASE OF PLANT PROMOTERS AND CIS – ACTING REGULATORY ELEMENTS .
Disponível em: http://bioinformatics.psb.ugent.be/webtools/plantcare/html/. Acesso em: 01 de
março de 2017.
DÍAZ, M. G.; HERNÁNDEZ-VERDEJA, T.; KREMNEV, D.; CRAWFORD, T.; DUBREUIL, C.;
STRAND, Å. Redox Regulation Of PEP Activity During Seedling Establishment In Arabidopsis
thaliana. Nature Communications. v. 9, p. 50, 2018.
DRUMMOND, A. J. E.; RAMBAUT, A. BEAST: Bayesian Evolutionary Analysis by Sempling
Tress. BMC Evolutionary Biology. 2007.
ENSEMBL GENOME ARCHIVES SITES. Disponível em: http://plants.ensembl.org.
www.plantgbd.org/. Acesso em: 01 de março de 2017.
EUCGENIE, THE EUCALYPTUS GENOME INTEGRATIVE EXPLORER. Disponível em:
https://eucgenie.org/. Acesso em: 01 de outubro de 2017.
31
GEIGENBERGER, P.; THORMÄHLEN, I.; DALOSO, D. M.; FERNIE, A. R. The
Unprecedented Versatility Of The Plant Thioredoxin System. Trends Plant Sci. p. 249-
262, 2017.
GÜTLE, D. D.; RORET, T.; MÜLLER, S. J.; COUTURIER, J.; LEMAIRE, S. D.; HECKER,
A.; DHALLEINE, T.; BUCHANAN, B. B.; RESKI, R.; EINSLE, O.; JACQUOT, J. P.
Chloroplast Fbpase And Sbpase Are Thioredoxin-Linked Enzymes With Similar
Architecture But Different Evolutionary Histories.Proceeding of the National Academy
of Sciencies USA. v. 113, p. 6779-84, 2016.
HOLMGREN, A. Thioredoxin. Annual Review Biochemestry. v. 54, p. 237-71, 1985.
ISAKOV, N.; WITTE, S.; ALTMAN, A. PICOT-HD: A Highly Conserved Protein Domain
That Is Often Associated With Thioredoxin And Glutaredoxin Modules. Trends
Biochemical Science, v. 25 p. 537- 539, 2000.
JACQUOT, J. P.; EKLUND, H.; ROUHIER, N.; SCHÜRMANN, P. Structural And
Evolutionary Aspects Of Thioredoxin Reductases In Photosynthetic Organisms.Trends
Plant Sciences. v.14, p. 336-343, 2009.
JACQUOT, J. P.; RIVERA-MADRID, R.; MARINHO, P.; KOLLAROVA, M.; LE
MARÉCHAL, P.; MIGINIAC-MASLOW, M.; MEYER, Y. Arabidopsis Thaliana NADPH
Thioredoxin Reductase. Cdna Characterization And Expression Of The Recombinant
Protein In Escherichia Coli. Journal Molecular Biology. v. 235, p. 1357-63, 1994.
JACQUOT, J. P.; BUCHANAN, B. B. Enzyme Regulation In C(4) Photosynthesis :
Purification And Properties Of Thioredoxin-Linked NADP-Malate Dehydrogenase From
Corn Leaves.Plant Physiology. v. 68, p. 300-304, 1981.
KATHOH, K.; MISAWA, K.; KUMAK, K.; MIYATA, T. MAFFT: A Model Method for Rapid
Multiple Sequecia Alignament Baseado on Fast Fourier Transform. Nucleic Acid Res. v.
30, p. 3059 – 3066, 2002.
KUROOKA, H.; KATO, K. MINOGUCHI, S.; TAKAHASHI, Y.; IKEDA, J.; HABU, S.;
OSAWA, N.; BUCHBERG, A. M.; MORIWAKI, K.; SHISA, H.; HONJO, T.Cloning And
Characterization Of The Nucleoredoxin Gene That Encodes A Novel Nuclear Protein
Related To Thioredoxin.Genomics. v. 39, p. 331-339, 1997.
32
LAURENT, T. C.; MOORE, E. C. E.; REICHARD, P. Enzymatic Synthesis Of
Deoxyribonucleotideos. IV. Isolation And Characterization Of Thioredoxin, The Hydrogen
Donor From Escherichia Coli. Journal Biological Chemistry, v. 239, p. 3436 – 3444,
1964.
LALOI, C.; RAYAPURAM, N.; CHARTIER, Y.; GRIENENBERGER, J. M.; BONNARD, G.;
MEYER, Y. Identification And Characterization Of A Mitochondrial Thioredoxin System In
Plants.Proceedings of the National Academy of Sciences USA, v. 98, p. 14144-9,
2001.
LALOI, C.; MESTRES-ORTEGA, D.; MARCO, Y.; MEYER, Y.; REICHHELD, J. P. The
Arabidopsis Cytosolic Thioredoxin H5 Gene Induction By Oxidative Stress And Its W-Box-
Mediated Response To Pathogen Elicitor. Plant Physiology. v. 134, p. 1006-1016, 2004.
LARKIN, M. A.; BLACKSHIELDS, G.; BROWN, N. P.; CHENNA, R.; MCGETTIGAN, P.
A.; MCWILLIAM, H.; VALENTIN, F.; WALLACE, I. M.; WILM, A.; LOPEZ, R.; THOMPSON,
J. D.; GIBSONT J.; IGGINSD, G.Clustal W And Clustal X Version 2.0. Bioinformatics, v.
23, p. 2947-2948, 2007.
LEE, J. R.; LEE, S. S.; JANG, H. H.; LEE, Y. M.; PARK, J. H.; PARK, S. C.; MOON, J. C.;
PARK, S. K.; KIM, S. Y.; LEE, S. Y.; CHAE, H. B.; JUNG, Y. J.; KIM, W. Y.; SHIN, M. R.;
CHEONG, G. W.; KIM, M. G.; KANG, K. R.; LEE, K. O.; YUN, D. J.; LEE, S. Y. Heat-shock
dependent oligomeric status alters the function of a plant-specific thioredoxin-like protein,
AtTDX. Proceeding of the National Academy of Sciences U S A. v. 106, p. 5978- 5983,
2009.
LENNARTZ, K.; PLÜCKEN, H.; SEIDLER, A.; WESTHOFF, P.; BECHTOLD, N.;
MEIERHOFF, K. HCF164 encodes a thioredoxin-like protein involved in the biogenesis of
the cytochrome b(6)f complex in Arabidopsis. Plant Cell. v. 13, p. 2539-2551, 2001.
LESCOT, M.; DÉHAIS, P.; THIJS, G.; MARCHAL, K..; MOREAU, Y.; VAN DE PEER
,Y.; ROUZÉ, P.; ROMBAUTS, S. PlantCARE, a database of plant cis-acting regulatory
elements and a portal to tools for in silico analysis of promoter sequences. Nucleic Acids
Res. v. 30, p.325-327, 2002.
LI, Y. C.; REN, J. P.; CHO, M. J.; ZHOU, S. M.; KIM, Y. B.; GUO, H. X.; WONG, J. H.;
NIU, H. B.; KIM, H. K.; MORIGASAKI, S.; LEMAUX, P.G.; FRICK, O. L.; YIN, J.;
BUCHANAN, B. B. The level of expression of thioredoxin is linked to fundamental
properties and applications of wheat seeds. Molecular Plant. v 2, p.430-441, 2009.
33
MAFFT: Disponível em: http://mafft.cbrc.jb/alignment/seven. Acesso em: 07 de agosto de
2018.
MARCHAL, C.; DELORME-HINOUX, V.; BARIAT, L.; SIALA, W.; BELIN, C.; SAEZ-
VASQUEZ, J.; RIONDET, C.; REICHHELD, J. P. NTR/NRX Define A New Thioredoxin
System In The Nucleus Of Arabidopsis Thaliana Cells. Molecular Plant. v.7, p. 30-44,
2014.
MARTINS, L.; TRUJILLO-HERNANDEZ, J. A.; REICHHELD, J. P. Thiol based redox signaling
in plant nucleus. Front Plant Sci. 28;9:705, 2018.
MENG, L.; WONG, J. H.; FELDMAN, L. J.; LEMAUX, P. G.; BUCHANAN, B. B. A
Membrane-Associated Thioredoxin Required For Plant Growth Moves From Cell To Cell,
Suggestive Of A Role In Intercellular Communication. Proceeding National Academy
Sciences U S A. v. 107, p. 3900-3905, 2010.
MEYER, Y.; BUCHANAN, B. B.; VIGNOLS, F.; REICHHELD, J. P. Thioredoxins And
Glutaredoxins: Unifying Elements In Redox Biology. Annual Review of Genetic. v. 43, p.
335-367, 2009.
MEYER,Y.; BELIN, C.; DELORME-HINOUX, V.; REICHHELD, J. P.; RIONDET, C.
Thioredoxin And Glutaredoxin Systems In Plants: Molecular Mechanisms, Crosstalks, And
Functional Significance. Antioxid Redox Signal. v. 17, p.1124-1160, 2012.
MICHAEL, T. P.; JACKSON S. The first 50 plant genomes. The Plant Genome, v. 6, p. 1-7,
2013.
MYBURG, A. A; GRATTAPAGIA, D.; TUSKAN, G. A.; HELLSTEN, U.; HAYES, R. D.;
GRIMWOOD, J.; JENKINS, J.; LINDQUIS, T. The Genoma Of Eucalyptus Grandis.
Nature, v. 510, p. 356-62, 2014.
MOTOHASHI, K.; HISABORI, T. HCF164 receives reducing equivalents from stromal
thioredoxin across the thylakoid membrane and mediates reduction of target proteins in the
thylakoid lumen. Journal Biological Chemistry. v. 281, 2006.
NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION. Disponível em:
https://www.ncbi.nlm.nih.gov/. Acesso em: 01 de março de 2017.
34
NIKKANEN, L.; RINTAMÄ, K. I. E. Thioredoxin-Dependent Regulatory Networks In
Chloroplasts Under Fluctuating Light Conditions.Philos Trans R. Society London
Biochemical Biology Science. v. 369, 2014.
PARK, S. K; JUNG, Y. J.; LEE, J. R.; LEE, Y. M.; JANG, H. H.; LEE, S. S.; PARK, J. H.;
KIM, S. Y.; MOON, J. C.; LEE, S. Y.; CHAE, H. B.; SHIN, M. R.; JUNG, J. H.; KIM, M. G.;
KIM, W. Y.; YUN, D. J.; LEE, K. O.; LEE, S. Y. Heat-Shock And Redox-Dependent
Functional Switching Of An H-Type Arabidopsis Thioredoxin From A Disulfide Reductase
To A Molecular Chaperone. Plant Physiology. v. 150, p. 552-561, 2009.
PHYTOZOME, THE PLANTS GENOMICS RESOURCE. Disponível em:
https://www.phytozome.jgi.doe.gov/. Acesso em: 01 de março de 2017.
PRIMER3, PICK PRIMERS FROM A DNA SEQUENCE. Disponível em:
http://bioinfo.ut.ee/primer3/. Acesso em: 23 de abril de 2018.
REICHHELD, J. P.; MESTRES-ORTEGA, D.; LALOI, C.; MEYER, Y. The Multigenic
Family Of Thioredoxin H In Arabidopsis Thaliana: Specific Expression And Stress
Response. Plant Physiology Biochemistry. v. 40, p. 685-690, 2002.
REICHHELD, J. P.; KHAFIF, M.; RIONDET, C.; DROUX, M.; BONNARD, G.; MEYER, Y.
Inactivation of thioredoxin reductases reveals a complex interplay between thioredoxin and
glutathione pathways in Arabidopsis development. Plant Cell. v. 19, p. 1851-1865, 2007.
REY, P.; PRUVOT, G.; BECUWE, N.; EYMERY, F.; RUMEAU, D.; PELTIER, G. A Novel
Thioredoxin-Like Protein Located In The Chloroplast Is Induced By Water Deficit In
Solanum Tuberosum L. Plants Plant Journal. v. 13, p. 97-107, 1998.
RIVAS, S.; ROUGON-CARDOSO, A.; SMOKER, M.; SCHAUSER, L.; YOSHIOKA, H.;
JONES, J. D. CITRX Thioredoxin Interacts With The Tomato Cf-9 Resistance Protein And
Negatively Regulates Defence European Molecular Biology Organization Journal.
v.23, p. 2156-2165, 2004.
SANZ-BARRIO, R.; CORRAL-MARTINEZ, P.; ANCIN, M.; SEGUI-SIMARRO, J. M.; FARRAN,
I. Overexpression of plastidial thioredoxin f leads to enhanced starch accumulation in tobacco
leaves. Plant Biotechnology Journal. v.11, p. 618–627, 2013
35
SERRATO, A. J.; FERNÁNDEZ-TRIJUEQUE, J.; BARAJAS-LÓPEZ, J. D.; CHUECA, A.;
SAHRAWY, M. Plastid Thioredoxins: A "One-For-All" Redox-Signaling System In Plants.
Frontiers in Plant Science. v. 4, p. 463, 2013.
SIGRIST, C. J. A.; DE CASTRO, E.; CERUTTI, L.; CUCHE, B. A.; HULO, N.; BRIDGE, A.;
BOUGUELERET, L.; XENARIOS, I. New And Continuing Developments At PROSITE.
Nucleic Acids Research. 2012.
SMALL, I.; PEETERS, N.; LEGEAI, F.; LURIN, C. Predotar: A tool for rapidly screening
proteomes for N-terminal targeting sequences.Proteomics. v. 4, p. 1581-1590, 2004.
STRING, FUNCTIONAL PROTEIN ASSOCIATION NETWORKS. Disponível em:
http://string_db.org. Acesso em: 07 de agosto de 2018.
TAMURA, K.; DUDLEY, J.; NEI, M.; KUMAR, S. Mega4: Molecular Evolutionary Genetics
Analysis (MEGA) Software Version 4.0. Molecular Biology And Evolution 2. v.4, p.
1596-1599, 2007.
TUSKAN, G. A.; DIFAZIO, S.; JANSSON, S.; BOHLMANN, J.; GRIGORIEV, I.; ROKHSAR, D.
et al. The genome of black cottonwood, Populus trichocarpa. Science. v. 15; p. 313-604, 2006.
VICENTINI, R.; SASSAKI, F. T.; GIMENES, M. A.; MAIA, I. G.; MENOSSI, M. In Silico
Evaluation Of TheEucalyptus Transcriptome. Genetic Molecular Biology, v. 28, p. 487–
495, 2005.
VINING, K.J.; ROMANEL, E.; JONES, R.C.; KLOCKO, A.; ALVES-FERREIRA, M.; HEFER,
C. A. The floral transcriptome of Eucalyptus grandis. New Phytol. v. 206; p. 1406-1422,
2015.
VIGNOLS, F.; MOUAHEB, N.; THOMAS, D.; MEYER, Y. Redox Control Of Hsp70-Co-
Chaperone Interaction Revealed By Expression Of A Thioredoxin-Like Arabidopsis
Protein. Journal Biology Chemestry. v. 278, p. 4516-4523, 2002.
WOLOSIUK, R. A.; BUCHANAN, B. B. Thioredoxin and glutathione regulate photosynthesis in
chloroplasts. Nature, v. 266, p. 565-567, 1977.
WONG, J. H.; CAI, N.; BALMER, Y.; TANAKA, C. K.; VENSEl, W. H.; HURKMAN, W. J.;
BUCHANAN, B. B. Thioredoxin targets of developing wheat seeds identified by
complementary proteomic approaches. Phytochemistry. v. 65, p. 1629-1640, 2004.
36
YANO, H. Ongoing Applicative Studies of Plant Thioredoxins. Molecular Plant. v. 7, p. 4 -13,
2014.
37
ANEXO 1
__________________________________________________________________________
Sequências de Tiorredoxinas das cinco espécies (Eucalyptus grandis, Jatropha curcas, Populus trichocarpa, Vitis vinífera, Arabidopsis thaliana) utilizadas para a construção de árvores filogenéticas. TIORREDOXINAS F >Eucgr.B01424.1 MRAREAREKGYPLGSCKPMPMPTMRSKRAPFVCGRSESSSWGRRMRPCSIRVIDSSDHARGHDKRSIQSDLVVFQEWPPNNISLASSNFSTTTPLDARRPPHTQSDIPKTPPPASPHIHKTKAPVSFLLSLRRRRRRRRRLRLLVLLSLRSAPMALQLSLSNPPSLRSSSAGSSGLSVASSSSSSSVFSPPSRPLKSVSIAGRAPRSGATGVVRCSVETAIAEVGQVTEVNKDSFWPIVRSAGDKTVVLDMYTQWCGPCKVMAPKYQELSEKYSDVLFLKLDCNQDNKPLAKELGLKVVPTFKILKDNKVVKEVTGAKLDNLVLAIDAVRSS >Eucgr.H01629.1 MALQLSLSASSSLRSQNSVPCLSSSGSSSSSSAISSSRWCWLGCKNVSLLRAGGNVGRGGNGVVVKCSVDTTGVYTVGTVTDVDKDTFWPIVNSAPDKTVVLDMYTQWCGPCKIIAPKFQELAEKYLDVVFLKLDCNQENKPLAKELGIRVVPTFKILKGGKIVKEVTGAKFDDLLLAIDTVRSS >JCDBP23011 (XP_012085778.1 thioredoxin F-type, chloroplastic) MSLIQFSITPTTPRSSPSFSSSQAHPIAAAIAKDSFTNSSPKPSSRSSFSRSLKVFKRNDCAFTVRSSLD TVGPTATVGQVTEVNKDTFWPIVKSAGAKAVVLDMYTQWCGPCKVIAPKFQELSEKYLDVVFLKLDCNQE NKPLAKELGIKVVPTFKILKDSKVVKEVTGAKYDDLVAAIEAVRSS >PtTrxf(estExt_fgenesh4_pg.C_LG_XIX0571) MASIQFSLSPTSSIRSSPSFAGSPANPITPQYSSTPTKDLSSYCKLSSRQKNVIKRNGSRNLVSTVRSSLDTAGPTSAVGQVTEVTKDTFWPIVNSAGDKTVVLDMYTQWCGPCKLIAPKYKELSQKYDDVVFLKLDCNQENKPLAKELGIKVVPTFKILKQGKIVKEVTGAKFDNLVIAIESVRSAS >VvTrxf(GSVIVP00025050001) MALRLSLSPPPIRSSASPSWAAPHSIAISCSSSSSVGVSVPTQEKRRARVVVRSSSIDTAEAVVGQVTEVNKDTFWPIVKAAGDKAVVLDMYTQWCGPCKVMAPKFQELSGKYLDVVFLKLDCNQDNKTLAKELGIRVVPTFKILKDSKIVKEVTGAKLDDLVVAIETVRSS >AtTrxf1(At5g16400) MPLSLRLAPSPTSFRYSPITSTGAGGFSPVKQHCRIPNSGVATKIGFCSGGGGVLDSGRRIGSCVVRCSLETVNVTVGQVTEVDKDTFWPIVKAAGDKIVVLDMYTQWCGPCKVIAPKYKELSEKYQDMVFLKLDCNQDNKPLAKELGIRVVPTFKILKDNKVVKEVTGAKYEDLLAAIEAARSG >AtTrxf2(At3g02730) MPLSLRLSPSPTALSPTTGGFGPSRKQCRIPYSGVPTTKIGFCSLDSRKRGDSSVVRCSLETVNVSVGQVTEVDKDTFWPIVKAAGEKLVVLDMYTQWCGPCKVIAPKYKALSEKYDDVVFLKLDCNPDNRPLAKELGIRVVPTFKILKDNKVVKEVTGAKYDDLVAAIETARSAASG
TIORREDOXINAS H
>Eucgr.A00783.1 MGQCVTKILCCSWCFQQEIKDNESDQHIDFASGNVHLITTKESWDEKLSQAIKDGKIVIANFSATWCGPCRVIAPFYSELSEKHPSLMFLLVDVDELTEFSTSWDIKATPTFFFLKDGNQVDKLVGANKPELQKKITAILDSIDQSQK >Eucgr.B02586.1 MGQNVSSGDCNDWAPAKASRVMEFHSKSRWDEHNDWAPAKASRVMEFHSKSRWDEHFEASKGNNKLMVIDFTATWCGPCRRMEPTIDELAETFADVDFIKIDVDELMNVARQYEVQAMPTFLLMKNGKVVDEVIGAKKDELRNKIEQNCNKSQPYLQSNSHHYAI >Eucgr.F01604.1 MAEEGQVYGCHTVDAWKEQFQKGVESKKLVVVDFTASWCGPCRLIAPIFAEMAKKMPHVLFLKVDVDELQSVATEHSVEAMPTFLLLKDGQIVDKVVGADKEHCCLTVYLVLREKNKPAPMLDALESIWLVSFPWISDTLVCEELSYLQI >Eucgr.F01854.1 MAGEGQVISCHTVDSWNQQLQTGAESKKLVVVDFSATWCGPCRLISPVLDNLARKLTDVIFLKVDVDELRSVAEDWAVEAMPTFIFIKEGAVVDKVVGANKDDLQMKIAKHAAATVTA >Eucgr.I01912.1 MGSFLSRLLRALGLGPRAPAAAPATTVSTDSPSQSSSSDSPPRHSRVQALHSTPPWQLHFNTVKETPKLMLIDFTASWCGPCKSMQPVVDAMASKFTDVDFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRLVGASKDELERKIQKHRGLVPTR
38
>Eucgr.I01913.1 MTTRKGWVQPAKQSERSSCHGLLPLQPPRSSGRRRLAGIVVGAFPRPGVPLHPAVAAPLQQSQGYLPIAKMVIDFAASWCGPCRMMEPAVSAMASKFADVEFAKIDVDELSDVAREFSVQAMPTFVLVKKGKEVDRIVGAKKDELERKVQKHRALMASS >Eucgr.I02383.1 MAEEGQVISCHSAESWSEQIAKSNESDKLVVVDFTASWCGPCRFIAPFLAELAKKFPNVLFLKVDVDELKTVAQEWAVEAMPTFMFVKGGKIVDRVVGAQKDQLQMTLAKHMATASA >Eucgr.J02387.1 MASSEEGQVIGCHTVGAWTEQIQKGNEPDQLVVVDFTASWCGPCRFIAPFLAELAKKFPAVLFLKVDVDELKQVAQEWAVEAMPTFIFVKGGKVVDKVVGAKKDDLQQTIGKHVATASA >Eucgr.K01294.1 MGQCYPKNQMHGDDSDEHVEFAGGNVHIVTTKESWDQKLSEANKDGKIVLANFSATWCGPCKMMAPFYSELSEKHSSILFLVVDVDELTEMSTSWDIKATPTFFFLRDGQQIDKLVGANKPELQKKITAILDSANPR
>NP_001295646.1 thioredoxin H1-like [Jatropha curcas] MAEEGQVIACHTVEAWNEQLEKGKESKTLIVVDFTATWCGPCRFITPILQDLAKKMPHVTFLKVDVDELR TVAEDWAVEAMPTFMFLKEGKIVDKVVGAKKEELQMTIVKHATEVAAA >JCDBP18536 (XP_012078402.1 thioredoxin H-type) MAAEEGQVIGCHTVEAWNEQLQKGNESKKLVVVDFTASWCGPCRFISPLLAELAKKLPNVIFLKVDVDEL QTVAQDWAVEAMPTFIFLKEGNILDKMLGANKDELQQKIAKHLATSTATASA
>XP_012091966.1 thioredoxin H7 [Jatropha curcas] MFRQMNSFQRARTMRSSFSFNYNKGLTDTQPSGIVEIRSVDQWKAYFEATKGNNKLLVIQFTATWCGPCR LIDPAIKEFAAKYKDVDFIKIDVDKLFLVAQQFEANTLPAFVLIKKGKEVDKIVGVKKIELQNKIEQLRI >XP_012091029.1 thioredoxin H-type [Jatropha curcas] MGQCLCLDKSQGADDADEHVEFVGSNVHLVTTNETWEQKLSEASRDGKTVLANFSATWCGPCRMIAPFYR ELSEKYPSLMFLLVDVDELPDFSTSWDIKATPTFFFLRDGQQLDKLVGANKPELQKKIAAVLDATA >XP_012067568.1 thioredoxin H4-1-like [Jatropha curcas] MGQCWSQVSICGKSKNNGNDDTKKSKDTGHGDCRCKNVHRINSIQKWEEKLSEANKDNKIVVVNFCSSWC SPSKSIAPAYCELADKYTSLVFLSVDIDELAEFSSSWEIKSTPTFFFLKDGRQVDKLVGADKPELQKKIA SFVGSK >XP_012082815.1 thioredoxin H2 [Jatropha curcas] MGSLFSALAGDSAAAAEDNSADHSGVTTFHSPERWQLHFNSVKDSSQLMVIDFAASWCGPCKLMEPEVKG MAVKFTDVQFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRIVGARKDELQRKIEKHRALVAAT >ADU56183.1 thioredoxin H-type [Jatropha curcas] MAEEGQVIACHTVEAWNEQLEKGKESKTLIVVDFTATWCGPCRFITPILQDLAKKMPHVTFLKVDVDELR TVAEDWAVEAMPTFMFLKEGKIVDKVVGAKKEELQMTIVKHATEVAAA >PtTrxh1.1(estExt_fgenesh4_pg.C_LG_V1461) MAEEGQVIACHTVDTWKEHFEKGKGSQKLIVVDFTASWCPPCKMIAPIFAELAKKFPNVTFDGKLVDKTVGADKDGLPTLVAKHATALKVDVDELKAVAEEWNVEAMPTFIFLK >PtTrxh2(gw1.VIII.1883.1) MEFAWPVLQRGRTVQTSFFHFDHSNGFPCKKPSAGVVDVHSVDAWRSFFEANKQNNKLLVVEFTATWCGPCRYMEQTMKDFAAKYADVVFIRIDVDELQHVAQQFNVTTMPAFSLLKKGKIVDEVAGVKKSELQNKIEKHGMI >PtTrxh3(gw1.VII.3777.1) MAAEDGQVIGCHTVEAWDEQLQRGNESKKLVVIDFHASWCGPCRVIAPFLAELARKLPDVIFLKVDVDELKTVAQDWAVEAMPTFMFLKEGKIVDKVVGARKDELQQAIAKHTAPAAATASA >PtTrxh4.2(estExt_fgenesh4_pg.C_LG_VI0901) MGLCLDKHKHDADNDELHVEFAGGNVHLVTTKESWDQKLSEASRDGKIVLANFSATWCGPCKQIAPFYNELSEKYPSLLFLLVDVDELSDLSTSWEIKATPTFFFLRDGKQLEKLVGANKPELQKKITAIADSLPPSDK >PtTrxh4.1(estExt_fgenesh4_pg.C_LG_XVI1300) MGLCLAKRNHDADDDEPHIELAGGNVHLITTKERWDQKLSEASRDGKIVLANFSARWCGPCKQIAPYYIELSENYPSLMFLVIDVDELSDFSASWEIKATPTFFFLRDGQQVDKLVGANKPE LHKKITAILDSLPPSAK >PtTrxh1.2(estExt_Genewise1_v1.C_LG_II0911) MAEEGQVIACHTVDVWKEQFEKGKGTQKLIVVDFTASWCPPCKFIAPVFADLAKKFTNVTFKDGKLVDKIVGADKDGLPALVEKHSVYTALKVDVDELKPVAAEWEVEAMPTFIFL >PtTrxh5(gw1.XVII.864.1) MGAVLSSIGSILSYLFGASAAGEDSASDGQSGVTAFHSSARWQLHFNSIKNTSQLTVIDFAASWCGPCKHMEPAVHAMAAKFTDVQFAKIDVDELPDVAQEFGVQAMPTFVLVKKGNEVDRVVGAQKEELQRKIEKHRPR
39
>VvTrxh1(GSVIVP00036859001) MAEEGQVIGVHSVEAWNDHLQKCNESNKLIVVDFTASWCGPCRFITPFLVELAKKIPTVTFLKVDVDELKSVATDWAVEAMPTFMFLKQGKIVDKVVGANKDSLQQTIAKHMATA >VvTrxh2(GSVIVP00028970001) MGASHSSSSKSSRVLTFNSSASWKIHFEEAKSTGKLMVIDFSATWCGPCRFMEPVINEFAEKYTDVEFVKIDVDELSDVAQEFGVQGMPTFLLIKRGTEVDKVVGAKKEELQKKIEAHRKN >VvTrxh3(GSVIVP00014532001) MAEEGQVVGCHSVESWKEQFQHGIESKKLVVVDFTASWCGPCRVISPFLAELAKKMPNVIFLKVDVDELETVAKEWEVEAMPTFLFLKEGNVVDKVVGAKREELVQKTEKHATA >VvTrxh4(GSVIVP00023385001) MVQHHNDDDDSDHNAAFASGNVHLITTKENWEEKLAEASKDGKIVIANFSATWCGPCKMIAPFYCELSEAHPSLMFLTVDVDELSEFSSSWDIKATPTFFFLRDGQQVDKLVGANKPELQKKITAILDSMTQCNK >VvTrxh5(GSVIVP00020873001) MGSVVSGLLGGGAADASDSTLEGSGVNVFHSSERWLLHFNASKESNQLMVIDFAATWCGPCKFMEPAVKSMASKYTDVDFVKIDVDELPDVAQEFTVQAMPTFVLLKKGKELERVIGAKKDELEKKIQKHRAVSNA >AtTrxh1(At3g51030) MASEEGQVIACHTVETWNEQLQKANESKTLVVVDFTASWCGPCRFIAPFFADLAKKLPNVLFLKVDTDELKSVASDWAIQAMPTFMFLKEGKILDKVVGAKKDELQSTIAKHLA >AtTrxh2(At5g39950) MGGALSTVFGSGEDATAAGTESEPSRVLKFSSSARWQLHFNEIKESNKLLVVDFSASWCGPCRMIEPAIHAMADKFNDVDFVKLDVDELPDVAKEFNVTAMPTFVLVKRGKEIERIIGAKKDELEKKVSKLRA >AtTrxh3(At5g42980) MAAEGEVIACHTVEDWTEKLKAANESKKLIVIDFTATWCPPCRFIAPVFADLAKKHLDVVFTFIFMKEGEIKETVVGAAKEEIIANLEKHKTVVAAAFKVDVDELNTVAEEFKVQAMP >AtTrxh4(At1g19730) MAAEEGQVIGCHTNDVWTVQLDKAKESNKLIVIDFTASWCPPCRMIAPIFNDLAKKFMSSAMPTFVFIKAGEVVDKLVGANKEDLQAKIVKHTGVTTAIFFKVDVDELQSVAKEFGVEA >AtTrxh5(At1g45145) MAGEGEVIACHTLEVWNEKVKDANESKKLIVIDFTASWCPPCRFIAPVFAEMAKKFTNVVFFKIDVDELQAVAQEFKVEAMPTFVFMKEGNIIDRVVGAAKDEINEKLMKHGGLVASA >AtTrxh7(At1g59730) MGSNVSSVHDVHSSMEITSNGFVVEIESRRQWKSLFDSMKGSNKLLVIDFTAVWCGPCKAMEPRVREIASKYSEAVFARVDVDRLMDVAGTYRAITLPAFVFVKRGEEIDRVVGAKPDELVKKIEQHRV >AtTrxh8(At1g69880) MGANVSTPDQRFQVTHFRSTKPWTPRPEIYPFKVNSPCIVEIKNMNQWKSRLNALKDTNKLLVIEFTAKWCGPCKTLEPKLEELAAKYTDVEFVKIDVDVLMSVWMEFNLSTLPAIVFMKKYTQSFFRGREVDMVVGVKVDELERKLN >AtTrxh9(At3G08710) MGSCVSKGKGDDDSVHNVEFSGGNVHLITTKESWDDKLAEADRDGKIVVANFSATWCGPCKIVAPFFIELSEKHSSLMFLLVDVDELSDFSSSWDIKATPTFFFLKNGQQIGKLVGANKPELQKKVTSIIDSVPESPQRP TIORREDOXINAS M
>Eucgr.A01813.1 MSSMAAMLDSVALSSPKIRPSPRRPAAAMASSPAAISLPSRPKADALPGFAGLRIQSRSLAPSNSRSSRGPRCSRNGRIVCEASDTALDLPPVTDTTWKSLVLKADGPVLVEFWAPWCGPCRMLHPVVGEIADEYAGKLKCFKLNTDESPSIATQYGVRSVPTIMIFSSGEKKDAVLGAVPKSTLTTCIEKFL >Eucgr.F02754.1 MEQCVQMMSATRGRVLQCCDRPVAFARRGMPNSPTRKGGAVLKKSALNFSLSSSPPPLASSLSVRHQRRSSIICKARDALDEVRVVTDSSWSNLVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIACYKLNTDDCPTIATQYGIRSIPTVLFFKNGEKKESVIGAVPKSTLSATVEKYLDL >Eucgr.F03319.1 MAAVLESLAVPRSSGAASAAALSPVASASSLAPTAGRRRSATFPQASGLRIGPVSVARSLRSPSQRPRRAPAVVCEAQDTAVEVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL >Eucgr.L03049.1 MNDVMPKKLHKKVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL
40
>XP_012066098.1 thioredoxin M-type, chloroplastic [Jatropha curcas] MAMKNCFQVCTSGRGGVVQCSQPLKIHLPTSCKGIFNIANKDLLSLSSSSLRLKPRSQKARFVCKAREAL NEVQAVTDSSWDNLVISSENPALVEFWAPWCGPCRMIAPVIDELAKEYAGKISCFKVNTDECPNIANKYG IRSIPTVLFFKKGEKKESVIGAVPKTTLSSTIEKYIDA
>PtTrxm1(eugene3.01420010) MVSSMVLSSYPSSRLKCSLSNPQSVIMMSSPQPTVALLFPVRLGGAASFAEFGGLRIQMGSKLSPSLVSINTRRNPKVFCRIVSEAQETVVDIPTVTDETWQSLVIEADGPVMIEFWAPWCGPCRIIHPVIAELSTEYGGKLKCFMLNTDESPSTVTKYGIRSIPTIIIFKKGEKKDAIIGAVPKTTLISNIKKFL >PtTrxm2(estExt_Genewise1_v1.C_LG_XIX2392) MDSSMALSSYSSRLKCSLPNPPPMMMVPSPQLPGVLPLSSRRCGIASFAEFRGLRIQMGSKLSTSLVSIGTRRNPKVFSRIVSEAHETFVDIPAVTDETWQSLIIEADGPVLVEFWAPWCGPCRIIHPVIAELSTEYDGKLKCFKLNTDESPSTTTKYGIRSIPTIMIFKNGEKKDAIIGSVPKTTLISNMKKFL >PtTrxm3(estExt_Genewise1_v1.C_LG_IX2199) MASSATSLYSPPLTSSRAAVLHQCQQLNPNRLSFPSDFNTAKRATNLTVQHVPLPLKVLCGRGNRATAVTQDSWENSILKSDIPVLVEFYASWCGPCRMVHRVIDEIAAEYDGKLKCFVLNTDNDLQIAEDYEIKAVPVVLLFKNGEKRESVVGTMPKEFYIAAVERVLQS >PtTrxm4.1(gw1.107.137.1) MAALLESLTVPPLTFPKPKPTTTTPLSAFASPIHRRSLRLPHVKGLKLSFNSSTINRSPGSFVTLTSSRLSRGGRIVCEAQETAVEVASVTDATWKSVVLESESPVLVEFWAPWCGPCRMIHPIIDELATQYTGKLKCYKVNTDDCPSIATQYGIRSIPTVIIFKNGEKKEAIIGAVPKTTLTTTIEKFL >PtTrxm4.2(estExt_Genewise1_v1.C_LG_XI3916) MATVLESLTAPSRSSAVLPKPTTTLVTAFASTINRRSLRFPQLKGLKIHFHSSSTVNRSLGSVSQSSSRLACAGRIVCEAQDIAVKVPAVTDATWKSLVLESESPVLVEFWAPWCGPCRMIHPVIDELANQYAGKLKCYKLNTDDCSSIATEYGIRSIPTVIIFKNGEKKEAIIGAVPKTTLTTSIEKFL >PtTrxm5.1(estExt_fgenesh4_pg.C_LG_II0671) MAMKNCFQVSSVSTTRAGVCHPFAPVEKLQLPTSKGLNTSNLLLSSPSSSFPPSLRSRCQESRIVCKAREAVDAVQVATDASWDAVIGGDTPVLVEFWAPWCGPCKMIAPVIEELAQEYAGKKTTLSSSIEKYIDVIACYKVNTDDCPSIATKYGIRSIPTVLFFKKGEKKESVIGAVP >PtTrxm5.2(estExt_fgenesh4_pg.C_LG_V1048) MAMKNCFQVSSVSTTTRAGVCHPFAPVEKLQLPTCKGPNTSNLSLSSPSSSFPRSLRSRCQKSRVVCKAREAVDAVQVATDASWDTVIGSDTPVLVEFWAPWCGPCKMIAPVVEELAKEYAGKIACYKVNTDDCPNIATKYGIRSIPTVLFFKKGEKKESVIGAVPKTTLSNSIDKYIDA >PtTrxm6(eugene3.00700019) MALHASMNMSTMSTTRAGVLCSNHVACSKEKLKLPTGRGLRRSSSLSFPSSFSSSYASVKNHKIHHCMQSSRSCRLQVVTDSSWDSLVIGCEIPVLVEFWAPWCGPCRMITPVIDELAAEYAIRSIPTVLMFKNGEKKEGVIGAVPKATLAAAIEKYVEA GKIACFKVNTDDCPNIASQYA >VvTrxm1(GSVIVT00018570001) MPSPTVVSVGRSSFSLPEFSGLKIHTNSSSALASLNSRTSRVCRRGGRIVCEAQETALDVPIVTDTTWQSLVLKATGPVLVEFWAPWCGPCRIIHPVVAELSEEYAGKLKFFKLNTDDSPSIATQYGIRSVPTTMIFINGEKKDAVLGAVPKTTLTASIEKFL >VvTrxm3(GSVIVT00036607001) MASCSNPPPLSSPLSPSLQTRKLFAPLSYPRSGGPSYALHFHAKRGIRFSNPPLRLKVLCSADYDKAAVVTGDSWEKSILNSEIPVLVEFYASWCGPCRMVHRVIDEIAEDYAGRLKCFVLNTDHDLHIAENYEIKAVPVVLLFKNGEKRESVVGTMPKEFYVAAIERVLSSGQFKFYKLNTDESPATPGQYG >VvTrxm5(GSVIVP00014312001) MALENCFQVSTVSCARAGVLQSHHPFSAKEKLNLPTCKGVKPSILSFSSSPSSLDYSFHRICRKSRIVCKAREAVDEVQVVTDSSWSNVVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIVCCKVNTDDCPNIATQYGIRSIPTVLFFKNGERKESVIGAVPKSTLTATIEKYVDM >AtTrxm1(At1g03680) MAAYTCTSRPPISIRSEMRIASSPTGSFSTRQMFSVLPESSGLRTRVSLSSLSKNSRVSRLRRGVICEAQDTATGIPVVNDSTWDSLVLKADEPVFVDFWAPWCGPCKMIDPIVNELAQKYAVRSIPTIMIFVNGEKKDTIIGAVSKDTLATSINKFL >AtTrxm2(At4g03520) MAAFTCTSRPPISLRSETRIVSSSPSASSLSSRRMFAVLPESSGLRIRLSLSPASLTSIHQPRVSRLRRAVVCEAQETTTDIQVVNDSTWDSLVLKATGPVVVDFWAPWCGPCKMIDPLVNDLAQHYTGKIKFYKLNTDESPNTPGQYGVRSIPTIMIFVGGEKKDTIIGAVPKTTLTSSLDKFLP >AtTrxm3(At2g15570) MAISSSSSSICFNPTRFHTARHISSPSRLFPVTSFSPRSLRFSDRRSLLSSSASRLRLSPLCVRDSRAAEVTQRSWEDSVLKSETPVLVEFYTSWCGPCRMVHRIIDEIAGDYAGKLNCYLLNADNDLPVAEEYEIKAVPVVLLFKNGEKRESIMGTMPKEFYISAIERVLNS >AtTrxm4(At3g15360) MASLLDSVTVTRVFSLPIAASVSSSSAAPSVSRRRISPARFLEFRGLKSSRSLVTQSASLGANRRTRIARGGRIACEAQDTTAAAVEVPNLSDSEWQTKVLESDVPVLVEFWAPWCGPCRMIHPIVDQLAKDFAGKFKFYKINTDESPNTANRYGIRSVPTVIIFKGGEKKDSIIGAVPRETLEKTIERFLVE
41
TIORREDOXINAS O >Eucgr.D00028.1 MRRCAALLRRSWTSSGRTGAGGLSRRPQFPLPLPGHADAACRAVAPKAAAAAAFAALSLPRTFSSASSPSPGSSKMHLIKSEEQFDGVLAKIRDESSPAILYFTAAWCGPCRLMSPAIEALNEKYPHVTTYKIDIDQEGIQDKLMELRIDSVPRLHFFSKGQKVDEIVGADIESLEHTMDRLYK >XP_012087817.1 thioredoxin O1, mitochondrial [Jatropha curcas] MRGISAIRRFVDRRSGWNFGSICSVSRFHETQISTPINFSSPTISLKLPFANVYSTKIQFSCPSLQLQRT LSSSAGSSKTVLIKSEEQFNNSLKDVQDKSLPAIFYFTAKWCGPCKFISPILAEQSEKYPNVTTFKIDID QEGLESLLSRLSIISVPTLHFFENGKKAAEIVGADVERLKDTMEELYGEDK >PtTrxo(estExt_fgenesh4_pg.C_290035) MRGNNKALLVRALIFGSHRSSMNSFSRHLHENLISNPSKTSHPSKSLSNFTTKFHFSTPYLQPFQRTLCSSSSSGASNIVLVKSDEELNSGLKNVQEKSSPAVFYFTATWCGPCKFISPVIEELSKKYPHATIYKVDIDTEGLQNALASLNIAAVPTLDFYKNGKKETTIVGADVAKLKNTMESLYRED >VvTrxo(GSVIVP00017858001) MARNSVLLRHLLRFSPSSRARSSSLIETLASSPIAVPSPPIHTISSFFTTATANSQFSRPCLNYRTLCSSSGQSKIALIKSEEEFNTSLSKVQDESLPAIFYFTAVWCGPCRFIAPIIAELSEKYPHVTTYKIDIDQDGLENTLRRLNIASVPTLHFFQNGKKAAEIIGADVARLKDTMDKLYKKD >AtTrxo1(At2g35010) MKGNWSIVRKVLHRQFSTLRSSTPSSRLSTSIRPLVLAPNSISSLIARNSLFTASNIGPSIDFNFSNTSLPHRRSLCSEAGGENGVVLVKSEEEFINAMSKAQDGSLPSVFYFTAAWCGPCRFISPVIVELSKQYPDVTTYKVDIDEGGISNTISKLNITAVPTLHFFKGGSKKGEVVGADVTKLKNLMEQLYK >AtTrxo2(At1g31020) MKSQWSNFHQIGRNSFLAASTVYVSNEFNFLNTSLLNRRSFCFAEGDRSSFVVLKSEAEFNSALSKARDGSLPSVFYFTAAWCGPCRLISPVILELSNKYPDVTTYKVDIDEGGLSNAIGKLNVSAVPTLQFFKGGVKKAEIVGVDVVRLKSVMEQLYKYYKGGRRVESFSGARADMLESLIQKHAK TIORREDOINAS X >Eucgr.J00880.1 MDGAALVSSSGVLFPPSLPPARLATALSAAAGCRFAPPPRSSFRTWRSGAGVAPVRKSARRCGAAVGGGGITEIDESQFPETVLKSDRPVLVEFVANWCGPCRLISPAMEWLAQEYKERLIIVKIDHDANPKLIEEYKVYGLPALILFKNGKEVPESRREGAITKVKLKEYLDSLLDSISVA >PtTrxx(gw1.VII.2415.1) MDKIILSSTSTPLSTSSLPPLRTVTSTASLSSPKKLFLLRSTQSQRKLSSSSRRSTSFCKVHKSTTITCGAITEINESEFQNVVLNSDRPVLVEFVATWCGPCRLISPAMESVAQEYGDRLTVVKIDHDANPKLIKEYKVYGLPALVLFKDGKEVPESRREGAITKAKLKEYVDALLESISVA >VvTrxx(GSVIVP00007099001) METMVSNSMPISVSSLPPVRVVASPRKLEFSSFTPKTTLFGSRSQRKIGFRCSPVRRAAVTCGVVTEIKESQFSDVVLKADEPVLVEFVATWCGPCRLISPAMEAIAQEYGDRLTVVKIDHDANPRLIEEYKVYGLPTLILFKNGQEVPESRREGAITKGKLKEYVDALLESISVA >AtTrxx(At1g50320) MDSIVSSSTILMRSYLTPPVRSCSPATSVSVKPLSSVQVTSVAANRHLLSLSSGARRTRKSSSSVIRCGGIKEIGESEFSSTVLESAQPVLVEFVATWCGPCKLIYPAMEALSQEYGDKLTIVKIDHDANPKLIAEFKVYGLPHFILFKDGKEVPGSRREGAITKAKLKEYIDGLLNSISVA TIORREDOXINAS Y >Eucgr.F04223.1 VEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPIFNEVSIRLKDTIQVVKIETEKYRSITHLYHGKPFERFVHGELWKEYLHFAKKAQTPLEMYIGTCGMENL >Eucgr.F04229.1 MAISLSASSIPRLSGENPAASSSMSPLRLRLPAGARGFGGGGRRISVNSKPRGFSLVVEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPILNEVSIRLNDTIQVVKIDTEKYPSIADKYKIEALPTFIIFKDGKPFERFVRCSDG >JCDBP18536 (XP_012080734.1 thioredoxin Y2, chloroplastic) MAISSLSASTIPSLKTPQLQSSTTKLTSLSSLQFQSHLQRLQFGNGGITSSPSRPRILPLVAAKKQTFSS FDELLENADKPVLVDFYATWCGPCQIMGPILNEVSTVLKDTIQVVKIDTEKYPTIADKYRIEALPTFIIF KDGKPYDRFEGAFSKDKFIQRIESSLQVKQ >PtTrxy1(estExt_fgenesh4_pg.C_LG_V1100) MAISSLSASTIPSLNTRNSTSNYSSKLSSFSSLQFPAQLHRLQFRNRGVSSHSRQRNLPLVAAKKQTFSTFDELLQNSDKPVFVDFYATWCGPCQFMAPILDEVGAVLKDTVQVVKIDTEKYIQRIESSLNVKQPSIADKYKIEALPTFIIFKDAEPYDRFEGALTKDQL
42
>PtTrxy2(fgenesh4_pg.C_LG_II000621) MAISSLSASTIPSLNTPNSTSNYSSKISSFSSLQFPVQLHRLQFRKRWITSPSRPPILPLVAAKKQTFSTLDELLEKSDKPVLVDFYATWCGPCQFMAPILNEVSAVLEDTIQVVKIDTEKYRFEGALTKDQLIQRIENSLNVEQPSIADKYRIEALPTFIIFKDGKPYD >VvTrxy(GSVIVP00031751001) MATSLTFSTVRALNSQRPTPLAFSSSSPSSKLFSSSPLQFPRQLRPIRIGNNGISSPSRPRTLPVVEAKKQTFSSLDELLANSEKPVLVDFYATWCGPCQFMVPILNEVGASLKDKIQVVKIDTEKYPSIADKYRIEALPTFIIFKDGKPYDRFEGALTADQLIQRIETTLKVKQ >AtTrxy1(At1g76760) MASISLSSSTVPSLNSKESSGVSAFASRSISAVKFQFPVRRVRTGDLKFPSLSSTTRCTPRRIEAKKQTFDSFEDLLVNSDKPVLVDYYATWCGPCQFMVPILNEVSETLKDKIQVVKIDTEKYPSIANKYKIEALPTFILFKDGEPCDRFEGALTAKQLIQRIEDSLKVKP >AtTrxy2(At1g43560) MAISLATAYISPCFTPESSNSASPSRTLSSVRLPSQIRRFGSVQSPSSSTRFAPLTVRAAKKQTFNSFDDLLQNSDKPVLVDFYATWCGPCQLMVPILNEVSETLKDIIAVVKIDTEKYPDGKLWDRFEGALPANQLVERIENSLQVKQSLANKYQIEALPTFILFK TIORREDOXINAS CXXS >Eucgr.D00853.1 APGIQKDFTSPTIPQVHIQKWAPPPAFLVLQSDQRRHQPLCLNYNGNSLDASGAGGTERRRRRPGKAPAPALSQISSGQARMEGQYDQQNKSRVVKVDSPESWETCLTQAAAQGCPVVVHFTAAWCMPSVAMNPFVEELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFCTSVA >Eucgr.L01943.1 MPSVAMNPFVRELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFRTSVA >XP_012091425.1 thioredoxin-like protein CXXS1 [Jatropha curcas] MENQEQQTKSRVVKVDSVQSWEFYVTQANNQGCPIVVHFTASWCIPSVAMNPFFEELASTYPDVLFLTVD VDDVKEVASKLEVKAMPTFVLMKEGAQVDRLVGANPEEIRKRIDGFVHSVRVYVA >XP_012070723.1 thioredoxin-like protein CXXS1 [Jatropha curcas] MAQHKQVKKSRVVKVDSEESWNFFTTQAANKGCPVMVHFTASWCMPSVAMNPFFEQLAITYQDFLFLTVD VDELKGVATKMEVKAMPTFVLMSKGAKVHKLVGANPHEIKKRVHAFILST >PtTrxCXXS1.1(grail3.0055010001) MAGHSQVIKTRVVRIDSEKSWDFFINQATNKECPVVVHFTACWCMPSVAMNPFFEEVASNYKHILFLSVDVDEVKEIATRMEVKAMPTFLLMMGGARVDKLVGANPEEIRRRIGGFVHTIHGYKAI >PtTrxCXXS1.2(grail3.0093003601) MESQEQQPKSRVIKVESVESWDFYITQATNQACPIVVHFTALWCMPSVAMNPVFEELASAYPDGLFLIVDVDEVKEVATKMEVKAMPTFVLMKDGAQVDKIVGANPEEIRKRIDGFVQSIRAYNA >PtTrxCXXS1.3(estExt_Genewise1_v1.C_LG_XI2388) MESEATNKSRVVMVESGESWDFYISQATTQTCPIAVHFTASWCMPSVAMNPIFEDLASAHPDILFLTVDVDAVKVINSFFCMPTFVLMKDSAQVDKIVGANPEEIRKRIDSFVQSIPANIA >VvTrxCXXS1(GSVIVP00012977001) MENQEPEENKSRVIKVESEESWDFYISQATTQGCPVVVHFTAAWCIPSVAMNQFFEELASNYPDALFLTVDVDEVKAVAVKMEVKAMPTFLLMKEGAQVDRLVGANPDEIRKRIDALVQSFRVYVA >AtTrxCXXS1(At1g11530) MARVVKIDSAESWNFYVSQAKNQNCPIVAHFTALWCIPSVFMNSFFEELAFNYKDALFLIVDVDEVKEVASQLEVKAMPTFLFLKDGNAMDKLVGANPDEIKKRVDGFVQSSRVVHIA >AtTrxCXXS2 (At2g40790) MGNHCTRIPCCKKVCSCICCCNRRNKTQARSQKGSYFIKGKVHPVSRMEKWEEKITEANSHGKILVVNFKASWCLPSKTILPIYQELASTYTSMIFVTIDVEELAEFSHEWNVDATPTVVFLKDGRQMDKLVGGDAAELQKKTAAAANLLLRQS >AtTrxCXXC2(At3g56420) MVKPEANTGPKERSIRAPWCVPCKKIEPVFRDLASRYPSMIFVTVDVEELAEFSNEWNVEAFLRKPTPTVVFLKDGRQMDKLVGAETSELQKKTAAAADL THIORREDOXINA Z >Eucgr.G03224.1 MGLLQIHSPIAVFLSKPVSSSHSKPPRLPPFQDSTRNFGQSSLFSSSPGIKDRVFTLSTAPRKLLCTPPQGKHVREDYLVKKLSAQEVQELVRGERNVPLIIDFYATWCGPCILMAQELEMLAVEYENNAMIVKVDTDDEYEFARDMQVRGLPTLYFISPDPNKDAIRTEGLIPIQMMRDILDNEM >XP_012068680.1 thioredoxin-like protein CITRX, chloroplastic [Jatropha curcas] MARLQPYTTTHKVTTFSSTFALLAPPLSSLSFPLCSLKTQKENSLFSTTNTTRKRPFSLSTQPRRLLCRP PLGKYVREDYLVKKKSAQEIQELVRGERNVPIIIDFYATWCGPCILMAQELEMLAVEYESNAIIVKVDTD EEYEFAHDMQVRGLPTLFFISPDPKKDAIRTEGLIPIQMMRDIIDKDM
43
>XP_002299198.3 thioredoxin-like protein CITRX, chloroplastic [Populus trichocarpa] MALLQTHSLHIRTLPSTFKSHSFLPLFSSPQSSFKTHQESSLFSITRTPKKRPFSLSTQQRRLLCRPPQG KYIREDYLVKKLSAEEIQELVKGERNVPLVIDFYATWCGPCVLMAQELEMLAVEYESNVMIVKVDTDDEY EFAQDMQVRGLPTLFFISPDANKDAIRTEGLIPLQMMRDIINNEM >XP_002264063.1 PREDICTED: thioredoxin-like protein CITRX, chloroplastic [Vitis vinifera] MAMMQTATRLPHSTITSVSPMIPLQGPPSHLCFSHSPMTHQPNLLFSTTNTRPFSLRPPRKLLCTPPRGK YVREDYLVKKMSAKEVQELVKEERTVPLIIDFYATWCGPCILMAQELEMLAVEYESNALIVKVDTDDEYE FARDMQVRGLPTLYFISPDPTKNAIRTEGLIPIQMMRDIIDNEM >AT3G06730.1 MALVQSRTFPHLNTPLSPILSSLHAPSSLF IRREIRPVAA PFSSSTAGNLPFSPLTRPRK LLCPPPRGKF VREDYLVKKL SAQELQELVK GDRKVPLIVDFYATWCGPCILMAQELEMLAVEYESNAIIVKVDTDDEYEFARDMQVRGLPTLFFISPDPSKDAIRTEGLIPLQMMHDIIDNEM
44
ANEXO 2
__________________________________________________________________________
Dados brutos dassequências genômicas, sequência CDS, sequências do transcriptoma, e sequências protéicas.
Legenda
5` UTR CDS 3`UTR
SEQUÊNCIAS DE EUCGENIE
Eucgr.A00783, Eucgr.A01813, Eucgr.B01424, Eucgr.B02586, Eucgr.D00028, Eucgr.D00853, Eucgr.F01604,
Eucgr.F01854, Eucgr.F02754, Eucgr.F03319, Eucgr.F04223, Eucgr.F04229, Eucgr.G03224, Eucgr.H01629,
Eucgr.I01912, Eucgr.I01913, Eucgr.I02383, Eucgr.J00880, Eucgr.J02387, Eucgr.K01294, Eucgr.L01943,
Eucgr.L03049
1. Eucgr.A00783
Genomic Sequence >Chr01:12689099..12692977 [3879 nucleotides] CTTGATCTCGAGCCAATACTTTTTCTTGGCAAATTTCGCCTCGCGCGGAGACGACCTCGCGTGGAGGGTCAACCGGAATTCGATCGCGGTACGTGTTGCATGGCGTTCTTGGGTTCATTTTGAATTGATGGTATTGTAGACGCGTGCATTGGGTTTGATGCATGGTCCTTTGGGTTTCCTCTTGTTGTTCTTGATGTTCTTGTTTTCTAGTGAGATGATTCAATTAGAAATTTTTATATCTGCGCGCGCTCAAATTGGTTGGAGGAATGAGGTTCTGGAATTCCGTCGTCTTTTCTCGGTTAGATTGATGGGGGATATGAATTTGGTTGAGAGCATTGGGAAAGAACATGGTGGCAGCTTCTGGTTGTGGGGTTTGATTAGAGGTTTATTGGGTGGCATGAAATGAGAGCTGTTTTAAGCATTGCTATTTTGCTAGCGGAGCTACTCATTGGAAATCCTGGAGAAATCCTTGATGTCGGTTGGATTGTCCTTCCATGGCGGCGACACGGACTGAAAAGCTGTATGTGGAGAAAGTTATTTTCTGAATTTTTCTCTGGTGCAACCTGTTGTGGCAGGGAGACGCTGCAGAAGTTCTTCGTGTTCATCAGATGACATTTGATCTAGTTTATCCATTGGATTGTTGTGTTGTCATCAAGGAATAATTTTTGTTGAAGTGGCACCAATGCGAACCCGACTTGTACCGAAATGATAGACAAGATACGAGCTTGACTATAACTGGCTTATCCTGTGATTCTAGATATAGAAAGAGTTAATGGTGTGGAACCAAGAGTCCTGTATTTTCCAATTTACTCTCTACACACCCTTGGATGCTCTTCATCCGTCCCTCCCATCATTTTGTCCTCAATGCATTTTATGGTTTGCGCATCTGATACCACTCAAGCCAAAAATCATGTTCCAATATGCAAAGACCTCACGTTCAGCCCCAGCATATGAACAAATCCCTTGCTGTTTTTGCAGCCACCTTACGTAGAGGGCCCAAGGTTATTCCCCCTTTGCAAATGACTTGCTGTTATAACGTTTGGCCGGGATGCATTCTGCATAAATAAGGAAATCTTGGTAGGAAGAGCCAAGTTCTTGCCAATCCTTAAAGGGTTTTAGTTTTTCTTCTCCTTGTCGTCACAGTTAATGTTGCTTGTGGTACATTTGACTTTGAGACATCCATTCTTGCTATTCTGCTATCTTCCTCATCCATTTTCAGTATTACCTCCTATAGCACATCATGAAACTTACCACAATATTCCAATACCCAATCATTAAAGTTTCTGACAATATCTGCTGGGACATGTAAAGTTGAAACAGGAAAGATTTGTGTAACACTTGCCCTTTAATTCTTAGCAAGTCTAACTAATTGAGCCAATCGGCCTTTAAGTGGAGTTGAGCCACACTTTATCCTGCCAGAAGAAAACAGAATCTCCTCTGCCAACAATGTGATCTATGGTAGAGTAGGAGGATCCACCTAACTTTTGTTAGTCCATCTCCAAGGGATCACTCTGAAAGTGCACCAACATTGTTAACCTGGCCAACATGGTTACATTTTTCTTATCGATGAATTCCCTCTGGAGGATTTTTTTTTTTGGTCATAATTTTCCAAGCCACTTGGCACACAGAGCTTCGTGGAAATGTAATAAAGACCGATACCCAAAGGCAAAGCCACTTTCACATGGGAAGTTTAATGATGCCTCACCTACCAAGGCTGAAATTATAAGCCTTTTGCTTACCTCCTTTAGAAACTCTCTCTCAATGTTATCGAGTATTCTAGCTGCCACACTTGAAGAGGGAAAAGCAGGGAAAGGAAAGCTGGCAGAGTTGTATGAGTCTCTCTACTGAAGTTAATCTGCCGCCATAGGAAGAATAACCTCTTTGAACTAATCAATTTTCTCTCTGTCTTGCAAAAAGCCAGGTCCTTCCAGTTTAATTCCTTGAGGTGGGTCCAAATAAGTGATAGGAAGACTACCTAGCTTACAGCCTATTACTCAACTGCAATGTCCTGGATTTTTCTTCAAACAAGAGAACAAAATGCTGTCATCAGCAAATAATAGATTGGAAAGTTTTAGGTTAGAATTACTTCTAGATACACGAAAGGATTATATCAAGTGTTTCGTATTGCTGCTCTGCCAATGGATTTCCTCATGCTTTTCCTGGGCTCCACTTGTTATGTGATCTATGTACCTATTTAGAATACCCTTTTGACTATACTTCAATATCATGCAGTAATCCTTATCTATATTGACCTTCAGGTTCTTCGTGCTTTCTTCTGCTGAATCTTGGAATTTGCATTCCGACCATCATTATGGGGCAATGCGTAACCAAGGTAATACATCTGGGCCATGTTTTGCTGGAATCTGTTGTGCAGATCTTTTACTTACTATCGTGAAGATGTACACATTTTTGTAGTTCTATCATACAATCACTTCTTGACCACTTCTCTCATGATATTTTGCTCTGTTGTTTGGGTAAGATTTCTGTCGTTTATAAAATATATGTATTATGGTGACTCTACTAAGTATACTTCTCCTACTCTATTCAACCATGTTTTCCCTACAACAGTTGTGCTCTGGCATTTGAAGGCTGCCTCCATTTATTTGCTGTTCCATGTCTTCTGTGTTTTGGCTTGAAATATTTCAATGAAACACTGTCAATTCTTTTTGTCAAAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTAAGTTTTCAAAATTAGTTATTTGCAGTTTAGATAAATATCTCGCTCTTGCTATGATCTATAACAAGATAAGCCTTTTTCTTCTCTCGGTAATGAGACTGAGTTTGTGGTTTATGCTTTAAGTATTTGCTTGATATTTGACAAATTGTATCTCCCTGTGTTTTCTCTTTTTGCGTATGTATTATTCAGCATAGGGATGATTCTTAGAGTTCATTTCAGTTTTTGAGAATCCAGAATAGACAGTTGCATGCACTCTGTATTGTGTCAAGTTCTGGCAAACTTTAATAATTCCAAGGTGTTTATGTGGGGAAGAAGGCTGAGAAAATCCTGTTATGTCAACTCTTATTTTATGTCAATTGTAACCTTTTCTTTGCATGAAAATTTGGCTGCCCACTGTGACGTGTGAATGCTTAACAGGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGTAAGTATGACTTTCATCTCTCGGACCTTGCAACCCGCGGCTCGGATGAGAAATTGGCCTAGTTATGTGCTGAATGTACCGACCGTGGCTCTTGTTTATTTCACAGGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGACGACGGGTTGCTAGAGGTGGGGGAGAACAAAGCTAAGCCATTTTGAAATTTTGTCGAACCACGTACATGCAGGTCTCCATGTTGTAAAATGCTTGCCACGGCACTCGTTCTTGAATGTAAATAGAGATGCTTGAGGGTGTCGAATAGTGAAAATATTGGAATGGTAATCGCCGTTCTCTTTATCGTGCCCTCGATGCCCATGCCGGGTGGAGAATGTCCATCGGTTTTGATTGGATTTCGAAAGTCTTTCTCAC
45
CDS sequence: >Eucgr.A00783.1 [447 nucleotides] ATGGGGCAATGCGTAACCAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGA
Transcript sequence: >Eucgr.A00783.1 [842 nucleotides] CTTGATCTCGAGCCAATACTTTTTCTTGGCAAATTTCGCCTCGCGCGGAGACGACCTCGCGTGGAGGGTCAACCGGAATTCGATCGCGGTTCTTCGTGCTTTCTTCTGCTGAATCTTGGAATTTGCATTCCGACCATCATTATGGGGCAATGCGTAACCAAGATTCTATGTTGTTCATGGTGCTTCCAGCAAGAAATAAAAGACAATGAGTCCGACCAACACATTGATTTTGCTAGCGGCAACGTGCATCTCATCACCACTAAAGAGAGCTGGGATGAAAAGTTATCACAAGCTATTAAGGACGGAAAGATCGTTATAGCAAACTTTAGCGCGACTTGGTGTGGTCCTTGTAGGGTGATTGCGCCTTTCTACTCTGAGTTATCTGAGAAGCACCCTTCTCTCATGTTTCTTCTTGTCGATGTGGATGAACTAACTGAGTTCAGCACATCTTGGGACATTAAAGCGACCCCTACCTTCTTCTTTCTTAAAGACGGGAACCAAGTCGACAAGCTCGTGGGCGCCAACAAGCCAGAGCTTCAGAAGAAGATAACCGCGATTCTAGACTCGATCGATCAAAGTCAGAAATGACGACGGGTTGCTAGAGGTGGGGGAGAACAAAGCTAAGCCATTTTGAAATTTTGTCGAACCACGTACATGCAGGTCTCCATGTTGTAAAATGCTTGCCACGGCACTCGTTCTTGAATGTAAATAGAGATGCTTGAGGGTGTCGAATAGTGAAAATATTGGAATGGTAATCGCCGTTCTCTTTATCGTGCCCTCGATGCCCATGCCGGGTGGAGAATGTCCATCGGTTTTGATTGGATTTCGAAAGTCTTTCTCAC
Protein sequence: >Eucgr.A00783.1.p [148 residues] MGQCVTKILCCSWCFQQEIKDNESDQHIDFASGNVHLITTKESWDEKLSQAIKDGKIVIANFSATWCGPCRVIAPFYSELSEKHPSLMFLLVDVDELTEFSTSWDIKATPTFFFLKDGNQVDKLVGANKPELQKKITAILDSIDQSQK
2. Eucgr.A01813
Genomic Sequence >Chr01:33116772..33122609 [5838 nucleotides] TCGTCAACCCCCGGCACTTCCACACTGTCCCGTCTTCCTTCTTCCTCTCCCTCGCCGCCTTCCATCTTCAGGTCCCCCACCGGAATCTCCATCTCTCTCTATCTTCAGCTCCTTGCGCACCGCTCTCATCTAACTTTCTCGCATCCCTCGTTCCGCTGCCGGCCGCGCGCGCTCCCTCCCTCCCCCATATAAACTCGCGCTTCCTCGTAATATCATCTCTCGATAATCTCTAGGCGCAGCGGTCGTTCCTCATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCGTGAGTTTTCATTCTCTTCCCTCCTTTTTGTATTTCGTTGATTGTAGACTTTGGCGTAGGGGGTTTTGCCGAAACGGTTTATCGTGCACTCGCGAATTTAGGACTGCGAAATGATGTGGTTTAGATTGAGCTGATTGATAGGGACTTTTGAATGGAAATGCCATATGTTCTATAGTTTGGTTGTTTCGGCATCGAGACTTAATTGTTTCGAGTGTGCATTTGATCGGTAGACTCGAGAAAAAAAAGAAGCAAAGAGACTTGTGTCTATGCTAATATACAGCACTAAGGCTTGTGGAGCAAATTTAACTACAAGAATCCTGCTGTAGATAGGCTCTCTCTCATAGTCTACGAGTTGTTCGACTCGCTACTTTTTACCAAGCACTGAATTTTCATGGAACGTCTCGGAATTGCTATGTATGATTTAGGGAATTATACTCGACCATCAGTATGATCTGATGTAAGTAGAATAGATCGATTTATTGGATCTGTATATTTCTTTATGAAGGCTATAGCTGAGTACGCATCCATATAGATATATAGGTGCGCCTTATAGGAATCAAAGGTAGAAGCAGAGTCCCGTCCTTCTTTCTCTTCGATAATGTCCTTGCTGGTAGCTAGAGAAAGTCCAATAGTTGGCGCGATCCCTTATTTTGATTGCATTGGAATATCAGCTTATTGCTGACATATGCTAATAACCATGTTTTTTGCTTGGGTAGAACTTTGAAAAACGTAATTTCATGCTCAAGTTTGAGATATAGACCAGCAGTCTTGAGGAGAATTTGGATTCGTCAGCGCCTTGGTTCAGGAACTCATTTACTATGCTCCCAAAACCTCAAATTATCTTAAGGTCTCCTCTAAATGCTCTGTTACCTCAAACTTTCGCAGATTCTTCACAATGGAAAGATAACTATAGTATCAACAGTGGGATGCATTTGCTTTGATACTAATCACTTATATGTTTGCCATTATAACAAAGTGACGCCATCTTCTTATTTCAAACACATTACCACAGAATTTTGTATATATGTAATGCATGAATACTGATCTTCACGACTTGGATCAATGAATGCGCTAGTAGACTGGCTAGTGATTGTCGTGAAGTTAATGTTTGACAAGGGAAGAATTGTCCCTGTAGACTTGGAACACCTTTGACCTGCTTAAACAGTGAATTATAATTGTTGGTCAACTAGATGTTTGTGAATGTGTTTGCCCACTCATATTGGATGACGATTCAATAGTTCATTAAAAGTTTGTTCCTTTTCTTCTGTTCCATCAATGGAAGATGTGCATCTCAAGATCATTAAATCCCAAACATGCTATTGCAAGCACTTGTTATTAATGTGAATGAGGGTGATTGGTGACAATTGACTGAGTCGTTGACACTCCCGTAAACTTTCTTTAGTTAATATAGGATAGGTTTTTCTCTCAACCTTTTTGGTTTTACTTTACAATAACTATGTTTCATACTGCAAGCATCCTGTTTGCTGAGTCTGATTAATTGGTCCCTAAGTATAACCCTGTTTCCATCTCAAAGCATATGACAGCCTTCTATGTTCTAGATTAAGTTTTCTAATTGCTAAAACAGAAGATAAGCAGAATCCCTGTTATATTTGAAGCTGGTATAAGTATGCACTTTTACTTTACACGATTAGAATGAGCTCTTTCCAGTTCCTCCAGTTAATGTTTAATGTAAATTCACATTCCTTACTGTTTTTGTTAATTGAGGAAGTAATGGAGTTGTAAAAGATCGAACTTCTATCTGATCATTTTGTCAGCCTAAGCACCAAAAGTTATTTGGATGCTCTTAAGTCTTGTCGTTTAGCCTTAGTTATAGGTCTGGAAGTTTATGTCCTGAAAACATTTGTCTACTTGTGGATCCATCCTCCTTTTACTTTCTCTAGATTATGCTTTCTTCATTCAAGCATAATCCCAATAATTCTTGTCTATGGTTTGGATGGCGTGACTGATGAGGTCTTAGTTTTTTGTCGTGTCCTTTCACTGATGCATGGAGGAAAATTTTAGATCAAGTGATCTTGATGAATATAAAGCATCTGGTAGCATCATAAAATGAAAGTATTTGTAACTTCTTTGCCCGAGTCAGCTCCAAGGGAGAAAATGATGTGTGTTCACGAGTCCTCTGATATTCGTGTATGTTAGTTTTGGTTGCTCTATTGTGTAAGGTTTGTGTGGTAGCATAAACCCTTTTGTTGGAATTCATCTTTAAAATCTTTTCTGAGAGTATGCTCTTCAGCTAGATTATTTTCAAGCTTTGGCTTAAATTTGCTGGAAATGCTGGAAGGAGACGTTACGTTTCTTGGACTATTGGAACCTGATCCTTCAACCTGGTTCTTCCTTAAGTCACATACTTGCATTGAAATAGATTTTGATCCCTGAGCCAGCAATTCCTCTGGTGATCCTCATCCACGTTCAACTTGTTGATCTAATGCTATTGCAGTGCTGCAATCATTGACCACATTTCTATACAACCTTCTGAAATGTCAAAGATGTTCCCATCTTTCTGGGTCTGTGGCTGCTTTGAGGATGCTACTGGGTAGTGGGTAGTTCTATGAATGTGGAGCTGTGGACTAGGATATATGAATGCATAAGTTTGCCACTTTAAGTTATGCGCTGAAAGTATTGTTTGCTGGCCGGTTTTTTCCACCCTTCCACTCCTATCATAAGTTTGTTTGATGTCTCTTTTAGGAGCAACACGAAGTTCTTTTCCAAGTGTGTGTTTGGATAGTGACTTGGTTCTGTTTCCTTTATAATGAACCGCAGTTCATGTCCAATACAGCCTAAATTCAGGCCTTCATAGTCTTCTGCAGGATTTGCAATTTTCTTTTCAACTTCGGTTCGAAATTATGTTGAAATAATTAGAATTCATCTTCAAACATGATCAGATCAATTATGTTGGAGTGACATTAACATTTGTAGTCTGGAGAACACAGTAG
46
TATGACAGCACTTAGACATAGAATATACGCTTTAAGCAATCATCTTTTATATTTTTGTCTTCTTCTTCAAGTAATGGGGAAAAGGTTTGCTGTACTAGCTGCATTTGGGCTTGGTTAATATCTCGAAGTATCTTGAAAGAACTAAGAAACTCGGCGGAGATAGGAGTGGGTTTATACTTACCTGAAAAAATAAAAGGTGGATTGGCAAGTTGCTTGTTTCACTTCATTTTCACCTGGACACTTGGTAATGGTGTTAAGATTCTTAAGAATAAAGCATGGTGTCATCATTAATAATTAAGTGAATTGTGCTATCTTAACATCATATCACCCTAATCTAGAAGTCAAGTTCATGTTTGATTCATGGACTAAGACAACACCATTAAAGTCATGCAGCTGACGCACATGCAGCGTGAAAACCTCATGCAAGTCAGACTGGAAGCAATTCTTGATGGAGACTATCAAAGGGTGGAAAGCTGGTTAATGGAAAATTAATATCAGAAGTGGACACTTCATCTCACCTACCTGTTACTTCATGTTCAAGATGCTCTTCTATATAAACACTTCTGAATGATGTTGGAAAACACTGCCATGCGTAGATCAACTACTCTTGTGGTATGTATTGATGTAACTAGTGTGTCGTTTAGGATGCTCTGTTTTTTTGTTGGACACTTAAGCATGGAAAGACAAAATCTTAAGGGAGTAAAAAGAGATTTGAAATAAGAGAGGTTCTGTGATGGAAAGGAAATCTGATCATTTTCGTTGTACTTGGTGCAAAGCGAAGTATAGGATTTGTCATGGGGATTTAGTTCTGCTTCAGTTGGTATCTTGATATGTATACTTTGTTCTCCTGCTTTTCAATACTTAGAGAATTCTACAACGGAGTCTACATGTTGGCGTGATCCTTGCTGAAAGGTCAAAGCACTTTATGTTGATGGACCATTTGTTTAGAATTTAGTCCAAAGGGTCTTTACAACCATATCTTTGAATTGTCGAGAATCTTTAACTTTATTCTGGAAAGAATGGGTCCTAGAAAGAGGACTAAGTTTGTTCTATTATAGTTTAATACAATTTGTCGTGTTTATTCATCAAATTTCTCGGCATTTAGATTCTAGGACAACTTTTTCTTGCTGTTGGCCCCATTGACCCACATACTGACTTCTTAGCAATGCAAGCACATGCGCAGAAAAAGATCGATTTTGTTTCTTGCTTTAGGTGTTCATTTTTTTATATACTAGCAAGTAATAAATTTGACTTCGATATTGGTTTATATATACTTCAAAATTTTTAAGTTGCTATTCCTTCAGACGATCATCTAAGCTTAATTGGTTTCCTCTTTATTGGCAAGTCCTGCATCTGCACTCAATTTATTCTCGTGGAGGTTTAATTTCTTTGTTTTATAATTCAGCAGAGTAATGCCACGAGATATAGTAGTTGTCTGAACTCATTAATCTAGCTGCCAGCATTTCTGGGGCTGCCCATTACTTCAGTACAGGCGAGATGTGAATTTTGAAGAAGCATGAGTGACTTTTCCCCTAGAATCTTGTGTTCCCATTTTGTCTGGAAAAGTTCATGATCCTTATTAGAATAAGATAATCATTTTTCTCATCTATATAATGTTCTTTGATATTGAAATTTATCAGCTGCTTAAACCATTTTTCTTTTCTTTTTCCAAAGAAGTTTGACTTCATTGCTTAAATTGGTCTGTCGGGCTCTGATCAGAATTAATTTTATTCAGTGGGTAACTCGTTTGTTTGTCTTCCTGCAGTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGAAAACAAATAGTGATGTGTAAAAGGTCAATTGGCTACGTTTTTATGATTTTGGAGAGTTCCATCTGTCTATGTTAGTGTGTACCTAGAATTCAATTATGTTTTTGTCTGGTGTGGGAATCGACATAGAGCCATGAAAAATAAGAAAGTTGATAGGATACCAATAGCTTGGTGGTGGTTGCTTGTCAACTGTAAGAGCATAAATGATACTGCTTTGCCCTTTTGTCAAAGTTTCAGTTTGAAATAATGCAAATCCGCACCACCGACCGAGGTGACGTGGATGGTAGATCAT
CDS sequence: >Eucgr.A01813.1 [582 nucleotides] ATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGA
Transcript sequence: >Eucgr.A01813.1 [1122 nucleotides] TCGTCAACCCCCGGCACTTCCACACTGTCCCGTCTTCCTTCTTCCTCTCCCTCGCCGCCTTCCATCTTCAGGTCCCCCACCGGAATCTCCATCTCTCTCTATCTTCAGCTCCTTGCGCACCGCTCTCATCTAACTTTCTCGCATCCCTCGTTCCGCTGCCGGCCGCGCGCGCTCCCTCCCTCCCCCATATAAACTCGCGCTTCCTCGTAATATCATCTCTCGATAATCTCTAGGCGCAGCGGTCGTTCCTCATGTCTTCGATGGCGGCAATGCTCGACTCGGTCGCTCTCTCCTCGCCGAAGATTCGCCCTTCCCCCCGCCGCCCGGCGGCGGCGATGGCCTCGTCCCCGGCGGCGATTTCCCTCCCCTCGCGGCCGAAAGCCGACGCCTTGCCGGGGTTCGCGGGGTTGAGGATTCAGTCGCGATCGCTCGCTCCGTCGAATTCCAGGAGCTCGAGAGGTCCTCGCTGCTCGCGGAATGGGCGGATCGTGTGCGAAGCCTCGGACACTGCTCTCGACCTTCCTCCAGTGACAGATACTACATGGAAGTCACTTGTTCTCAAGGCTGATGGGCCTGTGCTGGTCGAGTTTTGGGCCCCGTGGTGCGGGCCCTGCCGAATGCTCCATCCAGTGGTGGGAGAAATAGCGGACGAGTACGCTGGGAAGCTCAAGTGCTTCAAACTGAATACTGATGAGAGCCCTTCCATCGCAACTCAATATGGAGTCCGGAGTGTACCCACGATCATGATCTTCAGCAGTGGCGAGAAGAAAGACGCGGTCCTCGGTGCAGTGCCCAAATCAACCCTCACAACCTGCATAGAGAAGTTCTTGTGAAAACAAATAGTGATGTGTAAAAGGTCAATTGGCTACGTTTTTATGATTTTGGAGAGTTCCATCTGTCTATGTTAGTGTGTACCTAGAATTCAATTATGTTTTTGTCTGGTGTGGGAATCGACATAGAGCCATGAAAAATAAGAAAGTTGATAGGATACCAATAGCTTGGTGGTGGTTGCTTGTCAACTGTAAGAGCATAAATGATACTGCTTTGCCCTTTTGTCAAAGTTTCAGTTTGAAATAATGCAAATCCGCACCACCGACCGAGGTGACGTGGATGGTAGATCAT
Protein sequence: >Eucgr.A01813.1.p [193 residues] MSSMAAMLDSVALSSPKIRPSPRRPAAAMASSPAAISLPSRPKADALPGFAGLRIQSRSLAPSNSRSSRGPRCSRNGRIVCEASDTALDLPPVTDTTWKSLVLKADGPVLVEFWAPWCGPCRMLHPVVGEIADEYAGKLKCFKLNTDESPSIATQYGVRSVPTIMIFSSGEKKDAVLGAVPKSTLTTCIEKFL
47
3. Eucgr.B01424.1 Genomic Sequence >Chr02:25446921..25449412 [2492 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGGTGTTTCCGTCTTTCCAATGTTTTTAAAAACGACAATGGGCCCCTGTCGTATTTATAATCGCCCGCGCCTCTTCGAACTCTCCACCCCCGAAGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTAACGTTTCCTTCCCTCTCTCTCTCTCTCTCTCTCTCGCTCGCTCGCGTAGCTCATCTTCTTCGCGAGTTGGACTGTGCTTTCCTCGATATCGATTTCCCGTACTGTTTATGTGAACTGTGATCGGTGGCCGAGATTCAGAGGAGCTGCGGGAAGCGGCGAAATCGAAGATGATTACTGGGGAAACGCAGGACGTCCTGCTTACTTGGCACTTGTCGGGTAACCTGTCGAATGTATGATGAATATCAGATTGTTTACTAGCTAGAGTGTAGCATCACCAGTTCCAGGAAACTCCCTCGATTCTAAATTCGGATAGAATTATTGAACAGAAGTAACTTCTTGGAAAAGTATAGACCGGGGAATAGTTGCAGGGCTCTGCTCAAAATCACGTCTTGCTGCCGCTTTACAGAACCGTATGCGCGAGGCTCTTGCCTTGTGATGCTCCTCGGTACCATGTTCTGTCCACATCCTAAAAGGGGTTACACGATGATATATCGGGTGTGGAAGTAGGCCAACATTTCGATTGGCAAATTTGCCCGTTTAGGATCTGTGCTTCTTAGGACTGCTGCTATTCGCCCGAATGGCATTAGATCCTGCACCCTTGCTCCGAAGCTTTTGGTTGATGGCCGATGGCCTCGGCATGTAATATCCCCTGCAGGAAGTTCCTGCTTGATTCACATCGTTATCACACGGAAATTTTTGGGGTGGCTGAGTTTTAGGCATGGCCTCAATTAACAAATTGGGGAGATCTGGTTTTCTTTTGATTATCCCAAGTGTGAGGATCTCTGTGTTCATTGAGCTTTCTTACATTTGGTGGCAGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGGTAACGAACCACTTTCACTCGCGGGATGGTTTTGCGTGGTCCGTTCGAATTCCTCCCTTTCTCACACTCCCATGATCTTTCGAAACATTGTCCGTCAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGAATTGCGCTCCACCAGAAGAGAGATTCTCGTATACCATGACCGACTTCGCGGCATAATCGTTGTACTTATATGTATCTATCTGTATCCATCACTTGACATTTCGAGCTGAAGCTGAAATGAACCGGAGTGACTTTACACACGCCTTTGAGCACTGAAGTCCTGAAGTCGCTGGACTACCTATCTTTTGACTGCGAGGTAACGCACGACGTCGGTGTTTACCTGATGTATGTATGCAAAGCTCAGACAGCTGCTAGAAATTCAAGAAGCTTACAGAACTTAGTTGCCAATGAAGTCTTCTTTGACACAAACTAGCATGCATGTCTTCTTTCACTAGTCAAGAGGGCCTCTAATCACTATGTCTACATATGGTAGTTGGGATAAATTCAGGATATGATAAAATTTATTTTATCCTACGTTTAATGTCTGCTTAAGATAGGATGAAATCGAATATAAAGGGCATATAGACTGAATAAAATTATCCC
CDS sequence: >Eucgr.B01424.1 [999 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGA
Transcript sequence: >Eucgr.B01424.1 [1481 nucleotides] ATGAGAGCGAGGGAGGCTAGGGAAAAGGGATATCCCCTCGGATCATGCAAGCCGATGCCCATGCCGACCATGAGATCAAAACGAGCGCCATTCGTTTGTGGTCGGAGTGAATCCAGCTCGTGGGGTCGAAGGATGCGTCCTTGCTCGATCCGCGTGATCGACTCATCGGATCATGCTCGGGGCCACGACAAAAGATCGATTCAGTCCGATTTGGTCGTTTTCCAGGAATGGCCCCCGAATAATATCTCGCTCGCGAGCTCCAATTTTTCCACCACCACCCCTCTCGACGCCCGTCGTCCTCCTCACACGCAATCCGATATCCCCAAAACACCCCCGCCGGCTTCGCCCCATATCCACAAGACGAAGGCCCCCGTTTCATTCCTTCTCTCTCTTCGCCGTCGCCGTCGCCGTCGCCGTCGTCTTCGTCTTCTTGTTCTGCTCTCTCTCCGATCAGCTCCGATGGCTCTGCAACTTTCTCTCTCTAACCCGCCCTCGCTCCGTTCCAGCAGCGCTGGCAGCTCCGGGCTCTCGGTCGCCTCCTCCTCGTCTTCCTCCTCCGTATTTTCGCCGCCGTCGAGGCCTTTGAAGAGCGTGAGCATCGCCGGTCGGGCTCCGAGGAGCGGAGCCACCGGCGTGGTGAGGTGTAGCGTGGAGACGGCGATCGCGGAGGTCGGGCAGGTGACGGAGGTCAACAAGGACAGCTTCTGGCCCATCGTCAGGTCCGCCGGCGACAAGACCGTCGTCCTAGATATGTATACCCAGTGGTGTGGACCTTGCAAGGTGATGGCTCCAAAGTATCAAGAACTATCTGAAAAGTACTCTGATGTTCTCTTTCTAAAGCTGGACTGTAACCAAGACAACAAGCCTCTGGCAAAGGAGCTTGGCTTAAAAGTGGTTCCCACTTTCAAGATCCTCAAGGACAACAAGGTCGTGAAGGAAGTCACCGGGGCTAAACTCGACAATCTAGTCCTAGCGATTGACGCCGTCAGATCGAGCTGAATTGCGCTCCACCAGAAGAGAGATTCTCGTATACCATGACCGACTTCGCGGCATAATCGTTGTACTTATATGTATCTATCTGTATCCATCACTTGACATTTCGAGCTGAAGCTGAAATGAACCGGAGTGACTTTACACACGCCTTTGAGCACTGAAGTCCTGAAGTCGCTGGACTACCTATCTTTTGACTGCGAGGTAACGCACGACGTCGGTGTTTACCTGATGTATGTATGCAAAGCTCAGACAGCTGCTAGAAATTCAAGAAGCTTACAGAACTTAGTTGCCAATGAAGTCTTCTTTGACACAAACTAGCATGCATGTCTTCTTTCACTAGTCAAGAGGGCCTCTAATCACTATGTCTACATATGGTAGTTGGGATAAATTCAGGATATGATAAAATTTATTTTATCCTACGTTTAATGTCTGCTTAAGATAGGATGAAATCGAATATAAAGGGCATATAGACTGAATAAAATTATCCC
Protein sequence:
48
>Eucgr.B01424.1.p [332 residues] MRAREAREKGYPLGSCKPMPMPTMRSKRAPFVCGRSESSSWGRRMRPCSIRVIDSSDHARGHDKRSIQSDLVVFQEWPPNNISLASSNFSTTTPLDARRPPHTQSDIPKTPPPASPHIHKTKAPVSFLLSLRRRRRRRRRLRLLVLLSLRSAPMALQLSLSNPPSLRSSSAGSSGLSVASSSSSSSVFSPPSRPLKSVSIAGRAPRSGATGVVRCSVETAIAEVGQVTEVNKDSFWPIVRSAGDKTVVLDMYTQWCGPCKVMAPKYQELSEKYSDVLFLKLDCNQDNKPLAKELGLKVVPTFKILKDNKVVKEVTGAKLDNLVLAIDAVRSS
4. Eucgr.B02586.1
Genomic Sequence >Chr02:45847427..45849118 [1692 nucleotides] CCAAGCCAAGCAAAGCACCTCCCAATCCCCAAAGCATTTGCTAGCTTTTGCATAAGCCATTAGCCGTCGTATTGTAGGGACAAAAGAGAAGGAAAAAGGAAATAACTGATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGGTTAATGCTGCTCCATTGATGACTGAACTGTTGCTCTCTTTTTTCATTCATCATTTCCATTGCTTCATATTGACTGTGCTTCAAAATATTGGTATGGCAACAGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGGTACGGTTGTCGTTATTTTCCCTTCCAAGGAATTGAAAAGGGCCGCATGATCATTGCAATAAAGTTGGACTTGCATGCCCATATGGTGTCGGGTTTCGATCGTGTGTACTCAGGATAATGTGAACGTTGTTGTTGTGGAAATGCAGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGACCGCCGCCTCCTCAGTCGACAAAAGTATGATCGGCCTGTGCCTTCCACAGATAAATAAGATCGCGTTTCTGACCCAAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAAGATCGTGTTTCTCTCTCTTGCTTTTAATATTTTTTCTTGGAGTCGGTTGCTAAGAAACAGATGAGACACGGGCATATTCACTGCCAAAGATCATGCTTGAATAATAATCATCTTCCATGAGGTTTTGGCTGAATTGCTCTTTCGATGCAGCTAAGTAACAATCGAATGACATGGTTAGGGGACTTAATTTCCCTTCGGTCAACAGTATGAGCCGGAAAGTTTGCTGAAACGCAAACACTAATGGTCAGGGTGCCAACAACTTACAGAACAACCTCATGCGAATTGTACAAATGGGGTCGGACGATACAATGGAAATTGATCCAGCCAAACATCTCACATCACCATAGGACCGTACATAAATTTAATCAAACAAAAATTGAAAGAATTTGGTATAAACCTAAATAGAAAAGTTTCCAAGTGCCATTTATAAACTTCCAAGGCTGACAGAAACTGCAGACATCATGGCCGGTGACGGAGACTGGAGAGTGCTATTATGATACTTCACCCATCTGACATCTTCCTTTTCTCGCTTTCAGGCAATAAAATTGGGTCGATACTTCCTCTACGAACAATTAACAAGTAGAGGTCTCTGGAAGCGTAAAAGCAGAACTCAATCAAAGCTTATGAATATGTAATTCTGTAGAACGTTTTTGTACGCCCTATACTCTTGCTCCATGACTGCTTCACAATCCCTTACTTAATGAAGTCTTCAGCCACTGTT
CDS sequence: >Eucgr.B02586.1 [498 nucleotides] ATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGA
Transcript sequence: >Eucgr.B02586.1 [1443 nucleotides] CCAAGCCAAGCAAAGCACCTCCCAATCCCCAAAGCATTTGCTAGCTTTTGCATAAGCCATTAGCCGTCGTATTGTAGGGACAAAAGAGAAGGAAAAAGGAAATAACTGATGGGACAGAACGTGTCTTCCGGAGATTGCAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCACAACGACTGGGCTCCTGCGAAGGCGAGCCGTGTCATGGAGTTTCACTCCAAATCTCGATGGGATGAGCATTTCGAAGCGTCGAAAGGGAACAACAAGCTGATGGTGATCGACTTCACCGCCACGTGGTGCGGACCTTGCCGCAGGATGGAGCCGACGATCGACGAGCTCGCAGAAACGTTCGCTGACGTCGACTTCATCAAGATCGACGTCGATGAGTTAATGAATGTGGCGAGGCAATATGAGGTGCAGGCGATGCCAACATTCTTGCTGATGAAGAACGGGAAGGTGGTGGACGAAGTGATTGGCGCCAAGAAGGATGAGCTCAGGAACAAGATTGAGCAAAACTGCAACAAGTCACAACCATACCTTCAGAGCAATTCGCACCACTATGCAATCTGACCGCCGCCTCCTCAGTCGACAAAAGTATGATCGGCCTGTGCCTTCCACAGATAAATAAGATCGCGTTTCTGACCCAAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAGAAAAAGATCGTGTTTCTCTCTCTTGCTTTTAATATTTTTTCTTGGAGTCGGTTGCTAAGAAACAGATGAGACACGGGCATATTCACTGCCAAAGATCATGCTTGAATAATAATCATCTTCCATGAGGTTTTGGCTGAATTGCTCTTTCGATGCAGCTAAGTAACAATCGAATGACATGGTTAGGGGACTTAATTTCCCTTCGGTCAACAGTATGAGCCGGAAAGTTTGCTGAAACGCAAACACTAATGGTCAGGGTGCCAACAACTTACAGAACAACCTCATGCGAATTGTACAAATGGGGTCGGACGATACAATGGAAATTGATCCAGCCAAACATCTCACATCACCATAGGACCGTACATAAATTTAATCAAACAAAAATTGAAAGAATTTGGTATAAACCTAAATAGAAAAGTTTCCAAGTGCCATTTATAAACTTCCAAGGCTGACAGAAACTGCAGACATCATGGCCGGTGACGGAGACTGGAGAGTGCTATTATGATACTTCACCCATCTGACATCTTCCTTTTCTCGCTTTCAGGCAATAAAATTGGGTCGATACTTCCTCTACGAACAATTAACAAGTAGAGGTCTCTGGAAGCGTAAAAGCAGAACTCAATCAAAGCTTATGAATATGTAATTCTGTAGAACGTTTTTGTACGCCCTATACTCTTGCTCCATGACTGCTTCACAATCCCTTACTTAATGAAGTCTTCAGCCACTGTT
Protein sequence: >Eucgr.B02586.1.p [165 residues] MGQNVSSGDCNDWAPAKASRVMEFHSKSRWDEHNDWAPAKASRVMEFHSKSRWDEHFEASKGNNKLMVIDFTATWCGPCRRMEPTIDELAETFADVDFIKIDVDELMNVARQYEVQAMPTFLLMKNGKVVDEVIGAKKDELRNKIEQNCNKSQPYLQSNSHHYAI
49
5. Eucgr.D00028.1
Genomic Sequence >Chr04:234953..238152 [3200 nucleotides] GTTTCTCTCTCATCGCCACAATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTGCGCTTTCTCTCTCTCCTCCGCCCCGATTCATCAATACCTGCTTCGCTGCATTCCCGTCTTTTCCGTCGTTTTTAGATTGCTTCCTCAGTCTGCTTGTCGACGTGTGTCCGATTCTTGCATCGGCTATGCCCCGTTCGCGTGTCGGTACCGTTTGAAGAAATAACGCGACTTGCGACTTGAAAGATTGCATTTTGATTGCGAGTCGCCCAGTTGGAATTCAGATCTTTTCCTGCTTTCCACAAACCAAGCTTCCTATCCACTACACAACGGGCATTTGACTAACTGTGGACTCTTGTCTATATTTCTCCCAATTTTGGCGAAGGGGGTTATGAAACGAGGAAGGGTGTGATAGTTGGAATTGGATTCAATGCGCAAAATTCATGGTCCCCAGTTATGGACAGGGTTGCTCATGCTTTCTTGAAAGGCTGATAATTTGTGGCATTTCTGTTGGTTGCTTATTTTCCCTATTTAAGAATGTAAAAGTTAATGGTCGTATAGTGGATAGTTCCTGCCTCTTGGATGAATTGTGTATTCCGAATGGCTTAAATTTGATAAATTCATTCGGGCCAATCTTGCAATCTCAGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGGTTTGTTCTTCTTCTGCTGTTGACTCCTTATTGCTTTATGGCTATTGCACATGTGTGACACGGAAGAGATGGGATCGCAATGCTTACCACTTCGACGGCCCCCAAAATATGAAATTAACTTATGCTTTTGTCTGATTGATTTTGATAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGTAAGTAATCTCAACATCTAGGCATTTGTCAATGTCCTCCAGGCACTTCTTCCTCTTGGTTATCCTCTGTTACTTGAATGGAAAAGGTTATTTTAGCCTTCACATTAATCTGTGTCTTGCAGGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGTAATATCTTTTGCTTCTTCTCAGGTTTCCCCGTAGTCCCTCTAGACCATTTCATTAATCTTAGTGGAAGTTTTCCATGGTGATGCTCATGGCTGTCTCTTCTATGATAGGAATGCTTTCTACTCTAGGAAGCTAAAATTGTTGTTTTGTCTGCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGGTAAGCCAATGTTTATGCATGTTATGGAATGCTATTTTCAAGCAATGCATATGGGATGTTTAATTTCACTAACAAAGATGATCTGAAGATTGCTTTTCTAATTGATGCTGCAAATGGAGGAATGCTCTCAAAACTCAAGCTCTTCTTGGGAAGAAATTTGTGTCTTGATGCCTCCCTCTTATCTATGGAAGAAAATTCTTGGTTGTGATCTAAAATGTCTTGCAAACTGATGGTGGTTCCTTCTGATAGAGTTTATATCTTGGTACAGAGATAACAGTCTTTTCTGTTGTCAATCTGCTACCAAAACACCAAATCTTTTGCTCCAGTATGATTTCATGAGCCCACAGCAGTTGTTGCTTCATTCTATACTGTCCACATCTAGTGCTTTTCAAGTGCACAGCATTTGAACACACTTATCTGACCCAATTGACCTTTTATAATTTCTTGAAATGGATCTTTACTGGAGCAATATGGAGTTGGTCATTCTTTCCTTAGCCATTAGGAAAATATGTTTTAGTTATTTCTTTAATTGGAGCTATTACAGCTTCACTACAGCTGCCATCTTTTGAGTTTTTCATTTCATTTCATTTTATTTTATTTTTTTGGTGCTGGGGGTAAGAAATGGGGCTTGGTACAAAATCCTTGGTATGGAAAAAAACAGACATGAGCAGTGTTCCTGGAAGTGCATGACACCCTGAAGTTGTACAAAAAAACCTGAAGGGAATTGAAGACTGAGTTTAATCAACTGGAGTCGATCAGGAAATGTTCAGGTTTAGTCTAGTTCAGGCGGCCGTTATTTTTTTTCTTTTTCTTTTTCTTTTTTTTTTTTGTTCTTGCTATAGGTTTGGTTTATGTCATAAGAAGCAGAAATAGTCGGACTTGGAGTTGAACTGAATTGTTGCTGCAGTTCTCAGTTGTACATAGATTCTTCAACTTTGTTTCAACTCTGCGATTTGTTGTCTTTGGGCTGATGTGGTACAGTTAGGGTCACAAAAGAGAATTTCAACTTAAAAAAAAAAAGAAAAAAAGAAAAAAAAAAAAGGTCAGTTTGGGTTTGCACAGAAATTGATCCAGCCTCATTGACACCCATTAAATGAAGTGAGATGTGCTATGAGCTTGCCATGATGAAAAAGTTGGAGTCATCTTCATCGTTTTCTGACATTTTATGTCCTAAACTATGCATTGCTTGAGAATATCAGCAAGAACCGTGTGGGAGTTAATTTTCTGTCTTTGGCTTCATTAAACGCTCATCTGCATGGTACCTTTTTGTATGAGAAACTGATTTTGTATTTTGCTGCAGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGATTCTCTTATGGCCTTTGTGCCATACGGATTTGTTTGTGCATATGAGCCGATATAACTGCTCCTACCTATGAGCCTTAGTGGCTGCCGACCCTGCATAGGAGGGCATTACCTTGTGCAGAGTTTGTCAGGTGATGGCCATATATTTCTGTCTGTGTTGGTCCTGAGACTTTTCGGACTTCTTGTTGTCATGTTTTCTGTTGGTCAGGGGTAGGAAGTGTGATTTAACACATGTTTTCTCTTTGAAAGCCTCCAATCAAATATTTGGAACTATCTCTTGGCTGCCTCTTACATGCATAACTAGTGATAACTGAT
CDS sequence: >Eucgr.D00028.1 [555 nucleotides] ATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGA
Transcript sequence: >Eucgr.D00028.1 [887 nucleotides] GTTTCTCTCTCATCGCCACAATGAGGAGGTGCGCGGCTCTGCTCCGGCGATCGTGGACCTCGAGTGGCCGCACGGGAGCCGGTGGCCTCTCTCGACGGCCCCAGTTCCCCCTCCCTCTCCCGGGTCATGCCGACGCCGCATGCAGAGCCGTCGCTCCCAAGGCCGCCGCCGCCGCCGCCTTCGCCGCGCTCTCTCTTCCCCGGACCTTCTCCTCCGCTTCGTCTCCTTCTCCGGGTTCGTCGAAGATGCACCTTATCAAGTCAGAAGAGCAGTTTGATGGCGTACTTGCCAAGATCCGAGATGAGTCTTCGCCAGCAATTTTGTACTTCACTGCGGCATGGTGTGGTCCTTGCAGACTCATGTCCCCTGCCATTGAAGCATTGAATGAGAAGTACCCTCACGTGACTACGTATAAAATTGACATTGATCAGGAGGGCATTCAAGACAAATTGATGGAGCTGAGGATAGACTCTGTGCCGAGACTTCATTTCTTCAGCAAGGGACAAAAGGTAGATGAAATCGTGGGGGCAGACATCGAAAGTTTGGAGCATACAATGGATAGGCTATATAAGTGATTCTCTTATGGCCTTTGTGCCATACGGATTTGTTTGTGCATATGAGCCGATATAACTGCTCCTACCTATGAGCCTTAGTGGCTGCCGACCCTGCATAGGAGGGCATTACCTTGTGCAGAGTTTGTCAGGTGATGGCCATATATTTCTGTCTGTGTTGGTCCTGAGACTTTTCGGACTTCTTGTTGTCATGTTTTCTGTTGGTCAGGGGTAGGAAGTGTGATTTAACACATGTTTTCTCTTTGAAAGCCTCCAATCAAATATTTGGAACTATCTCTTGGCTGCCTCTTACATGCATAACTAGTGATAACTGAT
Protein sequence: >Eucgr.D00028.1.p [184 residues] MRRCAALLRRSWTSSGRTGAGGLSRRPQFPLPLPGHADAACRAVAPKAAAAAAFAALSLPRTFSSASSPSPGSSKMHLIKSEEQFDGVLAKIRDESSPAILYFTAAWCGPCRLMSPAIEALNEKYPHVTTYKIDIDQEGIQDKLMELRIDSVPRLHFFSKGQKVDEIVGADIESLEHTMDRLYK
50
6. Eucgr.D00853.1
Genomic Sequence >Chr04:15391539..15393214 [1676 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTACAGCTTTTTTCCCTGCTTCTTCTCGTACCGTTGCGTCTTCTCCGTCGTAATTCAGAAAAATCTCGACTTGGGTGTCGTCAAAGTTTCGAACTTTTTGCCTCCCGATGACTGCTGCTTGCTGCAAACCCCTGTTTCGGTTTTGAGATTGGGAATTCCCTTCTGGGCTGTGAATTTCGAAGGAGTGGCGTGATGGGTTGGTGTTGATGCAGGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGTAACGCCCAGATCTTGTCTCGGAGTAATTTGTGCAGGAGGACTTGAGTTTAGCTCGTTACATTAGGATGGAATCCATTTTCGGCAGTTGGGAACCTACAGTTTAGACTTGGGATGTCATTGAGATCATTAGGTGTTTATACTCTTTTCTTCTTGTACATAAGCTTGTGACATAATATATGTTGTGAACTGTAGTGTATGAAATTTTTTCTTTTCGTGTCTAGCAAGATTAGAATATGTTTGCTTTTGCTTAGGGTTGAGATTATGATTTTCATTTAAGCAACAAGCGATTTCCCCGACCACTTTGAAAGTTTTATTCCCTTTTGACGACACTGTACTTTCTGCTGCAACTTGAATCTGCTTTGTAGGTGTTTGTCTCCTGAATGTTTGCTTTAGTATTAAAACTACTACACCGTGGAAAACTTGGGAGTTCAGTCTTGATCTTTGGTGGAGCTGTTTCGAATTCTTTGGAAAGCAAGTGAAACTTCCAAAGTAGGACGCATGGTCGCTGAAATTTCTCAGCAGGCGCGATTATCTTTTCCCATTTGTGAGTTAGAATGTCTGTTGTTTTGGATGGTCTCGTGGCACTGAAAGTAACTTAGGCTGTTGATACTGGCACTCTAAGCTTTATAAGTTTGCATTCCAGCATCGATGTCTCTTTTGATATGTAGTTGGGGGGAGAAGAATATATGAAGTATTTTTGTGTTGCAAAGCTTGTCGTCTTGATCTTCCATCGAAGAGCAGAGGAGGCTTATTAGTCAAGATTAGTCTGGCTAACCAATGTGTTTATGCCAACCCTTGCCTATGAGAAAACATCGTTCTTAAGGTTTGCTTTTCGTAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG
CDS sequence: >Eucgr.D00853.1 [624 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG
Transcript sequence: >Eucgr.D00853.1 [624 nucleotides] GCTCCTGGAATACAAAAAGATTTCACTTCCCCAACAATTCCCCAAGTGCATATCCAAAAGTGGGCCCCACCCCCTGCCTTTCTTGTTTTGCAATCAGACCAGAGAAGGCATCAACCTCTTTGCTTAAATTACAATGGAAATTCTCTTGACGCTTCAGGAGCAGGAGGGACGGAGAGAAGGAGGAGAAGACCAGGGAAAGCACCAGCACCAGCACTAAGTCAAATCTCTTCAGGTCAAGCAAGAATGGAAGGGCAATATGACCAGCAGAACAAATCCCGGGTCGTGAAGGTCGACTCGCCCGAGTCGTGGGAAACCTGCTTGACTCAGGCCGCCGCTCAAGGCTGCCCTGTGGTGGTGCACTTCACCGCTGCTTGGTGCATGCCTTCAGTGGCCATGAACCCGTTCGTTGAGGAGCTGGCCTCGGCCAACCCAGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCAGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCTGCACCAGCGTTGCCTAG
Protein sequence: >Eucgr.D00853.1.p [207 residues] APGIQKDFTSPTIPQVHIQKWAPPPAFLVLQSDQRRHQPLCLNYNGNSLDASGAGGTERRRRRPGKAPAPALSQISSGQARMEGQYDQQNKSRVVKVDSPESWETCLTQAAAQGCPVVVHFTAAWCMPSVAMNPFVEELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFCTSVA
7. Eucgr.F01604.1
Genomic Sequence >Chr06:21245303..21247353 [2051 nucleotides] GCCGAGCGCGTCCTAATCGTAGAAGCGGCGACACCCCTTGGACGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTATCTCTGCTCTTTCATCTCTCTCCGCCCTTGCGTGGACGGAGCTCTCTTTTCTTGGTCTTTTTTGTACTCTAATTCTCAGTACGGCTGGGTGTCGGTGGGTGGTTTTTTGTTCGACTATGTCTCAGAATCGTGGGGGAATCCTTTTTTGCTACTCGATTGGCCGGGACGACGATACCCTTTTGTTATCATATGCATGCGTGATTTTTTTTTTGCCGTGGATTGCTACGCGATTGGCTCGGTTTTGCGTGGGGTTTGGCTTGTTTTGGTTGTGTTTTTTGACCCACTTCGTGCCGGTTAGGTTATGGGGGTGGTACTGGTGGGTGATGTCGAGGAAAAAGCTTGCTGATGGCTGCTTCCCTTGCCGTGGTTTTAGACAGGAGAGTGTATAGAAATGGGGGGTTTTGCATTTTCATTAGAATTCATTTGGGGGTGCAGAGCCTTAGCAAATGGGTAGGGGACATTGCAGACTAGGATGCAGTGACTGGAGTTCCTATCTGAACGCCTGAACTTGGCTTGCATTGGCTTTCACTTTGCCTTAAATTGGTTAAAAGAATTGTTTCTCCGAGATGGACAAAGCCCTTAGCGGAAGTTCTCTCCGCAATTTCGACCGAAGGGGTATCGGCTATTATGAAGCGAGACTCGTATTAGTTCGATCTATATCCATAGCTCTAGAATTGCATCGAGTAAATTAGCTCCTTGCTCTTGTTCTCTGAAAACAACTCTTTCTGACCTTTGTTAAGTCACTCTCAGCCTTTTCATGCCAGTGACCTTGAAAGAGTTTTTGCCGGTTGCCTTTGTGAGGCAATTCATTAGAAAACTTCTGACTTTTGCGGTATGAGCGTACTAGACCTGAGTCTTCAAATTGGATGACGTGACACATCGCCTTGCAGTATCACAATTCCTATGTGACTGTTTTCAGTGTTTGCTGAAAGACAAGATTTTTTGCCAGGTGGTGGTGGATTTCACCGCTTCATGGTGC
51
GGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGGTAAGCATGTGCCAAAATCTTTTCTGGCTTTAGAGTTTACTGCAAGTAGTATGGCTAGGCTTCATTTGGCTGAATACTTGGATTATTGCTGCTGTTTTTTCGTCCGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACAGTTGCAGGCGTCGATAAACAAGCACGCGACTGATGCAGTTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGATGGTTGATGTAACTTACGTCAATTGGCATCTATGACATCTTTATTTCGTGGACTGGCCTAAAGTTTGGCTGCATGTTTCGTTGCGCTGAAGTTTAAGTAGGCGCTTTCTTGATTGCGTGGCCGGAAAGTATCTTTTGTGCAGGGTTCAAAGTGTTGGTTGCTGGATCAAATTGACGAAAAAAACACTAGGTTCGTGTAAGTTCCGGTGATGTTACCGGCGTCACCGGAAGACTTGGCCACTGAAGCCTGGCAGTCCGATCGCAGGTTTTCCGACAATCTGGTGTGTTTTCGTCGAGCGCGCGTGTAACTTGGACTGTCTTAATCGATGGCCACCGGCTGGTGCGCATGATTAATTAGGGTTGAGAGAGGTTCTCTCATGTACATATGACTAGAGGTTAAAAACATATAAAGGGTCTGGCGAAAATG
CDS sequence: >Eucgr.F01604.1 [453 nucleotides] ATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTGGTGGTGGATTTCACCGCTTCATGGTGCGGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACATTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGA
Transcript sequence: >Eucgr.F01604.1 [952 nucleotides] GCCGAGCGCGTCCTAATCGTAGAAGCGGCGACACCCCTTGGACGAAAGAGAGAGAAAGAGAGAGAGAGAGAGAATGGCGGAGGAGGGACAGGTGTACGGCTGCCACACCGTGGATGCGTGGAAGGAGCAATTTCAGAAGGGGGTCGAATCCAAGAAATTGGTGGTGGTGGATTTCACCGCTTCATGGTGCGGGCCATGCCGTCTCATTGCCCCAATTTTTGCTGAAATGGCCAAGAAGATGCCCCATGTTTTGTTCCTGAAGGTGGATGTGGATGAATTGCAGTCTGTTGCCACGGAGCATTCTGTCGAGGCAATGCCAACTTTTTTACTCTTGAAAGACGGCCAAATTGTGGACAAGGTTGTGGGTGCAGACAAAGAACATTGCTGCTTGACTGTATATCTAGTACTTCGTGAAAAAAATAAACCGGCTCCGATGTTGGATGCTTTGGAGTCTATATGGTTGGTGAGCTTTCCTTGGATAAGTGATACACTGGTGTGTGAAGAACTGAGCTATTTGCAGATTTGATGGTTGATGTAACTTACGTCAATTGGCATCTATGACATCTTTATTTCGTGGACTGGCCTAAAGTTTGGCTGCATGTTTCGTTGCGCTGAAGTTTAAGTAGGCGCTTTCTTGATTGCGTGGCCGGAAAGTATCTTTTGTGCAGGGTTCAAAGTGTTGGTTGCTGGATCAAATTGACGAAAAAAACACTAGGTTCGTGTAAGTTCCGGTGATGTTACCGGCGTCACCGGAAGACTTGGCCACTGAAGCCTGGCAGTCCGATCGCAGGTTTTCCGACAATCTGGTGTGTTTTCGTCGAGCGCGCGTGTAACTTGGACTGTCTTAATCGATGGCCACCGGCTGGTGCGCATGATTAATTAGGGTTGAGAGAGGTTCTCTCATGTACATATGACTAGAGGTTAAAAACATATAAAGGGTCTGGCGAAAATG
Protein sequence: >Eucgr.F01604.1.p [150 residues] MAEEGQVYGCHTVDAWKEQFQKGVESKKLVVVDFTASWCGPCRLIAPIFAEMAKKMPHVLFLKVDVDELQSVATEHSVEAMPTFLLLKDGQIVDKVVGADKEHCCLTVYLVLREKNKPAPMLDALESIWLVSFPWISDTLVCEELSYLQI
8. Eucgr.F01854.1 Genomic Sequence >Chr06:28174385..28176117 [1733 nucleotides] ATACAGCAAGCAGCGAGAACCCCGGAATTTGCTGAGATACCCCGAATAAAGTTTTTGAATTTCGTTCACGGTTATCTGGAGAAACGAGAGGAGAGAAGAGAAGCAAAGAGATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTACGTAATTTCGCTTGCTCTGTCTTCTGATTGATTTTGTAGTATGTGGGTTTGATGGGATTCCGATGTGAGCTCGTGTTCTGTTTTTCGTTCCGGTGCTATGCTTCTTTGTTTTTCTTCCCGCGACTCCTTCGCGCTCGATATTCCTGCGATGGGTTTAGCACGGAGTTGGTTTTCGGTAGTTGCTATGAGAGATTGTGAAGGGCGGAGGCAATGGAAATGGAATGGTGTTTGAATGAATCTTGCTTTGTTTCGAGTTGATTCCACCCCCCCTATCAAGTGTTGGGGAGACTCGCGTTCTTGCGATTCTTTATGGCGAAGCGGATGAACCGAAAGGCCAAATTAAGTGTGCGCTTCATCGATTTCTTGTTTTGCCAGATATCTTCGTACACTGATCTGTACAATTTGCAACATGTTTCGTGCTTCCTAGTACTTTTCTTGACTGCCTGATATCCAATTCCGGGTTCTTAATCTCTTCTTCGGACCTTGGGTGCGGAAGTTTCTGTGCCCATCGAGTTTGCATTCTTCAAAGAGAGCAATTGCATTTTGCATGGAAAGAAGCTTCCGTGTCTGGGTTCTCTATGCTGAGGAATGGGCTTAAACATCGGAATGAGAACTGCTCACTCGAGATGACGTTTCGAAGCTTCATAAGTAAAGTTATCTCTAAAACTGGATATATATATTCACTAACAATTGTAGAAGCTTGCAGAAGCTCAAACCAAAATCATCCCGTTGTTGTTTTCGTCTATAATGTCTGCATTTGTGCCACTATATTGTCAGAAACATGTTGGATAGATATAAACCGCATTGTGGTTAACGCTTGTGCCACAAATTGTGTATGTACTTTTGAGTATTCATGTAAATGATTTGGTCCGTTTGATAGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGGTATAAACCATCTGGAACTTCCTCTTTGCTTACGATAATGCATACTTTGTGGATTACTCCACCTCATTTTCCTGTTATAACGTGTCTTTCTGCTTTGTTATGATGGATGCCACACTGGTAGTACAACTTCTAATTGGGGATTATCTTATACGTGATGAATGCAGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGATACTCTATATCTAGTGGACACATGGCTTGCCGTTGGATTTGACCATAGCATATCTTGGTCATTTCTCTGAAGTAACTCCTGTATAGCTTCAGATGTAATTCCATAGTCCAGACGACTCCACTTTTCAGTCTTTGTATTATATGGTGTTCGATGAATAAAGGCTAGTAAGATCTGTGTGAACTTATCATTTGAGTAATAAAGGCATAATTTTGCAGTTCT
52
CDS sequence: >Eucgr.F01854.1 [357 nucleotides] ATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGA
Transcript sequence: >Eucgr.F01854.1 [686 nucleotides] ATACAGCAAGCAGCGAGAACCCCGGAATTTGCTGAGATACCCCGAATAAAGTTTTTGAATTTCGTTCACGGTTATCTGGAGAAACGAGAGGAGAGAAGAGAAGCAAAGAGATGGCAGGTGAAGGGCAAGTGATTAGCTGCCACACCGTCGATTCTTGGAACCAGCAGCTCCAGACAGGAGCCGAAAGCAAGAAGCTGGTGGTGGTGGATTTTAGTGCTACATGGTGCGGTCCGTGTCGTCTCATTTCCCCAGTTCTGGACAACCTTGCGAGAAAGCTGACTGATGTCATTTTCCTGAAGGTCGACGTCGATGAATTAAGGTCTGTTGCTGAGGATTGGGCTGTGGAGGCGATGCCCACTTTTATCTTTATTAAAGAAGGCGCAGTAGTGGACAAGGTTGTTGGTGCAAATAAGGATGATTTGCAGATGAAGATCGCGAAACACGCAGCCGCTACCGTGACTGCTTGATACTCTATATCTAGTGGACACATGGCTTGCCGTTGGATTTGACCATAGCATATCTTGGTCATTTCTCTGAAGTAACTCCTGTATAGCTTCAGATGTAATTCCATAGTCCAGACGACTCCACTTTTCAGTCTTTGTATTATATGGTGTTCGATGAATAAAGGCTAGTAAGATCTGTGTGAACTTATCATTTGAGTAATAAAGGCATAATTTTGCAGTTCT
Protein sequence: >Eucgr.F01854.1.p [118 residues] MAGEGQVISCHTVDSWNQQLQTGAESKKLVVVDFSATWCGPCRLISPVLDNLARKLTDVIFLKVDVDELRSVAEDWAVEAMPTFIFIKEGAVVDKVVGANKDDLQMKIAKHAAATVTA
9. Eucgr.F02754.1
Genomic Sequence >Chr06:39636801..39638397 [1597 nucleotides] TCGCTCGCTCGCTCTCTTGGTTATTACCATCCACATGCACCCGAAAGCCTTCAGGACCTCACGATCCCCCTCGAGTGTCTATCCACCCACTCCCATTCACGTTCACAGGCTCCTCTAGCTGTCGTTCATCCCGGTGAGCACAGGAAAACGAACGGAAAGAATAGAATAAAGGACGCCCCAAAAGATAACAAAAACAATACTCGGGAGAGACTTCATAGGAATCAGCTCGTTTGGCGAGTGGGAGAGAGACAGACAGACAGACAGAGAGAGGGGAAGAGAATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGGTCAGCTTCTAGTTCATGGAGACCATGTATATTTGCACCGCTCTTTCGTGCCAATGTGATACATATGGGTGCGAGCTAACTCGTGCGTCCTCGAACTCTCTCGCCTTTTTATTTGACTGTTTGAACTTTGGATGCACAAGGAAGATTATATTGAGGATTGTAACAACATAAGCGACTAGTTCTGCTACAAGCCCAACGTTAGAGAGAAAATCACCAAGTATTACCAAATCTATAGTCATCTTCACCCCATCGAGGGTGATGAGTTCGTGGTGCGAGCTGTTTTAGTAATTTCAATCTTATAGTCTACTTTTGAAGCGGACCGACCCATGTTAGGTTTTCCATTAGACGTTGGTTAAAAACTGATCATACAGCGCTAAAACACTGGCTTTCATCCTTACATGTCGGCAGAAATTATGTTTTCACCATCGTCCTATGAACATGGATACTTGGAGTACTCCCTGAAGAGGGGAAGGATAAATTGCCGCAACAGATAATGTGGAAGTGCTTGCTTGACTCGATGTTTGTGCAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCATCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGAATTGAGAGCCTCTCAAAACAATCACTCTTCAGGATTTTGCGTCAGTACTTGTACTACATTACTTGATGTGTTTATAAGAACCCATCACATCATCGTATGTTGTTGTTGTACATGAACATACTGCCGTTTGAAATCTACCGTTTCTTTGTGGGTGAAGAAGAATGGAGATCTCTTTTGGCAAGAGATGTGTTTTAATTAAGATCTGTTCTTTCTCCAGCCACA
CDS sequence: >Eucgr.F02754.1 [567 nucleotides] ATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCATCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGA
Transcript sequence: >Eucgr.F02754.1 [1068 nucleotides] TCGCTCGCTCGCTCTCTTGGTTATTACCATCCACATGCACCCGAAAGCCTTCAGGACCTCACGATCCCCCTCGAGTGTCTATCCACCCACTCCCATTCACGTTCACAGGCTCCTCTAGCTGTCGTTCATCCCGGTGAGCACAGGAAAACGAACGGAAAGAATAGAATAAAGGACGCCCCAAAAGATAACAAAAACAATACTCGGGAGAGACTTCATAGGAATCAGCTCGTTTGGCGAGTGGGAGAGAGACAGACAGACAGACAGAGAGAGGGGAAGAGAATGGAGCAGTGTGTACAGATGATGAGCGCGACGAGGGGTAGAGTCTTGCAGTGTTGCGACCGCCCGGTCGCATTCGCACGCAGAGGGATGCCAAATTCGCCGACACGAAAAGGAGGGGCGGTGCTGAAGAAGTCCGCACTCAACTTCTCGCTGTCTTCTTCTCCTCCTCCTCTCGCCAGCTCGCTCAGCGTTAGGCACCAGAGGAGGTCTAGCATTATCTGCAAGGCCCGCGACGCGCTAGACGAAGTACGAGTGGTGACCGACTCGAGCTGGAGCAACCTGGTGATCGCCAGCGAGAACCCCGTCCTGGTGGAGTTCTGGGCGCCATGGTGCGGACCCTGCAGGATGATAGCCCCAGTCA
53
TCGACGAGCTGGCCAAGGAGTATGCCGGCAAGATCGCCTGCTATAAGCTCAACACCGACGACTGCCCCACCATCGCCACGCAATATGGGATCCGGAGCATCCCGACTGTCCTCTTCTTCAAGAATGGCGAGAAGAAGGAGAGTGTGATCGGGGCCGTCCCCAAGTCCACCTTATCTGCCACCGTTGAGAAGTACCTTGATCTGTGAATTGAGAGCCTCTCAAAACAATCACTCTTCAGGATTTTGCGTCAGTACTTGTACTACATTACTTGATGTGTTTATAAGAACCCATCACATCATCGTATGTTGTTGTTGTACATGAACATACTGCCGTTTGAAATCTACCGTTTCTTTGTGGGTGAAGAAGAATGGAGATCTCTTTTGGCAAGAGATGTGTTTTAATTAAGATCTGTTCTTTCTCCAGCCACA
Protein sequence: >Eucgr.F02754.1.p [188 residues] MEQCVQMMSATRGRVLQCCDRPVAFARRGMPNSPTRKGGAVLKKSALNFSLSSSPPPLASSLSVRHQRRSSIICKARDALDEVRVVTDSSWSNLVIASENPVLVEFWAPWCGPCRMIAPVIDELAKEYAGKIACYKLNTDDCPTIATQYGIRSIPTVLFFKNGEKKESVIGAVPKSTLSATVEKYLDL
10. Eucgr.F03319.1 Genomic Sequence >Chr06:44675869..44678312 [2444 nucleotides] CAAACGCCAGCCAAACACATCCCTCTCCCTCTAGAAAAAGAATCTCTCCACTCTCCGCTTCTTCTTCTTCTTCTTCTTCGTGCCCTTCGCAGTGACGTCTCTTCGCTTCGCCGTTCGCGCCTCCCGGTCCCCCGTCTCCCATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGGTCGGATTCCTCAAGCTCACGCCATTTCTTCCTTTTTTTTTTAATGCTAATGTCAGTGTTTCTGTGATTTTTCTCTCGTTTGTGGAGTTACCTGAACTTGTTCTTCGATTCATTTATCGTCGGTGTATCCGTAGATATGATTTGATTTGATTGCCTGGCCTAGTTCAGTTATGCGGAACTGAAGGCTTAGTATTGGGTCGCACTTAGTCGTGGACGAACTATCCTATGCTATAAGAGATTACACAAAATGATTGCAGTAGGCATAAGAAGTGTCGCCAGAGTTCTCTGTTGATATGTGGATGAGCTCTCTGCTAGACCTACCTTTAGTAATAATGTTTGCGGCGAAAAAAGGATGCCTTAGCTGTGTCCTTGAAGCCAACGAGCCTAATTCTTATTGTTTGTGTAAAAGAAGGCTCCAGTTGTCAACTTTTTGCAAATGAATGACTCGATGCCAAAGAAATTGCACAAGAAAGGTTTGTTTTTCTTGGATACAGTCCTCTCTTGTTAGAGGAAATAGAAATTGTGGTGTACCGATATGGATATATATTATCGTATAATTGCATCCCCTTGCTAATCTACATCATTAATGAGATTATCATAGGTTTTGAGGAAATGAAAACTCTTAGAACTTTAGGGCAATCGTAAATGAAAACTCTTAGAACTTTAGGGCAATCGTCGCCAACAAACTCATTCATAACCAACAATCACTAAAGCAGAACTTGTTGAATGCTTTAGCTTGAGCTCAGCATAAGCACTTTGCAAATCTCTATAGTGCTGCAGTATAGGTAAAACTTCTCTGGAAAGCTCTTCATGGGCACATTCTGAAAATGGAAAAAATTGCAGCCATAACTGGGGATCCGTCATATACTGATGCAACCATAATTTGGGATCTCTTATGTATTGTTCGTGTGCCAAGTATATGCACAAGTTTGCTGTAGAAAACGAGAAATCCTGGTTTTTTAAAGCAAATTTCAAAAGGTTAAGGCCATATCTTGCTTTCTGGGTCTGCATTTTGTTATGTATTAGAGGAACTGAGATGGTCACCACTCTAAAATTGGAAGAGTGATTCAGAAAGAGATATGTTTGAGCATTAACAGTCATTTCTTATTTTTGATGTAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGAAAGTAGTAAGCATGAGATGCCCTTGCAGCAAATAAAGTTAAGCATAACTTTTGTCAAATCTGCATTTTCTCTGTCTGAGGGCTGCATTGTGCGACTTCTGTATAGTGAAGTGGGGCTGTATTATCTACTTGCTTAATGTCAATATCGGCTGTATAACATCATCTGGTGAATTTGGTATCCAGCTCTTCCATTGCTCATATGTGTGTGCATTACCTTTGTGTTTGCAACCTGGTGCCGAAAGTATGTCGGAGCTTCAGTGTTAGCAAAACTTACCTGTTAAAAGAGTAGTAGAGTCTTGATTCTTGAGCTGGTAACCAATATTTCTATATTCAGCTGGACATTACTTAGGAGTTTAGTACATTCTCTGAGGATGATCTTCCTCTTTGTACCACAGTAATTCTAGATCTAGAAGAAGTTGTGCTGTGTCTTCATGAGAATATTCCTGTTGCTTGTGTGCCTTTTGAGAGTTCTAGGAGACTGGTTTTGTGATAATCACCTCTTACGTTAAATGGAGGAAGCTCGCTTCTTGAGTGGGATTTTATTTGTTGGATCTTGTAGGTCTCAGGACTTCAGTTGGTTTAATGCCTGAATGGGATGCATGACTCAGCTTTTCTTAATAA CDS sequence:
>Eucgr.F03319.1 [564 nucleotides] ATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA
Transcript sequence: >Eucgr.F03319.1 [1325 nucleotides] CAAACGCCAGCCAAACACATCCCTCTCCCTCTAGAAAAAGAATCTCTCCACTCTCCGCTTCTTCTTCTTCTTCTTCTTCGTGCCCTTCGCAGTGACGTCTCTTCGCTTCGCCGTTCGCGCCTCCCGGTCCCCCGTCTCCCATGGCCGCCGTGCTCGAGTCCCTCGCCGTGCCCCGCTCCTCCGGCGCGGCGTCCGCCGCCGCTCTCTCTCCGGTCGCCTCCGCGTCCTCCCTCGCCCCCACCGCCGGCCGCCGGCGATCGGCCACGTTCCCGCAGGCCAGCGGGTTGAGGATCGGGCCGGTTTCGGTCGCTCGGTCGCTGAGATCTCCGAGTCAGCGCCCGAGGCGTGCGCCGGCCGTTGTCTGCGAGGCTCAGGATACTGCGGTTGAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTTGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCCTGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTTAACACTGATGAGAGCCCTTCAGTTGCCACTCGATATGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGAAAGTAGTAAGCATGAGATGCCCTTGCAGCAAATAAAGTTAAGCATAACTTTTGTCAAATCTGCATTTTCTCTGTCTGAGGGCTGCATTGTGCGACTTCTGTATAGTGAAGTGGGGCTGTATTATCTACTTGCTTAATGTCAATATCGGCTGTATAACATCATCTGGTGAATTTGGTATCCAGCTCTTCCATTGCTCATATGTGTGTGCATTACCTTTGTGTTTGCAACCTGGTGCCGAAAGTATGTCGGAGCTTCAGTGTTAGCAAAACT
54
TACCTGTTAAAAGAGTAGTAGAGTCTTGATTCTTGAGCTGGTAACCAATATTTCTATATTCAGCTGGACATTACTTAGGAGTTTAGTACATTCTCTGAGGATGATCTTCCTCTTTGTACCACAGTAATTCTAGATCTAGAAGAAGTTGTGCTGTGTCTTCATGAGAATATTCCTGTTGCTTGTGTGCCTTTTGAGAGTTCTAGGAGACTGGTTTTGTGATAATCACCTCTTACGTTAAATGGAGGAAGCTCGCTTCTTGAGTGGGATTTTATTTGTTGGATCTTGTAGGTCTCAGGACTTCAGTTGGTTTAATGCCTGAATGGGATGCATGACTCAGCTTTTCTTAATAAC
Protein sequence: >Eucgr.F03319.1.p [187 residues] MAAVLESLAVPRSSGAASAAALSPVASASSLAPTAGRRRSATFPQASGLRIGPVSVARSLRSPSQRPRRAPAVVCEAQDTAVEVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL
11. Eucgr.F04223.1 Genomic Sequence >Chr06:52957701..52958321 [621 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTAATGTACATCCCCCATAGATTTGGAGCAATGATACCTGTTCTAATAAATCTTTGAGCAACTTGATTGGCATAATACTTATAATTTGAGCTTTTGTCCCCAGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTAAGTCTTATCTTTTTCACCTTTGCTATCATGTGGAAATTTTATTTGCTAATTTCTCATAATTATTATGTCAGTAAAGGCTCATAAAATTTTTAGATACTGTGATGAGATGCCTTAGATATCCTAATTTGAACAAAAACCTGCAGTCACAAGTTTTTTGGCAATTTCAATCTTTTATGATGTGAAAGGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA
CDS sequence: >Eucgr.F04223.1 [330 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA
Transcript sequence: >Eucgr.F04223.1 [330 nucleotides] GTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTGTTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCTTTAATGAGGTCAGCATTAGACTTAAAGATACAATTCAGGTTGTGAAGATTGAAACTGAGAAGTACCGTAGCATTACCCACCTTTATCATGGGAAGCCTTTTGAACGTTTTGTACATGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCGCAGACACCCCTTGAAATGTACATAGGCACTTGTGGCATGGAGAATCTATAA
Protein sequence: >Eucgr.F04223.1.p [109 residues] VEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPIFNEVSIRLKDTIQVVKIETEKYRSITHLYHGKPFERFVHGELWKEYLHFAKKAQTPLEMYIGTCGMENL
12. Eucgr.F04229.1 Genomic Sequence >Chr06:53013812..53017385 [3574 nucleotides] CCAGCTCCCTCCCTCCGCGAATCCACGCGCGGACGAGACGACGACGCAGCCGGGGGGAAGATATTTCTCTTCGATTTATCCAAAAAAGGAAGAAGGAAGAAGGAGATTTGGAGAGCTCGTGGTAGTCGTTCTTCGTTCGAGTCCCTCGTTTCCATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTAACGCCTCTCTCCGGGATTCGTTGTTTTTTTTTTTTTTTTTGCAGTGTTGCTCTGAGCTGTGGCGGAACGCGTGCTCGCCGGAGCGCGGGCTCTGTCTTGTCTGGTGCTCACTTGATGTTTGAAATATATGACTGGAATTGGACGTCTCTCTCTCTAATTTAGCTTGGCCGTGGCTTGCTTCTCTTGTTACAAGTATTCGGTGCTTGTGGTTTTGTTATGCTCTGGTGTGTATGTTCCGCCGGCATCGACATCCGGTCTTAGTGTGCAGTGGAGCTTTGTTGGGTCGATAGAAGTGTTGGTATGGTGGGTAAATCATACGAGCGGTCATTCTACGTTGGGCAAATTTTCATATTGCCTGCTTAACCTCAATTTTATCGGGGGGATTATTATGTGTTACGTCTTCATTCTATTTTATCATTTAGTTAGCTATATTTTTCAATAAATAATTGAATGATTTGACAATCTACACAGCTTGTGTTGCTATTTGCGTGCTGCCTGGCATTGCACTTGCCGTGGTTTTCCCTACTAAACCCATAGTGATTGTTTCCTAATTGTAATGAACGTGCTTTAGGAGGTGACCATGGACAATGTCATGTCGTGCTTGGCCAATCTGCATCTATTATAAAAAAAAAAATGCCATGTCATGCCGGGTCATTCATCTGCTTTCCACCAGTCCCGTGTCTTTTTCTTTACTAGATAAATTCTGTCATTACTTGGAGCATATCCTTGGATTGACCTGTTTCATATAATTCATACAAATGCATATCTGCCTCCTCAAGCAAAGAAGACAGATTTTGATGGTTTCATCATTTTGCATTGGACAATGCAACCTATAAATGATCTGTCTAGAAGAAAACAAACTGGTGAAATTGGACCAGTTGCTGTGTTATGAGGAGTTTGCTCATTTAATGTATGAGGAATTTTACATTCTCATGTTAGGATCTCATCTGAATCTTGAAGCATATTGGTGAAAGTGATATAGAGCTATAATGAACAACACTTTTAGAAAGTTAGGAGTAAGGCCTACAATGGCATCTTTGTAAAGCTTCTTTAGGGCAGGCCAGGGGTTAACCTATACCACACGAACTCTTAGCAGGAGTTGATTTTGTACTTGTCATCACAAACAACGACAAACAACTGTAGACCTTATCCTACTAGATGGGAGTTTTTATATATGTTGGTCTACTGGACGATTCTAGTATGTTAATATCTTTCTATGTAATTGAAGAGAGTGGGAGTGAAAGAGACCTACTTAGCTCTATCTTTATATATTTCCTCCTAATCAGTAAGTGCATTTATCCATTGTTATATGTCGTGCAATTTTTCCCCTTATTTTTTGTCTGCATCCTGTTTACTGCTGTTAATGATAAAACGTGTTTTGCTCTCCTTGTACTCCTTTACGCTAGTTATAGCATATGTTCTTTATTTAGTTGGCTTCTTCCTTTGATCTGTTGGAATAAACTTTATGTTCCTCTTTAATAAGTA
55
GCCTCTTTTGGACTTTATTAATATGGTTAAAGGAAGTATATGTGCTTCCTCTTGTCTCTGTTGGACCATTTGGTGACATTATTACTTTGATCTTTGTTTTGTAGATTAGAGACGTCTACTTACCTGCATCCCTTGTTTTTTACAGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTAATGTACATCCTCCATAGATTTGTATCAATGATACCTGTTCTAATAAATCTTCGAGCAACTTGATTGGCATAATACTTATAATTCAAGCTTTTGTGCCCAGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGTTTTATCTTTTTCACCTTTGCTATCATTTGGAAATTTAATCTGCTAAGTTCTTGTAACTATTATGTTAGTAAAGGCTCATAAAAAGTTTTTGATACTGTGATGAGATGCCTTAGATATCCTAATTTGAACAAAAACCTGCAGTCACAAGTGTTTTTGGCAATTTTAATCTTTTATGATGTGAAAGATTAAGGGTGAACTCTGGAAAGAGTACTTGCATTTTGCCAAAAAAGCACAGACAGCCCTTGTAATGTATATAGGCACTAAGGCCCCTCTTGTGGCATGAAGAATCTATATTGACCAATAATCAGTGGACACCCTTCTCCTCCTAAACTGTTTTTGACTGGGGAATTCCATCCCACTTCATCATTACTCTCTCGCATAACATGGAACCGGCAATGAAACCATGATGAAGCACCAACATGTTTCTACATAATAACCGATGATAAATATGCACAAACTGCATAAGTCTTCAACAGTGATCAATGAAAGGCCTTCCCTTTGTAGAGCTTGACTGTCGTGGAAAACACAGCTTCCCTAGTTGTTAGGTTGCTGCAACCATGTCGCTGCAATCCATGCATAGTAAGTGATACTTCTTTTAGCAATAGGCAGGGGGTATTCCTATAAATTTTCTGTGAAGGACATGGTTGCCGGCTCAATGCAGAAATGGTAATAACTGATGGCCATCACCTAAGATTTATGCATTATTCTGTGGTCTTTGAATGTTATTTAATCGGAAGTTAGGTTGATTCTCATTTATAATTTAACTGTAAGATTGGGTTGTGAATTTTTTCTGATGTTCAATTGCTTGCAACTTATACAGTTTTAAGATGTTTTAATCATCTGCCCTTATCTTAATTGAGCTATTTTCAATTATCAGGAGGGTGCTCTGACGGCTGATCAACTGATCCAGCGGATTGAGGATTCACTGAAAGTTAAGCAATAGTTTTGGTGAGCCCTAGTTATTCTTCTATTGCTTCCATTGTAGACATATCATGAAAACTGTCCTTTCTCAAATCCTCCAGAATATTGCAATTTTCATTCTAGAATGATAATTGGTGGCCTCGGCCTTGTTATATGAACTTTGAAGTGTGCATAGGAAGTTTTATTCTCCTCTTTCCATTTTTCCCCATCCTTGAACAGCCACTCGCCCAAGAGGTCATGATTTATGGTAACATTGTTCATCTGTGAAAATTGGGTAATTAGACCTAAACTTAAAGGGAATTGAGAGGAGTAAGTTACAT
CDS sequence: >Eucgr.F04229.1 [459 nucleotides] ATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGGTGCTCTGACGGCTGA
Transcript sequence: >Eucgr.F04229.1 [956 nucleotides] CCAGCTCCCTCCCTCCGCGAATCCACGCGCGGACGAGACGACGACGCAGCCGGGGGGAAGATATTTCTCTTCGATTTATCCAAAAAAGGAAGAAGGAAGAAGGAGATTTGGAGAGCTCGTGGTAGTCGTTCTTCGTTCGAGTCCCTCGTTTCCATGGCGATTTCTCTCTCCGCATCTTCGATTCCTCGCTTGAGCGGCGAGAATCCGGCCGCCTCCTCCTCCATGTCGCCGCTTCGGCTCCGGCTCCCGGCGGGCGCCCGCGGGTTCGGCGGCGGGGGCCGGAGGATCTCGGTGAACTCGAAGCCTCGGGGCTTCTCTCTGGTGGTTGAAGCTAAGAAGCAGACATATAACTCTTTTGATGATCTATTGGCCAAATCTGAGAAACCTGTATTAGTTGATTTTTATGCTACTTGGTGTGGTCCTTGTCAATTTATGGTTCCCATCCTTAATGAGGTCAGCATTAGACTTAATGATACAATTCAAGTTGTGAAGATTGATACTGAGAAGTACCCCAGCATTGCTGATAAATACAAGATAGAAGCATTACCTACCTTTATCATATTTAAAGATGGGAAGCCTTTTGAGCGTTTTGTAAGGTGCTCTGACGGCTGATCAACTGATCCAGCGGATTGAGGATTCACTGAAAGTTAAGCAATAGTTTTGGTGAGCCCTAGTTATTCTTCTATTGCTTCCATTGTAGACATATCATGAAAACTGTCCTTTCTCAAATCCTCCAGAATATTGCAATTTTCATTCTAGAATGATAATTGGTGGCCTCGGCCTTGTTATATGAACTTTGAAGTGTGCATAGGAAGTTTTATTCTCCTCTTTCCATTTTTCCCCATCCTTGAACAGCCACTCGCCCAAGAGGTCATGATTTATGGTAACATTGTTCATCTGTGAAAATTGGGTAATTAGACCTAAACTTAAAGGGAATTGAGAGGAGTAAGTTACAT
Protein sequence: >Eucgr.F04229.1.p [152 residues] MAISLSASSIPRLSGENPAASSSMSPLRLRLPAGARGFGGGGRRISVNSKPRGFSLVVEAKKQTYNSFDDLLAKSEKPVLVDFYATWCGPCQFMVPILNEVSIRLNDTIQVVKIDTEKYPSIADKYKIEALPTFIIFKDGKPFERFVRCSDG
13. Eucgr.G03224.1 Genomic Sequence >Chr07:53045862..53048473 [2612 nucleotides] ATCTCCTTCTCTATCTCTATCCAACATAGGAAATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGGTACGTTACCATGTTCGATTGCGGGTCTCTTTTGTTCCTATCAGTGCTTACATGAATATGTGTAATTCCGAATTTTTCGGTGGAAAAGTGGAAATTCTTGAATGCCGGATTAAGATAATACGAGCAGGTAGGGGAGCCATCTGATTATGGAATTTGGAACTTGGGATTTCTCCCTTGTTAGCCTATGAAAAGGGAAAAAATTATTATCTTTAGTGAGCTGATATATAGCCGCGTTTTCATTTAAATTGTATGGTTGGTTTTGCTTGGGCTTGGGGCGAATTACGTGGCTGGTCTTTGGCAGACTGTACAATCTTTTACATTGATGTGTTTCTTCATTTGGTTTGGAAGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGGTAGGTTCAAATCTGATGTCTTGTTGTGGGTTAATTTCAATCTCGAGTCATCTCTGTTTTTATTTTGATTAATTACTCTCATTTACGTTCTTTGCGGAGGGAAATATATTGTTCCATTATTGGGAAGATCATGGCTGTAGATGCTACAAGTATGTTGCCTTTTAATTTTTTAGCAAGTTAGTGCCAGCTATTCTCAGAATGGCAATGCTCTTCGATGAATTGGTTTCTATTGGGAGTTTCTTTTATTGATATACCACTTCAACAGAAGCAAAGCATTCATGATAGACCTGAATCGAGAGGCATGCTGATTAAATATCAGTTCATTGGCTTTTATAAATGCTTTTGATCGGTCTCAAGATTGACATCTTCCCTTAGTAAGGCAACATTTTCGATTTCTCTAGTTGCTGTATTGTCTTCCCCATTTTTCTCCCCTTGACAGGCTTGGGGACAAGATACTTATTTATGTCCAAGCTACTTCAAATTAGTGAATAGTTT
56
ATAAGATGCTTGCTACAAGTTTCATTGAGGTTAGGACCAAATGCTTCGATTGATTTCCTATTGCAGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTAATAATTGCCATTGATACTAGTCGGATACCTTTTCTTATGATTGTTGCATTCAAACTCTTGGCTTGAGATCTCCATCAATCTGGTGATATCATAAGACACTTGATGTCAGTACCCTTCTCTTGGTCCATAAATGTTGTTTAATGACAAGTGGAAACAGCTTTTCATTGAAAACCTTGCTAGGTTATGAGGCTCCTCTTATTAAACTGCTCCTTTCTCCCCCTTTTTGCTGTTAAGTCAAAAGAATTAAAAATGATTTGCTAGATTTTTTCAGAAATGAATATAAATTTTGATGAATCAAGATTCAGGACAAGCTAAGGTCAGTTAATCTCCAGTCGAAAAAAAAAATTGGCTGCTTATGAATTTCATTTGAAACTCCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGAAGGCATCAGGAAAATGATTGATAAAATGTCTTCTAGGATTTAGAGACAAAGCTGCTCCAGCTGCTCCAGATCCAATGTGCGATTTTGCTCTGTGATATCCTTTTAATATGAAGGTAGGTATAGGCCATTTGATCTGGAGTTGACGACCTTTTGTTGTTATACTTGATGAACTAGATCCTAAACTTAGGAGGTTTGGGCATTCAGCCCAATGGAAGGCGTGGCCCCGGAATATTGGTTGGTTGTATTTTGCATCTGGCCATTAAGATCTATATAGTAACTAGGGACAGCAACAATCTTTAAGGTAGTTTAGATAGTTTAATATGCAATTTGAAGATTGCTTTTACATCCCGGCAGATACCGGATAAATCATGCTCTCTGTTTTGCTTGTTTAATTCCCGGCAGATACCAAAATATTGTTAATTGCTCTGGGTTAGAGGAAATTACTACTAGATCTGCTTATTTTGCACTGAAATGAATCTCTGGTTCAAAATGAGCGGATATGAGTTTCTCAAAATGTTGTTGTTATTAGTGGACGACTGGGGAGATGGAATGCTCATCTAGCTTGAGATCAGTTGTATGCTGAGCAGGGAAATGGCACATGTCGGCAAGTGTACGACCTGATGACGCTGATGTAGGAACCACTGGTACTGGATATTAATGGCTTGCTTATCAAAGTGTAAGTGCAATTGAATTGCCATACTTAAGAGTCTGTTGGATGTATGGTTTACT
CDS sequence: >Eucgr.G03224.1[561 nucleotides] ATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGA
Transcript sequence: >Eucgr.G03224.1 [1322 nucleotides] ATCTCCTTCTCTATCTCTATCCAACATAGGAAATGGGTCTTCTCCAAATACACTCTCCAATCGCGGTCTTTCTCAGCAAGCCGGTCTCATCATCCCATTCCAAACCGCCTCGTCTTCCTCCGTTCCAAGATTCCACCCGGAATTTCGGACAAAGTTCGCTTTTTTCGTCTTCTCCAGGAATTAAAGACAGAGTCTTTACGCTATCCACTGCACCCAGGAAGCTGCTCTGCACACCACCTCAAGGGAAGCACGTAAGAGAAGACTATCTTGTGAAAAAATTGTCGGCTCAGGAGGTGCAGGAGCTTGTGAGGGGAGAAAGGAACGTGCCCCTCATCATTGATTTCTATGCAACATGGTGTGGACCCTGCATTTTGATGGCACAAGAACTCGAAATGCTTGCAGTGGAGTATGAGAATAATGCCATGATTGTGAAAGTTGATACAGACGATGAGTATGAATTTGCCCGAGACATGCAGGTACGTGGCCTGCCGACTTTGTACTTCATCAGTCCAGATCCCAACAAAGATGCTATTCGAACAGAAGGTCTCATCCCTATTCAGATGATGCGCGATATCCTAGACAATGAAATGTGAAGGCATCAGGAAAATGATTGATAAAATGTCTTCTAGGATTTAGAGACAAAGCTGCTCCAGCTGCTCCAGATCCAATGTGCGATTTTGCTCTGTGATATCCTTTTAATATGAAGGTAGGTATAGGCCATTTGATCTGGAGTTGACGACCTTTTGTTGTTATACTTGATGAACTAGATCCTAAACTTAGGAGGTTTGGGCATTCAGCCCAATGGAAGGCGTGGCCCCGGAATATTGGTTGGTTGTATTTTGCATCTGGCCATTAAGATCTATATAGTAACTAGGGACAGCAACAATCTTTAAGGTAGTTTAGATAGTTTAATATGCAATTTGAAGATTGCTTTTACATCCCGGCAGATACCGGATAAATCATGCTCTCTGTTTTGCTTGTTTAATTCCCGGCAGATACCAAAATATTGTTAATTGCTCTGGGTTAGAGGAAATTACTACTAGATCTGCTTATTTTGCACTGAAATGAATCTCTGGTTCAAAATGAGCGGATATGAGTTTCTCAAAATGTTGTTGTTATTAGTGGACGACTGGGGAGATGGAATGCTCATCTAGCTTGAGATCAGTTGTATGCTGAGCAGGGAAATGGCACATGTCGGCAAGTGTACGACCTGATGACGCTGATGTAGGAACCACTGGTACTGGATATTAATGGCTTGCTTATCAAAGTGTAAGTGCAATTGAATTGCCATACTTAAGAGTCTGTTGGATGTATGGTTTACT
Protein sequence: >Eucgr.G03224.1.p [186 residues] MGLLQIHSPIAVFLSKPVSSSHSKPPRLPPFQDSTRNFGQSSLFSSSPGIKDRVFTLSTAPRKLLCTPPQGKHVREDYLVKKLSAQEVQELVRGERNVPLIIDFYATWCGPCILMAQELEMLAVEYENNAMIVKVDTDDEYEFARDMQVRGLPTLYFISPDPNKDAIRTEGLIPIQMMRDILDNEM
14. Eucgr.H01629.1 Genomic Sequence >Chr08:19303645..19306634 [2990 nucleotides] TTGCCATTCACTCGTTGACGAGAACTAGTACTGCCACTCTTGCTCGCTCAGCCATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTACGTGCTTCCTCTCGCTGATCCCATCCTCATCTCTCTTTTCGTAAGTTCTTTCTTGCTGTCTGTATAATGCGGTAACCGTTAGTATCTCTAGGATAAGGAATTGATTGTTGTTGTTGTTGTCGTCTTTTGTGACATTCGTGGTATTTCGGGTCGGGGCTCTTAAGGAATGCAATCTTTTCACTTTAGAGGAAAGATTAGTGTTTCTGTGACCTGTTCTCTTGCAATATTATGGAGTTGCGAGATGCTCTTGAAAGGGTTCCTTTATCGGGTGTTGAGATTGTTGATCCACTACCTGGGGAAAGTTTGAGATGGCTTGTGAAGTTGGACTGGTGGTTGCTGGGTCGTTTTGGAGACGGGAGTTTCCATCATGCTAACTAGGATTCTCTATACTAGATGAAGTTTGAAAGCGTGTTCTCTATCTACGGGTTTTGCTCCTTCTGAGTGGTGAGCTGCTGATGAACCTATTTGAGACCAGTTGCTTCTAAAGGAGTATCCCCAGAATTCATTTTGCCCTCTAACTTGATAATTTAAAGAAGCAGCTCAGACAAGGTAGTCAGATTGGTTGCTGGAAACTTAGGATGGATATCCATAATGGTTTGGCCTTCTCTTGTTTGTTCTTGTCTATAATGCTGTTTGTTTATGTAGATACCGCAAGAAGCATTGAATGAGCCTCATAGAAGGATTTTCAGATTACAGCCTGATGATCTCGGTAGAATCAGAACACCATTAATCCAAAAAAGAAACTAAACGTGTCAGGTCTCATGAAAGTTGCAACAAGAAATTCTCCTTTAACATTATCTTGGGTGCTGGTTTTGCTGGCCAATTTCTTATATGGTTTGTGGTTGG
57
TAGTGTTTTGTAGCAATCAATTTCAGTGTTTTGTAATTATCAAAGAACATGTTGGGACTGTGTTTAATGACTCGTCCCTTTTGCTGTTTACATTTAAGAATATCCTATCTGTGTCTCTGCCTCTTGTCTGCAGTAGTGCAATGTGCAAATTTATCTGCCTAAGAAAAGAGCAACTTTGTTTTGCATGTGTATCTGAGGCAGCATGCCCTGGTACTTGCATGTTCCTTTTCAGTTTCTTTGTTTGAATAGGACTTTCATTTCTGTTGAGCACCTCTGTTTCACAAGGCTACTGGTACTTATGGAATAAGTACCTTTCATATATCTTTTTATAAACTTCAAGTTAAGTGGTCATGCTTATTATTATTTTTTTGGTAAGTCGTCATGCTTATTATTCAAGTAGTCTATATTCAAAAAAAAAAAATCTCGTTTCAAAATGTCTATAGATTATTATTGTGCTGATTCTGATGAATGTGACCAAATCTATGAACTACCTGTCTGGCCTTTTCCTCTGCTTCATTTTGACTGCTTGAAAATTGCAGATTTCTTGAAACTCAATACATATTGTACATGACAAATCACAAATTAGATCCAGCTAACTATCATGGGTCGCTTCAAGTTCCCAACTTCTGACCTTAGATCTTTGCTGGAGTTGTAATAAATTGTAATTTCTCTCGCTTTGAACAACGGTACCATATATTTTTTACTTCTCCTATCTTTGGAGAATGTAAGAAAGTTTGTACCGTAGATATCACCTTGAAGGACATTAATAAGGTGCTGCATTATTAACATAGATCCCTGGAATATGTGGCCCCTATCTAATTCCATCTCCTCTCTATTTTTCAAAGTACACGTATGCCACATTCAACTGTATGTAGTCATAAAAGGCCCGGTTTGCTTTCAACTTCTTGTGTGCTGTGTCTTTCGTCTACTGTGTTGCTGCTTCCCAGACTTCATTTGCATAAATACATGAGAGTGCTTGATAGCATATGCATGTATCAATTCCTCTAGATGCTGAGTTCTTGTGCACTCGCTTCCACTCATGTACATGTCATTGTGGTGCTAGCCTCACATTTCTCTAGGAGTCATTCTTATTGAGTTTGGGAATTAATAAGATTTAGACTTTTTCTTCACTTGTCTGATTCTAATGGTTGATATTTCTTGATCGATAATTTAATAGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGGTATATTCTTGCCACCCCCAAGAAAATGAAGAACCTCCTCCCCTCTCTCTCTCTCTCTCTCTGAGATTTCTTTGTTTTCCTTTTATTTTCTGGGAAAACTTGAGGGCAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGAAGAAGGCCCTCTTTTGCGACTGTTGATATAGTACCATCGCAACTTGTCGACCTCAAATCCGATGCTCTTCAATTAATCTTATCGAAAGTGAATCTATTGAATTCAATGTCTGGTATAAGGACGAGTGTGGTAATTATTGCACTCTTCTCATGGATGATGATTTTGTGAAATTTCCTTCCTCAATGGCCTTCCCGGCTCCCAATTCCCACGCCCGGAGAATCACTTGCTATTATCTCAACCAAGC
CDS sequence: >Eucgr.H01629.1 [558 nucleotides] ATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGA
Transcript sequence: >Eucgr.H01629.1 [855 nucleotides] TTGCCATTCACTCGTTGACGAGAACTAGTACTGCCACTCTTGCTCGCTCAGCCATGGCTCTTCAGCTCTCTCTCTCAGCTTCCTCCTCCCTTCGTTCCCAGAACTCGGTGCCTTGCCTCTCGAGCTCCGGCTCCAGCTCCAGTTCGAGCGCGATCTCCAGCTCGAGATGGTGCTGGTTGGGGTGCAAGAACGTGAGCTTGTTGCGAGCTGGTGGCAACGTCGGTCGTGGCGGGAATGGAGTGGTGGTGAAGTGCAGCGTGGACACGACGGGGGTTTACACGGTGGGGACGGTGACGGATGTGGATAAGGATACCTTCTGGCCCATCGTCAATTCTGCCCCCGACAAGACCGTCGTTCTTGACATGTACACCCAATGGTGTGGTCCTTGCAAAATCATTGCTCCAAAGTTTCAAGAGCTAGCTGAGAAGTATCTTGATGTTGTTTTTCTGAAGCTTGACTGCAACCAAGAAAACAAGCCATTGGCAAAGGAGCTTGGCATAAGGGTGGTTCCCACATTCAAGATACTAAAGGGAGGCAAGATCGTGAAGGAAGTGACAGGTGCCAAATTTGACGATCTTCTTCTCGCCATAGACACAGTCAGATCCAGCTGAAGAAGGCCCTCTTTTGCGACTGTTGATATAGTACCATCGCAACTTGTCGACCTCAAATCCGATGCTCTTCAATTAATCTTATCGAAAGTGAATCTATTGAATTCAATGTCTGGTATAAGGACGAGTGTGGTAATTATTGCACTCTTCTCATGGATGATGATTTTGTGAAATTTCCTTCCTCAATGGCCTTCCCGGCTCCCAATTCCCACGCCCGGAGAATCACTTGCTATTATCTCAACCAAGC
Protein sequence: >Eucgr.H01629.1.p [185 residues] MALQLSLSASSSLRSQNSVPCLSSSGSSSSSSAISSSRWCWLGCKNVSLLRAGGNVGRGGNGVVVKCSVDTTGVYTVGTVTDVDKDTFWPIVNSAPDKTVVLDMYTQWCGPCKIIAPKFQELAEKYLDVVFLKLDCNQENKPLAKELGIRVVPTFKILKGGKIVKEVTGAKFDDLLLAIDTVRSS
15. Eucgr.I01912.1
Genomic Sequence >Chr09:29105284..29106504 [1221 nucleotides] AGTGACGCATATATTCTCCTTTATTCGTGGCGTAAGACCCGCAAAAGTCATAACCAGCTCTGTGCATGGTGCCGTCGGTTGGAAATTCGCAACAAAAAGAGGATGCACCATCGTTGAGGATAGCCATGATCAGTACCATGAAGGGTGGAAAATCGAACGCCAGATGAGGGCCGGCAACGTGAATCCGCGCAAAGGACGAAATATAAAAGCGGGGGAAAAGAGAGAGCTGCTCAAGCATCGTAGCGCATTGGCTTAAGTTGCTACTTGTGAATTTGGTAGATTGCGAGCAACCATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGGTAAGGCTTGACCTCCGATCTCCTTCTTCCAGAATACGACTGAGCGTCTGGTGTTCTTCAAAACTGACGTGCTTGCGGGTTGCATCTGGGGAAAAAAGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGTACGTGAACTCCGCTCTCTTCCGCTCTCTGTTTTCAGATTCTCTTTTGTTGCCGGACAACGTCGAATTCGAGCTGATTTTTCCCCTCTCTCTCTCTCTCTCCCCTTCTGTGTTTGCGGCAACGGCGAAATCTCGCAGGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGAGTTCGATTCTTTTGCTCTTCTTCTTCTTCATGGGGAAAACAAGAGAGAGAGTTTTTATTGTATCTTCAGTTCGACTATCGCGCGCGAACGTTTGCTTTACCTGAATTGCGAAGCATTAGGAGAATGTTTCATGTTTGATCTGGTGTGTAACGTCTGAACTTGTCTCATGCTAATTCTAACGTTGGCATTATATCGATGTTTCGAGTTCTCGTTCGA
58
CDS sequence: >Eucgr.I01912.1[477 nucleotides] ATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGA
Transcript sequence: >Eucgr.I01912.1 [985 nucleotides] AGTGACGCATATATTCTCCTTTATTCGTGGCGTAAGACCCGCAAAAGTCATAACCAGCTCTGTGCATGGTGCCGTCGGTTGGAAATTCGCAACAAAAAGAGGATGCACCATCGTTGAGGATAGCCATGATCAGTACCATGAAGGGTGGAAAATCGAACGCCAGATGAGGGCCGGCAACGTGAATCCGCGCAAAGGACGAAATATAAAAGCGGGGGAAAAGAGAGAGCTGCTCAAGCATCGTAGCGCATTGGCTTAAGTTGCTACTTGTGAATTTGGTAGATTGCGAGCAACCATGGGCTCCTTCCTCTCCCGCCTCCTCAGAGCTTTGGGGCTGGGCCCCAGAGCTCCGGCTGCCGCTCCGGCCACCACTGTCTCGACTGACTCTCCGTCGCAGTCTTCGTCGTCGGACTCTCCGCCGAGGCATTCTCGTGTCCAGGCGTTGCACTCCACCCCACCGTGGCAGCTCCACTTCAACACCGTCAAGGAGACCCCCAAATTGATGTTGATAGACTTCACGGCGTCCTGGTGCGGGCCCTGCAAGAGCATGCAGCCAGTCGTGGACGCCATGGCTTCTAAGTTCACTGATGTCGATTTCGTTAAAATCGACGTCGATGAGTTGTCCGATGTGGCGCAGGAGTTCGGAGTGCAGGCGATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGCTTGTTGGGGCGAGTAAGGACGAGCTCGAGAGGAAGATCCAGAAGCACAGGGGTCTCGTGCCTACCCGTTGAGTTCGATTCTTTTGCTCTTCTTCTTCTTCATGGGGAAAACAAGAGAGAGAGTTTTTATTGTATCTTCAGTTCGACTATCGCGCGCGAACGTTTGCTTTACCTGAATTGCGAAGCATTAGGAGAATGTTTCATGTTTGATCTGGTGTGTAACGTCTGAACTTGTCTCATGCTAATTCTAACGTTGGCATTATATCGATGTTTCGAGTTCTCGTTCGA
Protein sequence: >Eucgr.I01912.1.p [158 residues] MGSFLSRLLRALGLGPRAPAAAPATTVSTDSPSQSSSSDSPPRHSRVQALHSTPPWQLHFNTVKETPKLMLIDFTASWCGPCKSMQPVVDAMASKFTDVDFVKIDVDELSDVAQEFGVQAMPTFVLVKKGKEVDRLVGASKDELERKIQKHRGLVPTR
16. Eucgr.I01913.1 Genomic Sequence >Chr09:29110832..29112055 [1224 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGGTAGGGGTTGGAAAAAGATTCCCTCCTCACGGGGGGCTCGCCAAGGACCCTTTACCGGGATTCCTCGCCCCCTGGCATGAGAAGAGGAGGTTGACCACTTAGATGCGAGGCTAAACCTCTTCAATGAAGGTTCCGAACCCCCAAAAGGGGCTCGGGTGGTGGCGACACCTACCCCTCTTAGTTTTACGTTGGAGGGACCTCGCAAAGCGCGGGCGACGTTGGATCAGTTGGGCACCCCCATTAGGGGGGGCCGTCATTTTTAGACCTTAGATCAATTGGGAACCCCCACCTTAGGGATTCCCCCGTCATTTCTAAGGAAGGACCTGTTCAGGTCCATTTTAGGGCAAAATTATCCTCTAATTTAATCAAGAAGATCCTGCCTAAAAACACGAACACCTAAATCCCAGCTGTCCATAATCCAATAGCCTCTCCGACTTCCCTTTCTGCTCATTCCTCCCCACCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGGTAAGGCGGCTGTAGACCCCTGAAACCCCTCTCCCCTCCTTCGGATCTCCTCCTCCTCCTCCTCCTCCTCCTCCTTCTTCCCCGGAATGCGATTGAGGCTGTCCGGCGTCCTTCGAAACTGACTGTGCTTGCGGTTTGCGATTTCTTGTGGGGTGGAGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGTACGTCGACTCCGCCCTCTGCCTTTAGGGTTTTTTTATAATTGTTGGCCGGCGATGTGGGATTCGAGCTGATTTTGCTCTCTCCTTCTGTGTTTGTTGTGGCGATGGTGAGATCTTGCAGGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA
CDS sequence: >Eucgr.I01913.1[480 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA
Transcript sequence: >Eucgr.I01913.1 [480 nucleotides] ATGACTACCAGGAAAGGTTGGGTACAGCCAGCGAAGCAGAGCGAGCGATCAAGCTGCCATGGGCTCCTACCTCTCCAGCCTCCTCGGAGCTCCGGCCGCCGACGGCTCGCCGGAATCGTCGTCGGAGCCTTCCCGCGTCCAGGCGTTCCACTCCACCCCGCGGTGGCAGCTCCACTTCAACAAAGTCAAGGATACCTCCCAATTGCGAAGATGGTGATCGATTTCGCGGCGTCCTGGTGCGGGCCCTGCCGGATGATGGAGCCGGCCGTGAGCGCCATGGCTTCCAAGTTCGCGGACGTCGAGTTCGCCAAGATCGACGTCGACGAGTTGTCCGACGTGGCGCGGGAGTTCAGTGTGCAGGCAATGCCGACGTTCGTGCTGGTGAAGAAAGGGAAGGAAGTGGACAGGATCGTCGGGGCGAAGAAGGACGAGCTCGAGAGGAAGGTCCAGAAGCACAGGGCTCTCATGGCTTCCAGTTGA
59
Protein sequence: >Eucgr.I01913.1.p [159 residues] MTTRKGWVQPAKQSERSSCHGLLPLQPPRSSGRRRLAGIVVGAFPRPGVPLHPAVAAPLQQSQGYLPIAKMVIDFAASWCGPCRMMEPAVSAMASKFADVEFAKIDVDELSDVAREFSVQAMPTFVLVKKGKEVDRIVGAKKDELERKVQKHRALMASS
17. Eucgr.I02383.1
Genomic Sequence >Chr09:34231097..34233464 [2368 nucleotides] GCGCAGGAAGGCGGTTTTCCATCAATAACGTGGTCACCTTCTCTCCTTCTCCCTTCATCATTCTTCCTCCTTCCTTCTTGTGCGTGCGCGTGTTCGTGAGTGAGAGAGAGAGAGAGAGAGATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGAGAAATTTTCGGATCCTTTTCATGCGTTCTGCACATGAATCTGGCGTTGTCGATGCGATATGCTGTCATCTAGTTCGCTTCCGTTTGTGCAAGTAGTCGTAGCAAATGGGCATGGCGTTCGACGAAATGCAATCTCGAGCCGGCTTCCGAGGCGATGGTTTGTCTTTGATACTTCTGGATCGGCCGCGCATTCGTTTGCGGTCCTTTTTTTTTTTTTTTTTTTACTTTTTGGCCCCGGCCGGGACGAACGAAACCTAATCGGTGGAACGGAGAAAAAGAAAAAAAACATCAGAATTCAGAAAGAGGCACGTTGATCTGAGCAATGACGCTGACAGGGAAGAGAAGCAATGCTTTTCAAGGAGATTATCATCAACTTTCATCGTTCAGACTTAGTGTTGTTCGATAAGACTTTTTTTTTCGTTTTTTTTTCCCGAAATCATATGTGATGGGAACGGGATCTGGAGGCGACGGCTGCGGGTTGGAAGGTGGCGGGCCGGCTGTGGCGGGAATGGGGTGGCGATGGTGGCGGCGGCGGGGATGGAGGAGGATGGCTGGCTCGAGGCCGAGGAAGAGAGAGAGAGCGCAGAGATCGTGCGGGTTCGGCTGTCCTTGCTTATTAGGGTTTTTATGTGCTTAGCTGTAAATTGACAGGCAGTGCGTTAAAGTGTGAATGGCTTGCCGCGTCGGCTACATAACCTCCTCCCGAATATGATTCACTTGTTTGAAATGCCACAAACAGTCTGTCGCAACACTTAGTATGCCGAAGTTGTGAATAGGGGTTGATGGCATTTTACCTGAGTTTATAATGCGGCGCCATGTCTGGCCAACTCGCTGAGCATAGGACGGGAAGAATACTCGGTACATAGTTCCCCGTTGTTGATTAGGTTGCTTGGTTGATCGTTCTCCTTTTGGACTATCTTAAGTTTTGCTTGTAACCCAAGTAAATCTCGCAAGAAAAGTGATTCTTTTCGCTAAATAGAATCATACTTAAGTCATCTTTTTACTCTCGTGTGAAATCAAGGGGGAGAAATTTGTTCATATCACTCTCCTTTTCTTTTGAATTCTATTTTCTCATGAAGAAAGTACATGCATTGCTTCTCTACTAGTACTAAAGAGGAGCTGGCTGAGTCATAGTTTATGACTAGTGTTGTTGTATGGCTTTCGAAGGTAAATACTCTGATTTTTTATGGCAATATCAGCAGTCTGCCAGTGAATTCTTAATAGCAGGTGATTTTGTTTGGGTTATTATATTTCTTTCAGTATAATTTGGTGGAAGAATGAGCAAATGGGTCAGTGTGGCTGATTAAGCTCTTTGTGTTCATGAGCTATTGAACTGCCAATTAACAATTTCCAGGATGTTTCTGCTGTAGCGTCTCATTTTATAACGCCACTAGTTTCGGTGATGAATTGGTCAGAATTGAAATGCATATGATGATCACCGAGTTTGTTTGTTTCTTTTTTGTTTGAAACAGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGGTAAAATAATCCGAGGACTACATTTCCAGGGCTATATGAATGATGGAAATTTGTCTTAATAGATGACAGCCTAGCTGTCTAAGTTCTGCTCTGCAAGTATTGTTGAACTCGTGAAGGAATGACTTTCCATTCTTTTGCAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAATCATTATATAAATGCTATCAACCAAGCTACATACAGTCTCTCTTTCTTTCTTTTAAGGAGTTGCATGCAGTGTCCCTTTGATGTTATGAGATTGCTTTGAATCTGGTTTTCAGTAGACATGCCTGTCTACATTCACCGCGTCGAATGTCTCACAGCACCTTACGTCCATCTCTGTAGAATTGTGATTCCCAAGCAAAAATAACACATATCATGCTACTTTGGGAGTATTTAGGATGAGGAAATAATGTATGGCAAGTCTCATGCAGATAGTGTTATAAC
CDS sequence: >Eucgr.I02383.1[354 nucleotides] ATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAA
Transcript sequence: >Eucgr.I02383.1 [753 nucleotides] GCGCAGGAAGGCGGTTTTCCATCAATAACGTGGTCACCTTCTCTCCTTCTCCCTTCATCATTCTTCCTCCTTCCTTCTTGTGCGTGCGCGTGTTCGTGAGTGAGAGAGAGAGAGAGAGAGATGGCGGAAGAGGGCCAGGTGATCAGTTGCCACAGCGCCGAGTCGTGGAGCGAGCAGATCGCCAAGAGCAACGAATCCGACAAGCTGGTGGTTGTCGATTTCACTGCTTCATGGTGCGGACCATGCCGTTTCATTGCACCATTCCTAGCTGAGCTGGCCAAGAAATTCCCTAATGTTCTGTTTCTGAAAGTTGATGTTGATGAGCTGAAGACGGTCGCTCAAGAGTGGGCCGTGGAGGCGATGCCGACTTTCATGTTTGTGAAGGGAGGAAAGATTGTTGACAGGGTGGTAGGAGCCCAGAAGGATCAGCTGCAGATGACTTTAGCTAAGCACATGGCAACCGCTTCGGCTTAATCATTATATAAATGCTATCAACCAAGCTACATACAGTCTCTCTTTCTTTCTTTTAAGGAGTTGCATGCAGTGTCCCTTTGATGTTATGAGATTGCTTTGAATCTGGTTTTCAGTAGACATGCCTGTCTACATTCACCGCGTCGAATGTCTCACAGCACCTTACGTCCATCTCTGTAGAATTGTGATTCCCAAGCAAAAATAACACATATCATGCTACTTTGGGAGTATTTAGGATGAGGAAATAATGTATGGCAAGTCTCATGCAGATAGTGTTATAAC
Protein sequence: >Eucgr.I02383.1.p [117 residues] MAEEGQVISCHSAESWSEQIAKSNESDKLVVVDFTASWCGPCRFIAPFLAELAKKFPNVLFLKVDVDELKTVAQEWAVEAMPTFMFVKGGKIVDRVVGAQKDQLQMTLAKHMATASA
18. Eucgr.J00880.1 Genomic Sequence >Chr10:9524711..9528067 [3357 nucleotides] TCCAGCCACGAGTCAAAGACTCAGATTCTCTCCCTCCCTCTCTCTCTCTCTCTCCACGGAAGCGAATCCGCCATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGA
60
CGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGTCTTCAAATCCTCTCCAATCCTCTCTCTCTCTCTATCTCTCTCTTCTGCGATTGAATTTCGTGATTCTTAGCTTTCTCTCGGCTTCATTCTGATTGGATTTCAATACTTACGTGCGTCTGTTTATGTTGACTTGAGCATCAGTTCTATATACCATCCAGCAGTTGACTGTTAGCAGACCGTTTTAAGCTGTTAGATTGATTGGCATTTGTTTCGCGTGATGCTTTTCATGGTATGGGAACCAAAGGTTCTGTGTTTTAAGGCTTCTCTCACTTGTTGTTTCCATCTCGAATGAATGACTGCGACGGGAATGTTAGAGCATTTTCAACTCAACTGGCTCAAGCTTTTTAGATTAGGGAGAGGGTTCCCTAGTAATAGTACGGACGCCATTAACCATATAACTTAGAGGCCGTCCAGAAGTTTGAATGACTTCCATCCTCATCTCATCCTTTTGTTGATTCTGGGTTGCAATCTCCTCAGCTTAAGTGACATGAGGATTTAAACTAGTCTGTGATGATGAATCGCTGATGCAAGATAAGTGACATGAGGATTTAGGTCCCCTTTTGAGTATTGAGGTAGCTCTGATTTTTCCGTTGCCTTTCTTTTCCTTAATTGTTCTCCCGTTGTTCTTCTTTCCACTTTATACCATCTGCTCTTAGCTATGATGGTTAAGCATTTTTTTTAACTTTTCTCTTGTATTCATATGGACGTTGAGGACCATAATTGGACACTATAATTTGTGATCTAAAAGCTAATTCTTTTTTTTACTGAACTGTCATGATTGCGTCCCTTTAATTTCTGGGGAGGTGGCAGCTTGGAGATGTGTTCCCTTAACCTTCTAGTGTAATGTTTTGCCAATTCATTAGGAACTAATTCCTGGATACCGTGTCAAGTTTTGACTTCGATCATTCATGTAAAATCAGATACTACCGTGTAAGCCAGCTTTTGGGAAGATATTTTCCACTTCTTTTCTTAAAATTTAGCCTCTCCTTACCCTCCATTTTTCAGCTACTCGATATCTTCATGAACAATTCGCCTCTTTTCTGTTGCTTAATTGCACAAACTGGCAGTCTCCATTGAGTGGAACCTTGTCAAATTTTTGTTGGCATGGTGAGAAAAAAATAGAGGGAAAAGCTGCTGATAAACACAGTCTAGGTTTTAAATGTTCAAGCTGTTAGGAATTGTTATGTCTTAATACTTTCCCTCAGAAAAGTTGGTTAACATCACCGATAGATTTCTGCTTTCTGTTGTTGTACTTTTAGGTGGCAATTACAATGGCAAAACGAAGATGCTAATTCATGACATGTATCGTAATGCGATCAGTCGAATTAGGATTCCTCTGATGGGTAAGTTGATTAAAGGAGTCCCTGTGTTTTTCTTTGTTATATTGTAAGCTGGTCTTTGTTGGTTCGGATTAATACAAGGCATGCATACAAAGAAACACCAATTCCTGCAATTTCTTTGTGTCATTCACTTGTTAGCAAGAAGCCTGTTCAGCCTAGCCTTTGAGCATGTTTGAGATCTATAGATAATCATCAACTTGGGTTTGTTTGAAAGTCAATGTCAGTGTGTTAATTACTGTCAACTTCTAAGGAAAGATGAGCCTTTACCTGCACCATGGTGCTCCAACAAGTAATTTTAGAAGAAATGGCGATATATCTGAGATCAGATTTGTTGGCAGATTTAAAGCATGCTAAAATCTTATGCTGGTTGGTTGCCATTTTGTTAGATTGTTTCTATGGTTTACTGCATGCCACTTTCTTTTTCATACAAATTGTATCACGGGACTCTTTTTTTCCATCAACTGTAGCATGGAACTATGTTTCCCTTGATTAATATTCATGGGAATCTTTTACTTGAAATGAGGCTCTTACCTAAGATATTCACACAAGAATGTGTTTTTCCAATCTCTGAGGTGCTTCAATTAATTATTCTGAAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAATGACCTTTGGATTTTTGCATATGACAAGCCAACTGCCTTATCCTTGTGTGTCTTTGCTCAAGCAAGTTTCTTCCTTCTACCAGTCAATTCTGGAAACAGATATTGGTATGAATGTGCAGTCTCTTCCGTTCATTTTGTTCTGTTTGCAAGCCAAGATGATCACATCGCGACTTTTTGAAGTCAATGGGGTTGATGATCCAGGGTTGTGGGCTTTTTGCTACTTCCTTTGTGCTGTGCAGTAAACAGAACTCTTTGCTAGCTTCTTGTGACATGATAATATTTTAATTTATCACAAGAAAAATGTGTTGTTCGAATGTATCATAGTTACTATTACAGCATTGTTGTACTGCTGGCATGATAGAGGTGGCAGGCTGTGTACTGCATTTGACATTAATATATCTGCAGATATGTAAGACTTCAGAGTGAGTTTATGGCTGTCTCTCATGCGACGGTGTCCTACCAAGTTGATTGAGAAGTTAATTAATTGCCAAAGGCAGTTCTGCTAACATTTCTGATTTTTTATGACCAAAAGAAAAAGAAAAAAACTTTTAGGATAGTCTTTGTTTTTTTTGGTAAGGCTTTTAGGATAGTCTTTGTTCTAACGTCTCTAATCCACAGTTTCACCACTTCCTTGCAGCCTAAGTGGAATTAATCATCAATTTTTACTTTTTCCGGCTAAGATCATGCCATCGGGTTAATCAATTTGATGGAGAAAAGATTACAGTCGGTATAAGTATCGCAGGAAGAATGGCATATCTTCTTGTTATTTTGCGGTTCTTGCAAGAATGGCATATCTTC
CDS sequence: >Eucgr.J00880.1[549 nucleotides] ATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGACGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAA
Transcript sequence: >Eucgr.J00880.1 [1419 nucleotides] TCCAGCCACGAGTCAAAGACTCAGATTCTCTCCCTCCCTCTCTCTCTCTCTCTCCACGGAAGCGAATCCGCCATGGACGGAGCCGCGCTCGTGTCGAGCTCCGGCGTGCTCTTCCCTCCGTCGCTCCCTCCGGCCCGTCTCGCGACCGCCCTGAGCGCCGCCGCCGGCTGCCGCTTCGCTCCTCCGCCGAGGTCCTCGTTCCGGACGTGGCGGAGCGGGGCCGGGGTCGCGCCGGTGCGTAAGTCCGCGCGGAGGTGCGGCGCCGCCGTCGGCGGCGGCGGCATAACGGAGATAGACGAGAGCCAGTTCCCCGAGACGGTGCTGAAGAGCGATCGTCCGGTCCTCGTGGAGTTCGTCGCCAACTGGTGCGGCCCCTGCCGTTTGATCTCTCCCGCCATGGAGTGGCTCGCTCAGGAATACAAAGAAAGATTGATCATCGTAAAGATTGATCATGATGCAAACCCAAAGTTAATTGAAGAGTACAAAGTTTATGGATTGCCAGCACTGATTCTCTTCAAGAATGGGAAAGAAGTTCCAGAAAGCAGAAGGGAAGGTGCAATCACGAAGGTGAAGCTAAAGGAGTATCTAGATTCTTTGCTAGATTCAATATCAGTTGCATAATGACCTTTGGATTTTTGCATATGACAAGCCAACTGCCTTATCCTTGTGTGTCTTTGCTCAAGCAAGTTTCTTCCTTCTACCAGTCAATTCTGGAAACAGATATTGGTATGAATGTGCAGTCTCTTCCGTTCATTTTGTTCTGTTTGCAAGCCAAGATGATCACATCGCGACTTTTTGAAGTCAATGGGGTTGATGATCCAGGGTTGTGGGCTTTTTGCTACTTCCTTTGTGCTGTGCAGTAAACAGAACTCTTTGCTAGCTTCTTGTGACATGATAATATTTTAATTTATCACAAGAAAAATGTGTTGTTCGAATGTATCATAGTTACTATTACAGCATTGTTGTACTGCTGGCATGATAGAGGTGGCAGGCTGTGTACTGCATTTGACATTAATATATCTGCAGATATGTAAGACTTCAGAGTGAGTTTATGGCTGTCTCTCATGCGACGGTGTCCTACCAAGTTGATTGAGAAGTTAATTAATTGCCAAAGGCAGTTCTGCTAACATTTCTGATTTTTTATGACCAAAAGAAAAAGAAAAAAACTTTTAGGATAGTCTTTGTTTTTTTTGGTAAGGCTTTTAGGATAGTCTTTGTTCTAACGTCTCTAATCCACAGTTTCACCACTTCCTTGCAGCCTAAGTGGAATTAATCATCAATTTTTACTTTTTCCGGCTAAGATCATGCCATCGGGTTAATCAATTTGATGGAGAAAAGATTACAGTCGGTATAAGTATCGCAGGAAGAATGGCATATCTTCTTGTTATTTTGCGGTTCTTGCAAGAATGGCATATCTTC
Protein sequence: >Eucgr.J00880.1.p [182 residues] MDGAALVSSSGVLFPPSLPPARLATALSAAAGCRFAPPPRSSFRTWRSGAGVAPVRKSARRCGAAVGGGGITEIDESQFPETVLKSDRPVLVEFVANWCGPCRLISPAMEWLAQEYKERLIIVKIDHDANPKLIEEYKVYGLPALILFKNGKEVPESRREGAITKVKLKEYLDSLLDSISVA
61
19. Eucgr.J02387.1 Genomic Sequence >Chr10:28963917..28966304 [2388 nucleotides] GCTCGACAAGATCCTCGGAATCGACGAGGAGCAAACAGCAGCAGCAGAAGAGGTTTCCAGCTGTCGCGAGGCGGCTAGTGTCGTGCAGTGCAGGGAGCGAGAATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTACCATCTTCTTTGTTTCATCTCTCTCTCTCTTTCCGTCCCTTCGTTTGCTTTCGTTTCGTTCGCGTTTGCGCTTTGATGTCCGGGACTGGCGGCGTTTTTTTTGGTTGGCTTTTTGCAACTCCGGATGCGTGATCTTCCGGCTGTCGAGGTTGCGTGTTACGGGTTCTCTTTGTTTTTGTTTTGGATTTGGCCGTGGCTCGGTTGATCGTCGCGAAAGGCGAGGCGTTGACTTCGATTTAGACGTGCCCGATTCGTGGATGGATTCGTACATGAACGAGAAAAGTGATTTCGAGTCGTGATTCGAGTGCCTGCTCTGATCGGGTTCGTCTGGTTGCACGTTTAATTTCCACCGGAAGCGGTGTGATTATCTACGGAGATGAGAAAACCCCCCGAATTGACGTGACTCTTGTTGAGTTTCTTCAGGCGGAAGATTCACAAGCCGTCTACATACGCGTGCATTTATGCAAATTTATCTGATTTTCCGGGGTTGTTCGTGGTTCGGCAACTATATCTTATGTAATTGTCAAGTGAACTGCTTTGTGGACCCTAGCTCGTGAGGGGGTTTGCTTCATCAACTGGGTTTTGATTTTTTATAGCTGCGGTTTCTCCAATAAGCCCTGCACTGGTTTGGCTTGAGAGCAGTGGTCGAAAAGGGGGCATATCTATAGATTTATACAGGTTCGGCCTACGACCGACCACATGGAAAATAGTGGCTTGATGTTACGTCGTAACCCACGATAATAATTCTTGCTGTAGGCAATGATATTGGATAGACCGCTTCCTCGATTGGACTGTTCTTGTATTTTTTCTCTGTTATTTTTCTTTTGATGGAGACATACTTCTTTTAACTTTGTTTTAAGCGAATAATGATATCTTCCGCGATAGGACCAAGTCCACGGTGGGAAACAAAAAGAAAACATGCGCTTGAGGAGCTTTCGTCTTTAAGTTAGACATGACGAAAAGAAGTGACAACTAGAGGTCAAGGCACAGTGGAAATTTTGAGTCTTGATGAGGAAAACTACGATGGGAAGTGGCTTGCAATTGATAAGCTGTTATCTAAGGAAAAATATTACTGTATATTTGTGCGATGAACACGGGATCACACTCCTTTTCTTAGTTGATTTGTGCTGATGTTCGATGCCCGTGTGATTAGTCACGGCAATTTCCCTTTCTAGGATCAAATCGGTTGGTTGCTAGTAGTCCTTACCATGTCATGCCACAGAAATACCTGAAAAACAGGTCATTTGACGTTCAACAAAGACAGAACTGAAGTCCCATGCCATTGCCATTGGCATATTTTGAACTGCAGATTTCTCCAACATGCCAATTCATGGATGACCTACTACTCTATCATCCAGCTTGATTTTAGATGTCCTCCCTGGACATTGAGGCGATAGAATGTTGTGTCAAAGTCATACTGTCTCCCAGTTCTTCTTGCACTTGTACAGAATATGGCCACCCTTCCAATTTAGTTTTCTAGAAGTGATTTACAGGGTGTTGTGACAGGCGACTAGCTTCCAACAAATCGATTTAAAATTCAAGGCCGAGCCGACCGTTCTTTATTTTTCCTGCATTAAAGCTCTGGGTCCAGTTTCAGATTCTCATCGATAACGATTGCTACTTTAATTAATGCAGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGGTAAATATAAAATTCCATCCCATGCGGAACTAAGATTGTTTCCCCAATTCCCCCATCCTTCCTGTGCAGTTAAATCACGGACTAATTACTTGTGTCTTTGCAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAATCACGCGGGCTCTGCGGGCTCCGCAGTTGTCTTTGAAGGACTCTTTGGAACAAGCTGAAATCCGCAGTGATATATTATAAGCGCCATATGTTATGTTGAGATTCTTATGTCTGCAGCATGGAGTGATTTTAGTGGAACTTTACAATCATGATGAATAAAACATAAGGAATTGATGGCGATTTCTG
CDS sequence: >Eucgr.J02387.1[360 nucleotides] ATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAA
Transcript sequence: >Eucgr.J02387.1 [647 nucleotides] GCTCGACAAGATCCTCGGAATCGACGAGGAGCAAACAGCAGCAGCAGAAGAGGTTTCCAGCTGTCGCGAGGCGGCTAGTGTCGTGCAGTGCAGGGAGCGAGAATGGCGTCGTCGGAGGAGGGACAGGTGATCGGCTGCCACACCGTCGGGGCTTGGACCGAGCAAATCCAGAAGGGCAACGAGCCCGACCAGCTGGTAGTTGTGGACTTCACTGCATCATGGTGCGGACCGTGTCGCTTTATCGCACCTTTCCTGGCAGAGCTGGCCAAGAAATTCCCCGCCGTCCTTTTCCTAAAGGTTGATGTGGATGAGCTGAAGCAAGTTGCTCAAGAATGGGCTGTGGAGGCGATGCCCACCTTCATTTTCGTGAAAGGGGGGAAGGTTGTGGACAAGGTGGTCGGAGCAAAGAAAGATGATCTTCAGCAGACCATCGGCAAGCATGTGGCTACTGCTTCAGCTTAATCACGCGGGCTCTGCGGGCTCCGCAGTTGTCTTTGAAGGACTCTTTGGAACAAGCTGAAATCCGCAGTGATATATTATAAGCGCCATATGTTATGTTGAGATTCTTATGTCTGCAGCATGGAGTGATTTTAGTGGAACTTTACAATCATGATGAATAAAACATAAGGAATTGATGGCGATTTCTG
Protein sequence: >Eucgr.J02387.1.p [119 residues] MASSEEGQVIGCHTVGAWTEQIQKGNEPDQLVVVDFTASWCGPCRFIAPFLAELAKKFPAVLFLKVDVDELKQVAQEWAVEAMPTFIFVKGGKVVDKVVGAKKDDLQQTIGKHVATASA
20. Eucgr.K01294.1 Genomic Sequence >Chr11:16362073..16366652 [4580 nucleotides] GGGCAAGAAAATGTTTTGCGAGTTTTCAAACCGGCAAGGTTGACGGTTTCGAGAGGCTTGTCAATCGTAGGCAACGAACGTCGGTGGGGCCGTTTCTGGATTATCTTATGGGGAAAGTATCGAGCTCGACAAACCAAACTCGGCAACTACCCTTTCCTTTCGTCGGGTTAGCATCCGAATTCGTCAACCTGGGTCGCGTTGCTTGCTTCTGCAAAAGGCAAAAGCGAAAATCCCCACTTCCTTGCCGGAGTTTCCATCGCAACCCCACGAGGCGAATCGAACCGAGCACGCTCCATTTCGTCGAGTCCGTCCGTCCGTCCGTCCGGGTTGGTCTTGGCCAAGATTCGGAGGCTCGAGCGTCGCCCGAGTTCGCGGCTGCGGCAGTACCCGTCTTGAAATCCGACGCTTCGGCGACTCCGCTGCTGCTCCGCTGGTAGACCGGCTTGTGAGGGAACGAACCTCCCCGCGGTTTCTGGGTTTGTTTTTCTGCCGAGCGAGAAAGGGTTGTTTCGGTTGTCGTCAGGTGGGTCAGTCGTGCGTGCTCGCTAATGCTGAATCTTGAATTCCTTCGTTTTCGTTTCGAGTTCGTGTGGTGTGTCGGATGAGTCGTGGGGATTTGGAGTCTCGCGAGTGTGAAATTTTCATCGATTGTTGTGACTTCTCGAACGAGCCGAAGCAGGAGGTGATTGTTTTTGTATTCGCGTTCTTGATTGATATAGATAGCGAGCTCGTTTATCGCATTGTTAATCTGCGTTTTCCTTTTCTAGAGATTTTTTTATGGGGTTCGTGTCTTACTTTCTTGGGTGAAATCAGAGAGAGAAGTTTGTGAGGTTTTGAAAAAGAATATTCTTTGATGTGTGGAAAGCATTCAAGAGTATTCAAGAGTCAACTTAC
62
TATCCAAAAAAGATGAGATTTTTAATGCTCGACAGCATTTATGCTCCCCAACATCTACTTTTTGCTAAAATAAAGAGTGGGGGGGGGGCGGCGGTTTTTGGAATGATACATGATAGAACTTTGAAGAATCAGGACTTGACTTGAGCGGCCCCTCCAATTAGCAGGTTTTGCAAGTGTCAAAATGGTTTCGTCATTCGTAAAGCCGAGTTTACAGTTTCCATTTCAAGCATAATTGCCCTGTGAAGTTTCCAGGACCTTGAAAATGTGAGCTCAGATTAGAAACTATGAAATTTTCAATGTTTCAGCCTTGGAGGTTTCTCTAGGCAATGATCGCGCTAACTCTTTTCTTCGAATTGCTTTTGTTAAACTTGGTTTCCATGTTTGTTCGACGAGAACCACCCAAGTAGCTTAATGGATGCTTAAGAATCTTTACTCTGGCAAATGCTATACTTTTTGGGTGCCACAAGGAATTTGTTTCCTCTCACTTCCTCTCAGCTTAATCCAACTCCTTGGCATGCGCTTAAATGGTCTAGAATGCTCTAGTTTGTCTACCAATTTATTGAGGTGTCTAATTCATTTCCTTTGTATCTTATTGGTTTAATATGTAGCCTTGGATTCGATAATTATTTTTCTTTTTTATGTGTACTGATAGGTTTTCTGCTGCTTTGTTTGTCAGGGTCCTTTTGTGTCTTAAGTATTGCAACTCCATTCCTGATACATCATCATGGGACAGTGTTACCCAAAGGTAAGTTTTTCATGGGATTAGCTAAAACGATTGATGGAATGGAATCTAATTTAGTCACAAGTTTGGCTCTTCAATCTGGGAAAGTTATTAAACCTGTCATCACATTTTTCATGTGATATAATAGCATTTAAGTGAGAAGAAACCTTTTCTTTGTAGTTATCTAATATCATGCATGTAATCATATTGAATAGCAGTCAAATTTATCTATCATTGCTAACTACAAAGTAAAAACAAATCGAGGTTATATGCATTTGCCTGCTTAATCTGCGGGGTATGCACTCAGTTTAAAAGTCCATGTTCGTTAGGTGCTTTCTTGGTGCACCTTTGGAAGGCTGCCTGTTAAGCATCTGCTGATCAGCCGCGTGTAGCAAATTTTGTCCAAAATAGTGCATATTGAAAATACATGTCCTGGTTTCGCTACATGTGTGCTCGCATCGTGTTTACATGTTTTTTTTCCCTTGATGAACCTCGTATCAGCACACTGGGTGAGATGGGGGAAGGCAGGGTTGTGAGAAGTCGAACTCCTAGCCTGTGTAAAATTTGTGGGAATTTACTGACCTGATGAAACTAACATCGAAAAACTTCCCCACGGCAACATTAGTTGTGGTTTTAATGCGCCATTCAATCCATCAATTTCAACTATTTTATCCATCACCTTGCTTTTGAATGCATGGATGTGATTCTTCCAATGGAAATAATGGATACATAATCCTTCTGAAGGACTTGAATTGCCTGCAAAAGACAGCTGATAACTGTCGCTTTCAAACTGAGCATATGTCAAAGGCCTGAGGTGAAGAGAATGTACTATGGACAATTTCAGCGGATACCAGATGTCATGACACATGACCATTGGAAAATTTACTTTGTGAATTGAAACACTTTTTGGAATGATCACTATGGCCTTTCAATTTCATGGGAAAAATTTTGCCCTAAGCCAATGGCTGAATAGGTAATTCATAAAATCTCACTACAATCGAGATACTAGTAATGCAATGCGGACTTTAGCTCTTTGAACCACCACATAAAAAGGGAATGGTGGTCTGTGGGTTGTGCTGAATGGTTGACAACAGGATATTTACTGATCATCAACAGCCCTGGGTAATACTGGTTTTTCCGTAGCCACACACCTAAAGGTGCATTCATGATGTCATAACCTAATCTAGACTCGTGTCTTGCTTATTTCTAAAGCCCTTATCACATGTGCAATTCTTGTAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTAAGTACTCTGCAGCTGCTTTTAGAAGTGTTTCATGAGCAAAATTAACACAATGCTAATTAGTTTGATTTTTATGAGGTATGTTGGGAAAAGATTTTGTTTGAGCAATTGTCAAGCATCACATCAGCAGATCATTTTTTTTAGGTTGCAAATTTAACTTATAATTATTTGTATTAGGTAGCATGCCTAATTATGTCTTTCGGCATTTTCTCTTTTGGTTGAATATGCTCAAATAAGATGTTCTTTACTGCATCAGTTAGGCCCCAATTTTATGAACAGTCTCAGAGCTGTGCTTCTCGCATAAGAATACCATGGGAGACTAAATTGTATTTATCCGAATATTCTTGAATTTGCATTGGTTTCTAATTTAATTGGATTTCTGTGCAGGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGTAAGCAATGAAACCTACTTATTTGCCTTAATCCTTAATTCCAACCGCTTAGCCTAAACAACAAACACATGCTCATGCAGTCGTCTTCAAAGTTTTCTTCCACTTTAGCCCTTAAACTGAAAGCAGCAAGTGCACAAGTGTTCACAATACATGAAAAGTAAAACACAAATAAGGATAAGAAAGGCAAAGTACATTCCATTAGGGGTTATTGAAATTTAGTGGAATTTGCAGACAGGTCACTGATTTTGATTTCAGTCGGCCAATATACTAACTTTTCACTTTTTTGCAACTGATACGCTATGGCTGGAATGAAATCTATTTTCTGTCGAGCGCTATCGTCAATGCCCACATGGCAATTACATGGCATCTAGAAAATTGTCACATATCTGCCATGTCAGTACTTTGCCAAAAAATTGTTGGATTCCGGTCAGAGTACATATGTTGTAAAAACTCGAAAGGCTAGTGCATTTGGTGATCGAAGTTAAAAGTTCAATGATTTGATTGCCAGTTCCACCAAGTGATCCGTGATCTATTCATGCAGAAAAACAGGAGTCACATAGCATCGTGATCATCATATAGAACAATCGACAATGTTTGTTGTTCTTCTCCACTTTCCCGTGTAAAATGCATTGATGATTTTGAACTTATGCAGGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAGACACGAATTTGTAATCGGTTGTCAGTGTGCGCGCGTCTATTTGGATCCTCTGTGTATGTGTGTATTTGGGATCCTTTCTTCAGCAGGTGCAAGGGGACCCTTTTCTTTTGCTTTCTTTTTTTGTGATTATTCTGATTCCTACTCATGAAATTCTCTGCTCCTAAATCTTTTGGCTTGGGATGTGTTTTTGTATATATGAGTATGACCGCGTGCTATTCTGGAAAAAATGTTTGCATTGTGTTCAAAACGTTGGTTCTGGTGTAAAAGATGTCTAGTCCTCTGGTTGCCTCTATT
CDS sequence: >Eucgr.K01294.1 [414 nucleotides] ATGGGACAGTGTTACCCAAAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAG
Transcript sequence: >Eucgr.K01294.1 [1279 nucleotides] GGGCAAGAAAATGTTTTGCGAGTTTTCAAACCGGCAAGGTTGACGGTTTCGAGAGGCTTGTCAATCGTAGGCAACGAACGTCGGTGGGGCCGTTTCTGGATTATCTTATGGGGAAAGTATCGAGCTCGACAAACCAAACTCGGCAACTACCCTTTCCTTTCGTCGGGTTAGCATCCGAATTCGTCAACCTGGGTCGCGTTGCTTGCTTCTGCAAAAGGCAAAAGCGAAAATCCCCACTTCCTTGCCGGAGTTTCCATCGCAACCCCACGAGGCGAATCGAACCGAGCACGCTCCATTTCGTCGAGTCCGTCCGTCCGTCCGTCCGGGTTGGTCTTGGCCAAGATTCGGAGGCTCGAGCGTCGCCCGAGTTCGCGGCTGCGGCAGTACCCGTCTTGAAATCCGACGCTTCGGCGACTCCGCTGCTGCTCCGCTGGTAGACCGGCTTGTGAGGGAACGAACCTCCCCGCGGTTTCTGGGTTTGTTTTTCTGCCGAGCGAGAAAGGGTTGTTTCGGTTGTCGTCAGGGTCCTTTTGTGTCTTAAGTATTGCAACTCCATTCCTGATACATCATCATGGGACAGTGTTACCCAAAGAACCAAATGCATGGAGATGATTCTGATGAGCATGTTGAATTTGCTGGTGGGAATGTACACATCGTTACTACCAAAGAAAGCTGGGATCAGAAGCTGTCAGAAGCAAATAAAGATGGCAAGATTGTTCTTGCAAATTTCAGTGCAACCTGGTGTGGTCCTTGTAAGATGATGGCACCATTCTATTCAGAACTGTCCGAGAAACATTCTTCTATCCTGTTTCTGGTGGTTGATGTGGATGAGCTAACTGAGATGAGCACATCTTGGGATATTAAAGCCACTCCCACTTTCTTCTTCCTCAGAGATGGCCAGCAAATCGACAAGCTAGTGGGTGCCAACAAGCCTGAGCTTCAGAAGAAGATCACTGCAATCCTTGATTCCGCCAACCCACGTTAGACACGAATTTGTAATCGGTTGTCAGTGTGCGCGCGTCTATTTGGATCCTCTGTGTATGTGTGTATTTGGGATCCTTTCTTCAGCAGGTGCAAGGGGACCCTTTTCTTTTGCTTTCTTTTTTTGTGATTATTCTGATTCCTACTCATGAAATTCTCTGCTCCTAAATCTTTTGGCTTGGGATGTGTTTTTGTATATATGAGTATGACCGCGTGCTATTCTGGAAAAAATGTTTGCATTGTGTTCAAAACGTTGGTTCTGGTGTAAAAGATGTCTAGTCCTCTGGTTGCCTCTATT
63
Protein sequence: >Eucgr.K01294.1.p [137 residues] MGQCYPKNQMHGDDSDEHVEFAGGNVHIVTTKESWDQKLSEANKDGKIVLANFSATWCGPCKMMAPFYSELSEKHSSILFLVVDVDELTEMSTSWDIKATPTFFFLRDGQQIDKLVGANKPELQKKITAILDS
21. Eucgr.L01943.1 Genomic Sequence >scaffold_464:25131..26597 [1467 nucleotides] TGCATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGTAACGCCCAGGTCTTGTCTCGGAGTAATATGTGCAGGAGGACTTGAGTTTTAGCTCGTTACATTTGGATGGAATCCATTTTCGGCAGTTGGGAACCTATAGTTTAGACTTGGGATGTCATTGAGATCATTAGGTTTTTATACTCTTTTCTTCTTGTACATAAGCTTGTGACATAGTATATGTTGTGAACTGTTGTATATGAAATTTTTTCTTTTCGTGTCTAGCAAGATTAGAATATGTTTGCTTTTGCTTAGGGATGGGATTATGATTTTCATTAAAGCAACAAGCGATTTCCTCGACCACTTTGAAAGTTTTATTCCCGTTTGACGACTCCGTACTTTCTGCTGCATCTTGAATCTGCTTTGTTGGTGCTTCTCCTGAATGTTTGCTTTAGCATTAAAACTGCTACACAGTGGAAAACTTGGGAGTTCAGTCTTGATCTTTGGTGGAGCCGTTTCGAATTCTTTGGAAAGCAAGTGAAACTTCCAAAGTAGGACGCATAGTCGCTGAAATTTCTCAGCAGGCGCGATTATCTTTTCCCATTTGTGAGTTAGAATGTCTGTTGTTTTGGATGGTCTCGTGGCACTGAAAGTAACTTAGGCTGTTGATACTGGCACTCTAAGCTTTATAAGTTTGCATTCCAGCATCGATGTCTCTTTTGATATGTAGTTGGGGGGAGAAGAATATATGAAGTATTTTTGTGTTGCAAAGCTTGTCGTCTTGATCTTCCATCGAAGAGCAGAGGAGGCTTATTAGTCATGATTAGTCTGGCTAACCAATATGTTTATGCCAAGCCTTGCCTATGAGAAAACATCGTTCTTAAGGTTTGCTTTTCGTAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAGTAACGGCTTCTTGCCCCCCGACGGGGACGTCACTGTACATTTCGGTCTTCCTAAGATTTGTGGTCTGAGTCTGCCATGGTGTCGGCATTTGCGAGCATGTTGTTTGTGAATTTGTCTTGTGGTATATCGATCCGGTAAGTGTCAAATGTCTTAATGGTGGTTTACCACAAGTATTCATACCTTGGTCTTTGGAGTTTCATCGACAGCATTCATCCTGTGCACATCTCTGTTCTTTGCTGTTCGAGTTTTTAGACCATCTTGTCTAAGATAAATTGTTGACATTGAAGTGTTTCGTCCATTGTTAATTCGCGTCAACATGACAGAACAGGGTATATACTTGAATTCTGTATACGGTACAATCACTAGAAATTTGAACTGA
CDS sequence: >Eucgr.L01943.1 [246 nucleotides] ATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAG
Transcript sequence: >Eucgr.L01943.1 [628 nucleotides] TGCATGCCTTCGGTGGCCATGAACCCGTTCGTGAGGGAGCTGGCCTCGGCGAACCCGGATGTTCTGTTTCTCACGGTTGATGTTGACGATGTTAAGGAGGTAGCGACTAGAATGGAGGTGAAAGCCATGCCAACGTTTCTACTGCTGAAGGACAAAACTCCGGTCGACAAGCTGGTGGGTGCGAATCCTGAAGAGATCAGGAAAAGGATAGATGGTTTCGTGCAGTCCTTCCGCACCAGCGTTGCCTAGTAACGGCTTCTTGCCCCCCGACGGGGACGTCACTGTACATTTCGGTCTTCCTAAGATTTGTGGTCTGAGTCTGCCATGGTGTCGGCATTTGCGAGCATGTTGTTTGTGAATTTGTCTTGTGGTATATCGATCCGGTAAGTGTCAAATGTCTTAATGGTGGTTTACCACAAGTATTCATACCTTGGTCTTTGGAGTTTCATCGACAGCATTCATCCTGTGCACATCTCTGTTCTTTGCTGTTCGAGTTTTTAGACCATCTTGTCTAAGATAAATTGTTGACATTGAAGTGTTTCGTCCATTGTTAATTCGCGTCAACATGACAGAACAGGGTATATACTTGAATTCTGTATACGGTACAATCACTAGAAATTTGAACTGA
Protein sequence: >Eucgr.L01943.1.p [81 residues] MPSVAMNPFVRELASANPDVLFLTVDVDDVKEVATRMEVKAMPTFLLLKDKTPVDKLVGANPEEIRKRIDGFVQSFRTSVA
22. Eucgr.L03049.1 Genomic Sequence >scaffold_1873:600..1564 [965 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGGTTCGTTTTTTTTTTGATACAGTCCTCTCTTGTTAGAGGAAATAGAAATTGTGGTGTACCAATATGAATATATATTATCGTATAATTGCATCCCCTTGCTAATCTACATCATTAATGAGATTATCATAGGTTTTGAGGAAATGAAAACTCTTAGAACTTTAGGGCAATCGTCGCCAACAAACTCATTCATAACCAACAATCACTAAAGCAGAACTTGTTAAATGCTTTAGCTTGAGCTTGGCATAAGCACATTGCAAATCTCTATAGTGCTGCAGTATAGGTAAAACTTCTCTGGAAAGCTCTTCATGGGCACATTCTGAAAATGGAAAAAATTGCGACCATAACTGGGGATCTGTCATATTCTGATGCAACCATACTTTGGGATCTCTTATATATTGTTCGTGTGCCAAGTATATGCACAAGTTTGCTGTAGAAAACGAGAAATCCTGGTTTTCTAAAGCAAATTTCAAAAGGTTAAGGCCATATCTTGCTTTCTGGGTCTGCATTTTGTTATGGATTAGAGGAACTGAGATGGTCACGACTCTAAAATTGGAAGAGTGATTCAGAAAGAGATATGTTTGAGCATTAACAGTTATTTCTTATTTTTGATGTAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA
CDS sequence: >Eucgr.L03049.1 [351 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA
64
Transcript sequence: >Eucgr.L03049.1 [351 nucleotides] ATGAATGACGTGATGCCAAAGAAATTGCACAAGAAAGTGGCTGGTGTGACTGATGCGACATGGCAATCACTCGTTTTGGAGTCTGAATCTCCAGTACTGGTTGAGTTTTGGGCTCCATGGTGTGGTCCATGCCGAATGATCCACCCTGTCATTGATGAATTGGCAAAGCAGTATGCAGGGAAATTGAAGTGCTACAAAGTGAACACTGATGAGAGCCCTTCAGTTGCCACTCGATACGGCATCAGAAGCATACCGACTGTCATGATATTTAAGAGTGGTGAGAAGAAAGATGCTGTTATTGGTGCTGTTCCCAAGTCCACATTGACCACTAGCATTGAGAAATTCTTGTGA
Protein sequence: >Eucgr.L03049.1.p [116 residues] MNDVMPKKLHKKVAGVTDATWQSLVLESESPVLVEFWAPWCGPCRMIHPVIDELAKQYAGKLKCYKVNTDESPSVATRYGIRSIPTVMIFKSGEKKDAVIGAVPKSTLTTSIEKFL
65
ANEXO 3
Dados brutos de expressão genica
__________________________________________________________________________
Tabela 1: Expressão tecido específica da Eucgr A00783.1, Tiorredoxina H9.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 6.371
Amostra de tecido Folha madura 3.739
Amostra de tecido Floema 7.079
Amostra de tecido Shoot Tips 2.728
Amostra de tecido Xilema 0.863 Baixa Baixa
Amostra de tecido Folha jovens 4.641
Tabela 2: Expressão tecido específica da Eucgr A01813.1, Tiorredoxina M2.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 18.058
Amostra de tecido Folha madura 26.237
Amostra de tecido Floema 20.746
Amostra de tecido Shoot Tips 35.095 Alta
Amostra de tecido Xilema 13.384 Baixa
Amostra de tecido Folha jovens 55.375 Alta Alta
Tabela 3: Expressão tecido específica da Eucgr B01424.1, Tiorredoxina F.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 1.835
Amostra de tecido Folha madura 0 Sem expressão Sem expressão
Amostra de tecido Floema 3.699
Amostra de tecido Shoot Tips 0.106 Baixa
Amostra de tecido Xilema 0.039 Baixa Baixa
Amostra de tecido Folha jovens 3.879
Tabela 4: Expressão tecido específica da B02586.1, Tiorredoxina H7.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 0 Sem expressão Sem expressão
Amostra de tecido Folha madura 32.259
Amostra de tecido Floema 0 Sem expressão Sem expressão
Amostra de tecido Shoot Tips 3.666 Baixa
Amostra de tecido Xilema 0 Sem expressão Sem expressão
Amostra de tecido Folha jovens 11.675
Tabela 5: Expressão tecido específica da Eucgr D00028.1, Tiorredoxina O1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 0.254 Baixa Baixa
Amostra de tecido Folha madura 3.849
Amostra de tecido Floema 16.915 Alta
Amostra de tecido Shoot Tips 1.835
Amostra de tecido Xilema 0 Sem expressão Sem expressão
Amostra de tecido Folha jovens 0.506 Baixa
66
Tabela 6: Expressão tecido específica da Eucgr D00853.1 Tiorredoxina CXXS1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 77.941
Alta
Amostra de tecido Folha madura 39.105
Alta
Amostra de tecido Floema 56.85
Alta
Amostra de tecido Shoot Tips 9.543
Amostra de tecido Xilema 123.363 Alta
Alta
Amostra de tecido Folha jovens 4.736 Baixa
Tabela 7: Expressão tecido específica da Eucgr. F01604.1, Tiorredoxina H2.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 28.017 Baixa Alta
Amostra de tecido Folha madura 408.017 Alta
Amostra de tecido Floema 478.688 Alta
Amostra de tecido Shoot Tips 606.3 Alta
Amostra de tecido Xilema 97.793 Baixa Alta
Amostra de tecido Folha jovens 690.95 Alta Alta
Tabela 8: Expressão tecido específica da Eucgr F01854.1, Tiorredoxina H1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 17.576
Amostra de tecido Folha madura 380.307 Alta
Amostra de tecido Floema 44.458 Alta
Amostra de tecido Shoot Tips 398.041 Alta
Amostra de tecido Xilema 8.12 Baixa
Amostra de tecido Folha jovens 370.373 Alta
Tabela 9: Expressão tecido específica da Eucgr F02754.1, Tiorredoxina M2.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 0.475
Amostra de tecido Folha madura 75.657 Alta Alta
Amostra de tecido Floema 0 Sem expressão Sem expressão
Amostra de tecido Shoot Tips 1.21
Amostra de tecido Xilema 0 Sem expressão Sem expressão
Amostra de tecido Folha jovens 8.316
Tabela 10:Expressão tecido específica da Eucgr F03319.1.1, Tiorredoxina M4.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 2.316 Baixa
Amostra de tecido Folha madura 129.314 Alta Alta
Amostra de tecido Floema 3.562
Amostra de tecido Shoot Tips 18.799
Amostra de tecido Xilema 6.313
Amostra de tecido Folha jovens 38.203 Alta
67
Tabela 11: Expressão tecido específica da Eucgr F04223.1, Tiorredoxina y1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 95.319 Alta Alta
Amostra de tecido Folha madura 35.39 Alta
Amostra de tecido Floema 53.448 Alta
Amostra de tecido Shoot Tips 15.812 Baixa
Amostra de tecido Xilema 74.524 Alta
Amostra de tecido Folha jovens 24.072
Tabela 12: Expressão tecido específica da Eucgr F04229.1, Tiorredoxina Y1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 73.044 Alta
Amostra de tecido Folha madura 110.752 Alta Alta
Amostra de tecido Floema 53.854 Alta
Amostra de tecido Shoot Tips 31.742 Baixa Alta
Amostra de tecido Xilema 63.979 Alta
Amostra de tecido Folha jovens 35.01 Baixa Alta
Tabela 13: Expressão tecido específica da Eucgr G03224.1 Tiorredoxina.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 0.824 Baixa
Amostra de tecido Folha madura 21.34 Alta
Amostra de tecido Floema 3.061
Amostra de tecido Shoot Tips 6.165
Amostra de tecido Xilema 0.824 Baixa
Amostra de tecido Folha jovens 21.34 Alta
Tabela 14: Expressão tecido específica da Eucgr H01629.1,tiorredoxina F1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 0.306 Baixa Baixa
Amostra de tecido Folha madura 44.367 Alta
Amostra de tecido Floema 0 Sem expressão Sem expressão
Amostra de tecido Shoot Tips 17.98
Amostra de tecido Xilema 0 Sem expressão Sem expressão
Amostra de tecido Folha jovens 28.611 Alta
Tabela 15: Expressão tecido específica daEucgr I01912.1,tiorredoxinaH2.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 60.104 Alta
Amostra de tecido Folha madura 7.778 Baixa
Amostra de tecido Floema 69.167 Alta
Amostra de tecido Shoot Tips 19.636
Amostra de tecido Xilema 89.051 Alta Alta
Amostra de tecido Folha jovens 8.634 Baixa
68
Tabela 16: Expressão tecido específica da Eucgr I01913.1, tiorredoxina H2.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 131.186 Alta
Amostra de tecido Folha madura 49.491 Baixa Alta
Amostra de tecido Floema 163.183 Alta Alta
Amostra de tecido Shoot Tips 79.59 Alta
Amostra de tecido Xilema 102.859 Alta
Amostra de tecido Folha jovens 92.021 Alta
Tabela 17: Expressão tecido específica da Eucgr I02383.1, tiorredoxina H.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 303.313 Alta Alta
Amostra de tecido Folha madura 18.047 Baixa
Amostra de tecido Floema 227.448 Alta
Amostra de tecido Shoot Tips 20.899
Amostra de tecido Xilema 149.285 Alta
Amostra de tecido Folha jovens 29.876 Alta
Tabela 18: Expressão tecido específica da Eucgr J00880.1 tiorredoxina X.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 2.172
Amostra de tecido Folha madura 13.204 Alta
Amostra de tecido Floema 4.593
Amostra de tecido Shoot Tips 2.855
Amostra de tecido Xilema 3.24 Baixa
Amostra de tecido Folha jovens 1.074 Baixa
Tabela 19: Expressão tecido específica da Eucgr J02387.1 tiorredoxina H1.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 2.316
Amostra de tecido Folha madura 129.314 Alta
Amostra de tecido Floema 3.562
Amostra de tecido Shoot Tips 18.799
Amostra de tecido Xilema 6.313 Baixa
Amostra de tecido Folha jovens 38.203 Baixa
Tabela 20: Expressão tecido específica da Eucgr K01294.1 tiorredoxina H9.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 95.319 Alta Alta
Amostra de tecido Folha madura 35.39 Alta
Amostra de tecido Floema 53.448 Alta
Amostra de tecido Shoot Tips 15.812 Baixa
Amostra de tecido Xilema 74.524 Alta
Amostra de tecido Folha jovens 24.072
69
Tabela 21: Expressão tecido específica da Eucgr L01943.1 Tiorredoxina.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 103.114
Alta
Amostra de tecido Folha madura 45.042
Alta
Amostra de tecido Floema 117.959
Alta
Amostra de tecido Shoot Tips 15.906 Baixa
Amostra de tecido Xilema 140.246 Alta Alta
Amostra de tecido Folha jovens 18.517 Baixa
Tabela 22: Expressão tecido específica da Eucgr L03049.1 Tiorredoxina.
GRUPO EXPERIMENTAL TECIDO FPKM LOCUS DE BIBLIOTECA DE
Amostra de tecido Xilema imaturo 4.919
Amostra de tecido Folha madura 232.727 Alta Alta
Amostra de tecido Floema 1.849 Baixa
Amostra de tecido Shoot Tips 37.528
Alta
Amostra de tecido Xilema 2.442
Amostra de tecido Folha jovens 82.177
Alta