Universidade Estadual de Campinas - UNICAMP
Instituto de Química
BRUNA KAUELY DE CAMPOS
Estudo comparativo entre gerações de soja
transgênica e não-transgênica utilizando uma
abordagem proteômica e metabolômica
Campinas
2017
BRUNA KAUELY DE CAMPOS
Estudo comparativo entre gerações de soja
transgênica e não-transgênica utilizando uma
abordagem proteômica e metabolômica
Tese de doutorado apresentada ao Instituto de Química da Universidade
Estadual de Campinas como parte dos requisitos exigidos para a obtenção
do Título de Doutora em Ciências
Orientador: Prof. Dr. Marco Aurélio Zezzi Arruda
ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA TESE DEFENDIDA PELA ALUNA BRUNA KAUELY DE CAMPOS E ORIENTADA PELO PROF. DR. MARCO AURÉLIO ZEZZI ARRUDA
Campinas
2017
Agência(s) de fomento e nº(s) de processo(s): FAPESP, 2013/17514-7; FAPESP,
02015/24668-6
Ficha catalográfica
Universidade Estadual de Campinas
Biblioteca do Instituto de Química
Camila Barleta Fullin - CRB 8462
Campos, Bruna Kauely de, 1989-
C157e Estudo comparativo entre gerações de soja transgênica e não-transgênica
utilizando uma abordagem proteômica e metabolômica / Bruna Kauely de
Campos. – Campinas, SP : [s.n.], 2017.
Orientador: Marco Aurélio Zezzi Arruda.
Tese (doutorado) – Universidade Estadual de Campinas, Instituto de
Química.
1. Transgênico. 2. Proteômica. 3. Metabolômica. 4. Soja. I. Arruda, Marco
Aurélio Zezzi, 1965-. II. Universidade Estadual de Campinas. Instituto de
Química. III. Título.
Informações para Biblioteca Digital
Título em outro idioma: Comparative study between generations of transgenic and non-
transgenic soybeans seeds using a proteomic and metabolomic approach
Palavras-chave em inglês:
Transgenic
Proteomics
Metabolomics
Soybean
Área de concentração: Química Analítica
Titulação: Doutora em Ciências
Banca examinadora:
Marco Aurélio Zezzi Arruda [Orientador]
Ana Rita de Araújo Nogueira
Aline Klassen
Anne Hélène Fostier
Alessandra Sussulini
Data de defesa: 23-11-2017
Programa de Pós-Graduação: Química
BANCA EXAMINADORA
Prof. Dr. Marco Aurélio Zezzi Arruda (Orientador)
Profa. Dra. Ana Rita de Araújo Nogueira (EMBRAPA/São Carlos-SP)
Profa. Dra. Aline Klassen (UNIFESP-Diadema)
Profa. Dra. Alessandra Sussulini (IQ- UNICAMP)
Profa. Dra. Anne Hélène Fostier (IQ- UNICAMP)
A Ata da defesa com as respectivas assinaturas dos membros encontra-se no
processo de vida acadêmica do(a) aluno(a).
Este exemplar corresponde à redação final da Tese de
Doutorado defendida pela aluna BRUNA KAUELY DE
CAMPOS, aprovada pela Comissão Julgadora em 23 de
novembro de 2017.
Dedico essa tese a minha mãe Elke Patricia,
a ela o meu amor e gratidão por nunca
medir esforços para garantir minha formação
e me apoiar em minhas escolhas.
“Não é sobre chegar no topo do mundo e saber que venceu
É sobre escalar e sentir que o caminho te fortaleceu”
Ana Vilela
Agradecimentos
Agradeço a Deus por toda sua bondade em me fazer chegar até aqui.
À minha mãe, Elke Patricia, pelo apoio incondicional, por ela ser minha
inspiração diária para querer sempre mais, pelo seu exemplo de coragem e
perseverança, a ela todo o meu amor e gratidão.
À minha avó Mirna que na hora do choro estava sempre presente segurando
minha mão, fazendo minhas comidas congeladas, a esse amor dedicado, a
minha gratidão.
Ao Osmar, meu papito, que cuida da minha mãe, do meu irmão Daniel e da
minha doce irmã Maria Eduarda, obrigada.
À toda família Campos, que muitas e inúmeras vezes fizeram a vez do meu pai,
que torcem por mim e se sentem orgulhosos da minha caminhada. A mãe de
todos, nosso exemplo Vó Maria, obrigada por sempre ter um café e um chimarrão
quentinho para me receber, esse amor transborda e nos faz seguir mais forte!
Tio Everaldo obrigada por ser o mais lindo da família, tia Lô obrigada por ser o
meu pai quando eu não o tive, tia Quel sua pedagogia me inspira, obrigada! Tio
Chico, sua Pitty agradece! Tio Juca, você foi na minha formatura do colegial,
obrigada! Tio Laurici, que eu leve a vida com a sua sabedoria. Tio Leo, tenho
certeza que suas orações me ajudaram muito, obrigada! Meu pai Neoraldo,
sempre há tempo para mudar, obrigada por tentar! Aos meus primos amados
companheiros de infância e aqueles que já são da nova geração, obrigada!
Ao grupinho da moda, Dra. Barbara, quase Dra. Daniele, Dr. João Benhur, Dr.
Silvano, vocês que eu conheci na faculdade, até aqui são 10 anos juntos, na
alegria e na tristeza, na saúde e na doença, obrigada! Agradeço em especial
meu amoy João, nosso Skype, nossa cumplicidade, nossa parceria, não há nada
igual, você me ajudou com os resultados desse trabalho, com interpretações e
ensinamentos, que sua vida seja longa para que eu possa desfrutar ao seu lado
tudo que há de melhor. Obrigada!
Ao GEPAM – agradeço cada sotaque, cada cultura, cada pessoa que por lá
passou. Vocês me fizeram crescer como profissional e ser humano. Aos amigos
queridos e especiais Ciço (Cícero), Rodrigo, Hemissone (Jemmyson), Gustavo,
Katika (Ketherine), Sra. Josi (Josiane), Alejandra, Lara (Larissa), vocês são
demais, espero revê-los um dia. Meu amigo Alisson, que alegria ter conhecido
um ser humano tão incrível como você, quebrando barreiras de preconceito você
“mata a cobra e mostra o pau”, obrigada por tudo!! Ivanilce (nesse momento ela
estava achando que eu não iria falar dela), você tem um lugar especial nesse
agradecimento, minha amiga que chorou junto comigo, que dividiu angustias,
que sempre me recebia com um “bom dia pra quem?”, à você o meu
agradecimento por tudo. Ao Prof. Dr. Zezzi, que me recebeu como uma estranha,
acreditou e apoiou os meus desejos e sonhos, obrigada. Certamente lembrarei
desse grupo com muito carinho.
Ao Artur Zardin Graeff, meu gruds, parceiro e amigo, que bom ter você com a
calmaria que eu precisava, que bom que você me fez sorrir e mudou a minha
vida, que bom fazer planos com você, obrigada!
Ao laboratório ThoMSon da UNICAMP e ao Dr. Tiago Santana Balbuena e Msc.
Bruna Santos da UNESP-Jaboticabal pela ajuda com os experimentos de
espectrometria de massas.
À Hexis Cientifica (Danaher Corporation), em especial a Patricia Rodrigues, pela
confiança em mim depositada para assumir o cargo de especialista de produtos
e assim poder repassar os conhecimentos acadêmicos a uma empresa e vice-
versa.
À fundação de amparo a pesquisa do estado de São Paulo (FAPESP) pelo apoio
financeiro concedido nos processos - regular 2013/17514-7 e BEPE 2015/24668-
6.
Por fim, agradeço a Bel da CPG que me socorreu inúmeras vezes, a todos os
mestres que até aqui me guiaram e a UNICAMP pela infraestrutura.
RESUMO
Este trabalho baseou-se no estudo comparativo entre sementes de soja
transgênica (T) e não-transgênica (NT) no que diz respeito a suas proteínas e
metabólitos em diferentes gerações da planta, pois acredita-se que o gene
inserido possa alterar seu perfil em nível molecular, uma vez que seu genoma
foi alterado. Para tal avaliação, foi necessário o plantio das sementes de soja em
casa de vegetação sob as mesmas condições até a obtenção da terceira
geração. Além disso, foram realizadas diversas extrações das proteínas das
sementes de soja para posterior separação por eletroforese em gel. Os géis de
eletroforese obtidos mostram um perfil bastante semelhante, mostrando que a
separação foi adequada, e que existem proteínas diferentes e também
diferenciais entre as mesmas. A quantificação relativa das proteínas foi realizada
por meio da técnica de 2-D DIGE, revelando um total de 89 proteínas diferenciais
com critério de seleção que partiu de p<0,1 e fator de regulação maior que 2,0
entre os grupos estudados. Um menor número de proteínas diferenciais foi
observado nos grupos de sementes T. Após identificação por espectrometria de
massas, 29,2% das proteínas corresponderam a classe de armazenamento.
Com relação aos metabólitos, os resultados indicaram que o solvente composto
por metanol/água (70/30% v/v) foi considerado o mais adequado para a extração
dos mesmos. Com isso, as duas gerações de sementes tiveram sua análise
realizada por LC-MS com analisador QTOF. Os dados obtidos foram avaliados
por uma análise estatística para melhor compreensão dos resultados. Os
resultados mostraram uma diferença estatística significativa entre os perfis T e
NT e também entre suas gerações. Esses resultados indicam, que as sementes
de soja T e NT estão sofrendo uma alteração em seu proteoma e metaboloma.
A soja T se mostrou mais robusta, mas não é possível afirmar se é devido a
transgenia. O fato das menores diferenças terem sido observadas entre os
grupos transgênicos, com um menor número de proteínas diferenciais e menores
variações estatísticas com relação aos metabólitos, nos levam a concluir que a
soja transgênica se adapta melhor as mudanças que estão ocorrendo em seu
metabolismo, sejam elas causadas por fatores biológicos, químicos ou físicos.
ABSTRACT
This work was based on the comparative study between transgenic (T) and non-
transgenic (NT) soybean seeds with respect to their proteins and metabolites in
different generations of the plant, since it is believed that the inserted gene can
change its profile at the molecular level, once their genome was altered. For this
evaluation, it was necessary to plant the soybean seeds in a greenhouse under
the same conditions until obtaining the third generation. In addition, several
extractions of the proteins of the soybean seeds were carried out for subsequent
separation by electrophoresis. The obtained electrophoresis gels show a very
similar profile, showing that the separation was adequate, and that there are
different proteins and also differentials between them. The relative quantification
of the proteins was performed using the 2-D DIGE technique, revealing a total of
89 differential proteins with a selection criterion starting from p<0.1 and a
regulation factor greater than 2.0 between the groups studied. A lower number of
differential proteins was observed in the T seed groups. After identification by
mass spectrometry, 29.2% of the proteins corresponded to the storage class.
Regarding the metabolites, the results indicated that the solvent composed of
methanol/water (30/70% v/v) was considered the most adequate. Thus, the two
seed generations were analyzed by LC-MS with QTOF analyser. The obtained
data were evaluated by a statistical analysis to better understand the results. The
results showed a difference between the T and NT profiles and also between their
generations. These results indicate that soybean seeds T and NT are undergoing
a change in their proteome and metabolome. The T soybean was more robust,
but it is not possible to say if it is due to transgenic. The fact that the smaller
differences were observed between the transgenic groups, with a lower number
of differential proteins and lower statistical variations with respect to the
metabolites, lead us to conclude that transgenic soya is better adapted to the
changes that are occurring in its metabolism, whether they are caused by
biological, chemical or physical factors.
Lista de abreviação
USDA United States Department of Agriculture
2-D DIGE Two-Dimensional Differential Gel Electrophoreisis
2-D PAGE Two-Dimensional Poliacrylamide Gel Electrophoresis
AmBic Ammonium Bicarbonate
CIBio Comissão Interna de Biosegurança
CTNBio Comissão Nacional de Biosegurança
Da Daltons
DIA Differential in-gel analysis
ESI Electrospray Ionization
GMO Genetically Modified Organism
HPLC High Pressure Liquid Chromatography
iCAP Isotope Coded Affinity Tags
ICR Ion Ciclotron Ressonance
IEF Isoeletric Focusing
IPG Immobilized pH Gradient
iTRAQ Isobaric Tags for Relative and Absolute Quantification
LC-SRM Liquid Chromatography Selected Reaction Monitoring
m/z Massa/Carga
MALDI Matrix Assisted Laser Dessorption/Ionization
MS Mass Spectrometry
MS-Imaging Mass Spectrometry imaging
NT Não-Transgênica
PFF Peptide Fragmentation Fingerprint
PHG Programa Genoma Humano
pI Ponto Isoelétrico
PMF Peptide Mass Fingerprint
PSMs Peptide Spectrum Match
SILAC Stable Isotope Labeling by Amino Acids in Cell Culture
T Transgênica
TOF Time of Flight
Sumário
INTRODUÇÃO GERAL 14
Capítulo 1-
Análise proteômica de duas gerações de soja transgênica e não-
transgênica
17
1.1 INTRODUÇÃO 18
1.2 OBJETIVOS 23
1.3 MATERIAIS E MÉTODOS 24
1.3.1 Reagentes e equipamentos 24
1.3.2 Cultivo das sementes de soja 25
1.3.2.1 Aspectos Éticos 26
1.3.3 Extração e separação das proteínas de Soja 26
1.3.4 Quantificação relativa das proteínas de soja por 2D-DIGE 27
1.3.5 Digestão com tripsina in gel das proteínas 29
1.3.6 Identificação das proteínas 30
1.4 RESULTADOS E DISCUSSÃO 31
1.4.1 Plantio e Cultivo da soja 31
1.4.2 Separação das proteínas 34
1.4.3 Quantificação relativa das proteínas diferenciais por 2-D
DIGE
37
1.4.4 Identificação das proteínas diferenciais por espectrometria
de massas
40
1.4.5 Conclusão Parcial 54
Capítulo 2-
Análise metabolômica de duas gerações de soja transgênica e
não-transgênica
56
2.1 INTRODUÇÃO 57
2.2 OBJETIVOS 61
2.3 MATERIAIS E MÉTODOS 61
2.3.1 Reagentes e equipamentos 61
2.3.2 Extração e análise de metabólitos 61
2.3.3 Pré-processamento de dados e análise multivariada 62
2.4 RESULTADOS E DISCUSSÃO 63
2.4.1 Plantio e cultivo da soja 63
2.4.2 Análise de metabólitos 63
2.4.3 Conclusão Parcial 79
3. CONCLUSÃO FINAL 81
4. REFERÊNCIAS 82
ANEXO 88
14
INTRODUÇÃO GERAL
A soja é uma semente que pertence à família das leguminosas
(Fabaceae), sendo considerada uma importante fonte de proteínas, pois, em
suas sementes, aproximadamente 40 % de sua massa seca corresponde a
proteínas e 20 % a óleo, o que torna a soja um produto aplicado nos mais
diversos setores industriais como alimentos para humanos e animais, e ainda,
como fonte alternativa de combustível (Arruda et al., 2015; Embrapa, 2014; Kim
et al., 2009; Komatsu e Ahsan, 2009; Sussulini et al., 2007). Nos últimos anos, o
cultivo de soja cresceu significativamente em muitos países. O departamento de
agricultura dos Estados Unidos da América (USDA, do inglês – United States
Department of Agriculture) divulgou a estimativa de produção esperada para a
safra de 2017/2018 em 351 milhões de toneladas. O Brasil contribuiu com uma
produção de 113 milhões na safra de 2016/2017 e se destaca por ser o segundo
maior produtor mundial de soja (CONAB, 2017), no entanto, é líder mundial em
exportação desse grão, sendo cerca de 43% de sua produção.
Devido à reconhecida importância da soja, muitos institutos de pesquisas
e empresas buscam aperfeiçoar a qualidade nutricional da planta e, ainda,
aumentar o controle contra pragas de uma maneira eficiente e barata. Nesse
sentido, na década de 80, foram realizados estudos iniciais baseados em
modificação genética nas sementes de soja pela empresa americana
Monsanto®, a qual patenteou esta tecnologia ao desenvolver a soja transgênica.
Denominada Roundup Ready® (RR) por ser resistente ao herbicida Roundup®
- um dos herbicidas mais empregados em todo o mundo (Barbosa, 2011;
Monsanto, 2013).
A soja sofreu uma modificação genética, e por isso é chamada de
transgênica, a qual foi realizada por meio da inserção do gene cp4EPSPS
proveniente da bactéria Agrobacterium do tipo cp4. Esta modificação confere a
esta variedade resistência ao herbicida que tem glifosato como princípio ativo
(Funke et al., 2006). O glifosato inibe os processos bioquímicos (formação de
compostos aromáticos) da planta nas quais a enzima EPSPS, que é produzida
pelas plantas de soja não-transgênicas, participa. O gene cp4EPSPS inserido na
soja é funcionalmente similar a enzima EPSPS, presente na soja não-
15
transgênica, no entanto, possui uma baixa afinidade pelo glifosato. Esse
processo está resumido na Figura 1 (Barbosa, 2011; Kim et al., Funke et al.,
2006).
Figura 1. (A) Síntese de compostos aromáticos na soja na presença da enzima
endógena da planta EPSPS (B) na presença da enzima exógena da planta cp4EPSPS.
Entretanto, o plantio e o consumo de alimentos geneticamente
modificados enfrentam numerosas críticas de consumidores e organizações
ecológicas que lideram alguns países e regulam sua produção, comércio e o
crescimento de GMO (do inglês - genetically modified organism) (Léon et al.,
2009). No Brasil, o plantio da soja RR foi aprovado pela comissão técnica
nacional de biossegurança (CTNBio) em 1998, após protestos e críticas com
relação a este organismo geneticamente modificado. Isso devido às inúmeras
controvérsias em relação aos riscos e benefícios que a soja transgênica poderia
causar na alimentação humana e animal (Kléba, 1998).
COO-
OH
-2O3PO OH
+-2O3PO COO-
Enzima Epsps
COO-
OH
-2O3PO O COO-
+ Pi
Inibição
HN PO3
2--OOC
glifosfato
shikimato-3-fosfato fosfoenolpiruvato 5-enolpiruvil shikimato-3-fosfato
X
COO-
OH
-2O3PO OH
+-2O3PO COO-
Enzima Epsps
COO-
OH
-2O3PO O COO-
+ Pi
Inibição
HN PO3
2--OOC
glifosfato
shikimato-3-fosfato fosfoenolpiruvato 5-enolpiruvil shikimato-3-fosfato
cp4EPSPS
X
(A)
(B)
16
Nos dias atuais, tal controvérsia ainda não foi esclarecida pela ciência,
contudo, alguns estudos estimam que a composição química de produtos
transgênicos mostrou modificações inesperadas neste tipo de organismo (Léon,
et al., 2009). Dessa forma, acredita-se que essa modificação genética sofrida
pela soja possa contribuir para mudanças nas características químicas e
biológicas da soja denominada transgênica (Arruda et al., 2015; Barbosa, 2011).
Isso corrobora com a necessidade de desenvolvimentos analíticos mais
poderosos, capazes de enfrentar a complexidade deste problema.
Sendo assim, a temática desta tese foi a de avaliar, de forma comparativa
e em nível molecular, se existem diferenças entre a soja transgênica e não-
transgênica cultivadas por duas gerações. No capítulo 1, uma abordagem
proteômica foi utilizada por meio das técnicas de eletroforese em gel de
poliacrilamida para separação das proteínas e espectrometria de massas para a
identificação das mesmas. Os resultados do estudo levaram a uma avaliação
metabolômica, que foi realizada por meio das técnicas de cromatografia líquida
de alta eficiência acoplada à espectrometria de massas, a qual é apresentada
no capítulo 2.
17
Capítulo 1-
Análise proteômica de duas gerações
de soja transgênica e não-transgênica
18
1.1 INTRODUÇÃO
O sequenciamento dos genes humanos, por meio de um grande estudo
realizado por inúmeros pesquisadores oriundos de diferentes países, ficou
conhecido como Projeto Genoma Humano (PGH). Tais estudos tiveram início na
década de 90 e tinham como objetivo elucidar questões que envolviam o
diagnóstico e a cura para inúmeras doenças. No ano de 2001, o artigo intitulado
The Sequence of the Human Genome foi publicado por Venter et al. (2001),
mostrando os resultados obtidos e, ainda, que cerca de 90% do genoma humano
já havia sido sequenciado com 99% de precisão. A partir de então, uma
revolução nas áreas biológicas aconteceu, a chamada “era pós-genômica”.
Contudo, para entender a função de todos os genes em um organismo,
se faz necessário conhecer não só quais genes são expressos, mas também
quais são os produtos dessa expressão e como são sintetizados. Assim, iniciou-
se o desenvolvimento dos estudos “ômicos”, como a transcriptômica,
proteômica, metabolômica, metalômica, dentre outras, com o objetivo de uma
maior e melhor compreensão de todo o RNA, proteínas, metabólitos e íons
metálicos, respectivamente, presentes em determinado organismo (Gomez-
Cabrero et al., 2014; Lay Jr. et al., 2006).
O termo proteoma foi proposto por Wilkins e Willians em 1994 (Wilkins e
Willians, 1994) como sendo todo o conteúdo de proteínas expressas por um
genoma, tecido, célula ou organismo. A comunidade científica percebeu que
após a euforia provocada pelo sequenciamento do genoma humano e outros
organismos, eram necessários outros estudos, pois enquanto o genoma de um
organismo permanece estável, o proteoma por exemplo, é extremamente
variável. Sendo assim, a área cientifica de estudo do proteoma de um organismo
ficou conhecida como proteômica.
A proteômica é uma área em crescente desenvolvimento que examina
todas as proteínas envolvidas em uma célula ou tecido e fornece informações
importantes para complementar os estudos de transcriptômica e metabolômica
(Patel, 2012). A avaliação de proteínas é essencial para compreender os
processos biológicos que ocorrem em organismos sadios, doentes, e/ou
geneticamente modificados. A análise de um proteoma, ou seja, do conjunto de
proteínas que pode ser encontrada em uma célula ou organismo, vem sendo
19
realizada em diferentes áreas do conhecimento e em diferentes matrizes
biológicas. Nas áreas médicas, por exemplo, os pesquisadores buscam
respostas para diferentes doenças e terapias, que vão desde a neurologia
(depressão, esquizofrenia, Alzheimer) até doenças como o câncer (Sussulini,
2011; Zhang et al., 2014). Já a biologia, química, ciências agronômicas, entre
outras, estudam multidisciplinarmente desde o proteoma humano até o animal e
vegetal (Navarrete-Perea et al., 2014).
Dependendo do objetivo geral, a análise proteômica pode ser dividida em
três diferentes áreas:
Proteômica qualitativa - que tem como objetivo caracterizar e
identificar um conjunto de proteínas presentes em uma
determinada amostra. As abordagens mais comuns são peptide
mass fingerprint (PMF) e peptide fragmentation fingerprint (PFF),
ambas as abordagens necessitam de uma digestão enzimática das
proteínas em peptídeos.
Proteômica quantitativa – que tem como objetivo quantificar as
proteínas entre diferentes amostras e/ou tratamentos da amostra
de forma relativa. Isso pode ser feito baseado em gel, marcação
das proteínas e também livre de marcação (label-free). A
proteômica quantitativa é o foco deste trabalho e será discutida
com maiores detalhes na sequência desse capítulo.
Proteômica funcional – que estuda a interação proteína-proteína ou
entre proteínas e outras moléculas de uma determinada amostra.
A tecnologia de MS-imaging (do inglês – Mass Spectrometry imaging) vem
sendo uma ferramenta importante para esse tipo de estudo, pois permite a
observação da localização de proteínas até de suas isoformas (Ortea, et al.,
2006). Entretanto, mesmo nos dias atuais, a análise proteômica é considerada
um desafio analítico, uma vez que são necessárias basicamente etapas de
extração, separação e identificação das proteínas.
O processo de extração das proteínas é crucial para um bom resultado,
uma vez que quanto maior o número de proteínas puder ser extraído, com
reprodutibilidade adequada e confiança, maiores são as chances de avaliar o
proteoma total do organismo em estudo. Devido à complexidade de amostras
vegetais, como a soja, protocolos de extração já estão muito bem definidos e
20
consistem basicamente em ruptura celular por meio de maceração, ultrassom,
radiação micro-onda, ou ainda, procedimentos que aumentem a solubilidade das
proteínas com uso de detergentes. As próximas etapas contemplam a
preservação das proteínas com consequente depleção de interferentes para
isso, meios caotrópicos como uréia e tiouréia são utilizados, os quais
proporcionam a ruptura das ligações proteicas e aumentam a interação com o
meio extrator. A adição de inibidores de protease (fluoreto de fenilmetilsulfonila
(PMSF) e o ácido etilenodiaminotetracético (EDTA)) é necessária ao protocolo
de extração, pois minimiza a degradação das proteínas extraídas no decorrer
das etapas do preparo de amostra. Essa etapa de preservação é essencial, pois
tecidos vegetais apresentam elevado conteúdo de protease (Rabilloud & Lelong,
2011).
Como mencionado, a proteômica quantitativa foi foco deste trabalho e
várias abordagens analíticas para tal podem ser utilizadas, dentre elas, as
técnicas mais empregadas são baseadas na separação por eletroforese em gel
(utilizada neste trabalho) (Barbosa et al., 2012; Clement et al., 2013; Collier et
al., 2012; Valdez et al., 2013), eletroforese capilar (Simó et al., 2010) e
cromatografia (Mataveli et al., 2012) e a identificação por espectrometria de
massas (utilizada neste trabalho) (Clement et al., 2013; Collier et al., 2012;
Déglon et al., 2012). A proteômica tem ido além da identificação de proteínas e
leva em conta a precisão e a confiabilidade em quantificar as diferenças na
abundância de proteínas em um organismo. Para isso muitos métodos de análise
vêm sendo utilizados a partir de diferentes técnicas.
Dentre as técnicas de separação, a eletroforese é uma das mais
empregadas para a separação de proteínas (Arruda et al., 2013; Rodrigues et
al., 2012; Xu et al., 2008). A eletroforese 2 D em gel de poliacrilamida (2-D PAGE
- do inglês two-dimensional polyacrylamide gel electrophoresis) foi desenvolvida
em 1975 por O’Farrel (O’Farrel, 1975). A separação é realizada em duas etapas,
as quais se baseiam em propriedades distintas das proteínas. Na primeira etapa,
a focalização isoelétrica (IEF, do inglês - isoelectric focusing) é empregada para
separar as proteínas de acordo seu ponto isoelétrico (pI), sendo este o pH no
qual a molécula apresenta carga líquida igual a zero. A separação de acordo
com o pI pode ser feita em fita pré-fabricada denominada IPG (immobilized pH
21
gradient). Na segunda etapa, a fita de IEF é inserida no topo do gel de SDS-
PAGE, havendo a separação por massa molecular.
Outro meio de separação, juntamente com a quantificação relativa de
proteínas, é obtido por meio da técnica de 2-D DIGE (do inglês, two-dimensional
difference gel electrophoresis), a qual foi desenvolvida por Unlu et al. (1997).
Nesta técnica, misturas complexas de proteínas provenientes de amostras
distintas são marcadas com corantes fluorescentes, por meio da ligação
covalente entre o corante e as proteínas. Com isso, a técnica de 2-D DIGE
apresenta algumas vantagens em relação à técnica de 2-D PAGE, como, por
exemplo uma maior sensibilidade, que permite a detecção de proteínas pouco
abundantes, a diminuição dos problemas de reprodutibilidade, e ainda, a
redução do número de géis necessários para uma análise, uma vez que duas
amostras distintas são analisadas em um único gel (Arruda et al., 2011).
Em estudos proteômicos, a identificação dessas proteínas previamente
separadas e/ou quantificadas por 2-D DIGE é realizada por espectrometria de
massas (MS – do inglês, mass spectrometry). Na prática, após efetuar a
separação e quantificação relativa dos spots proteicos, realiza-se,
primeiramente, a digestão das proteínas com tripsina, afim de que estas
apresentem massas moleculares dentro da faixa de relação m/z (massa/carga)
detectável pelo espectrômetro de massas. O tratamento dos dados gerados é
realizado por meio de uma busca em banco de dados utilizando algoritmos
específicos para a identificação das proteínas.
O sucesso da MS no campo de proteômica se deve, em grande parte, aos
avanços na tecnologia de fontes de ionização e dos analisadores de massas. A
MS é uma técnica analítica que permite discriminar íons de acordo com a relação
m/z de cada espécie analisada. É importante ressaltar, que o que é avaliado em
espectrometria de massas é a relação m/z e não a massa de um íon em Da
(Daltons). Apenas para íons monocarregados a relação m/z reflete a massa do
íon. Além de discriminar íons, a MS é capaz de contar a quantidade de íons
numa determinada razão m/z. Para usar a MS como ferramenta em proteômica
é necessário gerar os íons por meio de uma fonte de ionização, como eletrospray
(ESI - do inglês, electrospray ionization) ou MALDI (do inglês, Matrix Assisted
Laser Dessorption/Ionization), por exemplo, e ainda, discriminá-los por meio de
analisadores de massas, que dentre os mais utilizados pode-se citar os de alta
22
resolução como o TOF (do inglês, Time of Flight), o ICR (do inglês, Ion Ciclotron
Ressonance) e o mais recente desenvolvido por armadilha de íons - Orbitrap.
Quando se trata de quantificação de proteínas por espectrometria de
massas, muitos modos são encontrados na literatura, que incluem as técnicas
hifenadas de LC-MS/MS e LC-SRM (do inglês, Liquid chromatography –
Selected reaction monitoring) que é um método de quantificação que tem como
alvo proteínas específicas, ou seja, deve-se conhecer de antemão as proteínas
que se deseja quantificar. Esses modos podem ser combinados com diferentes
métodos para a quantificação, que podem incluir a marcação de peptídeos
isobáricos e isotópicos (iTRAP, do inglês - isobaric tags for relative and absolute
quantification ou iCAP, do inglês – isotope-coded affinity tags) ou metabólica
(SILAC, do inglês - stable isotope labeling by amino acids in cell culture).
Também pode ser realizada a quantificação de proteínas sem marcação
(label-free), na qual não é necessária a modificação dos peptídeos ou proteínas
com padrões isotópicos, exigindo, portanto, um preparo de amostra menos
trabalhoso. Assim, as proteínas podem ser quantificadas por meio da correlação
com as áreas dos picos obtidos por cromatografia ou por contagem no número
de espectros dos peptídeos sequenciados por espectrometria de massas. O
sinal analítico obtido é comparado com a abundância relativa das mesmas.
Embora a contagem espectral seja simples, um pequeno número de contagens
para proteínas presentes em baixa abundância fornece medições quantitativas
menos robustas, devido às limitações estatísticas e de outros fatores, tais como
a necessidade de limitar a taxa de falsa descoberta de modo a não "contar"
espectros de baixa qualidade. Na quantificação label-free, qualquer variação no
preparo de amostras, na reprodutibilidade, na eficiência de ionização e outras
variáveis do instrumento pode conduzir a erros na análise (Xie et al., 2011).
Contudo, esse método de quantificação pode ser considerado preciso e menos
trabalhoso, já que dispensa o uso de géis ou de reagentes com elevado custo
como isótopos, porém necessita de software específico e um cuidadoso trabalho
por parte do analista.
Com relação à proteômica da soja, é possível encontrar vários estudos na
literatura, no entanto, estudos comparativos entre soja T e NT ainda são
escassos (Arruda et al., 2015; Barbosa et al., 2012; Mataveli et al., 2012;
Natarajan et al., 2007). Neste sentido, Barbosa et al., (2012), estudaram, por
23
meio de comparação proteômica, as sementes de soja transgênica e não-
transgênica. Os resultados deste trabalho evidenciaram quatro spots proteicos
com abundância diferentes, indicando que tais proteínas apresentaram
abundâncias diferentes entre as amostras, provavelmente devido a modificação
genética realizada na soja transgênica. Tal fato, foi confirmado pela identificação
da proteína cp4EPSPS nas sementes de soja transgênica, característica da
modificação genética, e ainda, foi possível identificar um total de 192 proteínas
nessas sementes de soja, por meio da separação por 2-D PAGE e identificação
por espectrometria de massas do tipo MALDI-TOF.
Com relação à segurança alimentar, ainda não há relatos científicos sobre
os efeitos que a alimentação a base de organismos transgênicos pode causar.
Todavia, Krzyzowska et al. (2010) relataram possíveis efeitos do triticale
transgênico, investigando cinco gerações consecutivas de ratos. O triticale é um
cereal resultante da hibridação do trigo e do centeio. Os resultados indicam que
a utilização de triticale transgênico na alimentação dos roedores aumentou a
concentração de glóbulos brancos no sangue e, ainda, a expansão de células B
nos órgãos linfóides secundários.
Da mesma maneira, estudos sobre os efeitos que a transgenia pode
provocar em plantas de soja cultivadas com sementes provenientes de uma
mesma família, ou seja, em futuras gerações, ainda são escassos ou
inexistentes, bem como nas sementes por essas plantas fornecidas. Assim o
presente estudo é importante do ponto de vista de segurança alimentar, uma vez
que os produtores de soja costumam guardar sementes obtidas de uma safra
para plantar na safra seguinte.
1.2 OBJETIVOS
O objetivo principal desse capítulo foi o de investigar, de forma
comparativa, os efeitos que o cultivo consecutivo pode causar em nível
proteômico entre as sojas T e NT. Como objetivos específicos têm-se:
i. Plantar e cultivar as sementes de soja T e NT, em condições
idênticas, até sua terceira geração;
ii. Realizar a extração, separação e quantificação relativa das
proteínas de soja T e NT através da eletroforese bidimensional em gel de
24
poliacrilamida e eletroforese diferencial em gel de poliacrilamida (2-D PAGE e 2-
D DIGE);
iii. Identificar e caracterizar as proteínas diferenciais por
espectrometria de massas (nLC-MS);
iv. Avaliar se houve alguma alteração diferencial e ao longo das
gerações de sementes;
v. Investigar quais as funções das proteínas identificadas no
metabolismo das sementes.
1.3 MATERIAIS E MÉTODOS
1.3.1 Reagentes e equipamentos
Todas as soluções foram preparadas com água deionizada de alta pureza
(resistividade 18,2 MΩ cm) obtida a partir de um sistema deionizador de água
Milli-Q, modelo DirectQ 5 (Millipore). Na secagem das amostras de semente de
soja T e NT, usou-se uma estufa de secagem à 37 °C (Quimis).
Para o preparo da solução nutritiva utilizada no cultivo da soja, os sais
utilizados foram: KH2PO4 (J. T. Baker), Ca(NO3)2.4H2O (Ecibra), KNO3 (Nuclear)
e MgSO4.7H2O (Carlo Erba).
Na extração das proteínas das sementes de soja os reagentes utilizados
foram: Tris-HCl (GE Healthcare), KCl (Mallinckrodt), DTT (Ditiotreitol) (GE
Healthcare), PMSF (Sigma Aldrich), SDS (GE Healthcare) e éter de petróleo
(Mallinckrodt). Para a precipitação das mesmas, acetato de amônio
(Mallinckrodt), metanol (J. T. Baker) e acetona (Merck) foram usados.
No preparo dos géis foram utilizados acrilamida, bis-acrilamida, SDS
(dodecil-sulfato de sódio), tris-HCl, agarose, persulfato de amônio e TEMED (GE
Healthcare). Para os demais procedimentos de análise foram utilizados os
seguintes reagentes: Uréia, tiouréia, CHAPS e anfólitos pH 4-7 (GE Healthcare),
kit de quantificação de proteínas 2-D Quant (GE Healthcare), óleo mineral (GE
Healthcare), Comassie Blue (J. T. Baker), etanol (Synth), ácido acético (Synth),
iodoacetamida – IAA, bicarbonato de amônio - AmBic (GE Healthcare) e
acetonitrila (Sigma-Aldrich).
25
A separação das proteínas foi realizada em sistema de eletroforese
modelo EttanTM Dalt six (GE Healthcare, Suécia) e posterior tratamento das
imagens em Scanner, modelo Image Scanner (Amershan, Bioscience). As
análises de identificação das proteínas foram realizadas em um espectrômetro
de massas do tipo LTQ-Orbitrap (Thermo Scientific), equipado com fonte de
nanoESI (Thermo Scientific). Entre outros equipamentos e materiais
volumétricos utilizados, destacam-se balança analítica AX 200 7 (Shimadzu),
ultrasonicador (modelo Qsonica Q700, potência 700 W) e micropipetas de 20 –
200 μL; 100 – 1000 μL e 1000 – 5000 μL (Eppendorf).
1.3.2 Cultivo das sementes de soja
As sementes de soja transgênica (T - variedade M7211 RR) e não-
transgênica (NT - variedade MSOY 8200) foram gentilmente cedidas pela
empresa Monsanto do Brasil.
O primeiro cultivo (sementes precursoras) para obtenção da segunda
geração de sementes foi realizado entre os meses de janeiro a maio de 2014.
Foram preparados 19 vasos para cultivar 3 sementes de soja T e 3 NT (por vaso),
denominadas ST2 e SNT2 (segunda geração), respectivamente, em casa de
vegetação pertencente ao Instituto de Biologia (IB) da Unicamp e em solo
apropriado, que consistiu de uma mistura 1:1 de substrato (BasaplantTM) e
vermiculita (AgroTM). As plantas foram irrigadas com água deionizada todos os
dias e com solução nutritiva [consistindo de uma solução composta por KH2PO4
(0,136 g L-1), Ca(NO3)2.4H2O (11,8 g L-1), KNO3 (5,05 g L-1) e MgSO4.7H2O (4,92
g L-1)] a cada 3 dias após os cotilédones dessas plantas apresentarem cor
amarelada (aproximadamente após 18 dias de cultivo). Após o décimo quinto dia
de cultivo, foi realizado o desbaste, que consistiu em retirar as duas plantas
menos desenvolvidas do meio, para que apenas uma crescesse e se
desenvolvesse. Esse procedimento foi necessário, para que não ocorresse
competição entre as sementes com relação aos nutrientes necessários para o
seu crescimento, e assim minimizasse o estresse da mesma. Depois de
aproximadamente 150 dias as sementes foram coletadas. Devido à alta umidade
apresentada naquele período foi necessário realizar um controle químico com
26
um fungicida sistêmico (SCORE® 250 EC, 200 μl L-1), com objetivo de prevenir
o aparecimento de fungos nas plantas.
O segundo cultivo para obtenção da terceira geração de sementes foi
realizado entre os meses de janeiro a maio de 2015 em condições idênticas ao
primeiro, com as sementes coletadas provenientes da segunda geração e que
foram denominadas ST3 e SNT3 (terceira geração). Novamente, após
aproximadamente 150 dias de cultivo as sementes foram coletadas.
1.3.2.1 Aspectos Éticos
Como nesse trabalho foram empregadas sementes de soja
geneticamente modificada, é informado o número do registro do Certificado de
Qualidade em Biossegurança: 240/2007, publicado em 24/07/2007, bem como
todos os experimentos foram conduzidos em laboratório apropriado para
manipulação de organismos transgênicos (classe I), que está certificado pela
CIBio do IQ-UNICAMP.
1.3.3 Extração e separação das proteínas de Soja
O procedimento de extração foi realizado de acordo com Barbosa (2012),
com algumas modificações. As sementes das três gerações de soja foram
congeladas em nitrogênio líquido e, então, maceradas com o auxílio de pistilo e
almofariz. Para cada 600 mg de soja moída, adicionaram-se 6 mL de éter de
petróleo, e então, o solvente foi deixado em contato com a amostra, sob
agitação, durante 10 minutos. O solvente foi removido e a amostra foi novamente
macerada (este procedimento foi realizado 3 vezes). As proteínas foram
extraídas pela maceração da amostra em banho de gelo com 6 mL de solução
extratora (Tris-HCl 50 mmol L-1 (pH 8,8), KCl 1,5 mmol L-1, DTT 10 mmol L-1,
PMSF 1,0 mmol L-1 e SDS 0,1% (m∕v)).
O extrato proteico foi centrifugado durante 5 minutos à 4°C e 5000 g, para
a remoção dos materiais insolúveis. O sobrenadante contendo as proteínas foi
armazenado em microtubos a -20ºC. A precipitação das proteínas foi realizada
com acetato de amônio 0,1 mol L-1 em metanol, a fim de remover possíveis
interferentes durante 12h a -20ºC. O precipitado proteico foi coletado por
27
centrifugação durante 10 min à 4°C e 5000 g, e, em seguida, lavado com solução
de acetona 80% (2 vezes) e etanol 70% (2 vezes), ambos gelados. Para a
obtenção dos géis de eletroforese, o precipitado proteico foi ressolubilizado em
tampão de hidratação [uréia 7 mol L-1, tiouréia 2 mol L-1, CHAPS 2% (m/v) e
anfólitos 0,5% (m/v)] em pH de 4-7, para a obtenção da quantidade de proteínas
totais extraídas, que foi obtida por meio do kit 2D-Quant, de acordo com as
instruções do fabricante.
Para a primeira dimensão da eletroforese utilizou-se uma fita de 13 cm
com pH de 4-7, aplicando-se sobre a mesma, 250 µL de amostra que continha
500 µg de proteínas ressolubilizadas. Esta fita foi hidratada por 12h em
temperatura ambiente com óleo mineral para, então, ser levada ao sistema
focalizador, o qual foi programado da seguinte maneira: (1) 500 V até 500 Vh,
(2) 1000 V até 800 Vh, (3)10000 V até 11300 Vh e (4) 10000 V até 2000 Vh.
Após a focalização, a fita foi equilibrada em duas etapas de 15 min cada,
sendo a redução e alquilação das proteínas, com DTT e iodoacetamida,
respectivamente. Após essa etapa a fita foi, então, fixada sobre um gel de
poliacrilamida 12 % para a obtenção da segunda dimensão. A corrida da
segunda dimensão foi realizada em duas etapas. Na primeira foi aplicado 90 V,
25 mA gel-1 e 100 W durante 30 min e na segunda 250 V, 25 mA gel-1 e 100 W
por aproximadamente 6 h. Por fim, as proteínas fixadas no gel foram fixadas com
solução contendo 40 % (v∕v) de etanol e 10 % (v∕v) de ácido acético por 1h e, em
seguida, reveladas empregando o corante Comassie Blue concentrado por 45
min. A remoção do corante foi realizada a partir de lavagens sucessivas com
água deionizada por aproximadamente 3 dias.
O gel obtido foi escaneado e sua imagem analisada pelo programa de
imagens ImageMaster 2D Platinum versão 6.0, que permite obter uma estimativa
do número de spots obtidos no gel de eletroforese.
1.3.4 Quantificação relativa das proteínas de soja por 2-D DIGE
A extração das proteínas das sementes de soja provenientes das
diferentes gerações para a quantificação relativa por 2 D-DIGE foram realizadas
da mesma maneira descrita no item 1.3.3.; no entanto, a partir da primeira etapa
28
de separação a massa utilizada e marcada com os corantes CyDyeTM DIGE
Fluors foi de 50 µg de proteínas para cada amostra e 50 µg de padrão interno
(que consiste em 25 µg de cada amostra do grupo). Os corantes Cy2, Cy3 e Cy5
foram misturados com as proteínas de cada amostra, de forma que cada amostra
fosse marcada com 400 pmol do corante selecionado. A reação foi feita à 4°C
durante 30 min e foi cessada com 1 µL de lisina 10 mmol L-1 durante 10 min (no
escuro). As amostras (padrão interno marcado com Cy2 e duas amostras
marcadas com Cy3 e Cy5) foram misturadas, e em seguida, levadas a um
volume de 250 µL com tampão de hidratação (descrito anteriormente, item 5.3.)
juntamente com 0,002% (m/v) de azul de bromocressol. A separação
eletroforética ocorreu da mesma maneira descrita no item 5.3. As imagens dos
géis foram obtidas por um scanner especifico para detectar a fluorescência dos
corantes utilizados na marcação das amostras e a análise das imagens realizada
com o programa DeCyderTM 2D-Differential Analysis Softwere v7.0 (GE
Healthcare), empregando o programa DIA (do inglês, differential in-gel analysis),
que permite avaliar os spots diferenciais, em termos de abundância, entre as
amostras marcadas com os corantes Cy3 e Cy5, sendo seus sinais normalizados
pelo corante Cy2 (utilizado como padrão interno). Um fator de variação de 2,0
(100% de variação) foi empregado para determinar as proteínas diferenciais. A
Figura 2 resume esse procedimento. Cada grupo de amostra foi avaliado em
duplicata de acordo com a Tabela 1.
29
Figura 2. Procedimento experimental para a separação e quantificação relativa das
proteínas por 2-D DIGE. Adaptado de Galazzi, 2017.
Tabela 1. Marcação das amostras de soja e seu respectivo corante
Géis Grupo Cy2 Cy3 Cy5
1-2 T1G x NT1G T1G/NT1G T1G NT1G
3-4 T2G x NT2G T2G/NT2G T2G NT2G
5-6 T3G x NT3G T3G/NT3G T3G NT3G
7-8 T1G x T2G T1G/T2G T1G T2G
9-10 T1G x T3G T1G/T3G T1G T3G
11-12 T2G x T3G T2G/T3G T2G T3G
13-14 NT1G x NT2G NT1G/NT2G NT1G NT2G
15-16 NT1G x NT3G NT1G/NT3G NT1G NT3G
17-18 NT2G x NT3G NT2G/NT3G NT2G NT3G
Onde: T = transgênica; NT = não transgênica; 1, 2 e 3G = primeira, segunda e terceira geração,
respectivamente.
1.3.5 Digestão com tripsina in gel das proteínas
Cada spot considerado diferencial em termos de abundância foi recortado
do gel de poliacrilamida com o auxílio de uma ponteira de polietileno e colocado
30
em uma placa de ELISA. O processo de lavagem consistiu em agitação
constante durante 1h com 100 μL de solução de lavagem [100% ACN:100 m mol
L-1 AmBic (1:1)] por três vezes. Os pedaços de géis foram desidratados com 100
μL de acetonitrila (ACN) e reidratados com solução redutora (10 mmol L-1 de DTT
em 100 mmol L-1 de AmBic) por 30 min à 56 °C. Após essa etapa, novamente,
os pedaços de géis foram desidratados com 100 μL de ACN e reidratados com
solução de alquilação (50 mmol L-1 de IAA em 100 mmol L-1 de AmBic) por 30
min na ausência de luz e em temperatura ambiente. Após essa etapa, foi
realizada a desitradatação com ACN e, em seguida, realizou-se a etapa de
digestão com solução de tripsina overnight à 37 °C. Após esse período, foram
adicionados 200 μL de solução de extração [5% ácido fórmico:100% ACN (1:2)]
e foi deixado sob agitação por 30 min (2x). O líquido sobrenadante foi coletado
em microtubos. Os peptídeos extraídos foram secos em SpeedVac e
armazedados em -80 °C até sua ressuspensão em 0,1% (v/v) de ácido fórmico
para posterior análise por espectrometria de massas.
1.3.6 Identificação das proteínas
As análises das proteínas digeridas em peptídeos foram realizadas em
um HPLC (do inglês – High Pressure Liquid Chromatography) de nano fluxo
(Easy nLC, Thermo Fisher Scientific) acoplado on-line a um espectrômetro de
massas do tipo QExactive [Orbitrap (Thermo Scientific)] com fonte de ionização
nanoeletrospray (Proxeon). Os peptídeos foram carregados em uma coluna de
fase reversa do tipo C18 (10 cm de comprimento e 75 μm de diâmetro interno) e
separados através de um gradiente linear de 5-95% da solução B (0,1 % de ácido
fórmico em ACN) com vazão de 20 μL min-1 controlado por IntelliFlow durante
120 min configurado para operar em modo de aquisição dependente de dados
(DDA), contendo uma função de MS fullscan (m/z 200 a 2000). Os peptídeos
foram ionizados em modo positivo com 2.1 kV em 250 °C. O espectrômetro de
massas foi controlado pelo software XCalibur 2.0 (Thermo Scientific) e os dados
foram processados no Proteome Discovery 2.0.
31
1.4 RESULTADOS E DISCUSSÃO
1.4.1 Plantio e Cultivo da soja
As variedades de sementes de soja MSOY 7211RR (T) e MSOY 8200
(NT) para obtenção da segunda geração de sementes foram plantadas no
período de janeiro até maio do ano de 2014. A Figura 3 apresenta algumas
imagens exibindo o desenvolvimento morfológico das plantas em seus diferentes
estágios.
32
Figura 3. Desenvolvimento morfológico da soja: (A) germinação, (B) crescimento vegetativo, (C) florescimento, (D) desenvolvimento da vagem,
(E) crescimento das sementes dentro da vagem e (F) maturidade completa.
33
Por meio da Figura 3, nota-se que o plantio se mostrou adequado para o
desenvolvimento das plantas e obtenção das sementes. Neste momento, é
importante ressaltar que a solução nutritiva foi adicionada depois de
aproximadamente 15 dias da emergência das plantas, pois as reservas nutritivas
armazenadas nos cotilédones suprem as necessidades da planta jovem depois
do estágio de emergência, ou até próximo estágio onde aparece o primeiro nó,
com o objetivo de melhorar a nutrição da planta (IPNI, 2015). O controle químico
aplicado foi eficiente para combater alguns fungos que foram observados com
aproximadamente 40 dias de cultivo nas plantas, e, assim, a planta se
desenvolveu normalmente.
Na Figura 4 é observado o estágio de florescência e a formação da vagem
das plantas de soja T e NT. O cultivar MSOY 7211RR apresenta uma flor roxa,
enquanto o cultivar MSOY 8200 a cor da flor é branca. Esta é a descrição
morfológica mais segura para a diferenciação dos cultivares T e NT dessas
variedades.
Figura 4. Plantas de soja no estágio de florescência (A) transgênica e (B) não-
transgênica.
Foi possível observar que as plantas T apresentaram uma maior
produtividade, ou seja, maior quantidade de sementes por planta, além da
maturidade completa da planta se dar em aproximadamente 20 dias antes das
plantas NT.
(A) (B)
34
Quanto ao segundo plantio, que iniciou em janeiro de 2015, para obtenção
das sementes de terceira geração, a colheita foi realizada em maio de 2015 e os
estágios pelos quais as plantas passaram foram semelhantes aos observados
na Figura 2.
1.4.2 Separação das proteínas
A separação das proteínas extraídas das sementes de soja T e NT foi
realizada de acordo aos procedimentos descritos por Barbosa (2011) e Sussulini
(2007). A separação ocorreu por meio da técnica de eletroforese em gel de
poliacrilamida (2-D PAGE), pois esta permite separar as proteínas de acordo
com seu ponto isoelétrico em fita pré-fabricada em pH 4-7 e massa molecular,
gerando assim, um perfil de proteínas representado por spots como representa
a Figura 5. A primeira dimensão foi realizada em pH 4-7, pois em trabalhos
anteriores foi observado um maior número de proteínas nessa faixa para
sementes de soja (Barbosa, 2011 e Brandão et al., 2010).
35
Figura 5. Mapa proteico obtido por meio da técnica de separação de proteínas 2-D PAGE das sementes de soja (A) T e (B) NT de primeira
geração. MM significa a massa molecular e pH variando de 4-7.
(A) (B)
pH pH 4 7 4 7
200
116
97
66
45
31
21
14
6
MM
36
O perfil proteômico obtido para as três gerações e variedades de
sementes é semelhante aos observados na Figura 5, e também, aos
apresentados por Barbosa (2011) em seu trabalho de Tese, sendo que a
separação foi considerada adequada para as análises por 2-D DIGE. Apesar do
perfil muito semelhante entre as gerações e variedades de soja estudadas, um
indicativo de que existem proteínas diferenciais entre as mesmas pode ser
observado na Figura 6, onde o spot é mais intenso na amostra não-transgênica
do que na transgênica, mostrando, assim, uma diferença no perfil químico das
sementes.
Figura 6. Região ampliada do mapa proteico das sementes de soja segunda geração
para (A) e (C) não transgênica e (B) e (D) transgênica. (C) e (D) são imagens obtidas
no programa em 3 dimensões.
37
1.4.3 Quantificação relativa das proteínas diferenciais por 2-D DIGE A técnica de 2D-DIGE foi utilizada para a quantificação relativa das
proteínas entre as sementes de soja T e NT e entre as gerações. O fator de
diferenciação foi considerado como sendo ≥ 2,0, ou seja, 100% de variação,
conforme determinado pelo programa de análise das imagens (software Decyder
2D). Na análise estatística, foi considerado um valor de p ≤ 0,1 de acordo com
teste t de Student. A Figura 7 foi obtida no programa de tratamento das imagens
e representa o gel obtido por 2-D DIGE para proteínas das sementes de soja de
primeira geração. Os corantes fluorescentes quais realizaram a marcação das
amostras como mencionado no item 1.3.5 dessa Tese, sofrem uma reação de
substituição nucleofilica com o grupo Ɛ-amido dos resíduos de lisina para formar
uma amida. Os corantes são positivamente carregados para compensar a carga
da lisina que é perdida na reação de marcação. Aproximadamente 1-3% da
concentração de cada proteína são marcadas por esta técnica, cada uma com
uma única molécula do corante. Isso faz com que esta técnica seja
extremamente dinâmica permitindo que todas as proteínas visualizadas sejam
quantificadas (Barbosa, 2011).
38
Figura 7. Análise por 2-D DIGE (pH 4-7) para sementes de soja T e NT de primeira
geração. Spots marcados em azul representam maior abundância na amostra
transgênica e spots marcados em vermelho representam maior abundância na amostra
não transgênica.
Na Figura 7, observam-se spots marcados em azul. Esses representam
proteínas menos abundantes marcadas com CY5, ou seja, na amostra NT1G
(Tabela 1) e somam 9 nesta análise. Em vermelho, são proteínas mais
39
abundantes, também em CY5 e somam 14, num total de 25 proteínas
diferenciais para esse grupo. O contrário é verdadeiro para o CY3, ou seja, para
a amostra T1G. O spot marcado em amarelo mostra a abundância relativa entre
a mesma proteína em diferentes amostras, ou seja, entre T e NT, por exemplo.
Os outros 8 grupos estudados, como mencionado na Tabela 1, foram analisados
da mesma maneira, e foi observado um total de 91 proteínas diferenciais ao todo.
As Figuras encontram-se no anexo I. A Tabela 2 mostra esses resultados, sendo
a quantidade total de proteínas diferenciais foram maior que 91, pois muitas das
proteínas se repetem entre os grupos.
Tabela 2. Quantidade de proteínas diferenciais por grupo estudado
Grupo Número de proteínas diferenciais
T1G x NT1G 24
T2G x NT2G 19
T3G x NT3G 36
T1G x T2G 16
T1G x T3G 17
T2G x T3G 4
NT1G x NT2G 21
NT1G x NT3G 43
NT2G x NT3G 23
Por meio da Tabela 2, é possível observar que as diferenças proteicas
entre as gerações de soja T foram menores do que entre a NT. Isso pode ser
justificado devido ao fato da soja T poder ser considerada mais robusta, e, sendo
assim, se adaptou melhor às pequenas variações climáticas ou de cultivo. As
diferenças observadas entre T x NT das diferentes gerações não apresentam
uma tendência em relação ao aumento da variação ou não. No entanto,
considerando que a primeira geração, ou seja, a semente precursora, é
proveniente de cultivo realizado em campo, e as demais de cultivo realizado em
casa de vegetação, as variações observadas podem ser consideradas
proveniente da mudança de solo, temperatura e umidade, por exemplo.
Entretanto, se considerarmos somente a segunda e terceira geração (que foram
40
obtidas em condições idênticas de cultivo), pode-se estimar um aumento de
proteínas diferenciais entre as sementes T e NT. Todas as proteínas diferenciais
encontradas no grupo T são mais abundantes na 3G em relação a 2G, enquanto
no grupo NT apenas 5, em um total de 23, são mais abundantes.
Em comparação ao trabalho desenvolvido por Barbosa (2011), que
realizou o estudo comparativo entre sementes de soja T e NT por 2D-DIGE, o
mesmo encontrou apenas 4 proteínas diferenciais; no entanto, as variedades
das sementes não são as mesmas das utilizadas nesse trabalho, o que justifica
o fato do número de proteínas diferenciais ser maior nesse estudo.
Com esses resultados, não é possível afirmar que tais mudanças sejam
causadas inerentemente pela inserção do gene da transgenia na planta, mas
pode-se estimar que a planta transgênica é mais resistente às variações
ambientais naturais de cultivo que as plantas não-transgênicas.
1.4.4 Identificação das proteínas diferenciais por
espectrometria de massas
Das 91 proteínas diferenciais observadas de acordo com o item 1.4.3, 72
puderam ter a análise realizada (devido à resolução do gel obtido) por um
espectrômetro de massas do tipo LTQ-Orbitrap (Thermo Scientific) em parceria
com o Dr. Tiago S. Balbuena da UNESP de Jaboticabal-SP. A Tabela 3
apresenta os resultados obtidos. A Figura 8 apresenta os spots marcados para
a identificação e a região dos mesmos. A Tabela 3 e Figura 8 são
complementares para o entendimento dos dados.
41
Figura 8. Gel 2-D marcado com cada spot considerado diferencial (fator de diferenciação > 2,0 e p-value > 0,01) entre os grupos de sementes de soja
estudados por 2-D DIGE, num total de 91.
42
Tabela 3. Identificação dos spots diferenciais (vide Figura 8) das sementes de soja T e NT de diferentes gerações por espectrometria de massas
do tipo LTQ-Orbitrap. Acesso = código da proteína; PSM = peptide spectrum match (número de espectro MS2 adquiridos para cada proteína); Variação =
diferença entre a abundância dos spots no gel experimental.
T1G x NT1G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
1 NR
2 NR
3 Glyma.12G213600.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
40,43 15,48 13 17,8 6,38 -5,13
4 Glyma.11G117300.1.p RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain) (RRM_1)
21,54 21,05 7 16,6 5,63 -3,08
5 NR
6 Glyma.01G095000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
28,07 13,30 10 22,4 5,01 3,69
7 NI
8 Glyma.08G341000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
78,72 17,24 25 22,6 7,24 -4,21
9 Glyma.08G341500.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
12,10 8,76 4 24,1 5,11 2,06
10 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 76,66 15,76 23 43,4 5,22 -2,69
11 NR
12 Glyma.03G163500.4.p 12S SEED STORAGE PROTEIN CRA1-RELATED 54,92 9,02 18 54,6 5,38 2,30
13 Glyma.20G164700.1.p Chitinase / Poly-beta-glucosaminidase 22,1 10,21 8 37 5,08 -5,72
14 Glyma.13G223700.2.p Protein of unknown function (DUF1264) (DUF1264) 34,24 41,74 12 27,3 6,10 2,08
15 Glyma.02G012600.1.p Legume lectin domain (Lectin_legB) 37,92 17,19 12 30,9 6,05 2,18
16 Glyma.02G012600.1.p Legume lectin domain (Lectin_legB) 7,52 12,28 3 30,9 6,05 -2,23
17 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 14,7 10,34 3 43,4 5,22 -3,93
18 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 9,25 10,34 2 43,4 5,22 -3,08
19 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 130,02 13,94 33 55,7 6,23 -2,45
20 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 56,61 16,77 16 55,7 6,23 -3,87
43
21 Glyma.10G155300.1.p GLUCOSE AND RIBITOL DEHYDROGENASE HOMOLOG 1-RELATED
45,64 24,57 13 31,8 7,36 2,11
22 Glyma.20G148400.2.p Cupin (Cupin_1) 14,93 11,25 4 63,2 5,05 -2,93
23 NI
24 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 12,14 6,69 3 67,9 6,58 3,32
T2G x NT2G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
6 Glyma.01G095000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
28,07 13,30 10 22,4 5,01 -3,90
7 NI
11 NR
13 Glyma.20G164700.1.p Chitinase / Poly-beta-glucosaminidase 22,1 10,21 8 37 5,08 -5,41
21 Glyma.10G155300.1.p GLUCOSE AND RIBITOL DEHYDROGENASE HOMOLOG 1-RELATED
45,64 24,57 13 31,8 7,36 -2,42
24 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 12,14 6,69 3 67,9 6,58 3,96
25 NR
26 NR
27 Glyma.01G177000.1.p CUPIN FAMILY PROTEIN 11,32 5,70 3 71,7 5,49 2,20
28 Glyma.09G185500.1.p Dehydrin (Dehydrin) 14,05 28,85 5 26,6 6,8 13,96
29 Glyma.20G146200.1.p Cupin (Cupin_1) 124,97 28,93 37 50,4 6,24 3,36
30 Glyma.12G159300.1.p Malate dehydrogenase / Malic dehydrogenase 9,32 7,54 3 36,1 8,12 -2,55
31 Glyma.20G148400.2.p Cupin (Cupin_1) 111,73 14,58 31 63,2 5,05 -5,65
32 Glyma.20G146200.1.p Cupin (Cupin_1) 93,16 22,1 28 50,4 6,24 -6,21
33 Glyma.20G146200.1.p Cupin (Cupin_1) 280,52 46,92 80 50,4 6,24 2,24
34 Glyma.20G148200.1.p Cupin (Cupin_1) 402,18 46,92 120 50,4 6,24 2,79
35 Glyma.20G146200.1.p Cupin (Cupin_1) 498 46,92 148 50,4 6,24 2,12
36 Glyma.13G149000.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATED
46,88 22,68 13 50,6 6,67 2,17
37 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 60,06 24,57 18 67,9 6,58 2,54
44
T3G x NT3G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
8 Glyma.08G341000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
78,72 17,24 25 22,6 7,24 -3,45
10 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 76,66 15,76 23 43,4 5,22 3,97
12 Glyma.03G163500.4.p 12S SEED STORAGE PROTEIN CRA1-RELATED 54,92 9,02 18 54,6 5,38 -3,10
13 Glyma.20G164700.1.p Chitinase / Poly-beta-glucosaminidase 22,1 10,21 8 37 5,08 -4,72
17 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 14,7 10,34 3 43,4 5,22 -7,72
18 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 9,25 10,34 2 43,4 5,22 -20,92
19 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 130,02 13,94 33 55,7 6,23 -5,45
20 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 56,61 16,77 16 55,7 6,23 -4,33
22 Glyma.20G148400.2.p Cupin (Cupin_1) 14,93 11,25 4 63,2 5,05 -4,76
23 NI
24 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 12,14 6,69 3 67,9 6,58 4,83
26 NR
27 Glyma.01G177000.1.p CUPIN FAMILY PROTEIN 11,32 5,70 3 71,7 5,49 -3,16
29 Glyma.20G146200.1.p Cupin (Cupin_1) 124,97 28,93 37 50,4 6,24 3,14
31 Glyma.20G148400.2.p Cupin (Cupin_1) 111,73 14,58 31 63,2 5,05 -3,45
32 Glyma.20G146200.1.p Cupin (Cupin_1) 93,16 22,1 28 50,4 6,24 -2,43
33 Glyma.20G146200.1.p Cupin (Cupin_1) 280,52 46,92 80 50,4 6,24 -9,39
34 Glyma.20G148200.1.p Cupin (Cupin_1) 402,18 46,92 120 50,4 6,24 -6,19
35 Glyma.20G146200.1.p Cupin (Cupin_1) 498 46,92 148 50,4 6,24 -5,33
37 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 60,06 24,57 18 67,9 6,58 5,31
38 NR
39 Glyma.11G117300.1.p RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain) (RRM_1)
21,54 21,05 7 16,6 5,63 -2,30
40 NR
41 Glyma.03G163500.4.p 12S SEED STORAGE PROTEIN CRA1-RELATED 54,92 9,02 18 54,6 5,38 3,65
42 NR
45
43 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 40,24 11,9 11 63,8 5,29 3,57
44 Glyma.06G170900.2.p ELONGATION FACTOR 1-BETA 5,31 9,42 2 20,7 4,6 8,31
45 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 123,95 7,64 30 63,8 5,29 -3,63
46 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 569,22 25,58 119 63,8 5,29 -4,29
47 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 18,39 10,34 4 43,4 5,22 -6,60
48 NI
49 Glyma.20G148200.1.p Cupin (Cupin_1) 175,45 36,45 57 50,4 6,24 -8,17
50 NI
51 Glyma.10G064400.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATEDLinksB Pm
87,5 35,63 27 48,8 6,42 2,76
52 NI
53 Glyma.10G246300.1.p Cupin 77,49 21,1 22 72,2 5,71 6,37
T1G x T2G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
4 Glyma.11G117300.1.p RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain) (RRM_1)
21,54 21,05 7 16,6 5,63 -2,30
16 Glyma.02G012600.1.p Legume lectin domain (Lectin_legB) 7,52 12,28 3 30,9 6,05 -2,78
17 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 14,7 10,34 3 43,4 5,22 -2,55
18 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 9,25 10,34 2 43,4 5,22 -2,43
24 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 12,14 6,69 3 67,9 6,58 2,46
38 NR
39 Glyma.11G117300.1.p RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain) (RRM_1)
21,54 21,05 7 16,6 5,63 -2,83
47 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 18,39 10,34 4 43,4 5,22 -2,61
50 NI
54 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 46,63 10,91 19 55,7 6,23 -3,59
55 Glyma.01G177000.1.p CUPIN FAMILY PROTEIN 11,32 5,7 3 71,7 5,49 2,48
56 NR
57 NR
46
58 Glyma.20G148400.1.p Cupin 97,11 10,58 24 70,3 5,17 -2,33
59 NI
60 Glyma.13G149000.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATED
96,85 34,99 29 50,6 6,67 2,31
T1G x T3G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
4 Glyma.11G117300.1.p RNA recognition motif. (a.k.a. RRM, RBD, or RNP domain) (RRM_1)
21,54 21,05 7 16,6 5,63 -5,03
10 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 76,66 15,76 23 43,4 5,22 -7,99
17 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 14,7 10,34 3 43,4 5,22 -2,17
18 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 9,25 10,34 2 43,4 5,22 -2,54
19 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 130,02 13,94 33 55,7 6,23 -3,15
38 NR
50 NI
51 Glyma.10G064400.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATEDLinksB Pm
87,5 35,63 27 48,8 6,42 3,35
54 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 46,63 10,91 19 55,7 6,23 -7,16
59 NI
61 Glyma.09G185500.1.p Dehydrin (Dehydrin) 22,88 28,06 7 26,6 6,8 -3,35
62 Glyma.20G148400.2.p Cupin (Cupin_1) 18,01 5,9 4 63,2 5,05 -3,24
63 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 27,12 6,06 7 55,7 6,23 -3,53
64 Glyma.20G148200.1.p Cupin (Cupin_1) 358,57 46,92 102 50,4 6,24 -4,63
65 Glyma.20G146200.1.p Cupin 161,08 45,33 44 50,4 6,24 -5,04
66 Glyma.20G148200.1.p Cupin (Cupin_1) 269,99 46,92 76 50,4 6,24 -2,69
67 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 176,84 34,37 49 67,9 6,58 3,17
T2G x T3G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
33 Glyma.20G146200.1.p Cupin (Cupin_1) 280,52 46,92 80 50,4 6,24 2,37
34 Glyma.20G148200.1.p Cupin (Cupin_1) 402,18 46,92 120 50,4 6,24 2,01
47
52 NI
68 NI
NT1G x NT2G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
8 Glyma.08G341000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
78,72 17,24 25 22,6 7,24 2,34
12 Glyma.03G163500.4.p 12S SEED STORAGE PROTEIN CRA1-RELATED 54,92 9,02 18 54,6 5,38 -3,24
17 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 14,7 10,34 3 43,4 5,22 2,03
21 Glyma.10G155300.1.p GLUCOSE AND RIBITOL DEHYDROGENASE HOMOLOG 1-RELATED
45,64 24,57 13 31,8 7,36 -2,15
35 Glyma.20G146200.1.p Cupin (Cupin_1) 498 46,92 148 50,4 6,24 -2,57
38 NR
57 NR
64 Glyma.20G148200.1.p Cupin (Cupin_1) 358,57 46,92 102 50,4 6,24 -4,06
65 Glyma.20G146200.1.p Cupin 161,08 45,33 44 50,4 6,24 -4,32
67 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 176,84 34,37 49 67,9 6,58 2,33
69 NR
70 NR
71 Glyma.13G288100.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
5,44 13,92 2 18,4 5,34 3,48
72 NI
73 Glyma.13G288100.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
9,04 15,82 3 18,4 5,34 3,08
74 NI
75 Glyma.13G288100.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
31,52 13,92 11 18,4 5,34 2,06
76 NR
77 NR
78 NR
79 Glyma.13G149000.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATED
66,12 35,64 18 50,6 6,67 2,28
48
NT1G x NT3G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
10 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 76,66 15,76 23 43,4 5,22 -15,67
19 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 130,02 13,94 33 55,7 6,23 -3,93
25 NR
26 NR
27 Glyma.01G177000.1.p CUPIN FAMILY PROTEIN 11,32 5,70 3 71,7 5,49 -3,64
29 Glyma.20G146200.1.p Cupin (Cupin_1) 124,97 28,93 37 50,4 6,24 2,98
33 Glyma.20G146200.1.p Cupin (Cupin_1) 280,52 46,92 80 50,4 6,24 -13,68
34 Glyma.20G148200.1.p Cupin (Cupin_1) 402,18 46,92 120 50,4 6,24 -13,29
35 Glyma.20G146200.1.p Cupin (Cupin_1) 498 46,92 148 50,4 6,24 -6,10
40 NR
43 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 40,24 11,9 11 63,8 5,29 2,25
44 Glyma.06G170900.2.p ELONGATION FACTOR 1-BETA 5,31 9,42 2 20,7 4,6 3,51
45 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 123,95 7,64 30 63,8 5,29 -3,97
46 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 569,22 25,58 119 63,8 5,29 -5,07
47 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 18,39 10,34 4 43,4 5,22 -3,73
48 NI
49 Glyma.20G148200.1.p Cupin (Cupin_1) 175,45 36,45 57 50,4 6,24 -5,48
51 Glyma.10G064400.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATEDLinksB Pm
87,5 35,63 27 48,8 6,42 3,95
55 Glyma.01G177000.1.p CUPIN FAMILY PROTEIN 11,32 5,7 3 71,7 5,49 2,32
59 NI
64 Glyma.20G148200.1.p Cupin (Cupin_1) 358,57 46,92 102 50,4 6,24 -4,76
65 Glyma.20G146200.1.p Cupin 161,08 45,33 44 50,4 6,24 -6,97
66 Glyma.20G148200.1.p Cupin (Cupin_1) 269,99 46,92 76 50,4 6,24 -3,90
67 Glyma.13G291800.1.p COLD-REGULATED PROTEIN 15B 176,84 34,37 49 67,9 6,58 2,82
70 NR
49
71 Glyma.13G288100.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
5,44 13,92 2 18,4 5,34 5,78
72 NI
73 Glyma.13G288100.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
9,04 15,82 3 18,4 5,34 3,27
74 NI
77 NR
78 NR
79 Glyma.13G149000.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATED
66,12 35,64 18 50,6 6,67 2,62
80 Glyma.12G213600.1.p Protease inhibitor/seed storage/LTP family (Tryp_alpha_amyl)
87,9 27,1 27 17,8 6,38 2,97
81 NI
82 NR
83 NR
84 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 4,46 5,05 2 55,7 6,23 3,13
85 NI
86 NR
87 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 38,59 14,47 13 43,4 5,22 10,26
88 Glyma.07G258200.2.p GLUCOSE AND RIBITOL DEHYDROGENASE HOMOLOG 1-RELATED
20,84 14,63 7 31,6 6,84 -5,09
89 Glyma.03G189200.2.p Late embryogenesis abundant protein (LEA_4) 23,42 25,24 9 34,5 6,19 -2,72
90 Glyma.10G028300.1.p Cupin 49,51 21,83 14 58 6,49 -2,12
NT2G x NT3G Acesso Nome da proteína Score Cobertura PSMs MM [kDa]
pI Variação
7 NI
8 Glyma.08G341000.1.p KUNITZ FAMILY TRYPSIN AND PROTEASE INHIBITOR PROTEIN-RELATED
78,72 17,24 25 22,6 7,24 -2,23
10 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 76,66 15,76 23 43,4 5,22 -11,40
19 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 130,02 13,94 33 55,7 6,23 -5,07
20 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 56,61 16,77 16 55,7 6,23 -4,42
50
25 NR
28 Glyma.09G185500.1.p Dehydrin (Dehydrin) 14,05 28,85 5 26,6 6,8 -7,06
29 Glyma.20G146200.1.p Cupin (Cupin_1) 124,97 28,93 37 50,4 6,24 2,15
31 Glyma.20G148400.2.p Cupin (Cupin_1) 111,73 14,58 31 63,2 5,05 2,07
33 Glyma.20G146200.1.p Cupin (Cupin_1) 280,52 46,92 80 50,4 6,24 -9,10
34 Glyma.20G148200.1.p Cupin (Cupin_1) 402,18 46,92 120 50,4 6,24 -6,01
35 Glyma.20G146200.1.p Cupin (Cupin_1) 498 46,92 148 50,4 6,24 -5,40
40 NR
43 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 40,24 11,9 11 63,8 5,29 2,71
45 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 123,95 7,64 30 63,8 5,29 -2,42
46 Glyma.10G037100.1.p 12S SEED STORAGE PROTEIN CRA1-RELATED 569,22 25,58 119 63,8 5,29 -3,53
47 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 18,39 10,34 4 43,4 5,22 -5,97
49 Glyma.20G148200.1.p Cupin (Cupin_1) 175,45 36,45 57 50,4 6,24 -4,23
51 Glyma.10G064400.1.p LATE EMBRYOGENESIS ABUNDANT PROTEIN (ATECP63)-RELATEDLinksB Pm
87,5 35,63 27 48,8 6,42 2,92
63 Glyma.03G163500.5.p 12S SEED STORAGE PROTEIN CRA1-RELATED 27,12 6,06 7 55,7 6,23 -2,12
85 NI
87 Glyma.03G163500.3.p 12S SEED STORAGE PROTEIN CRA1-RELATED 38,59 14,47 13 43,4 5,22 -5,72
91 Glyma.15G050200.1.p ACTIN 92,96 34,75 31 41,6 5,49 -2,50
NR = não recortado do gel/não levado a identificação. NI = não identificado por MS.
51
Das 72 proteínas levadas para a identificação, 61 tiveram sua identidade
conhecida de acordo com a Tabela 3. Um ponto importante a ser considerado
no processo de identificação foi sua eficácia de 84%, Barbosa (2011) identificou
apenas 49% por metodologia semelhante. O aumento do número de spots
identificados pode estar relacionado com o analisador de massas utilizado nesse
trabalho (Orbitrap), o qual é considerado de alta resolução, melhorando os
resultados nas análises proteômicas. Relacionado ao processo de identificação,
alguns spots apresentaram mais de uma identidade, o critério de seleção foi de
acordo com o score e PSMs apresentado por cada proteína, uma vez que cada
spot pode apresentar mais de uma possível proteína durante a identificação.
Utilizando o banco de dados de soja (Glycine max. Wm82.a2.v1) e Arabidopsis
thaliana, no site Phytozome (versão 12.1) as proteínas identificadas puderam ser
classificadas de acordo com atividade biológica em categorias. A Figura 9
representa as principais classes observadas.
Figura 9. Distribuição funcional das proteínas diferenciais identificadas entre os grupos
de soja transgênica e não-transgênica estudados por 2-D DIGE.
No geral, observa-se na Figura 9, que a maioria das proteínas diferenciais
identificadas corresponde aos processos de armazenamento e defesa da planta.
Esse resultado já era esperado visto que as proteínas de armazenamento
correspondem a 70-80% das proteínas totais da soja (Sebastiani, et. al., 1990).
59%
10%
2%
25%
2% 2%
Armazenamento Metabolismo Transporte
Defesa Divisão Celular Não identificada
52
O maior número de proteínas de armazenamento foi encontrado para a
superfamília Cupin. São conhecidas cerca de 18 classes funcionais diferentes
para essa superfamília, que variam de enzimas bacterianas de domínio único,
como isomerases e epimerases envolvidas na modificação de carboidratos da
parede celular, através de bicupins de dois domínios, tais como globulinas de
armazenamento de sementes tolerantes à dessecação e fatores de transcrição
de vários domínios, incluindo um ligado à resposta de nodulação em
leguminosas (Dunwell, et. al. 2004).
À tal família, pertencem as proteínas de armazenamento com diferentes
isoformas, tais como, beta-conglinina ’, e β, glicinina e suas subunidades (G1-
G5) entre outras. Durante o enchimento das sementes, essas proteínas são
reguladas por uma ampla rede fisiológica e genética da soja (Schmidt et al.,
2011) e é conhecido que as proteínas de armazenamento de sementes estão
envolvidas na síntese de amino ácidos e transporte de nitrogênio da planta (Cao
et al., 2016).
Até o momento, não foi reportado na literatura nenhuma relação das
proteínas diferenciais encontradas neste trabalho com os processos de
modificação genética. No entanto, três das quatro proteínas diferenciais
reportadas por Barbosa (2011) foram encontradas nesse trabalho, sendo elas:
Actin – que é considerada uma proteína de armazenamento e encontrada em
todas as células eucariotas, podendo se ligar a ATP e outras proteínas; RNA
recognition motif. – que é uma proteína que se liga ao DNA e RNA em plantas,
e está envolvida na resposta celular ao ambiente e condições de
desenvolvimento; superfamília Cupin – que é considerada a principal proteína de
armazenamento nas sementes de soja, e é responsável pelas propriedades
nutricionais da planta. Porém, vale ressaltar que as sementes estudadas por
Barbosa não são da mesma variedade das empregadas nesse trabalho.
Schmidt et. al. (2011), utilizaram soja transgênica para verificar a resposta
em silenciar proteínas de armazenamento das sementes, como beta-conglicina.
Essas proteínas são as mais abundantes nas sementes de soja como
mencionado anteriormente. Depois de análises proteômicas e metabolômicas
nas sementes, foi observado que a soja busca um reequilíbrio proteico,
mantendo sua concentração de proteínas a mesma, metabolizando o que lhe foi
silenciado em outras classes de proteínas, ou seja, alterando sua composição
53
proteica. Esse reequilíbrio é devido a pequenas alterações no transcriptoma e
metaboloma das sementes.
Pode-se estimar que a soja transgênica esteja buscando esse reequilíbrio
citado por Schmidt et. al. (2011) depois de sofrer a modificação genética, uma
vez que, de acordo com a Tabela 4, quando comparados os grupos de soja T x
NT, as proteínas que sofreram maior alteração em seu conteúdo foram proteínas
classificadas como de armazenamento.
Um fato curioso é que a enzima Malate dehydrogenase foi encontrada
como diferencial apenas no grupo T2G x NT2G. Essa é uma enzima que catalisa
reversivelmente a oxidação do malato em oxaloacetato usando a redução de
NAD+ para NADH. Esta reação é parte de muitas vias metabólicas, incluindo o
ciclo do ácido cítrico. Esta enzima está menos abundante na variedade NT, o
que pode explicar a alta produtividade das sementes transgênicas. Também a
proteína Late embryogenesis abundant (LEA), pertencente à classe de
crescimento e divisão celular, foi observada apenas no grupo T2G x NT2G, onde
encontra-se mais abundante na variedade NT. As proteínas LEA protegem as
membranas mitocondriais contra a desidratação e são bastante acumuladas nos
últimos estágios da embriogenese, ou seja, as sementes NT precisaram
desenvolver mais LEA proteínas para o seu desenvolvimento do que as
sementes T. Outra proteína pertencente ao grupo LEA é a Dehydrin, também foi
observada diferencial e esta envolvida em processos de desitatração e stress à
baixas temperaturas.
A proteína Kunitz pertence à classe dos inibidores de proteases e
apresenta massa molecular próxima de 22 kDa atuando como inibidor da
atividade da enzima tripsina. Essa proteína foi observada como diferencial em
todos os grupos T x NT, sendo nos grupos dois e três menos abundante na
variedade não transgênica. Chitinase foi observada como diferencial em todos
os grupos T x NT e mostrou-se em menor abundância nas variedades NT. Esta
proteína é especificamente expressa nos estágios de desenvolvimento da
planta. Como as plantas transgênicas historicamente apresentam um melhor
desenvolvimento e produtividade se comparadas à variedade NT, esse resultado
está de acordo com o esperado.
Não se pode afirmar que as proteínas diferenciais são relativas ao gene
da transgenia, mas podem ser atribuídas às pequenas variações ambientais. A
54
soja T se mostrou mais resistente em relação a essas variações, bem como em
trabalho recente desenvolvido por Wang et. al. (2012). A análise proteômica
comparativa entre sementes de arroz T e NT, mostrou que 21 proteínas são
mais, ou menos, abundantes devido às condições ambientais e de crescimento,
e não somente devido a inserção de um gene na planta. Isto ocorre porque uma
planta transgênica pode estar em diferentes condições ambientais e de
crescimento ser mais resistente com relação ao seu homólogo não transgênico.
De maneira semelhante, Agapito-Tenfen et. al. (2013) avaliaram as diferenças
entre milho T e NT, e os resultados mostraram que o meio ambiente foi a principal
fonte de influência sobre a expressão das proteínas do milho geneticamente
modificado. Essa observação indica que as mudanças no genoma do milho
podem ter efeito não somente sobre a expressão do gene, mas, também possuir
uma influência ambiental significativa. Tais mudanças não resolvem as questões
de segurança alimentar e mais estudos são necessários.
Com relação à segurança alimentar ao consumo de alimentos
transgênicos, Zhou et. al. (2012) avaliaram três gerações de ratos que foram
alimentados com arroz transgênico. A dieta dos ratos foi elaborada de modo que
um grupo fosse alimentado à base de arroz transgênico, outro grupo arroz
convencional, e, ainda, outro grupo controle. Análises hematológicas foram
realizadas a fim de avaliar o teor de células brancas, vermelhas, hemoglobina,
contagens de plaquetas, entre outras, no organismo dos roedores. Os resultados
após a dieta aplicada as três gerações de ratos mostraram que não houve
diferença significativa entre o consumo do arroz transgênico ou convencional.
Dessa forma, concluíram que não há problema em ministrar arroz transgênico à
dieta de ratos. Conclusões a respeito do consumo de transgênicos em seres
humanos ainda não são encontradas na literatura.
1.4.5 Conclusão Parcial
Pode-se concluir que o cultivo das sementes de soja T e NT em casa de
vegetação foi eficiente, pois conseguiu-se atingir o estágio de obtenção de
sementes. A extração e separação das proteínas presentes nas sementes de
soja também se mostraram adequadas. Com o perfil proteômico obtido, foi
possível realizar o estudo por 2-D DIGE, que permitiu a visualização dos spots
55
diferenciais, em termos de abundância, entre as gerações das sementes de soja
T e NT. O número de identificação atribuído aos spots foi considerado satisfatório
com 84%. Nesse sentido, a soja transgênica pode ser considerada mais robusta
em comparação com a não-transgênica, pois, um menor número de spots
diferenciais foi observado entre as sementes T de diferentes gerações.
56
Capítulo 2-
Análise metabolômica de duas
gerações de soja transgênica e não-
transgênica
57
2.1 INTRODUÇÃO Os metabólitos são moléculas pequenas (até 1000 Da) que são
quimicamente transformadas durante o metabolismo de um organismo,
proporcionando uma leitura funcional do estado celular. Ao contrário dos genes,
RNA e proteínas, que estão sujeitos a regulação epigenética e modificações pós-
traducionais, os metabólitos não são codificados diretamente no genoma, mas
eles servem como uma assinatura direta de uma atividade bioquímica. Por esta
razão, os metabólitos são diretamente correlacionados com o fenótipo, sendo
uma ferramenta útil para a caracterização de amostras biológicas e relacionando
a atividade molecular celular com o fenótipo da planta (Baker, 2011; Patti, 2011).
Geralmente, a classe dos metabólitos inclui espécies orgânicas, tais como
aminoácidos, ácidos graxos, carboidratos, lipídeos e vitaminas, bem como
espécies inorgânicas e elementares.
Determinar a composição química de um organismo é uma tarefa
desafiadora devido à alta, rica e complexa diversidade química em um extrato
bruto. Estima-se que o reino vegetal apresente mais de 200.000 metabólitos, no
entanto, apenas um quarto deles tiveram sua composição conhecida (Oksman-
Caldentey et al., 2004). O desenvolvimento da metabolômica fornece a
informação necessária sobre os níveis de metabólitos que permitem a avaliação
de mudanças para respostas a diferentes perturbações do organismo. Esta
perturbação pode ser devido a, por exemplo, produtos farmacêuticos, estresse
ambiental, mudanças relacionadas à dieta, modificações genéticas ou
contaminantes dos alimentos.
Assim como em proteômica, para determinar a composição total de
metabólitos em um organismo são necessárias técnicas de alta precisão e
sensibilidade. Avanços em tecnologias no campo da metabolômica com técnicas
hifenadas de separação e identificação e alta resolução de espectros de massa
tem contribuído para a elucidação desses desafios. As técnicas de separação
como eletroforese capilar (CE, do inglês - Capillary electrophoresis),
cromatografia líquida (LC, do inglês - liquid chromatography) e cromatografia
gasosa (GC, do inglês – gas chromatography) acoplada à espectrometria de
massa (MS) foram recentemente comparada para determinar qual a técnica mais
apropriada para a quantificação de metabólitos. Com base na cobertura,
58
sensibilidade, facilidade de uso, robustez à matriz e na operação de rotina, a
técnica de LC foi identificada como a plataforma ideal para separações dos
metabólitos (Buscher et al., 2009). A maior vantagem de utilizar LC é que é
compatível com os solventes geralmente utilizados para extração das amostras
como metanol e água, compostos polares de alta massa molecular podem ser
analisados sem reações de derivatização e LC-MS/MS também possibilita obter
a informação estrutural dos compostos (de Voz, et al., 2006).
Grande parte do sucesso da LC é baseado no método de eluição por fase
reversa que apresenta algumas vantagens em comparação com a fase normal,
entre elas pode-se citar o uso de uma fase móvel menos tóxica, fases
estacionárias estáveis, rápido equilíbrio de coluna depois de mudar a fase móvel
e, ainda, o fácil uso de eluição por gradiente com boa reprodutibilidade nos
tempos de retenção (Osiso, et al., 2008).
As técnicas analíticas para identificação dos metabólitos mais utilizadas
são: ressonância magnética nuclear (RMN) e espectrometria de massas (MS, do
inglês - mass spectrometry). Devido a limitações de sensibilidade em
RMN, a aplicação da MS neste campo está crescendo cada vez mais. Como
escrito no capitulo 1, a MS é uma técnica analítica que permite discriminar íons
de acordo com a relação massa/carga (m/z) de cada espécie analisada. Para
isso uma fonte de ionização é necessária, um analisador de massas e um
detector. Novamente analisadores de alta resolução como TOF e armadilha de
íons (Orbitrap), são os mais utilizados em estudos metabolômicos.
A ionização por eletrospray (ESI, do inglês – electrospray ionization) é
comumente empregada por ser considerada suave e pode ionizar desde grandes
moléculas como as proteínas até pequenas moléculas como os metabólitos. O
processo de ionização ocorre devido a uma alta tensão na fonte que está em
contato com a solução contendo os analitos. Nesta solução é aplicado um
potencial positivo ou negativo o qual gera os íons por redução ou oxidação. A
evaporação do solvente ocorre por meio de um fluxo de gás aquecido
(nitrogênio) permitindo que apenas íons isentos de solvente sejam
encaminhados ao analisador.
O analisador de massas do tipo TOF baseia-se na teoria de que a massa
de um íon está relacionada a velocidade do seu vôo ao longo do tubo e, portanto,
o tempo de chegada no detector é proporcional a sua massa. Já os analisadores
59
baseados em armadilhas de íons são ligeiramente diferentes. O objetivo é isolar
íons de baixa abundância enquanto estão presos, construindo uma população
de íons específicos para as análises posteriores (Mokochinski, 2017).
Os métodos de análise de um metaboloma continuam em
desenvolvimento, mas basicamente, podem ser resumidos em três formas. Uma
delas é a análise de metabólitos alvo, onde um pequeno conjunto ou classe
especifica de moléculas são pré-selecionadas e a análise é focada nesse grupo.
Para isso curvas de calibração e padrões de comparação são necessários e as
respostas são obtidas em concentração (targeted metabolomics). Outro método
é a análise de um perfil metabólico, neste, é realizado a identificação e a
quantificação relativa do número máximo de metabólitos (targeted
metabolomics). Para isso, os espectros de massa são processados e
convertidos em ID’s usando um software adequado e a comparação entre as
áreas dos picos é realizada. Por fim, um fingerprint metabólico também pode ser
adquirido (untargeted metabolomics). Esta é uma análise rápida de classificação
da amostra contendo metabólitos sem a realização de identificação dos
compostos. As amostras geralmente são injetadas no espectrômetro de massas
com separação prévia em cromatografia líquida ou gasosa e os dados podem
indicar diferenças entre as amostras em questão se utilizado um programa de
analise multivariada adequado (Vilas-Bôas e Gombert, 2006).
Os estudos em metabolômica seguem algumas etapas básicas, iniciando
com o objeto de estudo, que pode ser a comparação de diferentes tratamentos
aplicados em uma amostra por exemplo, seguindo por um fluxo de trabalho, que
é a parte mais importante da metodologia. O fluxo geralmente envolve o preparo
da amostra com posterior aquisição de dados, seguido do processamento de
dados e análise estatística, por fim, a identificação dos metabólitos. A última
etapa realizada é a interpretação biológica com base nos metabólitos
identificados.
Normalmente, os dados multidimensionais são convertidos em gráficos
2D ou 3D, permitindo uma interpretação visual mais significativa. Uma análise
muito comum é a PCA (do inglês, Principal Component Analysis), que é uma
análise exploratória e é baseada na redução dos dados, onde informações
desnecessárias como ruído e resíduos dão descartados.
60
Outro método exploratório destinado a encontrar similaridade entre as
amostras é o HCA (do inglês, Hierarchical Cluster Analysis) que usa informações
para combinar um cluster (aglomerado), medindo diferenças em conjuntos de
observações. Por outro lado, se o objetivo da análise de dados for a classificação
ou regressão dos dados, modelos preditivos como PLS (do inglês, Partial Least
Squares) podem ser utilizados.
Neste sentido, um estudo mostrou a importância da luz para o crescimento
e enchimento das sementes de soja por meio dos metabólitos, uma vez que a
luz induz a geração de ATP (Allen, 2009). Outro estudo mostrou que a
germinação das sementes foi regulada pela produção de etileno e espécies
reativas de oxigênio (ROS) (Ishibashi, 2013). Um estudo comparativo realizado
na Espanha entre os metabólitos da soja T e NT foi obtido por meio da
eletroforese capilar acoplada a um espectrômetro de massas (TOF). Os autores
indicam que muitos dos metabólitos encontrados não são alterados entre as
variedades T e NT. No entanto, alguns deles apresentam diferenças
significativas, como prolina, histidina, aspargina e ácido glucônico, que estão
mais abundantes na soja convencional do que na transgênica (Garcia-Villalba et
al., 2008).
A utilização de analisadores de relação m/z de alta resolução como FT-
ICR para a análise metabolômica vem sendo pouco relatada devido ao alto custo
do equipamento e a quantidade de dados gerados. No entanto, este pode
fornecer análises precisas e exatas permitindo obter uma correspondência entre
massas exatas para composições elementares a possíveis metabólitos, dando
como resultado, por exemplo, a geração de mapas metabólicos específicos para
cada organismo. León et al. (2009), mostraram o potencial desta técnica na
análise e identificação de metabólitos em amostras de milho geneticamente
modificado, com posterior avaliação estatística, para sugerir íons que
diferenciam as variedades T e NT.
Baseado nisto, foi realizada uma análise untargeted do metaboloma nas
diferentes gerações de sementes de soja transgênica e não-transgênica
estudadas no capitulo 1, a fim de conhecer se existem diferenças em nível
molecular entre as mesmas.
61
2.2 OBJETIVOS O objetivo principal desse Capítulo (como no anterior) foi o de investigar
de forma comparativa os efeitos que o cultivo consecutivo pode causar em nível
molecular entre as sementes de soja T e NT empregando análise metabolômica
comparativa. Como objetivos específicos têm-se:
i. Plantar e cultivar as sementes de soja T e NT, em condições
idênticas, até sua terceira geração;
ii. Avaliar uma solução extratora adequada para a extração dos
metabólitos das sementes de soja;
iii. Avaliar o perfil metabolômico por meio de espectrometria de
massas (acoplada ou não a cromatografia líquida);
iv. Identificar e caracterizar o maior número de compostos;
v. Avaliar se houve alguma alteração diferencial e ao longo das
gerações de sementes;
2.3 MATERIAIS E MÉTODOS
2.3.1 Reagentes e equipamentos Os reagentes utilizados para a extração dos metabólitos foram todos de
grau HPLC como: metanol, acetonitrila, CCl4 (Sigma Aldrich). Um espectrômetro
de massas do tipo ICR (Thermo Scientific) foi utilizado para a análise de
metabólitos baseada em fingerprint e para um perfil metabólico foi utilizado um
cromatógrafo líquido de alta eficiência acoplado a um QTOF (LC-MS). Os demais
materiais foram descritos no item 1.3.1 deste trabalho.
2.3.2 Extração e análise de metabólitos
Os metabólitos das sementes de soja T e NT da segunda e da terceira
geração foram extraídos de acordo com metodologia proposta por de Vos et al.
(2007) com algumas modificações. As sementes foram maceradas em nitrogênio
líquido, em seguida, pesou-se uma massa de 100,0 mg e a extração foi realizada
com 1 mL de solução de metanol/água (70:30 v/v) em ultrasonicador durante 30
62
s com condições de tratamento em modo de pulso 10 s on-off em 3 ciclos e 50%
de amplitude. Depois disso as amostras foram centrifugadas durante 5 min a
13000 g, sendo recolhido o sobrenadante das extrações, diluído e diretamente
analisado por espectrometria de massas. Os fingerprints foram adquiridos em
um espectrômetro de massas de alta resolução do tipo ICR com modo de injeção
direta controlado pelo software Xcalibur 2.0 (Thermo Scientific). As análises
foram conduzidas em modo positivo e negativo e os dados espectrais obtidos na
faixa de m/z 50 – 1000 com 100.000 de resolução na m/z 400.
Foram testados 3 protocolos de extração diferentes utilizando um pool de
50 mg das sementes já maceradas em N2 (l). O primeiro protocolo utilizou 800
μL MeOH + 200 μL H2O, o segundo utilizou 150 μL H2O + 190 μL CCl4 + 375 μL
MeOH e por fim, o terceiro protocolo utilizou 200 μL MeOH + 540 μL MTBE.
Todos os protocolos foram testados em triplicata e as amostras agitadas em
vórtex por 30 min bem como em ultrasonicador (do tipo cup-horn) empregando
uma amplitude de 50% durante 1 min (10 s on-off) separadamente, a fim de
comparação. Após essa etapa, todas as soluções foram centrifugadas e o
sobrenadante foi analisado diretamente após diluição por LC-MS do tipo QTOF
(Agilent Technologies) equipado com fonte ESI. Os dados espectrais foram
obtidos na faixa de m/z 100 – 1500 utilizando 3 μL de amostra por injeção durante
uma corrida cromatográfica de 25 min com um gradiente linear de 5-95% da
solução B (0,1 % de ácido fórmico em ACN) com vazão de 400 μL min-1.
2.3.3 Pré-processamento de dados e análise multivariada
Os cromatogramas foram pré-processados utilizando a ferramenta online
XCMS. Inicialmente os cromatogramas foram tratados para eliminação de ruído
e correção da linha de base. Em seguida, foram alinhados para corrigir possíveis
desvios do tempo de retenção. Os dados foram exportados para uma tabela e
posteriormente submetidos a análise multivariada por meio da ferramenta online
MetaboAnalyst (Xia, Sinelnikov, Han, & Wishart, 2015). Os valores da tabela,
contendo as intensidades dos íons, foram normalizados pela média e
transformação logarítmica (10log). O resultado foi posteriormente escalonado
pelo método de Pareto (centrado na média e dividido pela raiz quadrada do
desvio padrão de cada variável). As diferenças significativas entre os grupos de
63
amostras foram avaliadas a partir de Análise de Variância (ANOVA, p < 0,05). A
análise dos componentes principais – PCA (do inglês – principal component
analysis) e análise hierárquica de clusters HCA (do inglês – hierarchical cluster
analysis) foram utilizadas como uma abordagem não supervisionada, fazendo
uma revisão simplificada das amostras e variáveis, indicando possíveis outliers.
A análise discriminante para projeção de estrutura latente (PLS-DA, do inglês -
Projection to Latent Structure Discriminant Analysis) foi empregada para
encontrar metabólitos significativos, usando um modelo discriminante construído
por variáveis latentes. Heatmaps foram utilizados para encontrar padrões entre
replicatas e tratamentos.
A identificação dos metabólitos foi realizada seguindo as regras descritas
por Sumner et al. (2007), sendo classificados em quatro níveis: metabólitos
identificados por comparação com padrões (nível 1), compostos supostamente
identificados (nível 2), classes de compostos identificados (nível 3) e compostos
desconhecidos (nível 4). Os metabólitos selecionados foram verificados
manualmente utilizando um banco de dados interno baseado em comparações
de tempo de retenção, massa exata, composição isotópica e informação MS/MS.
Foram também utilizadas bases de dados de metabólitos disponíveis online, tais
como KNApSAcK, Kegg e MassBank.
2.4 RESULTADOS E DISCUSSÃO
2.4.1 Plantio e cultivo da soja
Resultado discutido no item 1.4.1 deste trabalho, pois foi usado o mesmo
cultivo de sementes.
2.4.2 Análise de metabólitos
A análise dos metabólitos das sementes de soja T e NT das três gerações
foi realizada com o intuito de se obter, primeiramente, um perfil químico entre as
variedades estudadas para explorar se existem ou não diferenças entre as
64
mesmas. O método de obtenção da composição química (fingerprint) das
amostras foi adquirido em modo negativo e positivo de ionização, no entanto, os
resultados em modo positivo não se mostraram adequados para descrever as
amostras uma vez que durante o tratamento de dados (discutido a seguir) não
foi observado separação entre os grupos e estes não serão apresentados. As
Figuras 10 e 11 representam os dados obtidos.
Figura 10. Fingerprint das amostras de sementes de soja T 1, 2 e 3G na m/z 100 à 1000
por ESI (-) FT-ICR MS.
100 200 300 400 500 600 700 800 900 1000
m/z
0
20
40
60
80
100
0
20
40
60
80
100
Re
lative
Ab
un
da
nce
0
20
40
60
80
100711.22
665.22191.02
387.11341.11
533.14637.14325.18 729.23258.99 833.52 921.49 987.52401.13 503.16
129.02
711.22
665.22191.02
387.12341.11 533.14729.23
601.11475.13 763.19325.18 833.52 921.49239.08133.01 987.52
651.23
665.22
711.22
191.02
341.11387.12
533.14637.14 763.19475.13 833.52 921.49325.18239.08133.01 987.52
717.16
NL: 1.05E5
1T1G_neg_ok#239-250 RT: 0.66-0.86 AV: 12 T: FTMS - p ESI Full ms [100.00-1000.00]
NL: 7.23E4
1t2g_neg_ok#232-243 RT: 0.66-0.86 AV: 12 T: FTMS - p ESI Full ms [100.00-1000.00]
NL: 7.51E4
1t3g_neg_ok#234-244 RT: 0.66-0.85 AV: 11 T: FTMS - p ESI Full ms [100.00-1000.00]
65
Figura 11. Fingerprint das amostras de sementes de soja NT 1, 2 e 3G na m/z 100 à
1000 por ESI (-) FT-ICR MS.
De modo geral, observa-se nas Figuras 10 e 11 que, independente da
geração analisada, o perfil químico é bastante similar de acordo com os
espectros de massas, e não foi possível avaliar qualquer relação entre os
metabólitos das sementes de soja. Pode-se estimar uma mudança entre os perfis
T e NT em relação a intensidade de alguns íons. Para melhorar a compreensão
dos resultados, foi realizado uma análise dos componentes principais (PCA) -
uma ferramenta estatística que permite que a dimensionalidade dos dados
originais seja reduzida por meio do cálculo desses componentes principais, a fim
de obter uma visão geral da variação, de modo que grupos e tendências possam
ser identificados entre as amostras. A razão pela qual tal redução é possível se
refere as variáveis que são correlacionadas uma com a outra.
A Figura 12 apresenta os resultados obtidos em 3 fatores, onde é possível
observar uma nítida separação entre dois grandes grupos das amostras T e NT,
e também entre as gerações 1, 2 e 3, confirmando o fato de que, em nível
molecular, as sementes de soja T são diferentes das sementes de soja NT.
100 200 300 400 500 600 700 800 900 1000
m/z
0
20
40
60
80
100
0
20
40
60
80
100
Re
lative
Ab
un
da
nce
0
20
40
60
80
100191.02
683.23
711.22665.22
387.11341.11533.14
729.23601.11475.13239.08 325.18
859.22445.12133.01 911.51763.20 987.52
683.23
191.02665.22 711.22
341.11387.12 533.14
729.23555.11 834.56133.01 239.08
325.18
637.14
911.51763.19401.13 957.51
683.23
711.22665.22
191.02475.13341.11 387.12
729.24533.14239.08 601.11133.01 911.51
325.18763.19 833.52439.08 957.51
NL: 6.54E4
1NT1G_neg_ok#234-245 RT: 0.64-0.85 AV: 12 T: FTMS - p ESI Full ms [100.00-1000.00]
NL: 6.42E4
1nt2g_neg_ok#229-240 RT: 0.65-0.85 AV: 12 T: FTMS - p ESI Full ms [100.00-1000.00]
NL: 6.16E4
1nt3g_neg_ok#255-266 RT: 0.64-0.85 AV: 12 T: FTMS - p ESI Full ms [100.00-1000.00]
66
Figura 12. PCA das sementes de soja analisadas que representam a análise de
metabólitos entre as mesmas.
Ao considerar todos os dados de massa obtidos pelo FT-ICR-MS sem
qualquer filtro por software, um número muito maior de sinais poderia ser
encontrado, mas sem qualquer informação estrutural, somente sua composição
elementar. Desse modo, baseado na alta resolução (100.000) do analisador de
m/z, conseguiu-se resolver alguns dos íons presentes nos espectros, bem como
a fórmula molecular mínima, por meio da exatidão de massa, apresentado na
67
Tabela 4, para as sementes T e NT de segunda e terceira geração, pois estas
foram cultivadas sob as mesmas condições.
Tabela 4. Identificação putativa de metabólitos presentes nas sementes de soja das
diferentes gerações obtidos por massa exata em analisador de massas ICR.
Possível composto* Massa
Molecular
(ICR)
Fórmula
Molecular
Erro
(ppm)
T2G NT2G T3G NT3G
Unknow 443.19255 C21H31O10 3.106 sim sim sim sim
Daidzein 7-O-malonyl glucoside
(daidzin)
501.10410 C24H21O12 2.689 sim sim sim sim
6-Methoxytaxifolin 333.05920 C16H13O8 -3.885 sim sim sim sim
Genistein 269.04535 C15H9O5 3.346 sim sim sim sim
Ɣ-L-Glutamyl-l-tyrosine 309.10912 C14H17O6N2 3.359 sim sim sim sim
Ɣ -l-Glutamyl-l-phenylalanine 293.11416 C14H17O5N2 3.282 sim sim sim sim
Gluconic acid (l-gluconate) 195.05076 C6H11O7 4.260 sim sim sim sim
Tetrahydroxypentanoic acid (l-xylonate) 165.04020 C5H9O6 5.063 sim sim sim sim
Glutamic acid 146.04564 C5H8O4N 5.860 sim sim sim sim
Taxifolin 3-rhamnoside 449.10994 C21H21O11 4.681 não não sim não
Kushenol B 505.24807 não não sim não
N-acetyl-l-glutamate 5-semialdehyde 172.06120 C7H10ON4 4.450 não não sim não
Trihydroxypentanoic acid 149.04530 C5H9O5 5.704 não não sim não
4-Hydroxy-4-methyl glutamate 176.05615 C6H10ON5 4.550 não não não sim
Medicarpin 3-O-glucoside 431.14095 C22H23O9 16.912 não não não sim
Trihydroxybutanoate (threonate) 135.02960 C4H7O5 5.926 sim não não não
Aspartic acid 132.02998 C4H6O4N 6.406 não sim não não
Daidzein 7-O-glucoside (daidzin) 415.10387 C21H19O9 3.6 não sim não não
Fuconate 179.05586 C6H11O6 4.722 sim sim sim não
* Compostos encontrados de acordo com a tabela de Garcia-Villalba (2008).
A Tabela 4 mostra que, por meio da busca no site ChemSpiderSearch and
share chemistry, foi possível encontrar 19 metabólitos que estão presentes (ou
não) nas gerações das sementes de soja T e NT segundo estudo realizado por
Garcia-Villalba (2008). Esses metabólitos pertencem a diversas classes, tais
como isoflavonas, aminoácidos, ácidos carboxílicos, peptídeos, entre outras. Os
primeiros nove metabólitos apresentados na Tabela 4 foram observados em
todas as gerações de sementes T e NT e, sendo assim, não são relevantes para
descreverem as amostras. Se forem comparadas as sementes T, observa-se
que quatro metabólitos estão presentes apenas na 3G, sendo eles, taxifolin 3-
rhamnoside, kushenol B, N-acetyl-l-glutamate 5-semialdehyde e
trihydroxypentanoic acid. Desses, os três primeiros citados, estão envolvidos em
68
rotas de biossíntese de flavonas e amino grupos (Garcia-Villalba, 2008).
Considerando que a EPSPS é a enzima chave da rota de biossíntese da
shikimato (precursor na formação de amino ácidos aromáticos) é plausível que
a síntese desses compostos esteja alterada nas gerações das sementes
transgênicas. Entre as gerações de sementes NT, a molécula 4-hydroxi-4-methyl
glutamate e Medicarpin 3-O-glucoside foram também encontradas apenas na
3G. Esses dados podem indicar que as sementes estão sofrendo alterações em
nível molecular quando cultivadas em gerações consecutivas. García-Villalba et
al. (2008), realizaram um estudo comparativo entre sementes de soja T e NT
com relação a seus metabólitos empregando as técnicas de eletroforese capilar
e espectrometria de massas, identificando 45 compostos. Os autores concluíram
que as sementes não apresentam mudanças relevantes, apesar do metabólito
4-hidroxy-L-threonine não ter sido observado na semente transgênica.
A soja tem sido considerada abundante no conteúdo de flavonoides e de
isoflavonas, que são predominantes em suas sementes (Miernyk e Johnston,
2013). Alguns flavonoides identificados nesse estudo foram: 6-Methoxytaxifolin,
Daidzin, Genistin, entre outros. Um estudo realizado por Leon et al. (2009),
avaliou três diferentes variedades de milho transgênico e sua respectiva linha
exógena de milho convencional, cultivados da mesma maneira, por meio da
técnica de FT-ICR MS. De acordo com os resultados, foi possível observar um
maior número de compostos no milho transgênico e que, ainda, algumas vias
metabólicas foram alteradas na variedade transgênica se comparada a
convencional do milho.
Após avaliar esses resultados e sabendo que infusão direta por FT-ICR
MS não pode diferenciar compostos isômeros e também devido a possível
acrescentar supressão iônica, uma dimensão analítica adicional foi necessária
para determinar/confirmar a identidade dos íons observados e possivelmente
outros. Abordagens utilizando LC-MS tem sido utilizada pois podem separar e
detectar melhor os metabólitos presentes na amostra como muitos compostos
semi-polares, de metabolismo primário e secundário. Sendo assim, um
experimento com um pool de sementes foi realizado por um LC-MS (Agilent
Technologies) em modo positivo e negativo de ionização, e a partir de diferentes
protocolos de extração, com o intuído de se obter uma condição de análise
adequada para que um maior número de íons pudesse ser observado. No
69
entanto, novamente o modo positivo não foi eficiente para descrever as amostras
e somente o modo negativo será apresentado na Figura 13.
Figura 13. Análise por LC-MS de um pool de sementes de soja (A) protocolo 1 utilizando
Vórtex (vermelho) e ultrasonicador (preto) como sistema de extração; (B) Protocolo 1
(preto), 2 (vermelho) e 3 (verde) utilizando ultrasonicador como sistema de extração.
Por meio da Figura 13 (A) pode-se observar que não houve diferenças no
perfil cromatográfico entre os sistemas de extração utilizados no preparo da
amostra. Como o ultrasonicador depende de um menor tempo com eficiência
semelhante ao vórtex, este foi escolhido como ideal para seguir com as análises
dos diferentes protocolos como descrito no item 4.7. deste trabalho. Observa-se
que o protocolo 1, o qual apresenta característica polar, foi o qual mostrou um
maior número de picos no cromatograma e assim uma melhor extração de
acordo com a Figura 13 (B), abrangendo compostos polares e semi-polares. Um
pico de alta intensidade no tempo de retenção aproximado de 16 min foi
observado no protocolo 2, que apresenta característica mais apolar se
comparada aos outros protocolos. No entanto, apesar da baixa intensidade, esse
mesmo pico também foi observado nos outros protocolos. Como a análise visa
70
obter diferenciação entre as amostras, neste momento, o maior número de íons
pode trazer um maior número de informações.
Portanto o protocolo 1, que utilizou o ultrasonicador como sistema de
extração foi escolhido para as posteriores análises dos metabólitos das
sementes de soja em suas gerações. Acredita-se que nesse protocolo, um maior
número de compostos semi-polares pode ser observado, devido a polaridade do
solvente utilizado, no entanto, metabólitos primários – que são mais polares -
como ácidos orgânicos, amino ácidos, açúcares, entre outros, podem co-eluir
com outros compostos resultando na supressão dos íons.
Após obter os dados, as diferenças significativas entre os grupos de
amostras (genotípicas e geracionais) foram observadas (p < 0,05) por meio da
análise cromatográfica por UHPLC-HRMS. Para melhor visualizar a variabilidade
dos resultados, os dados multidimensionais foram convertidos em
representações bidimensionais (PCA – 2D), permitindo uma interpretação visual
das variações mais significativas do conjunto de dados. O resultado dessa
análise exploratória permitiu identificar quatro grupos distintos. A componente
principal 1 (PC1) descreveu 44,4% da variância dos dados, enquanto na
componente 2 (PC2) foi observado 15,8%, totalizando 60,2% da variância em
apenas dois componentes. A Figura 14 representa os resultados obtidos.
71
Figura 14. Scores plot 2D de PCA dos grupos de soja transgênica (T) e não transgênica
(NT) de segunda (2nd) e terceira (3rd) geração. Elipses representam intervalo de
confiança de 95% entre os grupos.
Os quatro grupos foram separados por diferentes cores e as elipses
representam intervalo de confiança de 95% entre os grupos. Observa-se que na
PC1 é possível discriminar o efeito genotípico (T e NT), indicando que a maior
variabilidade dos dados está relacionada à transgenia. No que diz respeito ao
efeito geracional, também são observados diferenças entre os grupos de
amostras. A maior variabilidade está relacionada ao grupo de não-transgênicos
(NT). A partir da análise do perfil metabólico das amostras de transgênicos da
segunda e terceira geração, foi observada menor variabilidade (e maior
similaridade), característica evidenciada pela sobreposição elíptica. Outro
72
método de análise exploratória utilizado para identificar tendências e
similaridades entre as amostras é o HCA, o qual é representado pela Figura 15.
Figura 15. Gráfico de HCA dos grupos de soja transgênica (T) e não transgênica (NT)
de segunda (2nd) e terceira (3rd) geração.
Na Figura 15 é possível observar que as amostras foram agrupadas
corretamente e todas pertencem as suas respectivas classes.
Para construção do modelo de regressão multivariada, utilizou-se PLS-
DA, que consiste em um método matemático para combinação linear das
variáveis e construção de modelos de classificação e predição. Após
classificação, o modelo avalia a significância das variáveis através de
permutação para classificar as amostras. A Figura 16 representa os resultados
obtidos.
73
Figura 16. Scores plot 2D de PLS-DA dos grupos de soja transgênica (T) e não
transgênica (NT) de segunda (2nd) e terceira (3rd) geração.
A Figura 16 mostra o gráfico da análise discriminante, com a componente
1 descrevendo 35,7% da variância e a componente 2, 23,2%. Observa-se que o
resultado obtido através de PLS-DA é comparável com PCA. Em ambas as
análises (Figuras 14 e 16), pode-se observar que houve uma separação entre
os grupos T e NT na componente 1. Na PLS-DA fica evidente a distinção
geracional (segunda e terceira geração) na componente 2.
Por meio das Figuras 14, 15 e 16, pode-se observar que houve uma boa
separação entre os grupos T e NT e também com relação as suas gerações,
resultando em exatamente quatro pequenos grupos. Os dados sugerem que as
amostras transgênicas apresentaram uma menor variação no nível de
74
metabólitos, pois estes estão sobrepostos na Figura 16. Estes dados corroboram
com os dados obtidos para a análise proteômica, os quais apresentaram um
menor número de proteínas diferenciais entre os grupos de soja transgênica, de
acordo com a Tabela 3, se comparado com os grupos não-transgênicos.
As variáveis utilizadas no modelo foram organizadas de acordo com sua
importância na projeção (VIP, do inglês - Variable Importance in Projection) e as
25 mais discriminatórias são exibidas na Figura 17. Esses 25 íons também são
exibidos em um gráfico de heatmap (Figura 18) e alguns deles estão listados na
Tabela 5 de identificação.
Figura 17. Ranking das variáveis utilizadas pelo modelo de PLS-DA para classificação
das amostras. As caixas coloridas à direita indicam as intensidades relativas de cada
íon-ID.
75
Figura 18. Heatmap com os 25 metabólitos superiores classificados pela PLS-DA. Os
números apresentados no lado direito da figura são referentes a classificação do
processamento de dados. Variedades da soja e gerações (T2G, T3G, NT2G e NT3G)
são identificadas por cores acima do mapa.
Por meio da Figura 18, dois blocos principais de metabólitos foram
claramente identificados no gráfico de heatmap. O primeiro bloco (as primeiras
7 fileiras do topo) mostra um grupo de metabólitos que têm uma abundância
relativamente alta em plantas transgênicas, cuja abundância diminui em plantas
não-transgênicas. Os metabólitos do segundo bloco (demais fileiras), mostram
um efeito oposto, independente das gerações.
Se avaliarmos, no segundo bloco de metabólitos, a relação entre T2G e
NT2G, e também T3G e NT3G, observa-se uma tendência de os metabólitos
76
serem menos abundantes nas amostras transgênicas. Isso mostra, que as
gerações podem também influenciar no metabolismo da planta. A Tabela 5
mostra a identificação de alguns dos íons da Figura 18 e ainda, os demais que
puderam ser identificados nesse estudo.
77
Tabela 5. Lista de compostos identificados nas análises por LC-MS dos grupos de soja.
ID Tempo de
retenção
(min)
Massa
Experimental
KEGG_ID Nome do metabólito Formula
Molecular
Massa Teórica Desvio de
Massa
Nível Classe/Função
119 14,14 340,1282 C15509 Glyceocarpin C20H20O5 340,1311 -0,0029 2 Flavonoide
1424 13,02 210,1268 C08491 (-)-Jasmonic acid C12H18O3 210,1256 0,0012 2 Biosint. De metab.
Secundário 1575 11,77 336,0968 C10529 Sojagol C20H16O5 336,0998 -0,003 2 Flavoinode
1348 11,05 364,1478 C03579 Gibberellin A8 C19H24O7 364,1522 -0,0044 2 Lipídio
118 10,39 332,1616 C02035 Gibberellin A20 C19H24O5 332,1624 -0,0008 2 Lipídio
1146 9,45 942,5186 C08983 Soyasaponin I C48H78O18 942,5188 -0,0002 2 Terpenoide
1418 8,73 958,5178 C15428 Asiaticoside C48H78O19 958,5137 0,0041 2
524 6,6 284,0951 C07576 Psilocybin C12H17N2O4P 284,0926 0,0025 2 Alcalóide
616 6,35 254,0821 C05945 L-Arginine phosphate C6H15N4O5P 254,078 0,0041 2 Metabolismo secundário
563 0,99 429,1910 C20167 7-Benzylidenenaltrexone C27H27NO4 429,194 -0,003 2 Receptor de peptídeo
565 0,97 261,1471 C07790 Phenindamine C19H19N 261,1518 -0,0047 2 Sistema respiratório
114 4,78 518,1556 C12116 Esmeraldic acid C30H22N4O5 518,159 -0,0034 2
17 11,48 506,2124 C01593 Limonoate C26H34O10 506,2152 -0,0028 2
304 1,01 445,1862 C07862 Tridihexethyl iodide C21H36NO. I 445,1842 0,002 2
1278 10,38 180,0438 C01179 Aminoácido C9H8O4 180,0423 0,0015 3 Aminoácido
214 9,34 224,1412 C01760 Lipídeo C13H20O3 224,1412 0 3 Lipídeo
296 4,92 432,1457 C14942 Flavonoide C22H24O9 432,142 0,0037 3 Flavonoide
78
Todos os compostos identificados neste estudo por UHPLC-HRMS estão
listados na Tabela 5. É importante destacar o baixo desvio de massa obtido para
as identificações, o que mostra um resultado confiável. Dos 25 compostos que
foram mais discriminatórios das amostras de acordo com o PLS-DA, 9 deles
puderam ser identificados e estão apresentados na Tabela 5, são eles: ID 524,
616, 563, 565, 114, 17, 304, 214 e 296. O ID 214 foi um dos mais discriminantes
entre e representa o íon de massa 224,1412 g mol-1. Esse íon apresentou mais
de um possível composto e, portanto, foi classificado como nível 3, de acordo
com a sua classe funcional, lipídeo. Assim também o ID 296, que representa a
massa 432,1457 g mol-1, foi classificado em nível 3 e é um flavonoide. Os demais
ID’s do PLS-DA que tiveram sua identidade conhecida, foram classificados como
nível 2, são eles: Psilocybin, L-Arginine phosphate, 7-Benzylidenenaltrexone,
Phenindamine, Esmeraldic acid, Limonoate, Tridihexethyl iodide.
Desses compostos, o Psilocybin chama atenção por ser derivado de um
alcaloide o qual participa da biossíntese do Shikimato, que é a enzima
responsável pela formação dos compostos aromáticos e é inibida pelo glifosato,
nas plantas de soja não-transgênicas, como representado pela Figura 1 dessa
tese. Por meio do Heatmap (Figura 18), observa-se que esse metabólito está
mais abundante nas plantas NT do que nas T, e que na segunda geração
apresenta elevada abundância.
Observa-se uma tendência por meio da Figura 18, onde os íons que foram
discriminatórios, apresentam-se mais abundantes na variedade não transgênica
e também na segunda geração da planta. Provavelmente as plantas NT
precisam produzir um maior conteúdo desses metabólitos. Isso mostra que as
plantas T tem uma vantagem em relação as plantas NT.
Outros 8 compostos tiveram sua identidade conhecida e 7 deles foram
classificados em nível 2, são eles: Glyceocarpin, (-)-Jasmonic acid, Sojagol,
Gibberellin A8, Gibberellin A20, Soyasaponin I, Asiaticoside, apenas 1 foi
classificado como nível 3, um aminoácido.
O metabólito Soyasaponin I, pertence a classe das soya saponins e nos
últimos anos vem sendo alvo de estudos contra células cancerígenas. Embora
estudos recentes tenham demonstrado um efeito direto das saponinas de soja
em células cancerosas, também são discutidos mecanismos alternativos de
prevenção do câncer por esses agentes (Kervin, 2004). Esse metabólito foi
79
identificado porém como não foi discriminate nas análises estatisticas, não é
possivel afirmar sua abundância nas diferentes variedades estudadas.
O conteúdo de lipídeo se mostrou diferencial entre os metabólitos
identificados, principalmente entre as variedades T e NT. Os lipídeos são
acumulados nas plantas com o objetivo de nutrir o embrião da semente. A soja
é uma semente muito rica no conteúdo de óleo, que são formados a partir de
transformações bioquímicas dos açúcares que se originaram da glicose,
resultante da fotossíntese. Porém quando muito jovem, a soja ainda não faz
fotossíntese e utiliza os lipídeos como fornecedor de energia para o
desenvolvimento da planta. Mais uma vez a planta NT precisou desenvolver um
maior conteúdo de lipídeos em relação a T.
Além disso, as propriedades antioxidantes de produtos naturais e vegetais
como a soja, são muito explorados na literatura e mostram excelentes resultados
contra radicais livres, principalmente devido a alta concentração de compostos
fenólicos e flavonoides. Quimicamente, os compostos fenólicos pertencem a
uma classe de compostos que inclui uma grande diversidade de estruturas
simples e complexas. Caracterizam-se por apresentar em sua estrutura pelo
menos um núcleo aromático contendo substituintes hidroxilados e seus
derivados funcionais (Simões et al., 2004). Nesse estudo, foram identificados 2
metabólitos pertencentes a essa classe, sendo eles: Glyceocarpin e Sojagol.
Novamente esses metabólitos não foram discriminates nas análises estatisticas
e não é possivel afirmar sua abundância nas diferentes variedades de soja
estudadas.
Apesar do pequeno número de trabalhos destinados à elucidação de
metabólitos na soja, 14 compostos identificados pelo nosso estudo também
foram reportados em outros trabalhos da literatura obtendo classificação nível 2.
Nenhum composto pode ser identificado e classificado em nível 1, uma vez que
para isso, seria necessário a análise de um padrão, a qual não foi realizada
devido ao alto custo do mesmo e ainda, devido a intenção desta parte do trabalho
ser exploratória. A identificação desses íons foi realizada de acordo com a
ferramenta online KNApSAcK nos bancos de dados da Glycine max.
Poucos trabalhos na literatura utilizaram até o momento ferramentas
similares as utilizadas nesse trabalho no que diz respeito as análises
metabolômicas comparativa, principalmente se considerarmos a soja como
80
objeto de estudo. No entanto, há trabalhos que discutem a respeito de
organismos transgênicos. Chang et. al. (2014), buscou através da análise de
metabólitos e lipídeos, entender o mecanismo de ação do tratamento com
inseticidas em arroz transgênico (genes cry1Ac e sck) e seu tipo selvagem ou
natural. O método de análise foi validado em um LC-MS de geometria Q-TOF e
como resposta a 24h de tratamento, foi observado que antioxidantes, incluindo
ácido felúrico e sinápico, foram menos abundantes na variedade transgênica.
Um número significativo de flavonoides também foi alterado na variedade
transgênica. Os autores concluíram que a modificação genética afetou o
metabolismo de resposta do arroz quando exposto a um stress provocado pelo
inseticida.
Dessa maneira, as variações observadas no que diz respeito as análises
metabolômicas, leva a estimar que a soja transgênica está buscando um
reequilíbrio nutricional (proteínas e metabólitos) de forma mais efetiva do que a
soja não transgênica. Esse resultado pode ajudar a minimizar alguns mitos com
relação a organismos transgênicos, pois apesar das variações observadas,
nenhuma delas provoca como resposta algo ofensivo para a planta.
2.4.3 Conclusão Parcial
As técnicas analíticas utilizadas nesse Capítulo permitiram a avaliação em
nível molecular das sementes de soja em estudo. Os resultados indicam que
existe uma clara diferença entre as sementes transgênicas e não-transgênicas
no que diz respeito ao conteúdo de metabólitos. Também as gerações de
sementes estudadas indicam que pode haver uma diferença entre os níveis de
metabólitos de uma mesma variedade porem cultivadas em épocas diferentes.
Esses resultados corroboram aos obtidos no Capítulo 1 desta tese.
81
3. CONCLUSÃO FINAL
Dê acordo com o relatado, pode-se concluir que o cultivo das sementes
de soja T e NT em casa de vegetação foi eficiente, pois se conseguiu chegar ao
estágio de obtenção de sementes. A extração e separação das proteínas
também se mostraram adequada visto que com perfil proteômico obtido foi
possível realizar a quantificação relativa das mesmas por meio da técnica 2D-
DIGE. Assim, 89 proteínas se mostraram diferenciais entre os 9 grupos
estudados, no entanto, 79 foram levadas a identificação sendo 67 identificadas
com sucesso. Conclui-se também, que a soja transgênica pode ser considerada
mais robusta com relação a não-transgênica, pois foi observado um número
menor de proteínas diferenciais entre as sementes T de diferentes gerações.
Com relação aos seus metabólitos, fica claro que existe diferença entre
variedades e gerações de soja, corroborando com os dados proteômicos. Sendo
assim, é possível conclui que, de modo geral e em nível molecular, as variedades
de soja transgênica e não-transgênica não apresentam o mesmo metabolismo,
resultando em diferenças no que diz respeito à produção de suas proteínas e
metabólitos. Esse fato não gera até o momento, respostas em relação ao seu
consumo sendo benéfico ou maléfico, uma vez que não foram realizados testes
em seres humanos, mas gera uma proposta de investigação mais profunda para
futuras pesquisas relacionadas a esse tema.
82
4. REFERÊNCIAS
Agapito-Tenfen, S. Z.; Guerra, M. P.; Wikmark, O. and Nodari, R. O. Comparative
proteomic analysis of genetically modified maize grown under different
agroecosystems conditions in Brazil. Proteome Science, 11:46, 2013.
Arruda, S. C. C.; Barbosa, H. S.; Azevedo, R. A.; Arruda, M. A. Z.; Two-
dimensional difference gel electrophoresis applied for analytical
proteomics: fundamentals and applications to the study of plant
proteomics. Analyst, 136:4119, 2011.
Arruda, S. C. C.; Barbosa, H. S.; Azevedo, R. A.; Arruda, M. A. Z.; Comparative
studies focusing on transgenic through cp4EPSPS gene and non-
transgenic soybean plants: An analysis of protein species and enzymes.
Journal of Proteomics, 20:93-107, 2013.
Arruda, M. A. Z.; Galazzi, R. M.; Campos, B. K.; Herrera-Agudelo, M. A.; Arruda,
S. C. A.; Azevedo, R. A.; Soybean as a Food Source: Comparative Studies
Focusing on Transgenic and Nontransgenic Soybean. Genetically
Modified Organisms in Food. Chapter 1. Elsevier, 2015.
Barbosa, H. S.; Tese De Doutorado. Universidade Estadual De Campinas –
Unicamp, 2011.
Barbosa, H. S.; Arruda, S. C. C; Azevedo, R. A; Arruda, M. A. Z.; Analytical
Bionalytical Chemistry, 402: 299-314, 2012.
Baker, M. Metabolomics: from small molecules to big ideas. Nature Methods, v.
8, n. 2, p. 117–121, fev. 2011.
Buscher, J. M. et al. Cross-Platform Comparison of Methods for Quantitative
Metabolomics of Primary Metabolism. Analytical chemistry, v. 81, n. 6, p.
2135–2143, 2009.
Cao, H.; He, M.; Zhu, C.; Yuan, L.; Dong, L.; Bian, Y.; Zhang, W.; Yan, Y.; Distinct
metabolic changes between wheat embryo and endosperm during grain
development revealed by 2D-DIGE-based integrative proteome analysis.
Proteomics, 16, 1515–1536, 2016.
CONAB-Companhia Nacional de Abastecimento; Acompanhamento da safra
brasileira-grãos. v.3, safra 2015/15, N.12, pag. 115-125, décimo segundo
levantamento – Setembro, 2016.
83
Chang, Y; Zhang, L; Lu, X; Zhao, C; Zhu, Z; Wang, Z; Zhang, J; Chen. S; Zhao,
Y; Xu, G; A simultaneous extraction method for metabolome and lipidome
and its application in cry1Ac and sck-transgenic rice leaf treated with
insecticide based on LC–MS analysis. Metabolomics, 10:1197–1209.
2014.
Clement, C.C., et al.; Protein expression profiles of human lymph and plasma
mapped by 2D-DIGE and 1D SDS–PAGE coupled with nanoLC–ESI–
MS/MS bottom-up proteomics. Journal of Proteomics. 78, 172-187. 2013.
Collier, T. S., et al.; Analytical strategies for the global quantification of intact
proteins. Amino Acids. 43,1109–1117. 2012.
De Voz, R. CH., Moco, S., Lommen, A., Bino, R. J., Hall, R. D., Untargeted large-
scale plant metabolomics using liquid chromatography coupled to mass
spectrometry. Nature Protocols, 778, 2007.
Déglon, J., et al.; Direct analysis of dried blood spots coupled with mass
spectrometry: concepts and biomedical applications. Analytical and
Bioanalytical Chemistry. 402, 2485–2498. 2012.
Dunwell J. M, et al. Cupins: the most functionally diverse protein superfamily?
Phytochemistry. 65, 7-17. 2004.
Embrapa – Empresa Brasileira De Pesquisa Agropecuária (Embrapa Soja).
Disponível em: http://www.cnpso.embrapa.br/index.php?op_page=22&
Acesso em 02 de junho de 2014.
Funke, F.; Han, H.; Healy-Fried, M. L.; Fisher, M.; Schonbrunn, E.; Molecular
basis for the herbicide resistance of Roundup Ready crops. PNAS, 103,
13010–13015. 2006.
Galazzi, R. M; Emprego de estratégias ômicas na avaliação de plantas de soja
transgênica e não-transgênica após cultivo com nanoparticulas de prata.
Tese de doutorado. Universidade Estadual de Campinas - UNICAMP,
2017.
Gomez-Cabrero, D., et al; Data integration in the era of omics: current and future
challenges. BMC Systems Biology. 8, 1-10, 2014.
Kervin, S. M. Soy saponins and the anticancer effects of soybeans and soy-based
foods. Current Medicine Chemistry Anticancer Agents. 4 (3):263-72, 2004.
Kim, V. H.; Choi, S. J.; Lee, H. A.; Moon, T. W.; Quantitation of CP4 5-
enolpyruvyshikimate-3-phosphate synthase in soybean by two-
84
dimmensional gel electrophoresis. Journal of Microbiology and
Biotechnology, 16:25-31, 2006.
Kim, H. T.; Choi, U.; Ryu, H. S.; Lee, S. J.; Kwon, O. Mobilization of storage
proteins in soybean seed (Glycine max L.) during germination and
seedling growth. Biochimica et Biophysica Acta, 1814:1178–1187, 2011.
Kléba, J. B.; Riscos e benefícios de plantas transgênicas resistentes a
herbicidas: o caso da soja RR da Monsanto. Cadernos de Ciência e
Tecnologia, 15:9-12, 1998.
Komatsu, S E Ahsan, N.; Soybean proteomics and its application to functional
analysis. Journal of Proteomics, 72:325-336, 2009.
Krzyzowska, M.; Wincenciak, M.; Winnicka, A.; Niemialtowski, M.; The effect of
multigenerational diet containing genetically modified triticale on immune
system in mice. Journal of Veterinary Sciences, 13:423, 2010.
Lay Jr., J. O., et al; Problems with the “omics”. Trends in Analytical Chemistry,
25,1046-1056 , 2006.
Leon, C., Rodriguez-Meisozo, I., Lucio, M., Garcia-Cañas, V., Ibañez, E.,
Schmitt-Kopplin, P., Cifuentes, A. Metabolomics of transgenic maize
combining Fourier transform-ion cyclotron resonance-mass spectrometry,
capillary electrophoresis-mass spectrometry and pressurized liquid
extraction. Journal of Chromatography A, 1216:7314-7323, 2009.
Mataveli, L. R. V.; Fioramonte, M.; Gozzo, F. C.; Arruda, M. A. Z.; Improving
metallomics information related to transgenic and non-transgenic soybean
seeds using 2D-HPLC-ICP-MS and ESI-MS/MS. Metallomics, 4:373-378,
2012.
Miernyk, J. A.; Johnston, M. L.; Proteomic analysis of the testa from developing
soybean seeds. Journal of Proteomics, 265-272, 2013.
Monsanto. Soja Roundup Ready. Disponível Em:
<Http://Www.Monsanto.Com.Br/Produtos/Sementes/Soja_Roundup_Rea
dy/Soja_Roundup_Ready.Asp>. Acessado Em: 05 de Agosto de 2013.
Mokochinski, J. B.; Study of eucalyptus species by untarget and target
metabolomics. Tese de Doutorado. Universidade Estadual de Campinas.
2017.
Natajaran, S. S.; Xu, C.; Bae, H.; Bailey, B. A.; Determination of Optimal Protein
Quantity Required to Identify Abundant and Less Abundant Soybean Seed
85
Proteins by 2D-PAGE and MS. Plant Molecular Biology Reports, 6:756-
763, 2007.
Navarrete-Perea, J., et al.; Identification and quantificationof host proteins in the
vesicular fluid of porcine Taenia solium Cysticerci. Experimental
Parasitology. 143, 11–17. 2014.
O’farrel, P. H.; High Resolution Two-Dimensional Electrophoresis of Proteins.
Journal of Biological Chemistry, 250:4007-4021, 1975.
Oksman-Caldentey, K.-M.; Inzé, D. Plant cell factories in the post-genomic era:
new ways to produce designer secondary metabolites. Trends in Plant
Science, v. 9, n. 9, p. 433–440, set. 2004.
Ortea, I.; O’Connor, G.; Maquet, A. Review on proteomics for food authentication.
Journal of proteomics, 147, 212-225. 2016.
Ogiso, H.; Suzuki, T.; Taguchi, R. Development of a reverse-phase liquid
chromatography electrospray ionization mass spectrometry method for
lipidomics, improving detection of phosphatidic acid and
phosphatidylserine. Analytical biochemistry, v. 375, n. 1, p. 124–131.
2008.
Patel S. Role of proteomics in biomarker discovery and psychiatric disorders:
current status, potentials, limitations and future challenges. Expert Review
Proteomics. 2012. DOI.10.1586/epr.12.25
Patti, G. J. Separation strategies for untargeted metabolomics. Journal of
Separation Science, v. 34, p. 3460–3469, 2011.
Rabilloud, T & Lelong, C; Two-dimensional gel electrophoresis in proteomics: A
tutorial. Journal of Proteomics, v. 74, p. 1829-1841, 2011.
Rodrigues, P. M.; et al.; PROTEOMICS in aquaculture: aplication and trends.
Journal of proteomics. v. 75, p. 4325-4345, 2012.
Sebastiani, F. L.; Farell, L. B.; Schuler, M. A.; Beachy, R. N. Complete sequence
of a cDNA of subunit of soybean β-conglycinin. Plant Molecular Biology,
15:197-201, 1990.
Shekhar, S.; Agrawal, L.; Mishra, D.; Buragohain, A. K.; Unnikrishnan, M.;
Mohan, C.; Chakraborty, S.; Chakraborty, N.; Ectopic expression of
amaranth seed storage albumin modulates photoassimilate transport and
nutrient acquisition in sweetpotato. Scientific Reports. DOI:
10.1038/srep25384, 2016.
86
Schmidt, M. A.; Barbazuk, W. B.; Sandford, M.; May, G.; Song, Z.; Zhou, W.;
Nicolau, J. B.; Herman, E. M.; Silencing of Soybean Seed Storage Proteins
Results in a Rebalanced Protein Composition Preserving Seed Protein
Content without Major Collateral Changes in the Metabolome and
Transcriptome. Plant Physiology, 156:330–345, 2011.
Simó, C., et al.; A CE-TOF MS analysis of complex protein hydrolyzates from
genetically modified soybeans – A tool for foodomics. Electrophoresis. 31,
1175–1183. 2010.
Simões, C. M. O,; et al., Farmacognosia: da planta ao medicamento. 5⁰ edição.
UFRGS. 2004.
Sumner, L. W. et al. Proposed minimum reporting standards for chemical analysis
Chemical Analysis Working Group (CAWG) Metabolomics Standards
Initiative (MSI). Metabolomics, v. 3, n. 3, p. 211–221, 2007.
Sussulini, A.; Dissertação De Mestrado. Universidade Estadual De Campinas –
Unicamp, 2007.
Sussulini, A., et al.; Apolipoprotein A-I as a candidate sérum marker for the
response to lithium treatment in bipolar disorder. Proteomics. 11, 261-269.
2011.
Valdés, A., et al.; Foodomics strategies for the analysis of transgenic foods.
Trends Anal. Chem. 52, 2–15. 2013.
Villalba, R.; León, C.; Dinelli, D.; Carretero, A. S.; Fernandez-Gutierrez, A.;
Garcia-Canas, V.; Cifuentes, A. Comparative metabolomic study of
transgenic versus conventional soybean using capillary electrophoresis–
time-of-flight mass spectrometry. Journal of Chromatography A,
1195:164–173, 2008.
Vilas-Bôas, S. G. e Gombert, A. K. Análise do metaboloma: uma ferramenta
biotecnológica emergente na era pós-genômica. Biotecnologia ciência &
desenvolvimento. Ano IX, n° 36, 2006.
Wang, Y; Xu, Wentao; Zhao, Weiwei; Hao, Junran; Luo, Yundo; Tang, Xiaoge;
Zhang, Yu; Huang, Kunlun. Comparative analysis of the proteomic and
nutritional composition of transgenic rice seeds with Cry1ab/ac genes and
their non-transgenic counterparts. Journal of Cereal Science, 55:226-233,
2012.
87
Wilkins, M. R.; Willians, K. L.; Proteome research: new frontiers in functional
genomics. Germany: Springer-Verlag, p. 243. 1997.
Xia, J., Sinelnikov, I. V., Han, B., & Wishart, D. S. MetaboAnalyst 3.0 – making
metabolomics more meaningful. Nucleic Acids Research, 43 (1): 251–257,
2015. http://doi.org/10.1093/nar/gkv380
Xie, F., et al.; Liquid-Cromatography Mass spectrometry-based quantitative
proteomics. The Journal of Biological Chemistry. 2011.
Xu, C. Sullivan, J. H., Garrett, W. M., Caperna, J. J.; Natajaran, S.; Impact of
solar ultraviolet-B on the proteome in soybean lines differing in flavonoid
contents. Phytochemistry, 69:38-48, 2008.
Zhang, W., et al.; Proteomic profiles of human lung adeno and squamous cell
carcinoma using super-SILAC and label-free quantification approaches.
Proteomics. 14, 795–803. 2014.
88
ANEXO
T1G x NT1G
T2G x NT2G
89
T3G x NT3G
T1G x T2G
90
T1G x T3G
T2G x T3G
91
NT1G x NT2G
NT1G x NT3G
92
NT2G x NT3G
Top Related