Pró-Reitoria Acadêmica
Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia
Pró-Reitoria Acadêmica
Programa de Pós-Graduação Stricto Sensu em Ciências Genômicas e Biotecnologia
Pró-Reitoria Acadêmica
Programa de Pós-Graduação Stricto Sensu em Ciências
Genômicas e Biotecnologia
SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE
AMOSTRAS DE ZIKA VIRUS NO BRASIL
Brasília - DF
2018
Autora: Carolina Rodrigues Chanes
Orientador: Dr. Fabrício Falconi Costa
Coorientador: Dr. Fernando Lucas Melo
CAROLINA RODRIGUES CHANES
SEQUENCIAMENTO E ANÁLISE FILOGENÉTICA DE AMOSTRAS DE ZIKA
VIRUS NO BRASIL
Dissertação apresentada ao Programa de pós-
graduação Stricto Sensu em Ciências
Genômicas e Biotecnologia da Universidade
Católica de Brasília, como requisito parcial
para obtenção do Título de Mestre em
Ciências genômicas e Biotecnologia.
Orientador: Dr. Fabrício Falconi Costa
Coorientador: Dr. Fernando Lucas Melo
Brasília
2018
Ficha elaborada pelo Sistema de Bibliotecas da Universidade Católica de Brasília (SIBI/UCB)
C456s Chanes, Carolina Rodrigues.
Sequenciamento e análise filogenética de amostras de Zika virus no
Brasil / Carolina Rodrigues Chanes – 2018.
59 f.: il. ; 30 cm
Dissertação (Mestrado) – Universidade Católica de Brasília, 2018.
Orientação: Prof. Dr. Fabrício Falconi Costa
Coorientação: Prof. Dr. Fernando Lucas Melo
1. Zika virus. 2. Sequenciamento de genoma completo. 3. Epidemiologia. 4. Filogenética. I. Costa, Fabrício Falconi, orient. II. Melo, Fernando Lucas, coorient. III. Título.
CDU 606
Dedico este trabalho a mim.
Só eu realmente sei como foi a jornada até chegar aqui.
AGRADECIMENTOS
Agradeço a minha família pelo suporte a minha escolha de continuar sempre
estudando, aos meus orientadores pela motivação quando tudo parecia sem saída e pela
sinceridade de cada um, aos meus amigos que incansavelmente só ouviam sobre meu
mestrado e meus desesperos com o mesmo, principalmente a Jacqueline, que quando precisei
esteve prontamente a me ajudar, à minha irmã Isabel que sempre esteve comigo independente
do momento, ao meu namorado Hebertt que sabe de tudo que se passou e me deu apoio e
finalmente a minha psicóloga Gabriela que manteve minha sanidade mental no lugar.
Agradeço também àqueles que me auxiliaram no laboratório de alguma forma como o
Leonardo Assis da UnB, o Thiago e a Jacqueline.
Agradeço ao coordenador do Projeto “Zika, Dengue e Chikungunya: abordagem para
desenvolvimento de soluções aplicáveis em saúde pública”, ao qual estamos associados,
Professor Dr. Bergmann Morais da UnB, ao Paulo S. Prado do laboratório de virologia do
LACEN-DF, a Professora Lídia que sempre esteve ao meu lado desde o início da minha
jornada acadêmica e a CAPES pelo financiamento e possibilitar esse título.
Ao meu orientador Fabrício pelas suas conversas motivadoras e por se preocupar
comigo.
Um agradecimento especial ao meu coorientador Fernando porque, afinal, a gente sabe
como foi dura a jornada para ambos.
RESUMO
CHANES, Carolina Rodrigues. Sequenciamento e análise filogenética de amostras de Zika
virus no Brasil. 2018. 59 folhas. Mestrado em Ciências Genômicas e Biotecnologia –
Universidade Católica de Brasília, Brasília, 2018.
Zika virus é um flavivírus emergente transmitido por mosquitos do gênero Aedes,
primeiramente isolado em 1947 de macacos sentinelas na floresta de Zika na África. O vírus
se espalhou para outros continentes até ser relacionado com síndromes neurológicas e
congênitas na América do Sul sendo taxado como um problema de saúde pública. O
sequenciamento genômico emergiu como uma ferramenta crucial de respostas em tempo real
a surtos de doenças infecciosas e tem ajudado a entender a filogenia, origem e delinear a
propagação do Zika virus. Este trabalho tem como objetivos obter a sequência completa do
Zika virus circulante em três diferentes estados do Brasil, DF, MT e TO, utilizando a técnica
de amplificação por PCR multiplex, a plataforma portátil MinION da Oxford Nanopore. Além
disto, tivemos como objetivo realizar a árvore filogenética por máxima verossimilhança a fim
de compreender melhor a origem, propagação e disseminação do vírus nestes estados e,
consequentemente, no Brasil. As sequências obtidas no presente trabalho apresentaram alta
cobertura, foi possível cobrir entre 94% e 100% dos genomas que se apresentaram em quatro
linhagens distintas e se associaram em dois clados diferentes relacionados as amostras do
Nordeste do Brasil. Finalmente, nosso estudo fornece novas sequências completas do Zika
virus no estado do Mato Grosso, demonstra a relação das sequencias do MT com as
sequências do Nordeste do Brasil e sugere duas possíveis entradas do Zika virus no estado do
MT.
Palavras Chaves: Zika virus. Sequenciamento de genoma completo. Epidemiologia.
Filogenética.
ABSTRACT
Zika virus is an emergent flavivirus transmitted by mosquitos of Aedes genus, was first
isolated in 1947 from Zika forest in Africa of the sentinel’s monkeys. The virus spread to
other continents and was related with congenital and neurological syndromes in South
America and became a public health issue. The genomic sequencing arouses as a crucial tool
to obtain answers in real time about infections diseases outbreaks and has helped to
understand the origin, phylogeny and trace Zika virus propagation. The main goals of this
work are to obtain the complete Zika virus genome sequences that circulated in three different
states of Brazil, DF, MT and TO, using the amplification technic multiplex PCR, the MinION
portable platform of Oxford Nanopore. Besides that, we had the goal to generate the
phylogenetic tree by maximum likelihood to better understand the origin, propagation and
dissemination of the virus in these states, and consequentially, in Brazil. The sequences obtain
in this present work shown high coverage, 94% to 100% was the coverage of the
completeness of the genomes, that presented four distinct lineages, two different clades and
related with Northeast samples of Brazil. Finally, our study provides new complete genome
sequences of Zika virus in the state of Mato Grosso, demonstrate the relationship of the
genome sequences of MT with sequences of Northeast of Brazil and suggests two possible
entrances of Zika virus in the state of MT.
Keywords: Zika virus. Whole Genome Sequencing. Epidemiology. Phylogenetics.
SUMÁRIO
1. INTRODUÇÃO ..................................................................................................................... 8
2. REVISÃO DA LITERATURA ............................................................................................. 9
2.1 ZIKA VIRUS ...................................................................................................................... 9
2.2 SEQUENCIAMENTO DE GENOMA COMPLETO .................................................... 14
2.3 SEQUENCIAMENTO VIA NANOPOROS .................................................................. 16
2.4 FILOGENIA MOLECULAR ......................................................................................... 17
3. OBJETIVOS ........................................................................................................................ 20
4. JUSTIFICATIVA ................................................................................................................ 21
5. METODOLOGIA ................................................................................................................ 24
5.1 AMOSTRAGEM ............................................................................................................ 24
5.2 EXTRAÇÃO DE RNA TOTAL, RT-PCR E PCR MULTIPLEX ................................. 24
5.3 PREPARO DA BIBLIOTECA ....................................................................................... 26
5.4 SEQUENCIAMENTO .................................................................................................... 28
5.5 ANÁLISE DE DADOS .................................................................................................. 28
5.6 ANÁLISE FILOGENÉTICA .......................................................................................... 29
6. RESULTADOS ................................................................................................................... 31
6.1 AMOSTRAS POR CT ..................................................................................................... 31
6.2 PCR MULTIPLEX ......................................................................................................... 31
7. DISCUSSÃO ....................................................................................................................... 40
8. CONCLUSÃO ..................................................................................................................... 43
REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................................... 44
ANEXO I – CONJUNTO DE PRIMERS UTILIZADOS NA PCR MULTIPLEX ................. 49
ANEXO II – ARTIGO SUBMETIDO PARA A REVISTA ARCHIVES OF VIROLOGY
(ANNOTATED SEQUENCE) ................................................................................................. 50
8
1. INTRODUÇÃO
Desde a sua descoberta, o Zika virus (ZIKV) tem demonstrado com clareza que está
seguindo o caminho do Dengue virus (DENV) e Chikungunya virus (CHIKV) se espalhando
por todos os países com a presença do mosquito do gênero Aedes, principalmente o A.
aegypti. O Brasil que já é endêmico para essas arboviroses, devido a presença do mosquito no
país, agora tem o ZIKV para acrescentar em sua lista de epidemias virais (MUSSO;
GUBLER, 2016).
O ZIKV é um arbovírus emergente que se tornou um problema de saúde pública ao
chegar às Américas causando transmissões autolimitadas em seres humanos. Apesar de sua
síndrome ser de caráter leve, este foi relacionado com síndromes neurológicas e materno
fetais especialmente no Brasil (PLOURDE; BLOCH, 2016).
Devido a sua importância crescente, o ZIKV demanda ações rápidas e inteligentes,
essas, demandam conhecimento, em alguns casos, da natureza molecular do vírus para serem
tomadas. Saber a sequência genômica do ZIKV auxilia na compreensão da filogenia, origem,
conexão com síndromes neurológicas e a propagação do vírus no país e no mundo (CUNHA
et al., 2016; NACCACHE et al., 2016; YUN et al., 2016).
A compreensão completa da disseminação do ZIKV no Brasil depende do estudo dos
casos, principalmente durante as epidemias, em todos os estados do país com números de
sequências representativas para ser possível traçar um estudo filogeográfico e entender o
caminho viral dentro do país.
Tendo em vista que ainda não existem estudos publicados sobre a filogenia do ZIKV
nos estados brasileiros de Tocantins (TO), Mato Grosso (MT) e no Distrito Federal (DF), o
presente estudo se propôs a melhorar a compreensão da disseminação deste vírus no Brasil a
partir de algumas sequências genômicas virais isoladas nestes estados supracitados.
9
2. REVISÃO DA LITERATURA
2.1 ZIKA VIRUS
O ZIKV é um arbovírus membro da família Flaviviridae e pertencente ao gênero
Flavivirus. Este vírus foi isolado pela primeira vez de macacos sentinelas Rhesus em 1947 na
floresta de Zika localizada na Uganda durante uma pesquisa epidemiológica de febre amarela
e um ano depois identificado novamente na mesma floresta em mosquitos Aedes africanus
(DICK; KITCHEN; ADDOW, 1952).
Os primeiros casos registrados de doença em seres humanos pelo ZIKV ocorreram na
Nigéria em 1954 (MACNAMARA, 1954), apesar de já ter sido reconhecida a soroprevalência
de 6,1% de anticorpos contra esse vírus na população de Uganda, sugerindo infecções
humanas (DICK, 1952).
Estudos de soroprevalência e detecção de ZIKV em mosquitos continuaram
demonstrando a expansão do vírus no continente Africano: leste, central, oeste e sul
(MUSSO; GUBLER, 2016) e na Ásia incluindo Índia, Indonésia, Malásia e Paquistão
(KINDHAUSER et al., 2016).
O primeiro grande surto, documentado, relacionado ao ZIKV ocorreu nas Ilhas de Yap
localizada nos Estados Federados da Micronésia em 2007. A sintomatologia relacionada foi
de erupção cutânea maculopapular, artralgia, febre e conjuntivite não purulenta. Dados de
uma pesquisa em domicilio de sorovigilância na região estimaram que 73% da população de
6892 habitantes com três anos ou mais de idade foi infectada durante o surto (DUFFY et al.,
2009). Estas informações mostraram o potencial do ZIKV como um novo arbovírus
emergente (MUSSO; GUBLER, 2016).
Uma grande preocupação com o vírus veio à tona quando este foi relacionado com a
Síndrome de Guillain-Barré (SGB), uma neuropatia pós-infecciosa axonal motora aguda do
sistema nervoso sendo a principal causa de paralisia flácida aguda no mundo (VAN DOORN;
RUTS; JACOBS, 2008), e casos de síndromes congênitas durante um grande surto entre
outubro de 2013 e abril de 2014 na Polinésia Francesa, onde mais de 32 mil pacientes foram
avaliados com suspeita de infecção pelo ZIKV e o número de casos de SGB foi vinte vezes
maior do que o esperado para o ano (CAO-LORMEAU et al., 2016; MALLET; VIAL;
MUSSO, 2016).
Casos de SGB relacionados ao ZIKV também foram registrados nas Américas Central
e Latina, principalmente, no Brasil, Venezuela, Colômbia, República Dominicana, El
Salvador, Honduras e Suriname (DOS SANTOS et al., 2016; PARRA et al., 2016).
10
No Brasil os primeiros casos da infecção pelo ZIKV apareceram em maio de 2015 no
estado da Bahia com um surto da doença autolimitada (CAMPOS; BANDEIRA; SARDI,
2015) e seu primeiro caso de transmissão autóctone (ZANLUCA et al., 2015). No início de
dezembro do mesmo ano, dezoito estados do Brasil já haviam reportado a circulação do vírus
e no final do mesmo mês o número de casos suspeitos da infecção foi de quatrocentos e
quarenta mil para um milhão e trezentos mil (HENNESSEY; FISCHER; STAPLES, 2016;
MUSSO; GUBLER, 2016).
Em outubro de 2015 no estado de Pernambuco, Nordeste, o ZIKV foi associado com o
aumento da ocorrência de casos de microcefalia (20x) (SAMPATHKUMAR; SANCHEZ,
2016). A microcefalia é definida pelo tamanho da circunferência do perímetro cefálico com
no mínimo dois desvios abaixo da média e está relacionada com malformações cerebrais
(PASSEMARD; KAINDL; VERLOES, 2013).
Diversas investigações demostraram a presença do vírus no tecido fetal, placenta
(MARTINES et al., 2016; MLAKAR et al., 2016) e no líquido amniótico (CALVET et al.,
2016), além de infecções de células neurais in vitro (TANG et al., 2015) suportando a
transmissão materno-fetal. A confirmação experimental da associação do ZIKV com a
microcefalia ocorreu em 2016 por um estudo publicado por Cugula et al. (2016) onde estes
autores descreveram diversas más-formações em fetos de camundongos após infecção
experimental da mãe durante a gravidez.
Recentemente, o estudo de Yuan et al (2017) ofereceu uma explicação para esse “link”
ZIKV - microcefalia, devido ao achado de uma mutação na proteína prM (proteína presente
na membrana viral), usando linhagens contemporâneas asiáticas (2015-2016), onde uma única
substituição de serina para asparagina (S139N) demonstrou, através de evidências
experimentais, o aumento da infectividade em células neuroprogenitoras tanto de humanos
quanto de ratos e conduziu a um fenótipo microcefálico mais severo em ratos quando
comparado a linhagem mais antiga da Camboja (2010). Este grupo especulou que esta
substituição estivesse relacionada com a maturação da partícula viral, em consequência com o
aumento da sua neurovirulência (YUAN et al., 2017).
A sintomatologia mais comum causada pelo ZIKV (Febre pelo ZIKV) é de erupção
cutânea, febre, artralgia, mialgia, fadiga, cefaleia, dor retro ocular e conjuntivite não
purulenta, sintomas de grande semelhança com Dengue e Chikungunya, arboviroses
endêmicas na maioria dos países que o ZIKV tem emergido, o que dificulta o diagnóstico
clínico e favorece a sua circulação por diversas décadas de forma silenciosa (KINDHAUSER
et al., 2016; PLOURDE; BLOCH, 2016).
11
Outros motivos que favoreceram o ZIKV emergir como um problema de saúde pública
foram: doença de curso benigno ou assintomática, controle inefetivo do mosquito,
globalização, reações cruzadas no diagnóstico sorológico com outros Flavivirus, viremia
comumente baixa (dificultando isolamento e detecção do vírus) e modificações genéticas no
ZIKV, as quais podem aumentar o potencial virulento e epidêmico do vírus (BAUD et al.,
2017; PETERSEN et al., 2016).
Assim como outros flavivírus, o ZIKV é transmitido pela picada de mosquito,
principalmente o gênero Aedes (PLOURDE; BLOCH, 2016), porém, outras formas de
transmissão foram relatadas, como a sexual (FOY et al., 2011), congênita (CALVET et al.,
2016) e pela transfusão sanguínea (BESNARD et al., 2014; MUSSO et al., 2014).
O diagnóstico para ZIKV tem sido realizado pela RT-qPCR (PCR quantitativa), pois é
o método mais sensível de detecção e diversos fluidos têm sido reportados com a presença do
vírus, como sêmen, urina e sangue. O diagnóstico sorológico é complicado devido às reações
cruzadas com outros flavivírus e por isso não existe, até o momento, kits comerciais validados
de sorologia para ZIKV (MUSSO; GUBLER, 2016).
O tratamento é apenas sintomático tendo em vista que ainda não existem antivirais
para este vírus. Este consiste de antitérmicos, repouso, analgésicos e ingestão de fluidos. Os
anti-inflamatórios não são recomendados em caso de diagnóstico incerto e com a
possibilidade de infecção com o vírus da dengue. A prevenção é a principal medida na
maioria das arboviroses, evitando a picada de mosquitos, utilizando repelentes, telas de
proteção, roupas longas e a realização do controle da proliferação do mosquito (PLOURDE;
BLOCH, 2016).
O ZIKV tem as características do gênero Flavivirus, sendo envelopado, com a
partícula viral entre 40 e 50 nm de diâmetro, um genoma de RNA fita simples (Figura 1),
senso positivo, não segmentado, com 10794 nucleotídeos codificando uma única ORF (Open
Reading frame ou região de leitura aberta) que é flanqueada por duas regiões não traduzíveis
(5´-UTR e 3´-UTR) que estão envolvidas com a tradução, ciclização e estabilidade do
genoma, ORF é traduzida em uma única poliproteína que é clivada em sete proteínas não
estruturais (NS1, NS2a, NS2b, NS3, NS4a, NS4b e NS5) e três estruturais, proteína do
capsídeo (C), proteína de membrana ou pré-membrana (M e prM) e a proteína de envelope
(E) (Figura 2) (FAYE et al., 2014; MUSSO; CAO-LORMEAU; GUBLER, 2015).
12
Figura 1 - Representação gráfica do vírion de Flavivirus.
Fonte: ViralZone (2017)
Figura 2 – Representação esquemática do genoma de Flavivirus com indicativo se potenciais sítios de clivagem enzimáticos.
Fonte: ViralZone (2017).
Filogeneticamente o ZIKV foi caracterizado em três linhagens distintas, porque
provavelmente teve sua origem no leste da África (grupo da Nigéria) e assim, se espalhou
para todo o oeste da África (grupo MR766, primeiro ZIKV isolado) e chegou ao sudeste da
Ásia e no Pacífico (genótipo Asiático). Todas as sequências de ZIKV identificadas nas
Américas, inclusive as do Brasil, são parte da linhagem asiática e tem maior similaridade com
aquelas encontradas nos surtos de Yap, Tailândia e Polinésia Francesa (FAYE et al., 2014;
LANCIOTTI et al., 2016).
Os primeiros estudos do ZIKV nas Américas através de análises filogenéticas e de
relógio molecular demonstraram que aconteceu uma única introdução do genótipo asiático no
final de 2013 nas Américas, aproximadamente um ano antes de sua detecção no Brasil,
sugerindo que esta linhagem ancestral pode ter existido primeiramente no Brasil, proveniente
da Polinésia Francesa (FARIA et al., 2016).
13
Figura 3 – Árvore filogenética demonstrando as três linhagens distintas do ZIKV devido sua origem no Oeste da
África, Leste da África e Ásia.
Fonte: Lanciotti et al. (2016)
Considera-se a hipótese de que o Nordeste do Brasil é a região que recebeu a linhagem
fundadora do ZIKV nas Américas e possuiu maior importância no estabelecimento e
disseminação do vírus dentro do próprio Brasil, na América Central, Caribe e América do Sul,
entre julho de 2014 e abril de 2015. Estima-se que houve um movimento da linhagem do
vírus do nordeste para o sudeste do país na segunda metade de 2014 e levou a infecção para
os estados do Rio de Janeiro e São Paulo (FARIA et al., 2017a).
Os genomas encontrados na América do sul, principalmente na Colômbia, tem grande
similaridade com os do Brasil, sugerindo múltiplas introduções provenientes do Brasil
(METSKY et al., 2017).
O estudo sobre a introdução do ZIKV na América Central e México mostrou o
movimento das linhagens do Brasil para Honduras, entre julho e setembro de 2014, e de
Honduras para Guatemala, Nicarágua e o sul do México entre dezembro de 2014 e março de
2015. Algumas amostras do Panamá e do México foram exceções tendo sido introduzidas
nestes países provavelmente pela Colômbia ou pelo Caribe no segundo semestre de 2015.
(THÉZÉ et al., 2018).
14
Nos Estados Unidos, as regiões do Texas e da Flórida são afetadas pelas populações
de Aedes aegypti sazonais, e devido a este fator, um surto na Flórida em 2016 teve 256 casos
confirmados da febre pelo ZIKV. A introdução do vírus no Estados Unidos foi provavelmente
o resultado de ao menos quatro introduções separadas e foi introduzido na Flórida
supostamente pelas ilhas do Caribe, informação sugerida por análises filogenéticas e pela alta
frequência de viagens entre essas localidades, principalmente em cruzeiros marítimos
(GRUBAUGH et al., 2017).
Análises de recombinação e mutações com o objetivo de entender o mecanismo
molecular relacionado ao aumento da patogenicidade do vírus foram realizadas. Faye et al.
(2014) propôs que o ZIKV sofreu diversos eventos de recombinação na natureza, porém é um
dado que necessita de estudos aprofundados, pois não existem demonstrações experimentais
de recombinações dentro dos flavivírus. Yokoyama e Starmer (2017) propuseram sete
mutações críticas na região 3´-UTR no vírus que circulou na Malásia (Aea-Malaysia) como
possíveis causadores dos problemas médicos atuais (relação com neuropatias e síndromes
congênitas). Yokoyama e Starmer (2017) defendem ainda que estas complicações podem ter
passado despercebidas (do surto da Malásia ao surto na Polinésia Francesa) devido a região
geográfica de circulação do ZIKV ser a mesma do Dengue virus e Chikungunya virus.
2.2 SEQUENCIAMENTO DE GENOMA COMPLETO
A possibilidade de sequenciar genomas completos de vários organismos, incluindo os
vírus, nos permitiu realizar análises de comparação e evolução em larga escala, identificação
de variantes raras, traços de base genética, aumento da virulência relacionada a mutações,
recombinações de patógenos e até a identificação de microrganismos não cultiváveis, ações
que eram inimagináveis alguns anos atrás (NG; KIRKNESS, 2010; YOKOYAMA;
STARMER, 2017).
Uma aplicação do sequenciamento de genoma completo (SGC) na virologia é a
vigilância epidemiológica, onde as sequências gênicas dos vírus envolvidos em epidemias
revelam informações sobre a natureza do microrganismo quando comparadas com sequências
existentes em bancos de dados. Com passar do tempo e o acúmulo das informações obtidas de
outras sequências relacionadas aos surtos sendo depositadas, as divergências nucleotídicas
podem ajudar a prever o curso da doença e estabelecer conclusões epidemiológicas
importantes, devido à evolução rápida dos patógenos, em questão de semanas e meses
(GARDY; LOMAN; RAMBAUT, 2015).
15
O uso do SGC na virologia clínica também é de grande importância e pode ser usado
para detecção de variantes resistentes a drogas (HOULDCROFT; BEALE; BREUER, 2017).
Para sequenciar um genoma completo de vírus existem três abordagens mais
utilizadas, o sequenciamento por metagenômica, sequenciamento de amplicons de PCR e o
sequenciamento de enriquecimento alvo (Figura 4) (QUICK et al., 2017).
O sequenciamento por metagenômica tem a abordagem clássica de extrair o DNA e/ou
RNA total da amostra e a biblioteca ser realizada pela técnica de shotgun (DNA é quebrado
em pequenos fragmentos aleatoriamente). As desvantagens do método envolvem
contaminação de ácidos nucleicos de outros microrganismos, do próprio hospedeiro e
depende de uma alta concentração do vírus na amostra para que a proporção de reads
(fragmentos gerados no sequenciamento) seja suficiente para cobrir todo seu genoma. A
maior vantagem do método é no sequenciamento e identificação de novos vírus, sem a
necessidade de conhecimento prévio da sua sequência (HOULDCROFT; BEALE; BREUER,
2017).
O sequenciamento de amplicons de PCR é uma técnica que necessita do conhecimento
prévio da sequência, para que a amplificação de todo material genético viral, utilizando
primers específicos, seja o enriquecimento suficiente para o sequenciamento, principalmente
de vírus pequenos. A vantagem desse método é o custo e a sensibilidade. As desvantagens
incluem a grande diversidade viral, requerendo um número elevado de primers e dificuldades
de analisar novas variantes virais por bioinformática (HOULDCROFT; BEALE; BREUER,
2017; QUICK et al., 2017).
O sequenciamento de enriquecimento alvo é um método que envolve pequenas sondas
de DNA fixas em fase sólida (como beads magnéticos) que são complementares a sequência
completa do vírus de interesse, e estas irão hibridizar a sequência presente na amostra, a fase
sólida será capturada para que ocorra o sequenciamento apenas das sequências selecionadas.
Este método tem a vantagem de o genoma ser o mais representativo possível do vírus
analisado e reduz a quantidade de mutações possíveis quando se utiliza a PCR. As
desvantagens são o preço da biblioteca, a dependência da concentração inicial do vírus na
amostra e a necessidade do conhecimento anterior da sequência do vírus (HOULDCROFT;
BEALE; BREUER, 2017).
16
Figura 4 – Principais abordagens de sequenciamento para obter o genoma completo de vírus diretamente de
amostras clínicas. Todas as técnicas partem de uma amostra com material genético alvo (em vermelho) e do
hospedeiro (em azul). Sequenciamento de metagenoma: preparo da biblioteca através do shotgun e
sequenciamento de todo DNA presente. Sequenciamento de amplicons de PCR: amplificações específicas para o
DNA alvo são realizadas gerando os amplicons que serão utilizados no preparo da biblioteca e sequenciamento.
Sequenciamento de enriquecimento alvo: Uma biblioteca com sondas específicas ao material genético alvo,
fixada a uma fase sólida (beads magnéticos), é preparada (chamada de biblioteca isca), onde ocorrerá a
hibridização com as sequencias de interesse e a fase sólida será capturada, consequentemente as sequencias alvo
hibridizadas e o sequenciamento apenas do DNA alvo será realizada.
Fonte: Houldcroft, Beale e Breuer (2017) [Modificado].
2.3 SEQUENCIAMENTO VIA NANOPOROS
Nanoporos foram demonstrados como ferramentas para detecção de moléculas de
DNA e RNA de fita simples, pela primeira vez, em 1996 com canal iônico de alfa hemolisina
de Staphylococcus aureus (KASIANOWICZ et al., 1996).
Desde então os nanoporos têm sido explorados na intenção de criar uma tecnologia de
sequenciamento de quarta geração (NGS – Next generation sequencing) mais barata, simples
e rápida (BRANTON et al., 2008; LOMAN; WATSON, 2015).
O funcionamento desta tecnologia é dado pelo bloqueio da corrente iônica dentro do
nanoporo e o tempo de bloqueio determina as bases que ali translocam (Figura 5). Cada
nanoporo é colocado em uma membrana, a membrana por sua vez está imersa em um
ambiente de solução salina, onde a amostra de DNA é administrada e um campo elétrico é
formado a partir da aplicação de uma corrente iônica perpendicular a membrana. A passagem
do DNA pelos nanoporos é devido a sua capacidade de tornar-se carregado negativamente
nessa situação, passando assim eletroforeticamente pelo nanoporo, este possui uma corrente
17
iônica constante (linha de base) que é perturbada de acordo com o tempo e magnitude do que
ali passa (DE SOUZA, 2017; FYTA, 2015).
A duração do bloqueio da corrente indica o tempo de translocação que a molécula de
DNA leva para atravessar o poro. Um nanoporo grande o suficiente para caber um
nucleotídeo por vez que bloqueie a corrente durante a translocação é capaz de medir a
corrente iônica e dar um valor para cada base (FYTA, 2015).
Sequenciamento por nanoporos é uma tecnologia genômica que pode ser aplicada na
vigilância sanitária, no diagnóstico clínico e na investigação de surtos. Esta tecnologia gera a
detecção de moléculas únicas baseadas em nanoporos com vantagens de sequenciar reads
longos, não necessitar de amplificações, alta capacidade e ser livre de marcadores (FENG et
al., 2015; SHUKLA et al., 2016).
Uma desvantagem do método consiste na necessidade de leitura da mesma molécula
diversas vezes no mesmo poro ou cópias idênticas da molécula em poros paralelos para
diminuir a taxa de erro na leitura das amostras (O’DONNELL; WANG; DUNBAR, 2013).
Figura 5 – Sequenciamento pelo bloqueio de corrente iônica. Mostra-se na figura a linha de base quando o poro
está aberto e a corrente passa livremente, na parte superior da figura, e o poro bloqueado mostrando a queda
característica na corrente elétrica na parte inferior da figura.
Fonte: Branton et al. (2008) [Modificado].
2.4 FILOGENIA MOLECULAR
A filogenia tenta inferir os caminhos das mudanças evolutivas que produziram a
característica analisada, ou seja, descreve as relações evolutivas entre entidades. A forma mais
comum de representação dessa relação é através de diagramas de ramificações, ou árvores
filogenéticas, com ramificações unidas por nós levando a terminais nas pontas da árvore
(Figura 6) (BRUYN; MARTIN; LEFEUVRE, 2014).
18
Os “nós” representam ancestrais comuns das quais duas ou mais linhagens são
descendentes, representando os eventos de especiação; os pontos terminais tipicamente
representam espécies individuais que podem ou não ser contemporâneas umas das outras; a
raiz indica o ultimo ancestral comum compartilhado por todo grupo de espécies; e os padrões
de ramificações, topologia da árvore, indicam as relações evolucionárias (GREGORY, 2008).
Figura 6 – Exemplo de uma de uma árvore filogenética enraizada com indicação da Raiz, Ramificação, Nó e
Terminais.
Fonte: Bruyn, Martin e Lefeuvre (2014) [Modificado].
O avanço da biologia molecular e das tecnologias de sequenciamento possibilitou uma
filogenia molecular, ou seja, o estudo de diferenças em sequências homólogas nucleotídicas
ou de aminoácidos, demonstrando as relações evolutivas destes organismos (ALMEIDA,
2014; ZUKERKANDL; PAULING, 1965).
Os métodos de análise podem ser caracterizados em dois grupos: os métodos baseados
em distância e métodos baseados em característica ou variabilidade. O método de distância
mais utilizado é o Neighbor-Joining (NJ) e os métodos de variabilidade são de máxima
parcimônia (MP), máxima verossimilhança (MV) e inferência Bayesiana (IB) (PAGE;
HOLMES, 1998).
O NJ é baseado no cálculo de distância genética entre cada par de sequências e agrupa
as sequências que são mais similares para formar a árvore. Este método tem melhor uso para
formação de árvores iniciais, pois, diversos sítios que sofreram mutações podem passar
despercebidos e não permitem uma análise de qual característica contribui para grupos
específicos (LANGDALE; HARRISON, 2006).
O método de MP assume que características compartilhadas entre diferentes
indivíduos resultam de um ancestral comum, onde a explicação mais simples com menor
19
número de mudanças para a evolução é a correta. O que pode gerar múltiplas árvores devido
às várias características analisadas (LANGDALE; HARRISON, 2006).
A MV é um cálculo de probabilidade para saber se o conjunto de dados se adequa a
árvore com base em um modelo específico de evolução, considerando todos os sítios dos
dados de forma indistinta e sempre a árvore com a maior probabilidade será a mais verossímil
(NEI; KUMAR, 2000). A IB é muito semelhante ao método de MV, com distinção apenas na
especificação anterior da relação entre sequências e quantidade de dados que será inferida
(FELSENSTEIN, 2004).
A escolha do tipo de análise na filogenia molecular dependerá do rigor requerido no
experimento, principalmente a precisão da análise e o tempo do ensaio computacional. O uso
de mais de uma análise é o mais recomendado para uma maior precisão da filogenia
(LANGDALE; HARRISON, 2006).
20
3. OBJETIVOS
Este trabalho tem como objetivo sequenciar o genoma completo e realizar a análise
filogenética do Zika virus diretamente de amostras de soro de pacientes com diagnóstico
positivo nos estados do DF, MT e TO do Brasil. A fim de gerar dados para a inferência da
disseminação da doença durante os surtos, conhecer as características de evolução molecular
do vírus, gerar sequencias completas virais e auxiliar nas investigações epidemiológicas
nestes locais.
3.1 OBJETIVOS ESPECÍFICOS
• Gerar sequências completas do ZIKV;
• Determinar as relações filogenéticas do ZIKV presentes nos estados do MT, TO e DF;
21
4. JUSTIFICATIVA
Desde 2015 o Brasil foi acometido por uma epidemia de ZIKV com mais de trinta mil
casos notificados (FARIA et al., 2016). Em janeiro de 2016, a febre pelo ZIKV foi
determinada como de notificação compulsória e foi iniciada a produção de mais dados sobre a
presença crescente da doença no país. No primeiro semestre de 2016 foram registrados
174.003 casos prováveis (taxa de incidência de 85,1 casos/100 mil habitantes) de febre pelo
vírus Zika distribuídos em 2.251 municípios, tendo sido confirmados 78.421 casos
(MINISTÉRIO DA SAÚDE, 2016).
Sabe-se que a doença chegou no Brasil em 2015 e teve seus primeiros casos no
Nordeste do país, principalmente no estado da Bahia onde ocorreu também o primeiro caso de
transmissão autóctone do vírus (CAMPOS; BANDEIRA; SARDI, 2015).
Ao longo do ano de 2016 em relação a taxa de incidência, por regiões, da febre pelo
ZIKV no Brasil verificou-se que o centro-oeste foi o mais afetado com 172,7 casos/100 mil
habitantes. Estados com maior destaque na incidência foram Mato Grosso (610,8 casos/100
mil hab.), Bahia (315,8 casos/100 mil hab.), Rio de Janeiro (278,1 casos/100 mil hab.) e
Tocantins (166,1 casos/100 mil hab.), dados estes que podem ser observados na figura 7
abaixo (MINISTÉRIO DA SAÚDE, 2016).
Figura 7 - Taxa de incidência (/100 mil hab.) de febre pelo vírus Zika por município de notificação no Brasil no
ano de 2016. Destaque para os estados do Mato Grosso, Bahia, Rio de janeiro e Tocantins.
Fonte: Ministério da Saúde (2016).
Devido a sua associação com síndromes neurológicas como SGB e microcefalia o
ZIKV se tornou um vírus de impacto socioeconômico e uma ameaça global que a
22
Organização Mundial da Saúde (OMS) declarou como uma emergência de saúde pública de
preocupação internacional no início do ano de 2016 (PAN AMERICAN HEALTH
ORGANISATION, 2015; YUAN et al., 2017).
Entre outubro de 2015 e dezembro de 2016 foram notificados 10.232 casos suspeitos
de recém-nascidos e crianças com alterações no crescimento e desenvolvimento relacionadas
à infecção pelo ZIKV e outras etiologias infecciosas, a maioria dos casos notificados
concentram-se na região Nordeste do país (65,7%), seguindo-se as regiões Sudeste (20,6%) e
Centro-Oeste (6,5%), principais regiões afetadas pela febre do Zika no país (MINISTÉRIO
DA SAÚDE, 2017).
A literatura ainda carece de dados do ZIKV, pois diversos estados do Brasil que
possuem casos confirmados ainda não detêm genomas completos publicados em bancos de
dados públicos, como é o caso do MT e DF, estados em estudo neste trabalho, e o TO possui
atualmente apenas 7 genomas publicados no GenBank (informação de 27/07/2018).
O estado do Mato Grosso (MT) possui cerca de 3 milhões de habitantes (IBGE,
2017a) está localizado no centro oeste do Brasil e foi afetado no surto em 2015 com a
notificação de 9.328 casos da febre pelo Zika e teve um aumento 163% do total anual de
notificações em 2016 com 24.563 casos. O pico de notificações ocorreu entre a primeira e a
decima primeira semana do ano de 2016 (SES-MT, 2016a). O estado não possui um
laboratório central capacitado para realização dos exames laboratoriais de detecção do ZIKV,
sendo necessário o envio das amostras a um laboratório de referência, o que atrasa e dificulta
o diagnóstico e as notificações de casos confirmados (MINISTÉRIO DA SAÚDE, 2015).
Em 2016, 347 casos de microcefalia (recém-nascido, natimorto, abortamento ou feto)
foram notificados no MT, sendo que 12 casos por amostra positiva de ZIKV e 9 desses em
Cuiabá (SES-MT, 2016b).
O Tocantins (TO) está localizado na região Norte do Brasil, possui cerca de 1,3 milhão
de habitantes (IBGE, 2017b) e teve 6.217 casos notificados de febre pelo Zika no ano de
2016, com picos entre a sexta semana e a decima terceira. Em 2016 foram notificados 200
casos prováveis de recém-nascidos e crianças com alterações no crescimento e
desenvolvimento possivelmente relacionadas à infecção pelo ZIKV e outras etiologias
infecciosas (MINISTÉRIO DA SAÚDE, 2017; SES-TO, 2017).
O Distrito Federal (DF) é uma unidade federativa do Brasil situada na região centro
oeste e possui cerca de 3 milhões de habitantes (IBGE, 2017c), a unidade notificou 868 casos
no ano de 2016 da febre do Zika e a maioria dos casos prováveis estão notificados nas RAs
23
(Regiões administrativas) de Samambaia, Taguatinga, Gama, Planaltina, e Asa Sul (SES-DF,
2017).
A análise filogenética viral contém informações importantes a respeito da história
epidemiológica do microorganismo podendo ser usadas para determinar onde eles se
originaram, como se deu sua disseminação através das populações, prever o curso da doença,
identificar mutações relacionadas a distúrbios ou doenças e auxiliar na produção de vacinas
(CALDART, 2009).
No intuito de gerar dados para a análise filogenética viral, um sistema de
sequenciamento contínuo e integrado com dados de vigilância sanitária se faz necessário para
estabelecer conclusões epidemiológicas importantes contra o ZIKV e outras viroses no Brasil
e no mundo (FARIA et al., 2017a).
24
5. METODOLOGIA
5.1 AMOSTRAGEM
Foram selecionadas 105 amostras de soro provenientes de gestantes sintomáticas com
diagnóstico positivo para ZIKV, realizado pelo Laboratório Central de Saúde Pública do
Distrito Federal (LACEN-DF), pela metodologia de RT-qPCR (reação de transcriptase
reversa seguida de reação em cadeia da polimerase quantitativa) (valores de Ct - Cycle
Threshold foram anotados) incluindo amostras do Distrito Federal (DF), Mato Grosso (MT) e
Tocantins (TO) com início da sintomatologia entre janeiro de 2016 e junho de 2016.
Este trabalho foi aprovado pelo Comitê de Ética e Pesquisa da Universidade Católica
de Brasília sob o número CAAE 56459616.5.0000.0029.
Figura 8 – Mapa do Estado do Mato Grosso, Brasil, discriminando os municípios aos quais as amostras foram
coletadas.
Fonte: O autor.
5.2 EXTRAÇÃO DE RNA TOTAL, RT-PCR E PCR MULTIPLEX
Para gerar sequências genômicas completas do ZIKV, o protocolo com a metodologia
de PCR multiplex (múltiplas reações em cadeia da polimerase) para sequenciamento com a
plataforma MinION de ZIKV diretamente de amostras clinicas foi seguido (Figura 9)
(QUICK et al., 2017). O mesmo será brevemente descrito abaixo com as devidas
modificações realizadas neste trabalho.
25
Figura 9 – Fluxograma de trabalho para gerar amplicons pela técnica de “mosaico” a serem sequenciados pela
plataforma MinION.
Fonte: Quick et al. (2017) [Modificado].
As 105 amostras foram extraídas utilizando o QIAamp Viral RNA mini kit
(QUIAGEN) seguindo as instruções do fabricante. A etapa de RT-PCR (transcriptase reversa
e reação em cadeia da polimerase) para obtenção do cDNA foi realizada com a enzima
SuperScript IV (Invitrogen) seguindo o protocolo do fabricante com modificações nas
temperaturas de reação para um único ciclo no termociclador de 23ºC por 10 minutos, 50ºC
por 45 minutos, 55ºC por 15 minutos e 80ºC por 10 minutos. Após a RT-PCR foi adicionado
1µL de RNAse H por amostra para destruir o RNA dos híbridos RNA:DNA e incubado por
37º por 20min.
Para a PCR multiplex, foram utilizados dois conjuntos de primers (nomeados Pool 1 e
Pool 2) (Vide Anexo I) com uma metodologia de “mosaico” (Figura 10) onde dois conjuntos
de 35 pares de primers geram produtos que se sobrepõem em cerca de 100 nucleotídeos com
tamanho final de 400 pares de bases (pb) para cobrir o genoma do ZIKV (aproximadamente
11 kb) (QUICK et al., 2017).
26
Figura 10 – Esquema demonstrando os amplicons esperados durante a PCR multiplex no Pool 1 e no Pool 2
gerando 400pb e suas devidas sobreposições no genoma completo do ZIKV.
Fonte: Quick et al. (2017).
As duas reações da PCR multiplex para cada amostra foram realizadas com a enzima
Q5 Polimerase de alta fidelidade (New England BioLabs) com as seguintes especificações:
5µL de tampão de reação 5X Q5, 1µL de 10Mm de dNTPs, 0,5µL de Q5 DNA polimerase,
15µL de água livre de nucleases, 1µL do primer Pool 1 ou Pool 2 e 2,5µL de cDNA ou água
livre de nucleases para os controles negativos com volume final de 25µL por reação. A
ciclagem utilizada foi de 98ºC por trinta segundos, 95ºC por 15 segundos, 65ºC por 5
minutos, repetindo os passos 2 e 3 por 35 ciclos.
A etapa de confirmação da PCR multiplex foi realizada por meio de eletroforese de gel
de agarose 1% onde 5µL de cada produto da PCR foram aplicados na corrida deste gel,
juntamente com o marcador 1kb plus DNA ladder (Invitrogen). A purificação foi realizada
com AMPure XP beads (Beckman Coulter Genomics) na proporção 1X de beads para 1X de
amostra e seguindo as orientações do fabricante. Em seguida, a quantificação das amostras foi
realizada com Kit Qubit DNA de alta sensibilidade (Invitrogen) com 1µL do produto de cada
reação, seguindo as recomendações do fabricante.
5.3 PREPARO DA BIBLIOTECA
O preparo da biblioteca e sequenciamento foram realizados na plataforma MinION
(Figura 11) utilizando os kits Ligation Sequencing Kit 1D SQK-LSK108 e Native Barcoding
Kit todos da Oxford Nanopore Technologies (Figura 12).
Inicialmente, o preparo da biblioteca começou com a escolha de 04 amostras e seus
pools foram preparados de forma a associar Pool 1 e Pool 2 da mesma amostra para obter
quantidades equimolares de ambos pools. Foram utilizados apenas 1 barcode por amostra
(NB01-NB04). O volume final de cada amostra foi de 30µL.
27
O reparo das pontas e a adição dA na cauda foram realizadas com o NEB Next Ultra II
End-repair/dA-tailing module (New England BioLabs) adicionando 4,2µL do tampão Ultra II
End-Prep e 1,8µL da Ultra II End-Prep enzyme mix em cada amostra previamente preparada,
o tempo de reação foram de 5 minutos a 20ºC e 5 minutos a 65ºC.
Após a reação de reparo a purificação foi realizada com AMPure XP beads (Beckman
Coulter Genomics) na proporção 1X de beads para 1X de amostra e seguindo as orientações
do fabricante e as amostras eluídas em 15µL de água livre de nucleases.
A próxima etapa foi a ligação dos barcodes (Native Barcoding Kit - Oxford Nanopore
Technologies) na qual 5µL do barcode (NB01-NB12) foi, respectivamente, adicionado nas
amostras e 20µL de NEB Blunt/TA Ligase Master Mix (New England BioLabs) em cada
tudo. A reação foi incubada a temperatura ambiente por 10 minutos e em seguida aquecida a
65ºC por 10 minutos para garantir que na próxima etapa da biblioteca agrupada não aconteça
nenhuma ligação indesejada entre barcodes/amostras.
Em seguida as 04 amostras foram agrupadas em um único tudo para a purificação que
será realizada de acordo com as instruções do fabricante do AMPure XP beads (Beckman
Coulter Genomics) seguindo a razão de 1X de beads para 1X de amostra e a biblioteca será
eluída em 31µL de água livre de nucleases.
A quantificação das amostras foi realizada em seguida com o Kit Qubit DNA de alta
sensibilidade (Invitrogen) com 1µL da biblioteca, seguindo as recomendações do fabricante.
É esperada uma recuperação mínima 700ng.
A ligação dos adaptadores foi efetuada com 30µL da biblioteca, 20µL do adaptador
BAM 1D (Oxford Nanopore Technologies), 50µL de NEB Blunt/TA Ligase Master Mix
(New England BioLabs) e incubada por 10 minutos a temperatura ambiente.
A próxima reação foi uma purificação com o protocolo modificado apenas nas etapas:
adição de 40µL de AMPure XP beads (Beckman Coulter Genomics) na biblioteca que os
adaptadores foram previamente ligados, uso de 140µL do tampão ABB (Oxford Nanopore
Technologies) para realização das lavagens e eluição em 15µL de água livre de nucleases.
Após a etapa anterior a quantificação das amostras foi realizada com o Kit Qubit DNA
de alta sensibilidade (Invitrogen) com 1µL da biblioteca pronta, seguindo as recomendações
do fabricante. Esperava-se uma recuperação aproximada de 430ng nesta etapa.
28
Figura 11 – Plataforma MinION da Oxford Nanopore Technologies.
Fonte: Oxford Nanopore Technologies (2018).
5.4 SEQUENCIAMENTO
O sequenciamento foi efetuado de acordo com o protocolo da Oxford Nanopore
Technologies 1D Lambda Control Experiment (SQK-LSK 108) descrito brevemente abaixo.
A SpotON Flow Cell (R9.4) foi encaixada no MiniION (já previamente conectado a
um computador pelo cabo USB), preparada retirando aproximadamente 20µL de tampão do
priming port, pipetados 800µL do priming mix (576µL do tampão RBF e 624µL de água livre
de nucleases), após 5 minutos a tampa do SpotON foi aberta e 200µL do priming mix foram
pipetados no priming port.
Apenas 12µL da biblioteca foram combinados com 35µL de RBF, 2,5µL de água livre
de nucleases e 25,5µL LLB (library loading beads). Os 75µL desta combinação foram
pipetados gota por gota na abertura do SpotON, em sequência as tampas do SpotON e
priming port foram fechadas, assim como a do MinION.
O início da corrida se deu utilizando o software MinKNOW (programa da Oxford
Nanopore Technologies) e o progresso pode ser observado em tempo real enquanto os
arquivos são salvos diretamente no computador utilizado.
5.5 ANÁLISE DE DADOS
O pipeline da análise de bioinformática para MinION utilizado nesse projeto está
disponível em https://bedford.io/projects/zika-seq em licença de código aberto.
Os reads gerados pelo sequenciamento no MinION são gravados em formato FAST5,
posteriormente processados e convertidos para o formato FASTQ com o programa Albacore
v1.2.1 da Oxford Nanopore Technologies. Os reads processados foram separados por
29
bibliotecas com o programa porechop, gerando um arquivo FASTQ para cada biblioteca
(NB01, NB02, NB03 e NB04). Em seguida cada arquivo foi mapeado ao genoma de
referência (GenBank KJ776791.2) usando bwa mem, convertidos ao formato BAM usando
samtools view, os primers retirados e a cobertura normalizada utilizando align_trim.py. A
retirada dos primers é de grande importância para obtenção das sequências reais devido a
utilização da PCR multiplex anterior ao sequenciamento.
Utilizando o Nanopolish variants a sequência consenso foi calculada baseada na
detecção de SNPs (polimorfismos de base única) e INDELs (pequenas inserções e deleções)
nos reads brutos em comparação com a sequência de referência. Ao final as sequências de
baixa qualidade e as variantes de baixa cobertura são filtrados e as sequências finais geradas.
5.6 ANÁLISE FILOGENÉTICA
As quatro amostras do ZIKV sequenciadas neste trabalho foram utilizadas para as
análises filogenéticas, assim como 359 sequências encontradas em bancos de dados públicos,
incluindo sequências da Ásia, América do Norte, América Central e América do Sul.
O alinhamento das sequências foi realizado com o MAFFT v7.388, programa de
alinhamento de sequencias múltiplas, nos parâmetros padrões (KATOH; STANDLEY, 2013).
A reconstrução filogenética foi realizada utilizando método bayesiano implementado no
programa BEAST v1.10.1 (Bayesian Evolutionary Analysis Sampling Trees) (SUCHARD et
al., 2018). Foram realizadas 2 corridas independentes com 20 milhões de cadeias, com
amostragem a cada 2 mil cadeias. Com base em estudos anteriores sobre evolução de ZIKV
(FARIA et al., 2017b; GRUBAUGH et al., 2017; METSKY et al., 2017), foram utilizados os
modelos uncorrelated lognormal relaxed molecular clock (DRUMMOND et al., 2006) e
Bayesian skyline coalescent model (DRUMMOND et al., 2005). A convergência das análises
foi avaliada utilizando o programa TRACER (RAMBAUT et al., 2018) e árvore de máxima
credibilidade dos clados (maximum clade credibility tree, MCC tree) obtida com o programa
TreeAnnotator (http://www.beast2.org/treeannotator/) e visualizada com o programa FigTree
(http://tree.bio.ed.ac.uk/software/figtree/).
30
Figura 12 – Fluxograma com as etapas para o preparo da biblioteca de cDNA com os respectivos Kits a serem
utilizados no processo.
Fonte: O autor.
31
6. RESULTADOS
6.1 AMOSTRAS POR CT
O valor de Ct (Cycle Threshold) ou “limiar de detecção” é o valor utilizado na qPCR
para determinar o número de ciclos necessários para amplificação da sequência alvo e permite
a quantificação relativa de DNA presente em cada amostra.
A distribuição de Ct das amostras mostrou valores superiores a 30 em 88,5% dos
casos, a média dos Ct foi de 34,1 (n=105) e apenas 12 amostras apresentaram valores iguais
ou superiores ao Ct de 30. Valores podem ser observados na figura 13 abaixo.
Figura 13 – Distribuição do número de amostras por valores de Ct da RT-qPCR. Média observada dos Ct 34,1
(n=105).
Fonte: O autor
6.2 PCR MULTIPLEX
As reações de PCR multiplex foram realizadas como descrito na metodologia para 105
amostras e dois controles negativos do pool 1 e pool 2.
O produto destas reações foi aplicado em um gel de agarose em uma eletroforese
seguindo a metodologia descrita anteriormente. A figura 14 mostra o resultado das 20
primeiras amostras (1-20) do pool 1 e do pool 2, a figura 15 mostra o resultado das 50
próximas amostras (21-70) do pool 1, a figura 16 mostra o resultado das 50 amostras (21-70)
do pool 2, a figura 17 mostra o resultado das 35 amostras (71-105) do pool 1 e a figura 18 as
35 amostras restantes (71-105) do pool 2.
Os controles negativos do pool 1 e pool 2 estão na figura 19. Os controles negativos
têm grande importância no controle de contaminações das reações.
32
Foram selecionadas as amostras que apresentaram bandas entre 400pb e 500pb (pares
de bases), em ambos os pools, devido as variações genéticas do ZIKV.
Figura 14 – Resultado da PCR multiplex do pool 1 e do pool 2 em eletroforese de gel de agarose 1%. M:
Marcador 1kb Plus DNA Ladder (Invitrogen). 1-20 esquerda: Amostras de 1 a 20 do pool 1. 1-20 direita:
Amostras 1-20 do pool 2. As setas indicam o tamanho de produto de PCR esperado.
Fonte: O autor.
Figura 15 – Resultado da PCR multiplex do pool 1 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus
DNA Ladder (Invitrogen). 21-70: Amostras de 21 a 70. As setas indicam o tamanho de produto de PCR
esperado.
Fonte: O autor.
33
Figura 16 – Resultado da PCR multiplex do pool 2 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus
DNA Ladder (Invitrogen). 21-70: Amostras de 21 a 70. As setas indicam o tamanho de produto de PCR
esperado.
Fonte: O autor.
Figura 17 – Resultado da PCR multiplex do pool 1 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus
DNA Ladder (Invitrogen). 71-105: Amostras de 71 a 105. As setas indicam o tamanho de produto de PCR
esperado.
Fonte: O autor.
34
Figura 18 – Resultado da PCR multiplex do pool 2 em eletroforese de gel de agarose 1%. M: Marcador 1kb Plus
DNA Ladder (Invitrogen). 71-105: Amostras de 71 a 105. As setas indicam o tamanho de produto de PCR
esperado.
Fonte: O autor.
Figura 19 – Resultado da PCR multiplex do C1: Controle negativo pool 1. C2: Controle negativo pool 2 em
eletroforese de gel de agarose 1%. M: Marcador 1kb (Ludwig Biotec).
Fonte: O autor.
As 45 amostras que amplificaram em ambos os pools (entre 400pb e 500pb) foram
todas do estado do Mato Grosso de nove municípios diferentes, e a sua numeração, município
de coleta e valor de Ct, estão especificados na Tabela 1 abaixo.
35
Tabela 1 – Especificação do Ct (Cycle Threshold), Município do MT e numeração das 45 amostras que tiveram
amplificação positiva em ambos pools 1 e 2. Amostras sequenciadas aparecem com um asterisco (*).
Numeração Município Valor de Ct
1 Cuiabá 30
2 Tangará da Serra 37
3 Lucas do Rio Verde 32
4 Cuiabá 34
5 Marcelândia 33
6 Cuiabá 38
7 Lucas do Rio Verde 30
8 Várzea Grande 32
9 Várzea Grande 34
10 Várzea Grande 35
11 Várzea Grande 33
12 Cuiabá 36
13 Lucas do Rio Verde 37
14 Cuiabá 34
15 Cuiabá 33
16* Cuiabá 30
17 Cuiabá 32
18 Cuiabá 34
19 Cuiabá 34
20 Cuiabá 38
23 Sorriso 34
43* Juína 30
52 Lucas do Rio Verde 32
53 Marcelândia 33
55 Marcelândia 35
56 Marcelândia 37
57 Lucas do Rio Verde 32
58 Tangará da Serra 31
59 Tangará da Serra 31
60 Tangará da Serra 31
61 Lucas do Rio Verde 36
62 Cuiabá 35
63 Campo Verde 36
64 Lucas do Rio Verde 35
66 Lucas do Rio Verde 34
67 Lucas do Rio Verde 35
68 Lucas do Rio Verde 34
69 Lucas do Rio Verde 34
70 Cuiabá 38
36
77* Marcelândia 26
92 Cuiabá 33
94 Cuiabá 37
97* Lucas do Rio Verde 29
98 Lucas do Rio Verde 38
103 Nova Olímpia (Zona Rural) 31
Fonte: O autor.
6.3 SEQUENCIAMENTO
Um teste inicial com doze amostras foi realizado este, porém não apresentou
resultados devido a erros nos processos, devido a isso outros testes com DNA conhecidos e
controles foram realizados. Em seguida as amostras 16, 43, 77 e 97 foram sequenciadas com a
plataforma MinION de acordo com o descrito na metodologia e o resultado do tamanho do
genoma gerado de cada amostra, número de reads por amostra, nível em porcentagem da
cobertura da poliproteína do ZIKV e valor de Ct estão apresentados na Tabela 2 abaixo.
Tabela 2 – Resultado do sequenciamento das amostras com MinION, especificando o número de reads, tamanho
dos genomas obtidos em números de nucleotídeos, cobertura da poliproteína obtida em porcentagem (%) e valor
de Ct.
Amostra Número de reads Tamanho do genoma Cobertura em % Valor de Ct
V1_97 20.894 10.385 99,03% 29
V2_77 16.586 10.388 100% 26
V3_16 3.160 10.388 94,56% 30
V4_43 10.959 10.389 100% 30
Fonte: O autor.
A cobertura (quantidade de vezes que cada base foi sequenciada) é apresentada na
figura 20 para cada uma das 4 amostras sequenciadas. V1 para amostra 97, V2 a 77, V3 a 16 e
V4 a 43. O eixo X apresenta a quantidade de vezes que os reads foram sequenciados, o eixo
Y por sua vez, apresenta a posição dos reads no genoma em pares de bases (pb). As
coberturas acima de 20X são consideradas suficientes para montagem do genoma.
A amostra V3 apresentou as menores coberturas, em algumas regiões abaixo de 20X,
em consequência, a mesma apresentou gaps (lacunas) no seu genoma.
O padrão de locais com menores coberturas (acima de 20X) podem ser observados em
todas as amostras nos 100pb, 1800pb, 4500pb, 5700pb, 6200pb, principalmente 8000pb e
10000pb devido a provável dificuldade de amplificação de alguns primers dessas regiões do
genoma.
37
Figura 20 – Coberturas encontradas para as quatro amostras sequenciadas. Posição do genoma em pares de
bases. V1 amostra 97, V2 amostra 77, V3 amostra 16 e V4 amostra 43. O eixo X apresenta a quantidade de vezes
que os reads foram sequenciados. O eixo Y apresenta a posição dos reads no genoma em pares de bases (pb).
Fonte: O autor
38
Figura 21 – Árvore de máxima credibilidade dos clados (MCC tree) estimada com o genoma completo de 363
sequências de ZIKV. (A) Visão geral da filogenia com as amostras obtidas neste trabalho destacadas pelas setas
vermelhas; (B) e (C) detalhamento dos clados com as sequências deste estudo. Os círculos pretos demarcam os
nós com probabilidade posterior > 0,9.
Fonte: O autor.
39
A árvore filogenética de máxima credibilidade dos clados (MCC) está apresentada na
figura 21, foi estimada com 363 genomas, porém as sequências da linhagem Asiática foram
retiradas para melhor visualização.
As quatro amostras sequenciadas neste trabalho são indicadas pelas setas vermelhas
(Figura 21a) e formaram dois clados distintos: clado C com V1, V2 e V4 e clado B com V3,
sugerindo ao menos duas entradas do vírus no estado. As amostras V1, V2 e V4 foram
provenientes de cidades do interior do estado (Marcelândia, Lucas do Rio Verde e Juína,
respectivamente), enquanto que a amostra V3 é proveniente da capital do estado (Cuiabá).
O detalhamento do clado B é apresentado na figura 21b onde observa-se a relação da
amostra V3 com as amostras do Nordeste do Brasil.
O detalhamento do clado C está na figura 21c onde é possível ver a relação da
sequência V1 e V2 com amostras do Norte e Nordeste do Brasil, e da amostra V4 relacionada
com as amostras que foram exportadas para Ásia (China). É importante ressaltar que o suporte
para a separação das amostras V1, V2 e V4 não é alto, indicando que estas amostras formam
provavelmente um clado monofilético.
40
7. DISCUSSÃO
Desde maio de 2015, o Brasil reporta casos da febre pelo ZIKV e dentre estes casos, a
associação com a microcefalia (THÉZÉ et al., 2018). Ainda assim, existem diversos estados
que não possuem sequências depositadas em bancos de dados mesmo com números altos de
notificações e pouco se sabe sobre a dinâmica do vírus dentro do país. Este caso se deve
provavelmente pela dificuldade de sequenciar amostras clínicas, devido aos desafios impostos
pelas baixas cargas virais encontradas e a manipulação das amostras não ser apropriada para o
sequenciamento, principalmente para vírus de RNA (METSKY et al., 2017).
As baixas cargas virais são refletidas nos altos Ct apresentados nos diagnósticos
laboratoriais pelo RT-qPCR, onde 88,5% das amostras analisadas neste trabalho apresentaram
Ct maiores que 30 com uma média de Ct 34,1, valores similares a estudos anteriores (FARIA
et al., 2017a; METSKY et al., 2017; THÉZÉ et al., 2018).
Estes valores tem associação com a cobertura e completude genômica onde Ct abaixo
de 33 apresentam tipicamente coberturas mais altas e aqueles iguais ou maiores a 33
coberturas variáveis (FARIA et al., 2017a). Resultados comparáveis com os obtidos, pois a
cobertura foi para todas as amostras acima de 94% e Ct abaixo ou igual a 30 das amostras
sequenciadas.
Neste trabalho, a técnica de PCR multiplex foi escolhida devido as dificuldades
impostas pelo método de sequenciamento por metagenômica citados acima e demonstrados na
literatura por Metsky et al. (2017) onde das 38 amostras analisadas neste método quase
nenhuma apresentou RNA de ZIKV suficiente para fechar o genoma, então, eles se voltarão
para duas técnicas de enriquecimento, sendo uma delas a PCR multiplex.
Nos achados da figura 20, pode-se analisar que os padrões de menor cobertura são nas
mesmas regiões entre as amostras sequenciadas sugerindo que a eficácia da amplificação
varia entre as combinações dos pares de primers, necessitando de atualização nestas
sequencias de primers. Achados parecidos também foram descritos por Faria et al. (2017).
A árvore de MCC apresentou resultados compatíveis com a literatura (FARIA et al.,
2016), demonstrou que amostras da Ásia ficaram próximas a raiz dividindo o ancestral
comum com todas amostras das Américas. Amostras da Polinésia Francesa do surto de 2013
dividem um ancestral comum com as do Brasil (Dados não mostrados).
Duas amostras do Haiti, sendo um caso importado nos Estados Unidos, revelam a
possibilidade do ancestral comum da linhagem das Américas ter estado no Caribe antes da
41
chegada do ZIKV no Nordeste do Brasil, porém, estes dados devem ser analisados com
cautela tendo em vista o baixo número representativo de amostras.
Dados semelhantes foram encontrados por Faria et al (2017a) que inferiu a presença
do ancestral asiático ter chegado primeiramente no Brasil sem excluir a possibilidade (em
caso de novos dados serem apresentados) do Haiti ter sido intermediário para chegada e
estabelecimento do ZIKV no Brasil.
Campos et al. (2018) recentemente inferiu com essas mesmas duas amostras a
possibilidade de o ancestral comum ter estado no Caribe e entrado no Brasil posteriormente
por alguns militares brasileiros que estiveram em missão no Haiti em 2014 e importaram
casos de CHIKV e devido à grande migração de haitianos após o terremoto em 2010 para o
Brasil.
Assim como encontrado por Metsky et al. (2017) o Brasil possui sequências em todas
as bases dos clados (grupo de espécies com que tem um único ancestral comum) da árvore de
MCC originando os surtos nos estados do Brasil e distribuindo para as Américas, são
aproximadamente quatro grandes eventos de distribuições, dando suporte a teoria do surto ter
se originado no Brasil e sendo distribuído para outros países das Américas.
Nas árvores construídas verificamos que as quatro amostras do MT sequenciadas
geraram quatro linhagens distintas das quais três formaram um clado único (V1, V2 e V4)
chamado de clado C (Figura 21c). A amostra V1 possui seu ancestral comum mais próximo
com sequências do Pará, Paraíba, Bahia e Tocantins das regiões Nordeste e Norte do Brasil
respectivamente, sequências do surto no ano de 2015 e 2016, sendo provavelmente
introduzida no MT pelo Nordeste do país. A amostra V4 se relaciona com amostras que foram
exportadas para China no ano de 2016, porém, esse grupo não possui grande suporte devido
ao seu nó ter probabilidade posterior menor que 0,9. A amostra V3 apresentou uma linhagem
distinta presente no clado B (Figura 21b) possui ancestralidade comum com amostras de
Fortaleza e da Paraíba ambas do ano de 2015.
O fato das amostras se apresentarem em clados diferentes sugerem duas diferentes
entradas do vírus no estado do Mato Grosso. Semelhantemente, ocorreram quatro introduções
distintas no estado da Flórida nos Estados Unidos com a formação de quatro linhagens
distintas e dois clados (GRUBAUGH et al., 2017).
Atualmente, pouco se sabe sobre a filogeografia do ZIKV dentro do Brasil, porém,
sabemos da importância do Nordeste na distribuição do vírus para diversas outras regiões,
principalmente o Sudeste e Norte do país, e agora nossos achados corroboraram com essas
42
afirmações acrescentando o estado do MT representando a região Centro-Oeste do país
devido sua relação próxima com as amostras do Nordeste.
São necessários mais estudos para uma melhor compreensão da dinâmica de
disseminação do vírus dentro do país e principalmente obter mais sequencias completas do
ZIKV por todas as regiões do Brasil afim de obter conclusões epidemiológicas da circulação
viral no Brasil.
43
8. CONCLUSÃO
O presente trabalho colabora com a produção de sequencias genômicas do ZIKV no
Brasil principalmente por apresentar sequências do MT, estado que ainda não apresentava
nenhum genoma publicado apesar do surto que ocorreu no estado no ano de 2016, porém
ainda existe a necessidade do sequenciamento de mais genomas nesta região com um número
maior para melhor representatividade, assim como em diversos estados do Brasil que ainda
não apresentam sequencias depositadas.
Nosso trabalho demonstrou que o MT tem relação próxima com as amostras do
Nordeste do Brasil corroborando com a importância do mesmo na disseminação do ZIKV no
Brasil, porém, a compreensão da dinâmica de disseminação do ZIKV dentro do Brasil ainda é
incerta e a necessidade da produção de mais genomas e de análise dos mesmos ainda é
elevada.
44
REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA, R. V. M. Filogenia molecular das enzimas Isocitrato Liase e Malato Sintase e
sua evolução em Viridiplantae. [s.l.] Universidade Federal do Rio Grande do Norte, 2014.
BAUD, D. et al. An update on Zika virus infection. The Lancet, v. 0, n. 0, p. 1–11, jun. 2017.
BESNARD, M. et al. Evidence of perinatal transmission of zika virus, French Polynesia,
December 2013 and February 2014. Eurosurveillance, v. 19, n. 13, p. 1–4, 2014.
BRANTON, D. et al. The potential and challenges of nanopore sequencing. Nature
Biotechnology, v. 26, n. 10, p. 1146–1153, 2008.
BRUYN, A.; MARTIN, D. P.; LEFEUVRE, P. Phylogenetic Reconstruction Methods: An
Overview. In: BESSE, P. (Ed.). . Molecular Plant Taxonomy: Methods and Protocols,
Methods in Molecular Biology. 1115. ed. New York: Springer Science+Business Media,
2014. p. 256–277.
CALDART, E. T. Análise Filogenética: Conceitos Básicos E Suas Utilizações Como
Ferramenta Para a Epidemiologia Molecular De Doenças Virais. [s.l.] Universidade
Federal Do Rio Grande Do Sul, 2009.
CALVET, G. et al. Detection and sequencing of Zika virus from amniotic fluid of fetuses
with microcephaly in Brazil: a case study. The Lancet Infectious Diseases, v. 16, n. 6, p.
653–660, 2016.
CAMPOS, G.; BANDEIRA, A.; SARDI, S. Zika Virus Outbreak, Bahia Brazil. Emerging
Infectious Diseases, v. 21, n. 10, p. 1885–1886, 2015.
CAMPOS, T. D. L. et al. Revisiting Key Entry Routes of Human Epidemic Arboviruses into
the Mainland Americas through Large-Scale Phylogenomics. International Journal of
Genomics, 2018.
CAO-LORMEAU, V.-M. et al. Guillain-Barré Syndrome outbreak associated with Zika virus
infection in French Polynesia: a case-control study. The Lancet, v. 387, n. 1, p. 1531–1539,
2016.
CUGULA, F. R. et al. The Brazilian Zika virus strain causes birth defects in experimental
models. v. 534, n. 7606, p. 267–271, 2016.
CUNHA, M. S. et al. First complete genome sequence of the Zika virus released. Genome
Announcements, v. 4, n. 2, p. 1–2, 2016.
DE SOUZA, F. A. L. Detecção e Identificação Elétrica dos Nucleotídeos do DNA via
Nanoporo Híbrido de Grafeno e Nitreto de Boro Hexagonal: Um Estudo Teórico. [s.l.]
Universidade Federal do Espírito Santo, 2017.
DICK, G. W. A. Epidemiological Notes on Some Viruses Isolated in Uganda (Yellow fever,
Rift Valley fever, Bwamba fever, West Nile, Mengo, Semliki forest, Bunyamwera I Ntaya,
Uganda S and Zika viruses) BY. ROYAL SOCIETY OF TROPICAL MEDICINE AND
HYGIENE, v. 47, n. 1, p. 13–48, 1952.
DICK, G. W. A.; KITCHEN, S. F.; ADDOW, A. J. ZIKA VIRUS (I). ISOLATIONS AND
SEROLOGICAL SPECIFICITY. TRANSACTIONS OF THE ROYAL SOCIETY OF
TROPICAL MEDICINE AND HYGIENE, v. 46, n. 5, p. 509–520, 1952.
DOS SANTOS, T. et al. Zika Virus and the Guillain-Barre Syndrome - Case Series from
45
Seven Countries. The New England Journal of Medicine, v. 375, n. 16, p. 1598–1601,
2016.
DUFFY, M. et al. Zika Virus Outbreak on Yap Island, Federated States of Micronesia. The
New England Journal of Medicine, v. 360, n. 24, p. 2536–2543, 2009.
FARIA, N. R. et al. Zika virus in the Americas: Early epidemiological and genetic findings.
Science, v. 1126, n. 5036, p. 1–10, 2016.
FARIA, N. R. et al. Establishment and cryptic transmission of Zika virus in Brazil and the
Americas. Nature, v. 546, n. 7658, p. 406–410, 2017a.
FARIA, N. R. et al. Epidemic establishment and cryptic transmission of Zika virus in Brazil
and the Americas. BioRxiv, p. 1–39, 2017b.
FAYE, O. et al. Molecular Evolution of Zika Virus during Its Emergence in the 20th Century.
PLoS Neglected Tropical Diseases, v. 8, n. 1, p. 36, 2014.
FELSENSTEIN, J. Inferring phylogenies. Sunderland: Sinauer Associates, 2004.
FENG, Y. et al. Nanopore-based fourth-generation DNA sequencing technology. Genomics,
Proteomics and Bioinformatics, v. 13, n. 1, p. 4–16, 2015.
FOY, B. D. et al. Probable Non-Vector-borne Transmission of Zika Virus, Colorado, USA.
Emerging Infectious Diseases, v. 17, n. 5, p. 880–882, 2011.
FYTA, M. Threading DNA through nanopores for biosensing applications. Journal of
Physics Condensed Matter, v. 27, n. 27, p. 1–18, 2015.
GARDY, J.; LOMAN, N. J.; RAMBAUT, A. Real-time digital pathogen surveillance — the
time is now. Genome Biology, v. 16, n. 1, p. 155, 2015.
GREGORY, T. R. Understanding Evolutionary Trees. Evolution: Education and Outreach,
v. 1, n. 2, p. 121–137, 2008.
GRUBAUGH, N. D. et al. Genomic epidemiology reveals multiple introductions of Zika
virus into the United States. Nature, v. 546, n. 7658, p. 401–405, 2017.
HENNESSEY, M.; FISCHER, M.; STAPLES, J. E. Zika Virus Spreads to New Areas —
Region of the Americas, May 2015–January 2016. MMWR. Morbidity and Mortality
Weekly Report, v. 65, n. 3, p. 1–4, 22 jan. 2016.
HOULDCROFT, C. J.; BEALE, M. A.; BREUER, J. Clinical and biological insights from
viral genome sequencing. Nature Reviews Microbiology, v. 15, n. 3, p. 183–192, 2017.
IBGE. Mato Grosso - Brasil. Disponível em:
<https://cidades.ibge.gov.br/brasil/mt/panorama>. Acesso em: 27 jul. 2018a.
IBGE. Tocantins - Brasil. Disponível em: <https://cidades.ibge.gov.br/brasil/to/panorama>.
Acesso em: 27 jul. 2018b.
IBGE. Distrito Federal - Brasil. Disponível em:
<https://cidades.ibge.gov.br/brasil/df/panorama>. Acesso em: 27 jul. 2018c.
KASIANOWICZ, J. J. et al. Characterization of individual polynucleotide molecules using a
membrane channel. Proc. Natl. Acad. Sci. U.S.A., v. 93, n. November, p. 13770–13773,
1996.
46
KATOH, K.; STANDLEY, D. M. MAFFT multiple sequence alignment software version 7:
Improvements in performance and usability. Molecular Biology and Evolution, v. 30, n. 4,
p. 772–780, 2013.
KINDHAUSER, M. et al. Zika: the origin and spread of a mosquito-borne virus. Bull World
Health Organization, v. 94, n. 0, p. 675–686, 2016.
LANCIOTTI, R. S. et al. Phylogeny of zika virus in western Hemisphere, 2015. Emerging
Infectious Diseases, v. 22, n. 5, p. 933–935, 2016.
LANGDALE, J. A.; HARRISON, C. J. A step by step guide to phylogeny reconstruction.
The Plant Journal, v. 45, n. 0, p. 561–572, 2006.
LOMAN, N. J.; WATSON, M. Successful test launch for nanopore sequencing. Nature
Methods, v. 12, n. 4, p. 303–304, 2015.
MACNAMARA, F. N. Zika virus: A report on three cases of human infection during an
epidemic of jaundice in Nigeria. Transactions of the Royal Society of Tropical Medicine
and Hygiene, v. 48, n. 2, p. 139–145, 1954.
MALLET, H.-P.; VIAL, A. L.; MUSSO, D. Bilan de l’épidémie à virus Zika survenue en
Polynésie française entre octobre 2013 et mars 2014. De la descriotion de l’épidémie aux
connaissances acquises après l’évènement. Bulletin hebdomadaire epidemiologique 20-21,
v. 20–21, n. 0, p. 367–373, 2016.
MARTINES, R. B. et al. Notes from the Field: Evidence of Zika Virus Infection in Brain and
Placental Tissues from Two Congenitally Infected Newborns and Two Fetal Losses — Brazil,
2015. Morbidity and Mortality Weekly Report 1Infectious, v. 65, n. 6, p. 159–160, 2016.
METSKY, H. C. et al. Zika virus evolution and spread in the Americas. Nature, v. 546, n.
7658, p. 411–415, 2017.
MINISTÉRIO DA SAÚDE. Boletim Epidemiológico - Monitoramento dos casos de
microcefalia no Brasil até a Semana Epidemiológica 50. Disponível em:
<http://portalarquivos2.saude.gov.br/images/pdf/2015/dezembro/28/2015-boletim-
microcefalia-se50-vol46-n46.pdf>. Acesso em: 27 jul. 2018.
MINISTÉRIO DA SAÚDE. Boletim Epidemiológico. Monitoramento dos casos de
dengue, febre de chikungunya e febre pelo vírus Zika até a Semana Epidemiológica 27,
2016 Dengue. Disponível em:
<http://portalarquivos2.saude.gov.br/images/pdf/2016/agosto/10/2016-026--2-..pdf>. Acesso
em: 27 jul. 2018.
MINISTÉRIO DA SAÚDE. Boletim Epidemiológico - Monitoramento integrado de
alterações no crescimento e desenvolvimento relacionadas à infecção pelo vírus Zika e
outras etiologias infecciosas, da Semana Epidemiológica 45/2015 até a Semana
Epidemiológica 02/2017. Disponível em:
<http://portalarquivos2.saude.gov.br/images/pdf/2017/fevereiro/27/2017_003.pdf>. Acesso
em: 27 jul. 2018.
MLAKAR, J. et al. Zika Virus Associated with Microcephaly. New England Journal of
Medicine, v. 374, n. 10, p. 951–958, 2016.
MUSSO, D. et al. Potential for Zika virus transmission through blood transfusion
demonstrated during an outbreak in French Polynesia, November 2013 to February 2014.
Eurosurveillance, v. 19, n. 14, p. 1–3, 2014.
47
MUSSO, D.; CAO-LORMEAU, V. M.; GUBLER, D. J. Zika virus: following the path of
dengue and chikungunya? The Lancet, v. 386, n. 9990, p. 243–244, 2015.
MUSSO, D.; GUBLER, D. J. Zika Virus. Clinical Microbiology Reviews, v. 29, n. 3, p.
487–524, 2016.
NACCACHE, S. N. et al. Distinct zika virus lineage in Salvador, Bahia, Brazil. Emerging
Infectious Diseases, v. 22, n. 10, p. 1788–1792, 2016.
NEI, M.; KUMAR, S. Molecular evolution and phylogenetics. New York, NY: Oxford
University Press, 2000.
NG, P. C.; KIRKNESS, E. F. Whole Genome Sequencing. Methods in Molecular Biology,
v. 628, n. 0, p. 215–226, 2010.
O’DONNELL, C. R.; WANG, H.; DUNBAR, W. B. Error analysis of idealized nanopore
sequencing. Electrophoresis, v. 34, n. 15, p. 2137–2144, 2013.
PAGE, R. D. M.; HOLMES, E. C. Molecular Evolution: A Phylogenetic Approach.
Malden, MA: Blackwell Publishing, 1998.
PAN AMERICAN HEALTH ORGANISATION. Neurological syndrome, congenital
malformations, and Zika virus infection. Implications for public health in the Americas. Pan
American Health Organization, p. 1–11, 2015.
PARRA, B. et al. Guillain–Barré Syndrome Associated with Zika Virus Infection in
Colombia. New England Journal of Medicine, v. 375, n. 16, p. 1513–1523, 2016.
PASSEMARD, S.; KAINDL, A. M.; VERLOES, A. Microcephaly. In: DULAC, O.;
LASSONDE, M.; SARNAT, H. B. (Eds.). . Handbook of Clinical Neurology. 3. ed. [s.l.]
Elsevier B.V., 2013. v. 111p. 129–141.
PETERSEN, L. R. et al. Zika Virus. New England Journal of Medicine, v. 374, n. 16, p.
1552–1563, 2016.
PLOURDE, A. R.; BLOCH, E. M. A Literature Review of Zika Virus. Emerging Infectious
Diseases, v. 22, n. 7, p. 1185–1192, 2016.
QUICK, J. et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and
other virus genomes directly from clinical samples. NATURE PROTOCOLS, v. 12, n. 6, p.
1261–1276, 2017.
RAMBAUT, A. et al. Posterior Summarization in Bayesian Phylogenetics Using Tracer 1.7.
Systematic Biology, v. 00, n. 0, p. 1–3, 2018.
SAMPATHKUMAR, P.; SANCHEZ, J. L. Zika Virus in the Americas: A Review for
Clinicians. Mayo Clinic Proceedings, v. 91, n. 4, p. 514–521, 2016.
SES-DF. Informativo Epidemiológico Dengue, Chikungunya e Zika. Disponível em:
<http://www.saude.df.gov.br/wp-conteudo/uploads/2018/04/Informativo_n_01_2018.pdf>.
Acesso em: 27 jul. 2018.
SES-MT. Boletim Epidemiológico Dengue, Febre de Chikungunya e Febre pelo vírus
Zika. Disponível em: <http://www.saude.mt.gov.br/suvsa/arquivos/526/boletins-
epidemiologicos?p=ZIKA>. Acesso em: 27 jul. 2018.
SES-TO. Zika : Relatório do Monitoramento (1a a 52a semana epidemiológica de 2017).
48
Disponível em: <https://central3.to.gov.br/arquivo/388001/>. Acesso em: 27 jul. 2018.
SHUKLA, S. et al. Rapid Detection Strategies for the Global Threat of Zika Virus: Current
State, New Hypotheses, and Limitations. Frontiers in Microbiology, v. 7, n. 1, p. 1–15,
2016.
SUCHARD, M. A. et al. Bayesian phylogenetic and phylodynamic data integration using
BEAST 1.10. Virus Evolution, v. 4, n. 1, p. 1–5, 2018.
TANG, H. et al. Zika Virus Infects Human Cortical Neural Precursors and Attenuates Their
Growth. Cell Stem Cell, v. 18, n. 5, p. 587–590, 2015.
THÉZÉ, J. et al. Genomic Epidemiology Reconstructs the Introduction and Spread of Zika
Virus in Central America and Mexico. Cell Host and Microbe, p. 855–864, 2018.
VAN DOORN, P. A.; RUTS, L.; JACOBS, B. C. Clinical features, pathogenesis, and
treatment of Guillain-Barré syndrome. The Lancet Neurology, v. 7, n. 10, p. 939–950, 2008.
VIRALZONE. Zika virus. Disponível em:
<http://viralzone.expasy.org/6756?outline=all_by_species>. Acesso em: 22 ago. 2017.
YOKOYAMA, S.; STARMER, W. T. Possible Roles of New Mutations Shared by Asian and
American Zika Viruses. Molecular Biology and Evolution, v. 34, n. 3, p. 525–534, 2017.
YUAN, L. et al. A single mutation in the prM protein of Zika virus contributes to fetal
microcephaly. Science, v. 7120, n. 1126, p. 1–8, 2017.
YUN, S.-I. et al. Complete Genome Sequences of Three Historically Important,
Spatiotemporally Distinct, and Genetically Divergent Strains of Zika Virus: MR-766, P6-740,
and PRVABC-59. Genome Announcements, v. 4, n. 4, p. e00800-16, 2016.
ZANLUCA, C. et al. First report of autochthonous transmission of Zika virus in Brazil.
Memorias do Instituto Oswaldo Cruz, v. 110, n. 4, p. 569–572, 2015.
ZUKERKANDL, E.; PAULING, L. Molecules as documents of evolutionary history.
Journal of Theoretical Biology, v. 8, n. 1, p. 357–366, 1965.
49
ANEXO I – CONJUNTO DE PRIMERS UTILIZADOS NA PCR MULTIPLEX
Conjunto de Primers 1
Conjunto de Primers 2
Primers indicados com * (um asterisco) devem estar na concentração de 50µM e
Primers indicados com ** (dois asteriscos) devem estar na concentração de 100µM para
normalizar a cobertura do sequenciamento.
50
ANEXO II – ARTIGO SUBMETIDO PARA A REVISTA ARCHIVES OF
VIROLOGY (ANNOTATED SEQUENCE)
Nanopore sequencing of a novel bipartite New World Begomovirus species infecting
cowpea (Vigna unguiculata)
Fernanda Y. B. Naito1; Fernando L. Melo1*; Maria Esther N. Fonseca2, Carlos A. F.
Santos3; Carolina R. Chanes4, Bergmann M. Ribeiro1, Robert L. Gilbertson5, Leonardo
S. Boiteux1,2 & Rita de Cássia Pereira-Carvalho1
1Universidade de Brasília (UnB), Brasília–DF, Brazil;
2National Center for Vegetable Crops Research (CNPH), Embrapa Vegetable Crops, Brasília–
DF, Brazil.
3Embrapa Semi-Arid, Petrolina–PE, Brazil.
4Universidade Católica de Brasília, Brasília–DF, Brazil.
5University of California, Davis, USA.
*Author for correspondence: [email protected]
51
Abstract
A new bipartite Begomovirus species was detected on cowpea plants exhibiting leaves with
bright golden mosaic symptoms under field conditions in Brazil. Consensus sequences of the
complete DNA-A and DNA-B components of an isolate of the virus (PE–088) was obtained
by nanopore sequencing and confirmed by Sanger sequencing. The genome organization
displayed typical features of New World (NW) begomoviruses. Pairwise sequence
comparisons revealed low levels of identity with other Begomovirus species previously
reported infecting cowpea around the world. Phylogenetic analysis of the complete sequences
of DNA-A components from an array of closely related begomoviruses revealed that the
closest relatives of PE–088 (85-87% nucleotide sequence identities) were three legume-
infecting begomoviruses from Brazil: Bean golden mosaic virus, Macroptilium common
mosaic virus and Macroptilium yellow vein virus. According to the current classification
criteria, PE–088 represents a new species in the genus Begomovirus. We tentatively named
this species as Cowpea bright yellow mosaic virus (CoBYMV) to designate isolates that are
inducing bright golden leaf mosaic symptoms in cowpea across major producing areas of
Brazil.
52
Whitefly-transmitted geminiviruses (family Geminiviridae genus Begomovirus) are of
great economic relevance in many tropical and subtropical regions [1]. In terms of legumes
and pulses, begomovirus diseases cause more often economic problems in common beans
(Phaseolus vulgaris L.) in the New World (NW) [2] and in mung beans (Vigna radiata L.
Wilkeezek) in the Old World (OW) [1]. However, to date, begomovirus-induced diseases
have not been a major problem in cowpea [Vigna unguiculata (L.) Walp.] crop worldwide.
Although at least eight begomoviruses have been characterized to various degrees in
association with cowpea, there is a need for further studies on the potential importance of
begomovirus diseases in this crop and to better understand their diversity across distinct
geographic areas. The need for further characterization is evidenced by the fact that a same
name – Cowpea golden mosaic virus (CGMV) has been given to unrelated viruses from India
(GenBank AY618902), from Nigeria (AF029217), and from a partially characterized
Brazilian isolate (AF188708). The isolate from India is actually Mungbean yellow mosaic
India virus (MYMIV), based on having 98% sequence identity to isolates of this virus.
Cowpea is the most important legume crop in the Brazilian semiarid region [3].
Cowpea yields in Brazil can be severely affected by a “golden leaf mosaic disease” associated
with a begomovirus that has not been fully characterized. Here, we describe a novel bipartite
Begomovirus species infecting cowpea in Brazil.
Cowpea leaf samples without and with conspicuous begomovirus-like symptoms
(bright yellow/golden mosaic) were collected in commercial fields in Petrolina in Pernambuco
State, Brazil (Latitude: 09º 23’ 55’’S / Longitude: 40º 30’03’’ W and 376 meters above sea
level) in 2011. The disease incidence in this area was about 30%. Total DNA was extracted
from single representative leaf samples (1g each) using 2X CTAB buffer followed by rolling
circle amplification (RCA) [4]. These DNA samples were used as templates in PCR assays
with the degenerate begomovirus primer pairs designed to direct the amplification of genomic
segments of the DNA-A and DNA-B components [5]. Amplicons of expected-size of DNA
fragments of 1.1 kb (DNA-A) and 0.5 kb (DNA-B) were observed in agarose gel
electrophoresis only in samples exhibiting bright yellow (golden) mosaic symptoms (Fig.
1A).
The complete genome of the PE–088 isolate was obtained by nanopore sequencing
with the Ligation Sequencing Kit 1D (Oxford Nanopore Technologies) following
manufacturer’s instructions. Briefly, the RCA product was mixed with the NEBNext® Ultra™
II End Repair/dA-Tailing Module (New England Biolabs) and incubated for 5 min at 20˚C for
end-repair reaction, and then 5 min at 65˚C for dA-tailing reaction, followed by purification
53
with AMPure XP beads (Beckman Coulter) according to manufacturer’s instructions.
Blunt/TA Ligase Master Mix (New England Biolabs) was used to ligate native barcode
adapters (NB01) to end prepared DNA for 10 min at room temperature, and then purified
using AMPure XP beads. Four barcoded samples from diverse sources (insect and human
viruses) were pooled and the adapter ligation and tethering were then carried out with Adapter
Mix (Oxford Nanopore Technologies) and NEB Blunt/TA ligation Master Mix (New England
Biolabs). The adapter-ligated DNA library was then purified with AMPure beads, followed by
the addition of Adapter Bead binding buffer (Oxford Nanopore Technologies), and finally
eluted in Elution Buffer. Each R9 flow cell was primed with 1,000 µL of a mixture Running
Buffer with Fuel (RBF) and nuclease-free water. Then 12 µL of the library was diluted in 35
µL RBF, 25.5 µL of Library Loading Beads, and 2.5 μL nuclease-free water and loaded onto
a Spot-on flowcell (FLO-MIN106) (Oxford Nanopore Technologies) on a MinION Mk1B
(Oxford Nanopore Technologies). The raw FAST5 reads were uploaded to the online server
for base calling through the Metrichor EPI2ME platform. The basecalled MinION reads were
converted to FASTQ and assembled with Canu v1.7 [6]. The resulting assembly was polished
using Nanopolish v0.9.0 [7], to improve the accuracy of the consensus sequences. The
resulting contigs were translated and compared to the viral protein RefSeq database with
Blastx [8] implemented in Geneious version 9.1.2 [9]. The assembled contigs of the putative
complete DNA-A and DNA-B components (corresponding to a putative new species present
in our cowpea samples) were manually annotated and deposited in GenBank (accessions
MH469731 and MH469732). The complete DNA-A sequence was confirmed by Sanger
sequencing, as previously described [10].
The PE–088 DNA-A component is 2,632 nt and exhibited all major characteristics of
NW begomoviruses, including the virion-sense gene (AV1) and the five complementary sense
(AC1, AC2, AC3, AC4, and AC5) genes (Fig. 1B). The DNA-B genome is 2,593 nt and
harbored genes homologous to BV1 and BC1 (Fig. 1B). The common region (CR) was
identified by comparing the DNA-A and DNA-B sequences and it was 241 nt in size. The CR
possessed its functional elements, including the conserved hairpin containing stem-loop, the
conserved TAATATTAC nonanucleotide as well as repeated sequences (‘iterons”) (Fig. 1C
and 1D). Interestingly, the common region includes 93 nt of Rep coding region (Fig. 1B and
1C), which in DNA-B forms a small ORF (31 aa) encoding a Rep-like peptide with conserved
motif I of Rep proteins (Fig. 1D). Short Rep homologous sequences (sRepHS) were described
in some begomoviruses and could be involved in the posttranscriptional regulation of the
cognate viral Rep gene [11].
54
The BLASTn analyses of the complete DNA-A sequence revealed 86% nt identity of
the isolate PE–088 with Macroptilium common mosaic virus (MacCMV) from North-East
Brazil. Moreover, a partial genomic sequence (1,365 bp encompassing the Rep associated
protein and CP genes) of a cowpea-infecting begomovirus isolate from Brazil (AF188708),
which was tentatively named CGMV, was 97% identical with that of PE–088 DNA-A.
Furthermore, these sequences of cowpea-infecting begomovirus from Brazil were genetically
distinct (57% nt sequence identity) from two other cowpea-infecting begomoviruses from the
OW: CGMV (AF029217) and MYMIV (AY618902). These results suggest that both
Brazilian isolates (PE-088 and AF188708) represent isolates or variants of a novel viral
species, which is distinct from CGMV and MYMIV.
The complete sequence of the PE–088 DNA-A component was aligned to other related
viral species available in GenBank with MAFFT [12]. A phylogenetic tree was inferred with
FastTree [13] and a pairwise comparison was performed using SDT [14]. The phylogenetic
tree and pairwise comparison heatmap were plotted together with Evolview v2 [15]. PE–088
grouped together with legume-infecting begomoviruses from Brazil: Macroptilium yellow
vein virus (MacCMV) and Bean golden mosaic virus (BGMV) with nucleotide sequence
identities ranging from 85 to 87% (Fig. 2). Bipartite tomato-infecting begomoviruses from the
NW formed a distinct group with a maximum identity of 81% with PE–088.
DNA-A genome pairwise identities of 91% and 94% are currently accepted as the
demarcation thresholds for distinct species and strains, respectively for members of the genus
Begomovirus [1]. Therefore, PE–088 is a new bipartite species for which was the name
Cowpea bright yellow mosaic virus (CoBYMV) is proposed. The characterization of this
novel cowpea-infecting begomovirus species is important for better understand the nature of
these viruses in Brazil. More nationwide surveys are needed in order to establish CoBYMV as
a major economic problem for the cowpea crop in Brazil as well as to guide resistance
breeding programs. For that will be necessary to fulfill Koch’s Postulates with the
development of infectious clones and an agroinoculation method for screening cowpea
germplasm collection in search for natural sources of genetic resistance to CoBYMV. Our
work also demonstrated, for the first time, that a portable nanopore sequencing device can be
an alternative tool for characterization of plant virus genomes in a very accurate and rapid
way.
55
References
1. Brown JK, Zerbini FM, Navas-Castillo J, Moriones E, Ramos-Sobrinho R, Silva JCF,
Fiallo-Olivé E, Briddon RW, Hernández-Zepeda C, Idris A, Malathi VG, Martin DP, Rivera-
Bustamante R, Ueda S, Varsani A (2015) Revision of Begomovirus taxonomy based on
pairwise sequence comparisons. Arch Virol 160:1593–1619
2. Faria JC, Aragão FJL, Souza TLPO, Quintela ED, Kitajima EW, Ribeiro SG (2016).
Golden mosaic of common beans in Brazil: management with a transgenic approach. APS
Features. doi:10.1094/APSFeature-2016-10.
3. Santos CAF, Boiteux LS (2013) Breeding biofortified cowpea lines for semi-arid tropical
areas by combining higher seed protein and mineral levels. Gen Mol Res 12: 6782–6789
4. Inoue-Nagata AK, Albuquerque LC, Rocha WB, Nagata T (2004) A simple method for
cloning the complete begomovirus genome using the bacteriophage φ29 DNA polymerase. J.
Virol. Methods 116: 209–211
5. Rojas MR, Gilbertson RL, Russel DR, Maxwell DP (1993) Use of degenerate primers in
the polymerase chain reaction to detect whitefly-transmitted geminiviruses. Plant Dis 77:
340–334.
6. Koren S, Walenz BP, Berlin K, Miller JR, Bergman NH, Phillippy AM (2017) Canu:
scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation.
Genome research 27:722-736.
7. Loman NJ, Quick J, Simpson JT (2015) A complete bacterial genome assembled de novo
using only nanopore sequencing data. Nature Methods 12:733-735.
8. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic Local Alignment
Search Tool. J. Mol. Biol. 215:403-410.
9. Kearse M, Moir R, Wilson W, Stones-Havas S, Cheung M, Sturrock S, Buxton S, Cooper
A, Markowitz S, Duran C, Thierer T, Ashton B, Meintjes P, Drummond A (2012) Geneious
Basic: An integrated and extendable desktop software platform for the organization and
analysis of sequence data. Bioinformatics 28:1647-1649.
10. Patel VP, Rojas MR, Paplomatas EJ, Gilbertson RL (1993) Cloning biologically active
geminivirus DNA using PCR and overlapping primers. Nuc. Acids Res. 21: 1325–1326.
11. Gregorio-Jorge J, Bernal-Alcocer A, Bañuelos-Hernández B, Alpuche-Solís AG,
Hernández-Zepeda C, Moreno-Valenzuela O, Frías-Treviño G, Argüello-Astorga GR (2010)
Analysis of a new strain of Euphorbia mosaic virus with distinct replication specificity
unveils a lineage of begomoviruses with short Rep sequences in the DNA-B intergenic region.
Virol. J. 7: 275.
12. Katoh K, Misawa K, Kuma K, Miyata T (2002) MAFFT: a novel method for rapid
multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 30:3059–
3066.
13. Price MN, Dehal PS, Arkin AP (2009) FastTree: computing large minimum evolution
trees with profiles instead of a distance matrix. Mol. Biol. Evol. 26:1641–1650.
56
14. Muhire BM, Varsani A, Martin DP (2014) SDT: A Virus Classification Tool Based on
Pairwise Sequence Alignment and Identity Calculation. PLoS One 9: e108277.
15. He Z, Zhang H, Gao S, Lercher MJ, Chen WH, Hu S (2016) Evolview v2: an online
visualization and management tool for customized and annotated phylogenetic trees. Nucleic
Acids Research. 44: W236-W241.
57
Figure Legends
Fig. 1. (A) Symptoms of bright yellow mosaic in cowpea (Vigna unguiculata) in a
commercial field in Petrolina-PE, Brazil. (B) Cowpea bright yellow mosaic virus (PE-088)
genome organization, including the common region and the stem loop/. (C) DNA-A and
DNA-B common regions showing where the Rep ORF starts, the GGKGT core, TATA
region, stem loop and nonanucleotide. The asterisks show the differing nucleotides between
DNA-A and DNA-B. (D) Rep Iteron-Related domain showing motif I in the DNA-A and
DNA-B genomes.
Fig. 2. Maximum-likelihood tree and nucleotide pairwise identity comparison of CoBYMV
related begomoviruses. Both analyses were performed using DNA-A component. The tree is
midpoint rooted for clarity. The branch support was assessed by a Shimodaira-Hasegawa-like
test and values >90 are indicated by black dots.
58
Figure 1
59
Figure 2
Top Related