Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf ·...

109
Introdução à Bioinformática Danillo Oliveira de Alvarenga Departamento de Tecnologia Universidade Estadual Paulista Jaboticabal-SP

Transcript of Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf ·...

Page 1: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Introdução à

Bioinformática

Danillo Oliveira de Alvarenga

Departamento de TecnologiaUniversidade Estadual Paulista

Jaboticabal-SP

Page 2: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Área interdisciplinar

– Biologia Molecular

– Bioquímica

– Tecnologia da Informação

– Ciência da Computação

● Desenvolvimento

– escrita de algoritmos

– implementação de métodos

● Análise

– utilização de programas para análise

– interpretação de informação

Bioinformática

Page 3: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Outros nomes

– biologia computacional

– computação biológica

● Controvérsia

– várias definições

– várias discussões

● Diferenças sutis

– análise

– desenvolvimento

Bioinformática

Page 4: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

No nascimento da biologia molecular, reconheceu-se que um tema de pesquisa central deveria ser como os organismos vivos reúnem, processam, armazenam e

utilizam informação. No início dos anos 1970, definimos bioinformática como o estudo dos processos informáticos em sistemas bióticos em múltiplos níveis.

Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou a significar, a partir dos anos 1980, o desenvolvimento e o

uso de métodos computacionais para gerenciamento e análise de dados de sequências, determinação de estrutura proteica, predição funcional

baseada em homologia e filogenia.

Paulien Hogeweg

The Roots of Bioinformatics in Theoretical BiologyPLOS Comp Biol 7: e1002021, 2011

Bioinformática

Page 5: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Mágica

– solução para alguns problemas

– dados ruins resultados ruins→– tão ampla quanto a própria biologia

● Totalmente inacessível

– prática

– diferentes níveis

● Uma disciplina completamente distinta

– necessária em praticamente todas as áreas

– biologia do século XXI

Bioinformática Não É

Page 6: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Margaret Oakley Dayhoff(1925-1983)

Atlas of Protein Sequence and Structure (1985)

Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences (1966)

Histórico

Page 7: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Histórico

Page 8: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Histórico

Page 9: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Histórico

Page 10: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Avanços tecnológicos e científico

– computação

– biologia molecular

– sequenciamento

● Volume de dados

– larga escala

– alta velocidade

– grande complexidade

● Bioinformática

– ferramenta mais viável

Relevância

Page 11: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Sequências Disponíveis

GenBank

● Dezembro 1982– 680.338 bases– 606 sequências

● Junho 2017– 234.997.362.623 bases– 201.663.568 sequências

WGS

● Abril 2002– 692.266.338 bases– 172.768 sequências

● Junho 2017– 2.164.683.993.369 bases– 487.891.767 sequências

Page 12: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Genomas Disponíveis

Page 13: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuição de Genomas por Domínio

Page 14: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Ômicas

DNA

RNA

proteínas

metabólitos

diversos

← Genômica, Metagenômica

← Transcritômica, Metatranscritômica

← Proteômica, Metaproteômica

← Metabolômica, Metametabolômica

Page 15: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Estudo do DNA total em uma célula ou cápsula

● Etapas

– extração de DNA do organismo desejado

– fragmentação do DNA extraído

– sequenciamento do genoma-alvo

– reconstituição a partir dos fragmentos sequenciados

– predição de genes e anotação

Genômica

Page 16: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Genômica

Page 17: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Estudo do RNA mensageiro total em uma célula

● Etapas

– caracterização do genoma-alvo

– extração de RNA do organismo desejado

– eliminação de RNA ribossômico e transportador

– transcrição reversa e sequenciamento

– mapeamento dos transcritos contra referência

– avaliação de diferenças em relação às condições

Transcritômica

Page 18: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Transcritômica

Page 19: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Estudo de moléculas em amostras mistas

– metagenômica

– metatranscritômica

– metaproteômica

– metametabolômica

● Etapas

– extração das moléculas da amostra

– tratamento das moléculas extraídas

– sequenciamento e reconstituição

– identificação e separação de sequências

– predição e anotação de táxons e funções

Meta*ômicas

Page 20: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Genômica

– um organismo

– linhagem cultivada

– ambiente estranho

● Metagenômica

– vários organismos

– não cultivados ou em cocultivo

– genômica de comunidades

Metagenômica

Page 21: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Metagenômica

Page 22: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Recursos computacionais

– capacidade de processamento

– espaço para armazenamento

● Fonte de dados

– organismos

– alvos

● Recursos humanos

– analistas

– programadores

Estrutura

Page 23: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Composição biológica

– sequências

● Informação biológica

– anotação

– comparação

– predição

● Bancos

– públicos

– privados

Dados

Page 24: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Biomoléculas

– ácidos nucleicos

– proteínas

● Conjuntos de caracteres alfabéticos

– 5 + 12 bases

– 20 + 13 aminoácidos

Sequências Biológicas

Page 25: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Nucleotídeos

Page 26: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Bases Nitrogenadas

Page 27: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Mutações

Page 28: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Nucleotídeos

Page 29: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Ácido Desoxirribonucleico (DNA)

Page 30: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Ácido Ribonucleico (RNA)

Page 31: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Gene

Page 32: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Operon

Page 33: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Agrupamento Gênico

Page 34: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Homologia

– Caractere compartilhado presente no ancestral comum

– Mesma origem, não necessariamente a mesma função

– Revela relação evolutiva

● Homoplasia

– Caractere compartilhado não presente no ancestral comum

– Origem diferente, função semelhante

– Não revela relação evolutiva

Origem de Genes

Page 35: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Ortólogos

– Transferência vertical

● Xenólogos

– Transferência horizontal

● Parálogos

– Duplicação gênica

Homólogos

Page 36: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Aminoácidos

Page 37: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Aminoácidos

Page 38: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Proteínas

Page 39: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Primária de Proteínas

Page 40: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Secundária de Proteínas

Page 41: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Secundária de Proteínas

Page 42: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Secundária de Proteínas

Page 43: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Terciária de Proteínas

Page 44: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Terciária de Proteínas

Page 45: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Terciária de Proteínas

Page 46: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Estrutura Quaternária de Proteínas

Page 47: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Bases Nitrogenadas

Base 1 letra Base 1 letra

adenina A guanina ou citosina S

citosina C adenina ou timina W

guanina G guanina ou timina K

timina / uracila T / U adenina ou citosina M

desconhecida Nadenina ou guanina ou timina D

lacuna – adenina ou citosina ou timina

H

purina R adenina ou guanina ou citosina V

pirimidina Yguanina ou timina ou citosina B

Page 48: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Aminoácidos

Aminoácido 3 letras 1 letra Aminoácido 3 letras 1 letra

alanina Ala A metionina Met M

cisteína Cys C asparagina Asn N

aspartato Asp D prolina Pro P

glutamato Glu E glutamina Gln Q

fenilalanina Phe F arginina Arg R

glicina Gly G serina Ser S

histidina His H treonina Thr T

isoleucina Ile I valina Val V

lisina Lys K triptofano Trp W

leucina Leu L tirosina Tyr Y

Page 49: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Aminoácidos

Outros 3 letras 1 letra

desconhecido Xaa X

selenocisteína Sec U

pirrolisina Pyl O

asparagina ou aspartato Asx B

glutamina ou glutamato Glx Z

leucina ou isoleucina Xle J

hidrofóbico inexistente Φ

aromático inexistente Ω

alifático inexistente Ψ

pequeno inexistente π

hidrofílico inexistente ζ

positivo inexistente +

negativo inexistente –

Page 50: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Código Genético

Page 51: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Códon de início

– Aqui Tem um Gene

● Códons de terminação

– Termine AgorA

– Termine AGora

– Termine aGorA

Código Genético

5’- ATG TGA CTA GCT ACT ACG TAC TAG CGA TCG ATG CAT CGT ACA TGA -3’

5’- ATG AGC TAC GTA CGT ACG ATC CGT AGT CTG ACT GAG AGT AGC TAG -3’

5’- ATG CTA GTC GTA CTG AGT CAT GCG ATC TAA CGA TCA GTT GGG TGA -3’

Page 52: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Bases/Aminoácidos

– Fasta

● Qualidades

– Qual

– Fastq

● Anotações

– GenBank

– GFF

– EMBL

Formatos de Sequências

Page 53: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Fasta (.fasta, .fas, .fa, .fna)

>Sequência 1ATCGAGTCAGTCGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGTCATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCAGTCGTATCGAT

>Sequência 2AGTCGTAGTCAGTCGATCGTAGTCGATCGTAGTCCCAGCGATTCGATCGTAGTCGATCGTAGTCGATCGTCAGTCTGATGCAGTCGTAGTCAGTCGATGCTGATA

>Sequência 3GACGTACGTAGCTAGTCGATCGTAGTCGATCGTAGCGTATCAGTCGTAGTCAGTCGTAGTCAGTCGTAGTCGAGTCTGACGTAGTCGATCGTAGTCGATCGTACG

Formatos de Sequências

Page 54: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Fasta (.fasta, .fas, .fa, .faa)

>Sequência 1KLLAKKCACJALCJALKKLVLKEKLFLKEICIIOSKALKJFSDJOFJEHVEUCIAWKLCKJSVUIEFIALHFEYFHADJASJFOSDUSDUFJAOPKFSKAUOAAC

>Sequência 2AUFGEWYFWEJOKAMVJASDTRSRSUYIEKFKFMVAUDTWTYHVMVKSVISYGAJSJKAMAOIVHDSYWUAOIWYYEEUHGJLKOAIVTAGGBVKDVIWEIEJEI

>Sequência 3OIEIWUTIOEJGIEKGLMJHFUIHSFJAOFJAJGHIWEJUHERUIGSKDFMKSDMFIOSJDIJSDIGOJSAIOJDSGEHGUIEHUWIURGOSOJWUWQIJJISJS

Formatos de Sequências

Page 55: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Grau de confiança

– probabilidade de erro

– escala logarítmica

● Phred

– 10: 1 em 10 (90 %)

– 20: 1 em 100 (99 %)

– 30: 1 em 1000 (99,9 %)

– 40: 1 em 10.000 (99,99%)

Qualidade de Sequenciamento de DNA

Page 56: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Qual (.qual)

>Sequência 110 20 30 40 50 50 50 50 50 20 25 2530 30 20 15 20 35 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 50 50 50 50 50 50 50 50 5050 50 50 20 30 20 10 10

Formatos de Sequências

Page 57: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Fastq (.fastq)

@Sequência 1TTGCCTGCCTATCATTTTAGTGCCTGTGAGGTGGAGATGTGAGGATCAGT+Sequência 1hhhhhhhhhhghhghhhhhfhhhhhfffffe`ee[`X]b[d[ed`[Y[^Y

@Sequência 2GATTTGTATGAAAGTATACAACTAAAACTGCAGGTGGATCAGAGTAAGTC+Sequência 2hhhhgfhhcghghggfcffdhfehhhhcehdchhdhahehffffde`bVd

@Sequência 3TGCATGATCTTCAGTGCCAGGACCTTATCAAGCGGTTTGGTCCCTTTGTT+Sequência 3dhhhgchhhghhhfhhhhhdhhhhehhghfhhhchfddffcffafhfghe

Formatos de Sequências

Page 58: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● GenBank (.gb, .gbk)

LOCUS BX571963 240 bp DNA linear DEFINITION Rhodopseudomonas palustris CGA009 DnaA.ACCESSION BX571963VERSION BX571963.1

FEATURES Location/Qualifiers source 1..480 /organism="Rhodopseudomonas palustris CGA009" /strain="CGA009" gene 101..340 /gene="dnaA" /locus_tag="RPA0001" CDS 101..340 /gene="dnaA" /locus_tag="RPA0001" /product="chromosomal replication protein DnaA"

Formatos de Sequências

Page 59: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● EMBL (.embl)

ID BX571963 standard; DNA; 240 BP.XXAC BX571963;XXDE Rhodopseudomomnas palustris CGA009 chromosomalDE replication protein DnaA, complete cds.XXSQ Sequence 240 BP; acaagatgcc attgtccccc ggcctcctgc tgctgctgct 40 ctgccctgcc cctggagggt ggccccaccg gccgagacag 80 caggaataag gaaaagcagc ctcctgactt tcctcgcttg 120 aggccagtgc cgggcccctc ataggagagg aagctcggga 160 gcgcaccccc ccagcaatcc gcgcgccggg acagaatgcc 200 agaccttctc ctcctgcaaa taaaacctca cccatgaatg 240//

Formatos de Sequências

Page 60: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● GFF (.gff)

##gff-version 3##sequence-region BX571963 1 240seq1 gene 1 240 ID=C114_00001;product=DnaA##FASTA>BX571963 BX571963 Rhodopseudomomnas palustris CGA009 chromosomal replication protein DnaA, complete cds.acaagatgccattgtcccccggcctcctgctgctgctgctctgccctgcccctggagggtggccccaccggccgagacagcaggaataaggaaaagcagcctcctgactttcctcgcttgaggccagtgccgggcccctcataggagaggaagctcgggagcgcacccccccagcaatccgcgcgccgggacagaatgccagaccttctcctcctgcaaataaaacctcacccatgaatg

Formatos de Sequências

Page 61: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Alinhamentos

– verificar similaridades

– apontar dissimilaridades

● Identificação de sítios homólogos

– regiões conservadas

– regiões variáveis

● Tipos

– emparelhado/múltiplo

– local/global/semiglobal

Comparação entre Sequências

Page 62: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Alinhamento de regiões

– subsequências

– maximização de correspondência

– eliminação de colunas

● Matriz de substituição

– tempo de divergência

– penalização

– pontuação

Alinhamento Local

Page 63: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Stephen Altschul et al.

– Basic Local Alignment Search Tool (1990)

● Alinhamento local

– nucleotídeos × nucleotídeos

– aminoácidos × aminoácidos

– nucleotídeos × aminoácidos

– aminoácidos × nucleotídeos

● Banco de dados diversos

– remoto

– local

BLAST

Page 64: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● BLASTn

Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_2 86.1 1e-9

> Sequência_2Length=1103

Score = 86.1 bits (40), Expect = 1e-9 Identities = 35/40 (88%), Gaps = 0/46 (0%) Strand=Plus/Minus

Query 1213 TTTTTTGTCTGAATCAGGATGTCCAGGATTTAAGGATTTT 1253 |||||||||| |||||| |||||||||||||||||||Sbjct 779 TTTTTTGTCTGCATCAGGTACTCCAGGATTTAAGGATTTT 819

BLAST

Page 65: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● BLASTx

Query=Sequência_1Length=1309 Score ESequences producing significant alignments: (Bits) Value Sequência_3 45.1 9e-7

> Sequência_3Length=309

Score = 45.1 bits (105), Expect = 9e-7 Identities = 23/57 (40%), Positives = 36/57 (63%), Gaps = 1/57 (2%) Frame = +3

Query 807 IRLKGTRVGIETILFDYLFHAKSPEEIAKTYTSLTLEQVYATILYYLHNQQSVDEYI 977 + ++ +RV ++TI+ + + EEIA Y SL L VYA I +YLH+Q+ VD Y+Sbjct 28 VVIRNSRVTLDTIVAVF-NQGVTAEEIAYRYPSLMLADVYAAIAFYLHHQEEVDSYL 83

BLAST

Page 66: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Alinhamento de ponta a ponta

– sequências completas

– utilização de todos os sítios

● Sequências utilizadas

– homólogas

– tamanho semelhante

– mesmo sentido

Alinhamento Global

Page 67: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Fasta (.fasta, .fas, .fa, .fna)

>Seq_1ATCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT

>Seq_2ATCGAGCTAGCGGTAGATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGTCGATCACGTAGTAGCAGTAGTTGCAACGTTATCGAT

>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCATATCGAT

Formatos de Alinhamento

Page 68: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Fasta (.fasta, .fas, .fa, .fna)

>Seq_1ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT

>Seq_2ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTGCAACGTTATCGAT

>Seq_3ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTGCA----TATCGAT

Formatos de Alinhamento

Page 69: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Clustal (.aln)

Seq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAG **** *** **************************

Seq_1 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTASeq_2 TCGATGAGATGCGATGT----CGATCACGTAGT-AG-C--AGTASeq_3 TCGATG--ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTA ****** ********* ************ ** * ****

Seq_1 GTTGCA----TATCGATSeq_2 GTTGCAACGTTATCGATSeq_3 GTTGCA----TATCGAT ****** *******

Formatos de Alinhamento

Page 70: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Phylip (.phy)

3 105Seq_1 ATCG------ --GTAGTCGA TCGTAGTCTG ACGTACGATGSeq_2 ATCGAGCTAG CGGTA---GA TCGTAGTCTG ACGTACGATGSeq_3 ATCGAGCTAG CGGTAGTCGA TCGTAGTCTG ACGTACGATG

TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG TCAGTCGATG AGATGCGATG T----CGATC ACGTAGT-AG TCAGTCGATG --ATGCGATG TCAGTCGATC ACGTAGTCAG

TCGTAGTAGT TGCA----TA TCGAT -C--AGTAGT TGCAACGTTA TCGAT TCGTAGTAGT TGCA----TA TCGAT

Formatos de Alinhamento

Page 71: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Nexus (.nex)

#NEXUSBEGIN DATA;dimensions ntax=3 nchar=105;format missing=? interleave=yes datatype=DNA gap=- match=.;

matrixSeq_1 ATCG--------GTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_2 ATCGAGCTAGCGGTA---GATCGTAGTCTGACGTACGATGTCAGTCGATGSeq_3 ATCGAGCTAGCGGTAGTCGATCGTAGTCTGACGTACGATGTCAGTCGATG

Seq_1 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTTSeq_2 AGATGCGATGT----CGATCACGTAGT-AG-C--AGTAGTTSeq_3 --ATGCGATGTCAGTCGATCACGTAGTCAGTCGTAGTAGTT;end;

Formatos de Alinhamento

Page 72: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Montagem

ATGCGGCATCGCATGAGTGC

ATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATG

TCGCATGAGTGCACGCAGCTGAGTC

Page 73: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Montagem

ATGCGGCATCGCATGAGTGC

ATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATG

TCGCATGAGTGCACGCAGCTGAGTC

Page 74: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Montagem

ATGCGGCATCGCATGAGTGCATGAGTGCACGCAGCTGA

CAGCTGAGTCTAATATGTCGCATGAGTGCACGCAGCTGAGTC

ATGCGGCATCGCATGAGTGCATGCTAGCTGAGTCTAATATG

Page 75: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Conhecendo o (GNU/)Linux

Page 76: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Físicas (hardware)

– processador

– memória

– disco rígido

– placas e controladores

– dispositivos de entrada/saída

● Lógicas (software)

– sistema operacional

– interface

– bibliotecas

– aplicativos

– documentação

Componentes de um Computador

Page 77: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Gerenciador de recursos

– controla dispositivos

– coordena tarefas

– administra pedidos

– regula processos

– manipula dados

● Coração da máquina

– inicialização

– execução

– processamento

Sistema Operacional

Page 78: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Microsoft Windows

Apple macOS

GNU/Linux

Sistemas Operacionais

Page 79: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Microsoft Windows

Apple macOS

GNU/Linux

Sistemas Operacionais

Page 80: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Ken Thompson & Denis Ritchie (1969)

– AT&T

● Inovações

– multitarefa

– multiusuário

● Variantes proprietárias

– código fechado

– licença restritiva

UNIX

Page 81: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● “Clones”

– GNU/Linux

– BSD

– Solaris

– Xenix

● Padronização

– Portable Operating System Interface (POSIX)

– Executable and Linkable Format (ELF)

UNIX

Page 82: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

UNIX

Page 83: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Richard Matthew Stallman (1983)

– GNU’s Not Unix

– Free Software Foundation

● Linha de comando

– utilitários

– aplicativos

– compiladores

● GNU Public License

GNU

Page 84: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

● Linus Benedict Torvalds (1991)

– Linus’ Unix

– Linux Foundation

● Núcleo operacional

– física lógica←→– entrada saída←→– gerenciamento

● GNU Public License

Linux

Page 85: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Linux

Page 86: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Linux

Page 87: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuições

● Coleções coerentes de projetos

– GNU

– Linux

– SystemD/Upstart/SysV

– Deb/RPM/tar.gz

– X/Wayland

– Gnome/KDE/XFCE/LXDE

– aplicativos

– customizações

● Slackware e Debian (1993)

– mais antigas na ativa

Page 88: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuições

Page 89: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuições

● Baseadas no Debian

– Debian

– Ubuntu

– Mint

● Baseadas no Red Hat

– Red Hat

– CentOS

– Fedora

● Outras bases

– Slackware

– Gentoo

– OpenSUSE

– Arch

Page 90: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuições

Page 91: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Distribuições

Page 92: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Por Quê?

● Sistema dominante

– servidores

– computação científica

– supercomputadores

– dispositivos móveis

● Muitas vantagens

– gratuito

– livre e com código aberto

– alterações são compartilhadas

● Grande estabilidade

– segurança

– suporte

Page 93: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Linux na Bioinformática

● Flexibilidade

– gratuito

– customizável

● Diversidade

– programas otimizados

– programas exclusivos

● Colaborativo

– desenvolvido em comunidades

– aberto e reproduzível

Page 94: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Bio-Linux

● UK National Environmental Research Council (2006)

– Open Software for Biologists: From Famine to Feat

● Voltada para bioinformática

– sistema operacional

– conjunto de pacotes

– mais de 250 programas

● Várias formas

– SO independente (baseado no Ubuntu)

– adicionar a um sistema pré-instalado

Page 95: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Preciso Mudar de SO?

● Não

– trabalho remoto

– servidores disponíveis na Internet

– programas comerciais

● Sim

– compatível com todas as configurações

– sem limitações

– toda a capacidade disponível

– melhor forma de aprender

Page 96: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Preciso Mudar de SO?

● Sem alterações

– virtualização

– mídia externa

● Execução direta

– substituir o sistema atual

– instalar ao lado do sistema atual

Page 97: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Subsistema Windows para Linux

Page 98: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Terminais para Android

Page 99: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Servidores

● Fornecem serviços

– “nuvem”

– atendem clientes

– maior capacidade de processamento

– maior espaço para armazenamento

● Plataforma-padrão

– mesmas ferramentas

– favorece comparações entre a equipe

– facilita acesso às últimas versões

– reduz o número de especialistas

Page 100: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Servidores

● Secure Shell (SSH)

– terminal

– PuTTY

– Cygwin

● Virtual Network Computing (VNC)

– gráfico

– VNC Viewer

● WinSCP

Page 101: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Interfaces de Programas

● Gráfica

– Galaxy

– CLCBio

– Geneious

● Linha de comando

– maior parte dos programas

Page 102: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Linha de Comando

● Interface de texto

– instruções comandos→

● Mais eficiente

– mais leve

– mais rápida

– mais objetiva

● Permite automação

Page 103: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Programação

● Conjunto de instruções para algum processo

– comandos em sequência lógica

● Linguagens distintas

– compiladas

– interpretadas

● Bioprojetos

– Open Bioinformatics Foundation

Page 104: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Programas Compilados

● Linguagens de menor abstração

– mais complexas

– mais rápidas

● Compilador

– tradução em código binário

– maior número de detalhes

● Principais linguagens

– C

– C++

● Instalação mais trabalhosa

Page 105: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Programas Interpretados

● Linguagens de maior abstração

– mais simples

– mais lentas

● Interpretador

– maior abstração

– instruções legíveis

● Principais linguagens

– Perl

– Python

– R

● Instalação simples

Page 106: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Licenças

● Questões legais

– direitos autorais

– patentes

● Permissão

– o que fazer

– como fazer

– distribuição

Page 107: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Licenças

● Proprietária

– variável

● Livre/permissiva

– domínio público

– BSD

– MIT

– Apache

● Livre/viral

– GPL

Page 108: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

Prática

Page 109: Introdução à Bioinformá - Câmpus de Jaboticabalgenomics.fcav.unesp.br/Aulas2017/intro.pdf · Impulsionada pelo aumento exponencial dos dados de sequências, bioinformática passou

1) https://cygwin.com/;

2) mover instalador para a Área de Trabalho;

3) Prompt de Comando;

4) cd Desktop;

5) setup-x86.exe --no-admin.

Cygwin