5 Potencial da bioinformática nas análises genômicas · Associação Brasileira de...

46
!"#$%#!& ! Potencial da bioinformática nas análises genômicas Guilherme Targino Valente FCA-UNESP As 5 questões O que seria bioinformática? Quem são os bioinformatas? Quais são as habilidades básicas? O que faz um bioinformática? Qual o objetivo da bioinformática?

Transcript of 5 Potencial da bioinformática nas análises genômicas · Associação Brasileira de...

!"#$%#!&'

!'

Potencial da bioinformática nas análises genômicas

Guilherme Targino Valente FCA-UNESP

As 5 questões

O que seria bioinformática?

Quem são os bioinformatas?

Quais são as habilidades básicas?

O que faz um bioinformática?

Qual o objetivo da bioinformática?

!"#$%#!&'

('

O que seria bioinformática? -  Área que estuda aspectos e fenômenos biológicos com o uso

de ferramentas computacionais. -  Ciência de estocagem, extração, organização, análises e

interpretação de dados utilizando informação biológicas.

-  Biólogos e outros profissionais de áreas afins; -  Cientistas/engenheiros da computação; -  Matemáticos; -  Físicos;

Quem são os bioinformatas?

Quais são as habilidades básicas? -  Biologia; -  Princípios de programação;

Duas vertentes básicas

Desenvolvimento Aplicação

Desenvolvimento Aplicação

!"#$%#!&'

)'

Os dados biológicos…

…aumentaram e também se tornaram mais complexos

!"#$%#!&'

&'

…aumentaram e também se tornaram mais complexos

!"#$%#!&'

*'

15/07/2014 80,370,243 proteínas

DNA – Ácido desoxirribonucléico

Avery, MacLeod e McCarty (1944): DNA, material genético

~1930: avanços no conhecimento da estrutura do ácido nucléico A nucleina se tornou o ácido nucléico desoxirribose e, posteriormente, ácido desoxirribonucléico.

Watson e Crick (1953): Estrutura do DNA

Os ácidos nucléicos e sua história

1989 - Primeiro gene sequenciado

1995 - Primeiro genoma sequenciado (Haemophilus influenza)

2001 - Primeiro rascunho do genoma humano

2005 - NGS

2013 – 1 genoma por ~ R$ 2000,00

!"#$%#!&'

+'

!"#$%#!&'

%'

O que faz um bioinformática?

-  Reconstrói as informações; -  Compila dados; -  Constrói ferramentas e novos métodos de análises; -  Organiza as informações; -  Extrair padrões e informações biológicamente úteis; -  Modela estruturas e sistemas;

Qual o objetivo da bioinformática?

-  Omics -  Genoma; -  Transcriptoma; -  Proteoma; -  Metaboloma; -  Metagenômica; -  smRNAs; -  Lipidomicas; -  Fluxomica; -  Interactomas (biol. sist.);

-  Proteínas -  Estruturas; -  Dinâmicas;

-  Banco de dados -  Criação; -  Manutenção; -  Análise;

!"#$%#!&'

"'

- Análise de sequencias

Encontrar padrões e diferenças em: - estudos evolutivos; - estudos biotecnológicos; - estudos clínicos;

A mais antiga atuação da computação sobre a genômica.

Softwares de alinhamento Início

Alinhadores de reads e genomas

- Anotação de genomas

Processo de identificar as funções de cada “peça” de um genoma

1995 – Owen White. Primeiro programa

UMD Hemophilus influenzae

!"#$%#!&'

,'

- Análise de expressão gênica

Identificar níveis de expressão dos RNAs

-  Microarray; -  ESTs sequencing; -  Serial analysis of gene expression (SAGE); -  Massively parallel signature sequencing (MPSS); -  RNA-Seq

- Análise de expressão protéica

Identificar níveis de expressão das proteínas -  Protein microarray (HT); -  Espectometria de massa;

!"#$%#!&'

!$'

- Predição de estruturas protéicas

Determinar a estrutura de proteínas recém identificadas: processo vital para entender sua função

-  Biologica evolutiva; -  Desenvolvimento de fármacos; -  Compreensão das funções básicas;

-  Determinar estrutura; -  Docking; -  Mutações in silico; -  Dinâmica molecular;

- Genômica comparativa

Identificar homologia entre genomas em termos estruturais e funcionais.

-  Como mutações afetam o genoma; -  Como os genomas tem evoluído e quais os processos principais da

evolução dos genomas (duplicações, traposição, transferência horizontal; deleção, inserção, ploidia);

-  Encontrar marcadores moleculares; -  Estudos de rearranjos cromossômicos; -  Busca do estabelecimento da relação genótipo-fenótipo

!"#$%#!&'

!!'

- Modelagem de sistemas biológicos

Integração e análises biológicas em divesas escalas e contextos

-  Integração de informações; -  Origem e funcionamento do sistema; -  Modelagem do sistema; -  Realização de predições; -  Analisar o sistema espaço-temporalmente;

Histórico

Década de 80-90 – Projeto Genoma Humano

Termo cunhado em 1979 por Paulien Hogeweg. “the study of informatic processes in biotic systems”

!"#$%#!&'

!('

Bioinformática no Brasil 14 anos de história.

João Meidanis e João Setúbal UNICAMP - SP

1999 – Genoma Xylella fastidiosa

!"#$%#!&'

!)'

SP/MG -  UNICAMP Campinas; -  EMBRAPA Campinas; -  CNPEM Campinas; -  USP São Paulo; -  USP Ribeirão; -  USP Piracicaba; -  IB-UNESP Botucatu; -  UNESP Jaboticabal; -  Hospital Sírio Libanês; -  Hospital do Câncer; -  Fio Cruz BH; -  UFMG BH; -  UFV Viçosa -  FCA-UNESP Botucatu

RJ -  LNCC Petrópolis; -  UFRJ Rio de Janeiro;

SC/RS/PR -  UFRGS Porto Alegre; -  UFSC Florianópolis; -  UFTPR Cornélio Procópio; -  UFPR Curitiba

PA/RN -  UFPA Belém

Associação Brasileira de Bioinformática e Biologia Computacional

X-meeting

!"#$%#!&'

!&'

http://elements.eaglegenomics.com/

… do início até hoje.

Inúmeros programas e métodos foram e vem sendo desenvolvidos

http://nar.oxfordjournals.org/

A tabela periódica dos programas

http://bioinformatics.oxfordjournals.org/

-  Omics -  Genoma; -  Transcriptoma; -  Proteoma; -  Metaboloma; -  Metagenômica; -  smRNAs; -  Lipidomicas; -  Fluxomica; -  Interactomas (biol. sist.);

-  Proteínas -  Estruturas; -  Dinâmicas;

-  Banco de dados -  Criação; -  Manutenção; -  Análise;

Bioinformática na genômica

!"#$%#!&'

!*'

A era OMICs

Omics

!"#$%#!&'

!+'

Omics

Identificar, quantificar e caracterizar todos os componentes

de um sistema biológico – Extremamente ligada a biologia de

sistemas.

Omics Sulfixo “omes”

-  Século 20

-  Biomes;

-  Popularização durante os primeiros projetos genomas;

-  Caracterizar globalmente biomoléculas – entender funções biológicas;

DNA Fenótipo

-  Outras Omics

!"#$%#!&'

!%'

Omics – ácidos nucléicos -  Genomica;

-  Sequenciamento de todo DNA

-  Transcriptoma;

-  Sequenciamento de todo o RNA

-  smRNA;

-  Sequenciamento de todos os RNAs não codantes

-  Metagenômica;

-  Sequenciamento do material genético de uma microbiota

-  Epigenomica;

-  Sequenciamento das regiões regulatórias e modificações

na cromatina;

Omics – outras biomoléculas -  Proteomica;

-  Sequenciamento de todas as proteínas

-  Metaboloma;

-  Todo o peril de metabólitos de uma amostra (visão

fisiológica)

-  Lipidomica;

-  Todo o perfil lipídico de uma amostra

-  Fluxomica;

-  Dinâmica das moléculas dentro do sistema

-  Glicomica;

-  Todo o perfil de açúcar de uma amostra

!"#$%#!&'

!"'

Omics – in silico -  Interactoma;

-  Integrar dados de todas as outras omics

Omics

-  Genômica; -  Transcriptoma; -  Proteomica; -  Epigenomica; -  Metagenômica; -  Metaboloma; -  smRNA; -  Lipidomica; -  Fluxomica; -  Glicomica; -  Interactoma;

High-dimensional biology approach

!"#$%#!&'

!,'

Omics

-  Genômica; -  Transcriptoma; -  smRNA; -  Epigenoma; -  Metagenômica; -  Proteoma; -  Metaboloma; -  Fluxomica; -  Lipidomica; -  Glicomica; -  Interactoma;

Next generation sequencing

Técnicas diversas

Técnicas computacionais

Genômica Determinar a estrutura do genoma de uma determinada espécie.

Haemophilus influenzae – 1995, primeiro genoma sequenciado

1.830.140 bp – 1740 genes

Método de Sanger

!"#$%#!&'

($'

Genômica Projetos em andamento

Transcriptoma Amplamente aplicado;

- “Facilidade” maior de obtenção de resultados;

- Análises funcionais;

- Pode possibilitar o estudo de todos os tipos de RNAs;

- Não necessita de um genoma sequenciado;

- “Reduz” a necessidade de sequenciamento de genomas: ideal

para genomas complexos;

- Pode ser aplicado a qualque organismo, tecido e tipos celulares;

!"#$%#!&'

(!'

Transcriptoma

-./0123'!' -./0123'('

Filtragem

-  Por tamanho; -  Presença de cauda poli-A; -  smRNAs; -  microRNAs

Todos os RNAs

NGS

Epigenoma Sequenciamento das modificações epigenéticas ou regiões regulatórias.

CHIP-Seq – Chromatin immunopreciptation sequencing Variação do ChIP-on-Chip

!"#$%#!&'

(('

Determinar sítios de ligação de uma proteína

Purificação e montagem da biblioteca

NGS

CHIP-Seq – Chromatin immunopreciptation sequencing

FAIRE-Seq (Formaldehyde-Assisted Isolation of Regulatory Elements)

NGS

!"#$%#!&'

()'

Sequenciamento das modificações epigenéticas ou regiões regulatórias. Ex. ENCODE

!"#$%#!&'

(&'

Metagenômica Sequenciamento do material genético de uma microbiota

Metagenômica Sequenciamento do material genético de uma microbiota

!"#$%#!&'

(*'

Metagenômica Sequenciamento do material genético de uma microbiota

Depois do sequenciamento

Montagem Alinhamento

Binning – organizar as sequencias em grupos que possam representar genomas individuais ou de um grupo

Anotação – identificar os tipos de sequencias

Thomas et al. 2012

!"#$%#!&'

(+'

Metagenômica Sequenciamento do material genético de uma microbiota

-  Tem propiciado avanços na ecologia, evolução e diversidade microbiana;

-  Descobrimento de novas enzimas;

45131236072891/.3' 451392/15/.3'

Metagenômica

-  Microbioma da pele: rico em protobacterias. Microbiota semelhante a da pele do

rato;

-  Microbioma do intestino: maioria das bacterias são de dois grupos (Bacteriods e

Firmicutes). As suas proporções estão ligadas a obesidade;

!"#$%#!&'

(%'

Metagenômica

http://www.nature.com/nature/focus/humanmicrobiota/#current

Especial da Nature

sobre microbioma

humano

Proteomica

1994 - Mark Wilkins (University of New South Wales – Austrália) cunhou o termo proteoma. Congresso “2D Electrophoresis: from protein maps to genomes” na Itália.

1- Ponto isoelétrico (carga) 2- Peso molecular

!"#$%#!&'

("'

Proteomica

Cromatografia líquida e espectometria de massa

-  Perfil de expr. protéico; -  Quantifica a expressão; -  Análise global; -  Rápido; -  Baixo custo; -  Identificar mod. pós-trad.

Proteomica

Metal affinity complexationThe coordinated binding between immobilized metal ions and charged peptides. Immobilized metals such as Fe3+ or Ga3+, or metal oxides such as TiO2 or ZrO2, are commonly used to enrich phosphorylated peptides from non-phosphorylated peptides.

As modified peptides only constitute a minority of all peptides, it is usually necessary to enrich them for proteome-wide modification analysis48. Ideally, this enrichment captures all modified peptides of interest and no others. In practice, modified peptides have a certain ‘enrichment factor’ with respect to the starting peptide mixture, which can range from over 100-fold for phosphorylation to only several fold for methylated peptides. In phosphoproteomics, metal affinity complexa-tion of the phosphogroup is the most common principle, but there are many other strategies49. PTM enrichment methods can also be more or less ‘specific’. This term refers to the proportion of modified peptides in the enriched population and can range from close to 100% for some fractions in phosphopeptide purification to about 5% for Lys-acetylated peptides captured by anti-bodies50. In our experience, enrichment of PTM-bearing peptides by affinity purification is preferable to chemical derivatization of PTMs. Chemical modifications are invariably accompanied by side reactions that need to be distinguished from in vivo modifications (see for example REF. 24). TABLE 1 contains a list of the most frequently studied PTMs and how they are analysed by MS.

Sequence-specific identification of PTMs. In terms of data quality, there are two distinct tasks in PTM char-acterization: confident identification of the peptide sequence bearing the PTM and unambiguous localiza-tion of the PTM to the correct amino acid. For example, it may be possible to identify a phosphorylated pep-tide with high confidence (> 99%) but the data may not be sufficient to distinguish which of two adjacent Ser residues is phosphorylated. Therefore, proteomic PTM data sets should contain both a peptide identifica-tion score and a PTM localization score51–53, which is unfortunately not always the case. It is important that the FDRs of PTM determination are rigorously deter-mined, especially when PTM studies are meant to serve as resources for the community. Unambiguous localiza-tion of PTMs benefits from high mass accuracy in the

fragmentation spectra, which increases the confidence of both peptide identification and PTM localization (BOX 1; FIG. 3).

Comprehensiveness of PTM analysis by MS. One of the surprises of systems-wide PTM analysis has been the large number of sites that are routinely discovered. Phosphoproteome studies have identified more than 20,000 phosphorylation sites in a single project54 and there may be more than 100,000 sites in the phospho-proteome of human cells. The numbers for other modifications, such as acetylation, ubiquitylation, methylation and gylcosylation, are also large, and no modification has been mapped to completion yet. Quantitative analysis is therefore essential to focus on the subset of regulated sites that are likely to be func-tionally important in the biological process of interest. Determining the occupancy of the site of modification is also becoming possible for many sites54 and this may further help in pinpointing the sites that probably have functional roles.

In large-scale phosphoproteomics experiments, cover age of the well-known functional sites in the pathway under investigation can validate the quality of the data. Although some phosphorylation sites are in sequence contexts that are difficult to probe by MS (for example, in very short tryptic peptides), in general this goal seems to be within reach of current technology.

Non-phospho PTMs in signalling. Although most MS-based studies so far have focused on analysis of phosphorylation-dependent events, MS can in principle examine any other PTM involved in cell signalling. For example, an antibody-based enrichment approach and the ‘heavy methyl’ SILAC variant, in which heavy labelled Met serves as a donor for the methyl group, pro-vide a tool to investigate in vivo methylation of Lys and Arg55. Enrichment of peptides containing acetylated Lys residues revealed a surprisingly large number of acetyla-tion sites on mitochondrial proteins56. Recently, high

Table 1 | PTMs currently amenable to large-scale MS analysis

PTM Mass shift (!m; Da)*

Enrichment methods

Largest MS study‡

Organism Remarks

Phosphorylation 79.96633 IMAC, TiO2 and

antibodies20,443 sites54 Homo sapiens

(HeLa cell line)Fe3+-based IMAC and TiO

2 are most commonly used for

enrichment of phosphoSer, phosphoThr and phosphoTyr-containing peptides

Acetylation 42.01056 Pan anti-acetyl-Lys antibodies

3,600 sites50 Homo sapiens (A459, Jurkat and MV4-11 cell lines)

Trypsin often cannot cleave acetylated peptides; thus, acetyl-Lys is located internally on modified peptides, which aids in the site-specific localization of PTMs

Ubiquitylation (diGly tag)

114.04292 Tagged ubiquitin 110 sites59 Saccharomyces cerevisiae

Cells express a tagged version of ubiquitin (the tag is used to isolate ubiquitin-conjugated proteins); tryptic peptides contain diGly-conjugated uncleaved Lys

Methylation 14.01565 Anti-methyl-Lys or anti-methyl-Arg antibodies

59 sites55 Homo sapiens (HeLa S3 cell lines)

Currently available pan anti-methyl-Lys and anti-methyl-Arg antibodies typically have low specificity

-GlcNac 203.07937 Lectin 141 sites124 Homo sapiens (HeLa cell lines)

Very labile PTM; may benefit from fragmentation methods such as ETD and ECD

ECD, electron capture dissociation; ETD, electron transfer dissociation; IMAC, immobilized metal affinity chromatography; MS, mass spectrometry; o-GlcNac, o-linked !-N-acetylglucosamine; PTM, post-translational modification. *The " masses given here are monoisotopic masses of the PTM. ‡Reference to the largest proteomics study for each PTM to date.

REVIEWS

432 | JUNE 2010 | VOLUME 11 www.nature.com/reviews/molcellbio

REVIEWS

© 20 Macmillan Publishers Limited. All rights reserved10

Bionfo -  Identificação das proteínas; -  Quantificação; -  Análise de enriquecimento;

!"#$%#!&'

(,'

Metaboloma

Perfil metabólico de um tecido; Determinar aspectos funcionais

Metaboloma

!"#$%#!&'

)$'

Metaboloma

ANRV410-PP61-20 ARI 26 March 2010 19:22

Key

Inositol-1PInositol-1PGluconateGluconate

myo-Inositolmyo-InositolTrehaloseTrehaloseGalacturonateGalacturonate

GDPGDP

HistidineHistidine

GuanosineGuanosineRiboseRibose

CytidineCytidine

CytosineCytosine

UMPUMPMannoseMannose

G6PG6P

FRUFRU

GLUGLUMaltoseMaltose

SucroseSucrose

AnthranilateAnthranilate

TrpTrp

QuinateQuinate SalicylateSalicylate

ShikimateShikimate

Tetracosaoic acidTetracosaoic acidLeuLeu

PyridoxaminePyridoxamineGlycerateGlycerate

ErythritolErythritol CystineCystine

SerSer

b-Cyanoalanineb-Cyanoalanine

GlyGly

XylitolXylitol

GlycerolGlycerolGlcNAcGlcNAc

G3PG3PGlycolic acidGlycolic acid

AMPAMP

AdenosineAdenosine

Linoleic acidLinoleic acid

IAAIAA

AllantoinAllantoin

Apigenin-Hex-RhaApigenin-Hex-Rha

JasmonateJasmonate

Chrysoeriol-Hex-RhaChrysoeriol-Hex-Rha

Tricin-Hex-RhaTricin-Hex-Rha

TyrTyr

PhePhe

IAA-AspIAA-Asp

Schaftoside isomer #1Schaftoside isomer #1

58:1TAG58:1TAG

Chrysoeriol-C-Hex-C-Pen isomer #1Chrysoeriol-C-Hex-C-Pen isomer #1

Sinapic acidSinapic acid

Schaftoside isomer #2Schaftoside isomer #2

SinapoylglucoseSinapoylglucose

60:2TAG60:2TAG60:3TAG60:3TAG

58:2TAG58:2TAG

Chrysoeriol-C-Hex-C-Pen isomer #2Chrysoeriol-C-Hex-C-Pen isomer #2

56:3TAG56:3TAG

54:6TAG54:6TAG

54:1TAG54:1TAG

54:2TAG54:2TAG

54:4TAG54:4TAG54:3TAG54:3TAG

56:2TAG56:2TAG

54:5TAG54:5TAG

52:3TAG52:3TAG

52:1TAG52:1TAG50:2TAG50:2TAG

52:5TAG52:5TAG

16:0LysoPC16:0LysoPC

18:2LysoPC18:2LysoPC 52:4TAG52:4TAG18:1LysoPC18:1LysoPC

Ca!eic acidCa!eic acid

FPFP

IAA-Asp-HexIAA-Asp-Hex

p-Coumaric acidp-Coumaric acid

NicotianamineNicotianamine

GlutarateGlutarate

Nicotinic acid derivative #2Nicotinic acid derivative #2

Nicotinic acid-HexNicotinic acid-Hex

IleIle

Nicotinic acid derivative #3Nicotinic acid derivative #3

NicotinateNicotinate

Nicotinic acid derivative #1Nicotinic acid derivative #1PantothenatePantothenate

Homo-SerHomo-Ser

PutrescinePutrescine

AspAsp

b-Alanineb-Alanine CholesterolCholesterolGlnGlnOryzanol-25methylcycloartenolOryzanol-25methylcycloartenol

GluGlu

SuccinateSuccinate StigmasterolStigmasterol

5-Oxoproline5-Oxoproline

CampesterolCampesterol

SqualeneSqualene2-Ketoglutarate2-Ketoglutarate Oryzanol-cycloartenolOryzanol-cycloartenol

isocitrateisocitrate Oryzanol-campestanolOryzanol-campestanol

alpha-Tocopherolalpha-TocopherolCitCit

PhytolPhytolMalonateMalonate

cis-Aconitatecis-Aconitate

LactateLactate

ValVal

Oleic acidOleic acidPalmitic acidPalmitic acid

TetradecanoateTetradecanoate

GABAGABAL-OrnithineL-Ornithine ProPro HydroxyprolineHydroxyproline

DiaminopimelateDiaminopimelateLysLys

NADNAD

ThrThr

MetMet CholineCholine

MalMal

FumFum

AsnAsn

AlaAla

BetaineBetaine

Inositol-1PGluconate

myo-InositolTrehaloseGalacturonate

GDP

Histidine

GuanosineRibose

Cytidine

Cytosine

UMPMannose

G6P

FRU

GLUMaltose

Sucrose

Anthranilate

Trp

Quinate Salicylate

Shikimate

Tetracosaoic acidLeu

PyridoxamineGlycerate

Erythritol Cystine

Ser

"-Cyanoalanine

Gly

Xylitol

GlycerolGlcNAc

G3PGlycolic acid

AMP

Adenosine

Linoleic acid

IAA

Allantoin

Apigenin-Hex-Rha

Jasmonate

Chrysoeriol-Hex-Rha

Tricin-Hex-Rha

Tyr

Phe

IAA-Asp

Schaftoside isomer #1

58:1TAG

Chrysoeriol-C-Hex-C-Pen isomer #1

Sinapic acid

Schaftoside isomer #2

Sinapoylglucose

60:2TAG60:3TAG

58:2TAG

Chrysoeriol-C-Hex-C-Pen isomer #2

56:3TAG

54:6TAG

54:1TAG

54:2TAG

54:4TAG54:3TAG

56:2TAG

54:5TAG

52:3TAG

52:1TAG50:2TAG

52:5TAG

16:0LysoPC

18:2LysoPC 52:4TAG18:1LysoPC

Ca!eic acid

FP

IAA-Asp-Hex

p-Coumaric acidApigenin-C,C-pentosideApigenin-C,C-pentosideApigenin-C,C-pentoside

Nicotianamine

Glutarate

Nicotinic acid derivative #2

Nicotinic acid-Hex

Ile

Nicotinic acid derivative #3

Nicotinate

Nicotinic acid derivative #1Pantothenate

Homo-Ser

Putrescine

Asp

"-Alanine CholesterolGlnOryzanol-25methylcycloartenol

Glu

Succinate Stigmasterol

5-Oxoproline

Campesterol

Squalene2-Ketoglutarate Oryzanol-cycloartenol

isocitrate Oryzanol-campestanol

alpha-TocopherolCit

PhytolMalonate

cis-Aconitate

Lactate

Val

Oleic acidPalmitic acid

Tetradecanoate

GABAL-Ornithine Pro Hydroxyproline

DiaminopimelateLys

NAD

Thr

Met Choline

Mal

Fum

Asn

Ala

Betaine

LC-MSGC-MS CE-MS

a Plant materials

Retrieval

Sample extraction and pretreatment

Functional genomics and systems biology

LC-PDA LC-MSLC-MS(Lipid)(Lipid)LC-MS(Lipid) FT-IR NMR

Data processing and peak annotation

Data acquisition

b Metabolome data

Metabolome pipelines

LC-MSGC-MS

CE-MSLipid

GC andCE-MS

466 Saito · Matsuda

Ann

u. R

ev. P

lant

Bio

l. 20

10.6

1:46

3-48

9. D

ownl

oade

d fr

om w

ww

.ann

ualre

view

s.org

by U

nive

rsid

ade

Esta

dual

de

Cam

pina

s (U

nica

mp)

on

08/2

8/13

. For

per

sona

l use

onl

y.

GC-MS – gas chromatography mass spectrometry

LC-MS – liquid chromatography

mass spectrometry CE-MS – Capillary electrophoresis

mass spectrometry FT-IR – Fourier transform infrared

spectometry NMR – nuclear magnetic resonance LC-PDA – LC-photodiode array

Fluxoma Camada entre proteoma e metaboloma;

Avalia os aspectos dinâmicos do metabolismo;

Permite melhor entendimento dos modos de regulação do metabolismo do sistema;

ANRV410-PP61-20 ARI 26 March 2010 19:22

Key

Inositol-1PInositol-1PGluconateGluconate

myo-Inositolmyo-InositolTrehaloseTrehaloseGalacturonateGalacturonate

GDPGDP

HistidineHistidine

GuanosineGuanosineRiboseRibose

CytidineCytidine

CytosineCytosine

UMPUMPMannoseMannose

G6PG6P

FRUFRU

GLUGLUMaltoseMaltose

SucroseSucrose

AnthranilateAnthranilate

TrpTrp

QuinateQuinate SalicylateSalicylate

ShikimateShikimate

Tetracosaoic acidTetracosaoic acidLeuLeu

PyridoxaminePyridoxamineGlycerateGlycerate

ErythritolErythritol CystineCystine

SerSer

b-Cyanoalanineb-Cyanoalanine

GlyGly

XylitolXylitol

GlycerolGlycerolGlcNAcGlcNAc

G3PG3PGlycolic acidGlycolic acid

AMPAMP

AdenosineAdenosine

Linoleic acidLinoleic acid

IAAIAA

AllantoinAllantoin

Apigenin-Hex-RhaApigenin-Hex-Rha

JasmonateJasmonate

Chrysoeriol-Hex-RhaChrysoeriol-Hex-Rha

Tricin-Hex-RhaTricin-Hex-Rha

TyrTyr

PhePhe

IAA-AspIAA-Asp

Schaftoside isomer #1Schaftoside isomer #1

58:1TAG58:1TAG

Chrysoeriol-C-Hex-C-Pen isomer #1Chrysoeriol-C-Hex-C-Pen isomer #1

Sinapic acidSinapic acid

Schaftoside isomer #2Schaftoside isomer #2

SinapoylglucoseSinapoylglucose

60:2TAG60:2TAG60:3TAG60:3TAG

58:2TAG58:2TAG

Chrysoeriol-C-Hex-C-Pen isomer #2Chrysoeriol-C-Hex-C-Pen isomer #2

56:3TAG56:3TAG

54:6TAG54:6TAG

54:1TAG54:1TAG

54:2TAG54:2TAG

54:4TAG54:4TAG54:3TAG54:3TAG

56:2TAG56:2TAG

54:5TAG54:5TAG

52:3TAG52:3TAG

52:1TAG52:1TAG50:2TAG50:2TAG

52:5TAG52:5TAG

16:0LysoPC16:0LysoPC

18:2LysoPC18:2LysoPC 52:4TAG52:4TAG18:1LysoPC18:1LysoPC

Ca!eic acidCa!eic acid

FPFP

IAA-Asp-HexIAA-Asp-Hex

p-Coumaric acidp-Coumaric acid

NicotianamineNicotianamine

GlutarateGlutarate

Nicotinic acid derivative #2Nicotinic acid derivative #2

Nicotinic acid-HexNicotinic acid-Hex

IleIle

Nicotinic acid derivative #3Nicotinic acid derivative #3

NicotinateNicotinate

Nicotinic acid derivative #1Nicotinic acid derivative #1PantothenatePantothenate

Homo-SerHomo-Ser

PutrescinePutrescine

AspAsp

b-Alanineb-Alanine CholesterolCholesterolGlnGlnOryzanol-25methylcycloartenolOryzanol-25methylcycloartenol

GluGlu

SuccinateSuccinate StigmasterolStigmasterol

5-Oxoproline5-Oxoproline

CampesterolCampesterol

SqualeneSqualene2-Ketoglutarate2-Ketoglutarate Oryzanol-cycloartenolOryzanol-cycloartenol

isocitrateisocitrate Oryzanol-campestanolOryzanol-campestanol

alpha-Tocopherolalpha-TocopherolCitCit

PhytolPhytolMalonateMalonate

cis-Aconitatecis-Aconitate

LactateLactate

ValVal

Oleic acidOleic acidPalmitic acidPalmitic acid

TetradecanoateTetradecanoate

GABAGABAL-OrnithineL-Ornithine ProPro HydroxyprolineHydroxyproline

DiaminopimelateDiaminopimelateLysLys

NADNAD

ThrThr

MetMet CholineCholine

MalMal

FumFum

AsnAsn

AlaAla

BetaineBetaine

Inositol-1PGluconate

myo-InositolTrehaloseGalacturonate

GDP

Histidine

GuanosineRibose

Cytidine

Cytosine

UMPMannose

G6P

FRU

GLUMaltose

Sucrose

Anthranilate

Trp

Quinate Salicylate

Shikimate

Tetracosaoic acidLeu

PyridoxamineGlycerate

Erythritol Cystine

Ser

"-Cyanoalanine

Gly

Xylitol

GlycerolGlcNAc

G3PGlycolic acid

AMP

Adenosine

Linoleic acid

IAA

Allantoin

Apigenin-Hex-Rha

Jasmonate

Chrysoeriol-Hex-Rha

Tricin-Hex-Rha

Tyr

Phe

IAA-Asp

Schaftoside isomer #1

58:1TAG

Chrysoeriol-C-Hex-C-Pen isomer #1

Sinapic acid

Schaftoside isomer #2

Sinapoylglucose

60:2TAG60:3TAG

58:2TAG

Chrysoeriol-C-Hex-C-Pen isomer #2

56:3TAG

54:6TAG

54:1TAG

54:2TAG

54:4TAG54:3TAG

56:2TAG

54:5TAG

52:3TAG

52:1TAG50:2TAG

52:5TAG

16:0LysoPC

18:2LysoPC 52:4TAG18:1LysoPC

Ca!eic acid

FP

IAA-Asp-Hex

p-Coumaric acidApigenin-C,C-pentosideApigenin-C,C-pentosideApigenin-C,C-pentoside

Nicotianamine

Glutarate

Nicotinic acid derivative #2

Nicotinic acid-Hex

Ile

Nicotinic acid derivative #3

Nicotinate

Nicotinic acid derivative #1Pantothenate

Homo-Ser

Putrescine

Asp

"-Alanine CholesterolGlnOryzanol-25methylcycloartenol

Glu

Succinate Stigmasterol

5-Oxoproline

Campesterol

Squalene2-Ketoglutarate Oryzanol-cycloartenol

isocitrate Oryzanol-campestanol

alpha-TocopherolCit

PhytolMalonate

cis-Aconitate

Lactate

Val

Oleic acidPalmitic acid

Tetradecanoate

GABAL-Ornithine Pro Hydroxyproline

DiaminopimelateLys

NAD

Thr

Met Choline

Mal

Fum

Asn

Ala

Betaine

LC-MSGC-MS CE-MS

a Plant materials

Retrieval

Sample extraction and pretreatment

Functional genomics and systems biology

LC-PDA LC-MSLC-MS(Lipid)(Lipid)LC-MS(Lipid) FT-IR NMR

Data processing and peak annotation

Data acquisition

b Metabolome data

Metabolome pipelines

LC-MSGC-MS

CE-MSLipid

GC andCE-MS

466 Saito · Matsuda

Ann

u. R

ev. P

lant

Bio

l. 20

10.6

1:46

3-48

9. D

ownl

oade

d fr

om w

ww

.ann

ualre

view

s.org

by U

nive

rsid

ade

Esta

dual

de

Cam

pina

s (U

nica

mp)

on

08/2

8/13

. For

per

sona

l use

onl

y.

!"#$%#!&'

)!'

Novas fronteiras Expressão e conteúdo protéico são diferentes!!! Variações estocásticas são comuns!!!

Cluster 363 células de C. elegans de acordo com a similaridade de expressão. B.w.m Body wall muscle Blast – Blast cells

Wang e Bodovits 2010

!"#$%#!&'

)('

Wang e Bodovits 2010

As análises de OMICs podem conter viés!!

Novas fronteiras – Single cell

-  Analisar células individuais podem dar maior acurácia para a análise do sistema;

-  Células troncos - melhorar o entendimento da via auto-renovação ou transformação;

-  Câncer – melhorar a compreensão da iniciação, progressão, metástase e respostas terapêuticas.

!"#$%#!&'

))'

Redes biológicas

? O que são redes biológicas?

!"#$%#!&'

)&'

As peças da biologia

O mundo biológico é complexo

!"#$%#!&'

)*'

Abióticos Bióticos

VIDA

Estudos multi-escala

Sistema biológico – composto de multiplas “entidades”

:6;<3<5'!'

:6;<3<5'('

:6;<3<5')'

:6;<3<5'&'

:6;<3<5'*'

:6;<3<5'+'

:6;<3<5'%'

:6;<3<5'"'

:6;<3<5','

:6;<3<5'!$'

!"#$%#!&'

)+'

As sete pontes de Königsberg (ex-capital da Prussia) – Leonard Euler 1736 Encontrar um caminho pela cidade que cruze cada ponte somente uma vez

Teoria de grafos (redes)

Analisando a determinação sexual de vertebrados com base em redes de interação entre proteínas

! "!

Figura 1 – Exemplo de grafo. Nesse exemplo, os nós e as linhas (arestas) podem ser

encarados como proteínas e suas relações, respectivamente (Junker, 2008).

As redes de regulação reportam o controle da expressão gênica. A expressão final

de um gene pode ser modulada por diversas variáveis tais como, fatores de transcrição,

modificações pós-traducionais ou por associação dessas proteínas com outras biomoléculas.

Nesses modelos, a rede é demonstrada por um grafo direcionado (Junker, 2008;

Pavlopoulos et al., 2011) tal como V2!V3, significando que a molécula “V2” interage com

“V3” e não o oposto. Em termos práticos, V2!V3 simbolizariam a interação unidirecional

entre um fator de transcrição e o promotor de um gene, respectivamente (Figura 2).

As redes de transdução de sinais são representadas por grafos direcionados multi-

arestas que representam as interações uni ou bi-direcionais entre proteínas, outras

moléculas orgânicas ou inorgânicas. Em suma, essas redes reportam como o sinal

extracelular pode ser transmitido para o ambiente intra-orgânico ou como os sinais são

conduzidos dentro de uma célula ou organismo (Junker, 2008; Pavlopoulos et al. 2011)

(Figura 2).

As interações entre proteínas são geralmente reportadas como grafos não-

direcionados uma vez que não importa a direção que a interação ocorre (Figura 2) (Junker,

2008). O presente trabalho é baseado nesse tipo de rede, sendo os capítulos 1 e 2

dedicados a esse tipo de interação.

4N

ET

WO

RK

SIN

BIO

LO

GY

FIG

UR

E1.1

Exam

pleof

abiologicalnetw

ork.The

largeststronglyconnected

component

(seeC

hapter2)

ofthe

human

proteininteraction

network

isshow

n.T

henetw

orkis

basedon

thecom

pletedata

setforinteraction

ofhum

anproteins

downloaded

fromthe

Database

ofInteracting

Proteins(D

IP,[35])inJanuary

2005.

advanceshave

made

itpossibleto

elicitentirenetw

orks,oratleastlargeproportions

ofthem.

The

nextsection

containsa

conciseoverview

ofbasic

biologyand

isespecially

aimed

atreadersw

how

ouldlike

torefresh

theirknow

ledgeof

biology.Section1.3

introducesthe

conceptofsystems

biology.InSection

1.4,anoverview

isgiven

aboutw

hatfindingshave

beenm

adeaboutdifferentbiologicalnetw

orksw

ithm

odernnet-

work

analysism

ethods.

1.2B

IOL

OG

Y101

1.2.1B

iochemistry

andM

olecularB

iology

The

information

abouttheassem

blyofan

organismisstored

inthe

desoxyribonucleicacid

(DN

A,see

Fig.1.2).DN

Aisa

coiledladder(helix)consisting

oftwo

sugarphos-phate

backbonesenclosing

pairsof

thenucleotide

basesadenine,cytosine,guanine,

andthym

ine(A

,C,G

,T).T

henucleotide

Apairsonly

with

T,whereasC

pairsonlyw

ith

Nós ou vértices – fatores abióticos ou

bióticos

Linhas ou arestas – relação entre os

fatores

!"#$%#!&'

)%'

Redes intra celulares -  Redes metabólicas; -  Redes transcricionais; -  Redes de sinalização celular; -  Redes de interação entre proteínas; -  Redes de co-expressão; -  Estrutura protéica

Outras redes biológicas

-  Sinapse; -  Redes ecológicas; -  Árvores filogenéticas; -  Droga e alvo;

Tipos de redes biológicas

Interações metabólicas (metabolomas)

Relação entre metabólitos

Modelagem do metabolismo

-  Resposta ao ambiente; -  Crescimento; -  Reprodução; -  …

!"#$%#!&'

)"'

Redes de regulação (transcriptoma, smRNAs e epigenoma)

DNA ! RNA ! Proteína " "

Diferenciação celular

Redes de regulação (transcriptoma, smRNAs e epigenoma)

RNA-Seq Co-expressão

microRNAs

Integração de dados!

Predição de alvos Correlação negativa

inter. entre genes

Degradoma (plantas)

inter. entre miRNA e mRNA

FAIRE-Seq Chip-Seq

Mol. regu.-DNA

!"#$%#!&'

),'

Centralidade – a posição de um nó na rede em relação aos outros. Indica sua importância.

Análises de redes

Comparações – Alinhamento de redes

Isorank algorithm

Network BLAST (Trey Ideker)

Análises de redes

!"#$%#!&'

&$'

Integração de dados – Extração de modelos

Modelo de uma célula completa de Mycoplasma genitalium

Integração de dados – Extração de modelos

Modelo integrativo da célula

Dividiram a funcionalidade da célula em módulos

Agruparam os sub-módulos

Cada módulo foi modelado matematicamente

Integrar os modelos dos 28 sub-módulos

!"#$%#!&'

&!'

Biologia de sistemas!!!

Banco de dados!!! Parte crucial de qualquer grande projeto.

!"#$%#!&'

&('

? Banco de dados

='

!"#$%#!&'

&)'

Banco de dados (database) – é um conjunto de dados organizados em uma determinada estrutura que possibilite ao usuário encontrar facilmente a informação desejada

Até 2008 – mais de 1.000 bancos de dados

!"#$%#!&'

&&'

>?@'

Genes, genomas, proteínas, elementos transponíveis, miRNAs, interações prot-prot, interações tf-promotor;

? O que torna um banco de dados uma ferramenta

extraordinária

!"#$%#!&'

&*'

!"#$%&%$'()*+"(,+-. /)$--01$*-.,$.12%*(-.3+%4(-.

564("*,(,$.

7+48(%9':(4$"#+.,$.*"3+%4(;<$-.

=$%%(4$"#(-. ,$. ("2'*-$-. >?'(-#@. ('*":(4$"#+-@. ?6-)(. ,$. ('1+-@.("2'*-$-.,$.4+93-@.$#)AB.

C*"D-.8(%(.+6#%+-.E$?.-*#$-.)+4.+6#%(-.3$%%(4$"#(-.+6.*"3+%4(;<$-.

F(-#(.?*?'*+G%(H(.$.*"3+%4(;<$-.-+?%$.+.I6$.-$.?6-)(.

!"#$%#!&'

&+'

http://www.ncbi.nlm.nih.gov/ http://genome.ucsc.edu/

AB9C##DDDEF6892/1E/2G#'AB9C##9H3.E036G52E37EFI#'

AB9C##DDDEG56/.87F0EJ8/K/G85E560EH2#G56/.87F0L%)E$!#7G8LJ86#05327AE9K'

AB9C##DDDEG828601E/2G#259J305#'

http://omabrowser.org/cgi-bin/gateway.pl