1_Introducao_2013

7
282//13 1 1 Bioinformática 2 - Introdução Bioinformática 2013 2 Bioinformática / Biologia Computacional Novas disciplinas que reúnem as seguintes áreas científicas: Biologia (molecular) Ciência de computação Estatística Tecnologias de Informação Computadores e Ciência da informação Abrange o estudo e utilização das ferramentas computacionais para armazenamento, acesso e análise de dados Em resumo A Bioinformática faz uso das ferramentas computacionais para armazenar, aceder e analizar todo o tipo de dados biológicos que podem ir do DNA aos ecossistemas Bioinformática 2013 3 Marcos na história da Biologia Molecular e Bioinformática 1869 - Johann Friedrich Miescher descobriu o DNA e chamou-lhe nucleína 1881 - Edward Zacharias mostrou que os cromossomas eram constituídos por nucleína 1899 - Richard Altmann chamou ácido nucleico à nucleína Johann Miescher Bioinformática 2013 4 Marcos na história da Biologia Molecular e Bioinformática Cerca de 1900, foram identificadas as estruturas químicas dos 20 aminoácidos 1902 - Emil Hermann Fischer ganha o prémio Nobel: mostrou que as proteínas são constituídas por a.a. ligados entre si. Postulou que as propriedades das proteínas são definidas pela sua composição em a.a. e pela sequência desses a.a. Emil Fischer

description

Introdução a bioinformática.

Transcript of 1_Introducao_2013

  • 282//13

    1

    1

    Bioinformtica

    2 - Introduo

    Bioinformtica 2013

    2

    Bioinformtica / Biologia Computacional

    l Novas disciplinas que renem as seguintes reas cientficas: l Biologia (molecular) l Cincia de computao l Estatstica l Tecnologias de Informao

    l Computadores e Cincia da informao l Abrange o estudo e utilizao das ferramentas computacionais para

    armazenamento, acesso e anlise de dados Em resumo

    l A Bioinformtica faz uso das ferramentas computacionais para armazenar, aceder e analizar todo o tipo de dados biolgicos que podem ir do DNA aos ecossistemas

    Bioinformtica 2013

    3

    Marcos na histria da Biologia Molecular e Bioinformtica

    1869 - Johann Friedrich Miescher descobriu o DNA e chamou-lhe nuclena

    1881 - Edward Zacharias mostrou que os cromossomas eram constitudos por nuclena

    1899 - Richard Altmann chamou cido nucleico nuclena

    Joha

    nn M

    iesc

    her

    Bioinformtica 2013

    4

    Marcos na histria da Biologia Molecular e Bioinformtica

    Cerca de 1900, foram identificadas as estruturas qumicas dos 20 aminocidos

    1902 - Emil Hermann Fischer ganha o prmio Nobel: mostrou que as protenas so constitudas por a.a. ligados entre si. Postulou que as propriedades das protenas so definidas pela sua composio em a.a. e pela sequncia desses a.a.

    Em

    il Fi

    sche

    r

  • 282//13

    2

    Bioinformtica 2013

    5

    Marcos na histria da Biologia Molecular e Bioinformtica

    1911 Thomas Hunt Morgan descobre que os genes se

    encontram nos cromossomas e que so as unidades da

    hereditariedade

    1911 - Pheobus Aaron Theodore Lerene descobre o RNA

    1933 - Arne Tiselius foi o primeiro a usar a electroforese para

    separar protenas em soluo. Ganhou o prmio Nobel da

    Qumica em 1948

    Thom

    as M

    orga

    n

    Arn

    e Ti

    seliu

    s

    Bioinformtica 2013

    6

    Marcos na histria da Biologia Molecular e Bioinformtica

    1941 George Beadle e Edward Tatum descobrem que os

    genes produzem protenas

    1943 Foi construdo o primeiro computador electrnico na

    Universidade da Pensilvnia

    1950 Edwin Chargaff descobre a complementaridade entre as

    bases do DNA

    Geo

    rge

    Bea

    dle

    Edw

    ard

    Tatu

    m

    Edw

    in C

    harg

    aff

    Bioinformtica 2013

    7

    Marcos na histria da Biologia Molecular e Bioinformtica

    1950s Mahlon Bush Hoagland isolou tRNA

    Mah

    lon

    Hoa

    glan

    d

    Hemoglobina humana, A 1951 Pauling e Corey propuseram as estruturas para a helice e a folha pregueada da estrutura secundria das protenas

    Linu

    s P

    aulin

    g

    Rob

    ert C

    orey

    Bioinformtica 2013

    8

    Marcos na histria da Biologia Molecular e Bioinformtica

    1952 - Martha Chase e Alfred Hershey provaram que o DNA era a molcula responsvel pela transmisso e armazenamento da informao gentica

    Em 1969 Hershey ganhou o prmio Nobel da Medicina pela sua descoberta de que um vrus pode causar mutaes e ter mltiplos genes

    Mar

    tha

    Cha

    se

    Alfr

    ed H

    ersh

    ey

  • 282//13

    3

    Bioinformtica 2013

    9

    Marcos na histria da Biologia Molecular e Bioinformtica

    1952-1953 - James Watson e Francis Crick deduziram a estrutura da

    molcula de DNA recorrendo ao material ode difraco por raios X

    obtido Rosalind Franklin

    1955 A sequncia da insulina bovina foi a primeira protena a ser analisada por F. Sanger

    Rosalind Franklin

    1958 - Jack Kilby construiu o primeiro circuito integrado

    para a Texas Instruments

    F S

    ange

    r

    Jack

    Kilb

    y

    James Watson

    Fran

    cis

    Cric

    k

    Bioinformtica 2013

    10

    Marcos na histria da Biologia Molecular e Bioinformtica

    1956 - George Emil Palade mostrou que as protenas so produzidas

    em ribossomas

    1969 Foi criada a ARPANET para estabelecer ligaes entre os

    computadores de Stanford, UCSB, Universidade de Utah e

    UCLA

    1970 - Howard Temin and David Baltimore isolaram

    independentemente a primeira enzima de restrico

    Geo

    rge

    Em

    il P

    alad

    e

    How

    ard

    Tem

    in

    Dav

    id B

    altim

    ore

    Bioinformtica 2013

    11

    Marcos na histria da Biologia Molecular e Bioinformtica

    1977 - Phillip Sharp e Richard Roberts demonstraram que o pre-mRNA processado pela remoo dos intres e recolocao dos exes

    Phi

    llip

    Sha

    rp

    Ric

    hard

    Rob

    erts

    1980 Sequenciao completa do primeiro gene de um organismo (FX174). O gene posuui 5 386 bp e codifica para 9 protenas 1980 fundada a IntelliGenetics, Inc na California. O seu principal produto foram os programas IntelliGenetics Suite para a anlise de sequncias de DNA e protenas

    Bioinformtica 2013

    12

    Marcos na histria da Biologia Molecular e Bioinformtica

    1981 - publicado o algoritmo Smith-Waterman algoritmo para o alinhamento de sequncias.

    1981 A IBM introduz no mercado o primeiro computador pessoal. 1983 lanado o Compact Disk (CD). 1985 - publicado o algoritmo FASTP. 1985 - Kary Mullis e colaboradores descrevem

    a reaco de PCR.

    Kar

    y M

    ullis

  • 282//13

    4

    Bioinformtica 2013

    13

    Marcos na histria da Biologia Molecular e Bioinformtica

    1986 - Leroy Hood desenvolveu o mecanismo de sequenciao automtica

    1986 anunciada a Human Genome Initiative para sequenciao do

    genoma humano 1986 cunhado o termo Genmica por Thomas Roderick para descrever a

    rea cientfica que inclui o mapeamento, sequenciao e anlise de genes. 1986 criada a base de dados SWISS-PROT pelo Department of Medical

    Biochemistry da University of Geneva e o European Molecular Biology Laboratory (EMBL).

    1987 So descritos os YACs (yeast artificial chromosomes) (David T. Burke,

    et. al., Science, 236: 806-812).

    Lero

    y H

    ood

    Bioinformtica 2013

    14

    Marcos na histria da Biologia Molecular e Bioinformtica 1988 O NCBI (National Center for Biotechnology Information) lanado pelo

    National Cancer Institute 1988 O algoritmo FASTA para comparao de sequncias publicado por

    Pearson e Lupman. 1988 - Um programa novo - vrus informtico- infectou 6 000 computadores

    militares no EEUU 1995 John Craig Venter sequenciou o

    primeiro genoma bacteriano 1995 Sequenciao fluorescente automtica e robtica 1996 Primeiro genoma eucariota sequenciado levedura

    John

    Cra

    ig V

    ente

    r

    Bioinformtica 2013

    15

    Marcos na histria da Biologia Molecular e Bioinformtica

    1997 Genoma de E. coli sequenciado 1998 - PerkinsElmer, Inc. desenvolveu o sequenciador de 96 capilares 1998 - Genoma de Caenorhabditis elegans completamente sequenciado 1999 - Primeiro cromossomas humano sequenciado (cromossoma 22) 2000 Sequncia completa da poro eucromtica do genoma de Drosophila

    melanogaster 2001- 2004 Rascunho do genoma humanto at concluso do Projecto

    Sequenciao do genoma do ratinho (mouse) e do rato (rat)

    Bioinformtica 2013

    17

    Tipos de informao l Genoma

    l Totalidade do complemento de DNA de um organismo determinado por sequenciao

    l Transcriptoma l Totalidade ds mRNAs (transcritos presentes num tipo de clula e numa

    determinada condio) representa a totalidade de genes expressos nesse tipo celular. Quantifica-se por microarrays e/ou SAGE (Serial Analysis of Gene Expression)

    l Proteoma l Totalidade de protenas presentes num tipo de clula e numa determinada

    condio

    l Metaboloma l Descrio das protenas metabolicamente activas e de outros metabolitos

    presentes na clula

    l Metiloma l Totalidade de sequncias que se encontram metiladas

  • 282//13

    5

    Bioinformtica 2013

    18

    Disciplinas emergentes l Genmica Estrutural:

    l Estudo das estruturas 3D dos produtos da expresso gnica protenas e RNA

    l Genmica Funcional: l Pretende estudar o funcionamento dos genomas como um todo:

    informao gentica, regulao desta informao e expresso fentipo

    l Biologia de Sistemas l Faz uma anlise global e integrada dos processos biolgicos l Tem como objectivo compreender sistemas biolgicos complexos com

    usando ferramentas interdiciplinares

    Bioinformtica 2013

    19

    Biologia de sistemas

    Human oncogene-signaling map

    Mol

    ecul

    ar S

    yste

    ms

    Bio

    logy

    3:1

    52

    Bioinformtica 2013

    20

    Que perguntas podemos responder com a Bioinformtica / Biologia Computacional?

    Bioinformtica 2013

    21

    1 Semelhanas entre sequncias

    l Problema: l Possumos uma sequncia de DNA ou protena . Queremos

    saber rapidamente a funo dessa sequncia.

    l Soluo: l Efectuar pesquisas de semelhana entre sequncias. l software especializado compara a nossa sequncia com grandes

    bases de dados onde existem milhes de sequncias l Se na base de dados existe uma sequncia muito semelhnate

    nossa (com um grande scoring), ento podemos comear a inferir que a nossa sequncia tem a mesma funo ou uma funo semelhante.

  • 282//13

    6

    Bioinformtica 2013

    22

    2 Semelhanas entre sequncias

    l Usam-se correntemente alguns softwares de pesquisa:

    l BLAST (Basic Local Alignment Search Tool) - ferramenta mais usada em Bioinformtica

    l muito rpido, sensvel e est disponvel para todos. Existe ligado a muitas organizaes o que permite a pesquiza em inmeras bases de dados

    Bioinformtica 2013

    23

    2 Organizao de genomas l Problema:

    l Determinar a sequncia completa de uma longa seco de DNA a partir de uma coleco de numerosas sequncias pequenas. Estas sequncias pequenas so o resultado directo da sequenciao e tm em mdia aproximadamente 500 pares de bases (bp)

    l Soluo: l A montagem destas sequncias feita com recurso a software

    que identifica as sequncias pequenas que se sobrepoem e produz um contig (contiguous assembly)

    Bioinformtica 2013

    24

    1 Organizao de genomas

    l Depois de ter todos os fragmentos uni-los na ordem correcta

    l O Problema: SCS Problem (Shortest Common Superstring) l Alguns dos fragmentos

    sobrepoem-se l Sobrepr todos os fragmento

    e encontrar a sequncia menor possvel que inclua todos os fragmentos

    Bioinformtica 2013

    25

    1 Organizao de genomas

  • 282//13

    7

    Bioinformtica 2013

    26

    3 Previso da estrutura de uma protena l Problema:

    l A nossa protena possui uma determinada sequncia que foi previamente cofirmada atravs da anlise de busca de semelhanas mas queremos saber mais acerca da sua funo atravs da previso da sua estrutura

    l As protenas l so as molculas mais importantes do ponto de vista metablico

    catalizam reaces l encontram-se envolvidas na regulao da expresso gnica

    l Soluo:

    l Existem vrios tipos de mtodos que prevem a estrutura a partir da sequncia

    Bioinformtica 2013

    27

    3 Previso da estrutura de uma protena

    Bioinformtica 2013

    28

    Previso de uma macroestrutura

    Capsid of Lambda-like Phage HK97