Goran Neshich EMBRAPA _ Foco: Dados Conhecimento.

22
http://www.cbi.cnpia.embrapa.br Goran Neshich EMBRAPA _ Foco: Dados Conhecimento

Transcript of Goran Neshich EMBRAPA _ Foco: Dados Conhecimento.

Page 1: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

EMBRAPA _ Foco: Dados Conhecimento

Page 2: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Bioinformática na EMBRAPA

Seqüenciamento

Genoma completoEstrutura Proteica

Fluxograma – descrição completa do projeto GENOMA

Alvos para açção dos fármacos, agrotóxicos, inseticidas, fungicidas etc.

#1

#2

#4

#3

Produto

In silico testesTestes no campo

Page 3: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

•Anotação Gênica•Comparação degenomas

•Descritores de Estrutura

•Descritores de Função

•Proteoma•Redes de expressão de genes

Sequence

Blast

Lexical

Structure

STING

Sintactic

Function

SMS

Semantic

Role

MicroarrayImage

Analysing

Pragmatic

Page 4: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Bioinformática na EMBRAPA

Seqüenciamento e Anotação das seqüências(unidades descentralizadasda EMBRAPA)

Análise das Estruturas das proteínas e seus complexos com DNA e Ligantes (Cenargen &

NBI/CNPTIA)

Funcionalidade das proteínas e seus complexos(NBI – CNPTIA)

Fluxograma – descrição completa do projeto GENOMA

Alvos identificados nasestruturas protéicas e ligantes detectados como modificadores da função(NBI – CNPTIA)

Função

EstruturaSeqüências

Page 5: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Bioinformática na EMBRAPA

Desktops Server 2Anotação das seqüências

Seqüências Server 3

Usuários Lab 12, 2,3,7

Sistema de transfer.

Usuários Lab 4

Usuários Lab 2 Usuários Lab 7Usuários Lab 3

Seqüências

Fluxograma – sugestão baseada na competência atual

Função

Seqüência

Estrutura

Page 6: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Bioinformática na EMBRAPA

Desktops Server 2Anotação das seqüências

Seqüências Server 3

Usuários Lab 12, 2,3,7

Sistema de transfer.

Seqüenciamento, junSeqüenciamento, junçãção e anotao e anotaçãção das seqüênciaso das seqüências

Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa contribuem com arquivos contendo as seqüências e suas anotações

As seqüências são juntadas para criar o genoma completo

As sequências são anotadas de acordo com sua similaridade com outras sequências já existentes em BDs

Todos os dados permanecem com descritores originais, para busca fácil e identificação

As atualizações são refletidas para todos os participantes

O sistema exige o controle de acessos e segurança.

Usuários Lab 4

Usuários Lab 2 Usuários Lab 7Usuários Lab 3

Seqüências

Page 7: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Bioinformática na EMBRAPA

Desktops Server 2Geração das vacinas

Inibidores comespecificidade alterada

Server 3

Usuários Lab 12, 2,3,7

Sistema de transfer.

HTS: Modelagem das estruturas, identificação dos alvos para fármacosHTS: Modelagem das estruturas, identificação dos alvos para fármacos

Os laboratórios de pesquisa das unidades descentralizadas do sistema Embrapa RECEBEM DE VOLTA a informação indicando a parte mais pragmática do processo que começou com a revelação da seqüência

Os descritores de estrutura e função são elaborados e atribuídos ao arquivo contendo a seqüência (gênica ou proteica)

Uma lista de “matching” entre um certo local na superfície de qualquer proteína, identificado como um alvo, e BDs dos ligantes, será apresentado.

Esta lista poderá então servir como base para a pesquisa cuja finalidade será identificar modificadores de função com rigor da verificação experimental.

Usuários Lab 4

Usuários Lab 2 Usuários Lab 7Usuários Lab 3

Controle de expressãogênica

Page 8: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Usar as ferramentas existentes (Java Protein Dossier de STING Millennium Suite) para gerar descritores de estrutura e função de proteínas;

Seleção de alvos para desenvolvimento de drogas a partir de seqüências genômicas geradas por grupos participantes e/ou outros, adaptando para este processo as ferramentas existentes (Modeller e/ou Dragon) para modelagem da estrutura proteica automática

Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:

Aplicações de BioInformática com alta demanda por CPU’s em era pós-genoma

Page 9: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

As interações macromoleculares acontecem através das suas superfícies – formando as interfaces.

Nós pretendemos mapear em detalhes todos os parâmetros físico-químicos pertinentes nestas interfaces e que definem o reconhecimento entre o alvo na proteína e seu ligante.

Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:

Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos

Page 10: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Sting Millennium Suite (SMS) e Java Protein Dossier (PD)- BD dos alvos

SMS e Java Protein Dossier são ferramentas afinadas para a visualização e mapeamento das interações na interface!

“Interface Forming Residues (IFR)” definidos pelo SMS e seu JPD, possuem uma extensa lista de parâmetros físico-químicos necessários para a análise de reconhecimento entre macromoléculas

Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:

Page 11: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Descritores da estruturaAnotação

Genomas de sequenciamento

Genoma estrutural

Interações: Proteínas / ligantes (Matching DB)

Estudos dos mutantese sua dinâmica Docking

BD das estruturas

Estrutura-Função

Livro da vida

Busca por novos moduladores de função

Descoberta de novos Fármacos (Drug Discovery)

SMS e Java Protein Dossier – Banco de dados dos alvos para fármacos

Objetivos específicos do grupo daObjetivos específicos do grupo daBioInformática Estrutural EMBRAPA/CNPTIA:BioInformática Estrutural EMBRAPA/CNPTIA:

Page 12: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

O Objetivo final: complementar o caminho dos projetos Genoma…

BD dos pequenosreagentes

Impressão Digital(Fingerprint)

Estruturas nos arquivos locais

Impressão Digital(Fingerprint)

Sequências do genoma completo

Modelagem por homologia

Interações: Proteínas / ligantes (Matching DB)

Estudos dos mutantese sua dinâmica Docking

Proteína-informação 2-D do seu sítio ativo

(para comparação)

Casamento entre mapas 2Ddo contorno das superfícies

Ligando-informação2-D da sua superfície

(para comparação)

Page 13: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Busca por novos moduladores de função

Cartola de enzimas

encaixe

Cartola de moduladores de função (e.g. inibidores)

encaixe encaixe

Casamento perfeito

Casamento perfeito

Casamento perfeito

Casamento entre impressões digitais de proteínas e moduladores de função

Page 14: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Contatos na interface mapeados na sequênciaProdutos específicos do NBI_Embrapa/CNPTIA

Page 15: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

JPD com mapeamento de potencial eletrostático, hidrofobicidade e curvatura

Page 16: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Page 17: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Serviços Web Tecnologia GRID

Serviços GRID

Otimização do uso dos computadores disponíveis no sistema Embrapa Tecnologia GRID (Grade computacional)

Page 18: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Desafio de instalação de Grade Computacional na Embrapa

Busca por novos fármacos In silico

ampladisseminação

Clientes com desktopArmazém

dos arquivos

Acesso online aos recursos computacionais descentralizados

Page 19: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

~3000 PCs e dezenas de estações de trabalho do sistema EMBRAPA: ociosos?

HD HPSS

HD HD

External Networks

Rede ExternaRede Externa

RedeExterna

Recursos Locais Recursos Locais

Recursos LocaisRecursos LocaisCPU’s ocisosos

CPU’sociosos

Campinas Brasília

Otimização de uso dos recursos computacionais EXISTENTES para criação eficaz dos produtos para agropecuária da nova geração

Page 20: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Motivação para estabelecer a Grade Computacional no sistema Embrapa

• Objetivo: providenciar a interface de Grid portal através da qual os biólogos moleculares podem disparar e gerenciar os processos e dados

Aplicação

Planejamento

Execução

Serviços deCatalogação

Serviços de Informação

Segurança

Monitoramento

Gerenciamento

Serviço confiávelde transferência

Recursos Computacionais

Recusros dearmazenamento

Page 21: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Unidade #2

Unidade #3

Unidade #1

Conexões de rede dedicadas

ou compartilhadas

Brasília

Centros de computação

descetralizadosdo sistema Embrapa

CampinasCNPTIA

Outros parceiros

Modelo hierárquico de unidades descentralizadas

Page 22: Goran Neshich  EMBRAPA _ Foco: Dados Conhecimento.

http://www.cbi.cnpia.embrapa.br Goran Neshich

Grades Computacionais baseadas em conhecimento

AtributosSemântica

Conhecimento

Informação

Dados

Serviços de Entrada

Gerenciamento Serviços de Acesso

(Acesso baseado em modelo)

(Sistema de gerenciamento de dados)

Repositório deInformação

Querybaseado emAtributo

Query baseado em Propriedades

Query / BrowseBaseado emConhecimento

Repositório deconhecimento para as Regras

RelaçãoEntreConceitos

CamposContainersFichários

Armazém(Replicações,IDs Permanentes)