Qualificação de Mestrado

24
Uma abordagem computacional para estudo de polimorfismos de base única. Orientando: Miguel Galves Orientador: Zanoni Dias Instituto de Computação UNICAMP

description

Apresentação da qualificação de mestrado em Ciência da Computação na UNICAMP

Transcript of Qualificação de Mestrado

Page 1: Qualificação de Mestrado

Uma abordagem computacional para estudo de polimorfismos de base única.

Orientando: Miguel Galves

Orientador: Zanoni Dias

Instituto de Computação

UNICAMP

Page 2: Qualificação de Mestrado

Roteiro Contexto SNPs: Polimorfismos de Base Única Porque estudar SNPs? Metodologias de estudo de SNPs:

PCR-RLFP Abordagem computacional

Etapas para o estudo de SNPs Alinhamento Detecção Correlação

Projeto PIPE Cronograma

Page 3: Qualificação de Mestrado

Contexto

A informação genética dos seres vivos está codificada em cadeias de nucleotídeos (A, C, G, T). Conjunto de sequências = genoma. Genoma armazenado na forma de DNA ou

RNA. Expressão gênica: geração de proteínas

a partir do DNA. Duas etapas: transcrição, tradução.

Page 4: Qualificação de Mestrado

SNPs: Polimorfismos de base única

Polimorfismo: mudança de uma ou mais bases em sequências genêticas. Devem ser observadas em mais de 1% de

índividuos de uma população. SNP: Polimorfismo que ocorre em apenas

uma base em um dado gene. Poderia ser bi, tri, ou tetra alélico.

Caso mais comum: bi-alélico.

Page 5: Qualificação de Mestrado

Porque estudar SNPs?

Correspondem a mais de 90% dos polimorfismos nos seres humanos.

Grande parte das doenças com base genética são causadas por um ou mais SNPs.

Grande interesse das industrias farmacêuticas: Criação de terapias específicas. Farmacogenética: interface entre genética e

farmacêutica.

Page 6: Qualificação de Mestrado

Metodologias de estudo de SNPs: PCR-RLFP

RLFP - Restriction Length Fragment Polymorphisms.

Utiliza enzimas de restrição para detectar polimorfismos.

Restrito ao estudo de SNPs conhecidos: Permite detectar apenas SNPs que criem ou

destruam sítios de restrição. Depende da disponibilidade de enzimas de

restrição apropriadas.

Page 7: Qualificação de Mestrado

Metodologias de estudo de SNPs: Abordagem computacional Utiliza sequências de DNA obtidas através de

métodos de sequenciamento automático. Se baseia em comparação utilizando

ferramentas computacionais. Método que está se popularizando com o

barateamento do processo de sequenciamento automático.

Se beneficia do grande número de sequências armazenadas em bases de dados públicas.

Page 8: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Conceitos

Inserção de buracos em duas sequências deixando-as com mesmo tamanho:

Permite criar uma pontuação para avaliar os alinhamentos obtidos. Exemplo: match =1, mismatch = -1, gap = -2. Exemplo: match =1, mismatch = -1, g = -2, h = -1

Objetivo: obter um alinhamento ótimo entre duas sequências.

ACGTTCGGCTA-GTTTG-CT

Page 9: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Estratégias

Alinhamento global: visa gerar o melhor alinhamento entre duas sequências.

ACTGACCTCGGGAC-G-CGT--GG

ACTGACCTCGGGACGCGTGG

Page 10: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Estratégias

Alinhamento semi-global: utilizado para alinhar sequências incompletas. Não penaliza a criação de buracos no início e final das

sequências.

ACTGACC-TCGGG-------ACCGTCGGGCGG

ACTGACCTCGGGACCGTCGGGCGG

Page 11: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Estratégias

Alinhamento local: encontra o melhor alinhamento entre duas sub-sequências. Retorna apenas o alinhamento dos segmentos que

geram a maior pontuação.

TCGGGTCGGG

ACTGACCTCGGGACCGTCGGGCGG

Page 12: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Problema

Problema: alinhar cDNA e RNA com DNA genômico: DNA muito maior que

cDNA. DNA pode conter

regiões de íntrons.

Page 13: Qualificação de Mestrado

Etapas para o estudo de SNPs: Alinhamento - Objetivos

Estudar os métodos de alinhamento de DNA genômico e cDNA utilizados por ferramentas de domínio público.

Definir um conjunto de parâmetros ideais para alinhamento de DNA com cDNA utilizando estratégia semi-global.

Executar testes para medir a qualidade dos alinhamentos obtidos.

Page 14: Qualificação de Mestrado

Etapas para o estudo de SNPs: Detecção - Métodos existentes

Análise de cromatograma (polyphred). Analisa o cromatograma obtido após análise

sequenciamento.

Page 15: Qualificação de Mestrado

Etapas para o estudo de SNPs: Detecção - Métodos existentes Análise de sequências alinhadas (polybayes).

Utiliza métodos Bayesianos para determinar SNPs em um alinhamento

Page 16: Qualificação de Mestrado

Etapas para o estudo de SNPs: Detecção - Objetivos

Análise dos métodos existentes para detecção de polimorfismos.

Formulação de uma nova metodologia para detecção de SNPs.

Montar casos de testes com dados reais para avaliação da metodologia proposta.

Page 17: Qualificação de Mestrado

Etapas para o estudo de SNPs: Correlação - Motivação

Predisposição a uma doença pode ser influenciada por SNPs agindo em conjunto.

LD: associação não-aleatória de alelos. Quand um alelo está presente, o outro

também estará, e vice-versa. Importante ter medidas para quantificar o

grau de correlação.

Page 18: Qualificação de Mestrado

Etapas para o estudo de SNPs: Correlação - Medidas Existentes D = PAB - PA x PB

Primeira medida proposta. Não tem muita utilidade.

D’ = D / (máx D) D’ = 1 representa LD completo.

r2 = D2 /(PA x PA’ x PB x PB’) r2 = 1 representa LD perfeito. Medida utilizada para medir a utilidade de um LD. r2 > 1/3 indica LDs úteis em processos de

mapeamento.

Page 19: Qualificação de Mestrado

Etapas para o estudo de SNPs: Correlação - Objetivos

Análise das medidas utilizadas para avaliação de SNPs.

Formulação de uma metodologia que permita integração destas medidas ao processo de estudo de SNPs

Page 20: Qualificação de Mestrado

PIPE: Sistema de Identificação de Polimorfismos Programa de apoio a pequenas empresas de

base tecnológica. Concedido à empresa Scylla Bioinformática.

Coordenação: Prof. João Meidanis Visa desenvolver a ferramenta SIP Projeto será desenvolvido nas instalações da

empresa. Trabalho comprenderá a documentação das

metodologias desenvolvidas.

Page 21: Qualificação de Mestrado

Cronograma

I - Estudo e identificação de parâmetros ideais para alinhamento.

II - Testes com os novos métodos de alinhamento obtidos.

III - Escrita dos resultados obtidos nos testes.

Page 22: Qualificação de Mestrado

Cronograma

IV - Análise dos métodos existentese formulação de uma nova metodologia de correlação de SNPs.

V - Testes computacionais com os novos métodos de correlação de SNPs.

VII - Escrita dos resultados obtidos nos testes.

Page 23: Qualificação de Mestrado

Cronograma

VII - Análise das metodologias utilizadas e formulação de uma nova metodologia de detecção de SNPs.

VIII - Testes computacionais com os novos métodos propostos.

IX - Escrita dos resultados obtidos nos testes.

Page 24: Qualificação de Mestrado

Cronograma

X - Revisão do texto da dissertação. XII - Defesa da dissertação