Ivan G. Costa Filho [email protected] Centro de Informática Universidade Federal de Pernambuco

9
Biologia In Silico - Centro de Informática - UFPE Ivan G. Costa Filho [email protected] Centro de Informática Universidade Federal de Pernambuco Projeto Analise de Expressão Gênica de Câncer

description

Projeto Analise de Expressão Gênica de Câncer. Ivan G. Costa Filho [email protected] Centro de Informática Universidade Federal de Pernambuco. Motivacao. Analise explorativa de dados de expressão gênica de câncer. Utilização de técnicas pre-processamento Classificação seleção de atributos - PowerPoint PPT Presentation

Transcript of Ivan G. Costa Filho [email protected] Centro de Informática Universidade Federal de Pernambuco

Page 1: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Ivan G. Costa [email protected]

Centro de InformáticaUniversidade Federal de Pernambuco

ProjetoAnalise de Expressão

Gênica de Câncer

Page 2: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Motivacao

• Analise explorativa de dados de expressão gênica de câncer.

• Utilização de técnicas• pre-processamento• Classificação• seleção de atributos• visualização.

Page 3: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Metodologia• Analise de 6 bases de dados

– Dados extraídos a partir da literatura indicada.

• Pre-processamento e filtro– Usar a metodologia de Souto et al 2008 (ver pagina 12

Experimental Design) http://www.biomedcentral.com/1471-2105/9/497

• Classificação– Métodos com selecao de atributos– PAM, Nearest Shrunken Centroids, LDA, QDA, …– Avaliação Leave-one-out

• Atributos– Analise de enriquecimento (gost)

• http://biit.cs.ut.ee/gprofiler/

• Visualização– PCA (tecidos)

Page 4: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Dados I

• Andersson, C. Microarray-based classification of a consecutive series of 121 childhoodacute leukemias: prediction of leukemic and genetic subtype as well as of minimal residual disease status. Leukemia, 61:11981203,April 2007.

• S. S. Dave,. Molecular diagnosisof burkitt’s lymphoma. N Engl J Med., 354(23):2431–42, June 2006.

• P. Farmer. Identification of molecular apocrine breast tumoursby microarray analysis. Oncogene, 24(29):4660–71, July 2005.

• C. B. Gilks. Distinction between serous tumors of low malignant potential and serous carcinomas based on global mrna expression profiling. Gynecol Oncol., 96(3):684–94, March 2005.

• C. M. Perou,. Molecular portraits of human breast tumours. Nature, 406(6797):747–52, August 2000.

• D. S. Rickman, Distinctive molecular profiles of high-grade and low-grade gliomas based on oligonucleotide microarray analysis. Cancer Research, 61(18):6885–91, September 2001.

Page 5: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

• D. Talantov, A. Novel genes associated with malignant melanoma but not benign melanocytic lesions. Clinical Cancer Research, 11(20):7234–42, October 2005.

• True, I. A molecular correlate to the gleason grading system for prostate adenocarcinoma. Proc Natl Acad Sci U S A, 103(29):10991–6, July 2006.

• Y. F. Wong, Expression genomics of cervical cancer: molecular classification and prediction of radiotherapy response by dna microarray. Clinical Cancer Research, 9(15):5486–92, November 2003.

• X. J. Yang, A molecular classification of papillary renal cell carcinoma. Cancer Research, 65(13):5628–37, July 2005.

• M. Sanchez-Carbayo. Defining molecular profiles of poor outcome in patients with invasive bladder cancer using oligonucleotide microarrays. Journal of Clinical Oncology, 24(5):778–789, February 2006.

• T. Watanabe. Distal colorectal cancers with microsatellite instability (msi) display distinct gene expression profiles that are different from proximal msi cancers. Cancer Research, 66, 2006.

Dados II

Page 6: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Relatório Final

• Relatório em latex• Formato de Artigo

– Introdução– Métodos – Experimentos (dados e metodologia)– Resultados

• comparação de métodos com analise estatística• Gráficos com analise de pca

– Referencias• Código e Bases de dados finais (De Souto

2008)

Page 7: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Cronograma

• Encontro semanal– Terças na hora da aula

• Cronograma– 26/5 - bases preparadas e filtradas– 2/6 - experimentos de classificação– 9/6 - analise dos genes – 16/6 - visualização– 23/6 – relatório final (dia 24 viajei!)

Page 8: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Dicas

• Fazer a analise em R – Implementa pre-processamento– Tem implementacao dos metodos

• Olhar literatura relacionada– Sandrine Dudoit and Jane Fridlyand,

Classification in microarray experiments, Technical Report 2002.

Page 9: Ivan G. Costa Filho igcf@cin.ufpe.br Centro de Informática Universidade Federal de Pernambuco

Biologia In Silico - Centro de Informática - UFPE

Avaliação

• Por projeto – baseada no acompanhamento do projeto e avaliacao final

• Por aluno – no final cada um escreve um parágrafo dizendo o que cada participante fez.

– Ver Authors' contributions em de Souto 2008.