Dia Da Computação - CEFET

Post on 04-Jan-2016

214 views 0 download

description

Dia Da Computação - CEFET

Transcript of Dia Da Computação - CEFET

Como Escrever e Apresentar Artigos Científicos em Computação?

Daniel de Oliveira

danielcmo@ic.uff.br

1º Dia da Computação 24 de outubro de 2013

Quem sou eu • Professor adjunto do Instituto de

Computação da Universidade Federal Fluminense (UFF) desde 2013.

• Recebeu o grau de Doutor em Ciências pela UFRJ em 2012.

• Publicou mais de 50 artigos em periódicos indexados e em congressos nacionais e internacionais.

• Seus interesses de pesquisa incluem bancos de dados, computação em nuvem, gerência de workflows científicos, paralelismo de dados, bioinformática e mineração de dados.

• É membro da ACM, IEEE e SBC.

Prof. Daniel de Oliveira, D.Sc.

Agradecimentos

• Profa. Mirella Moro – UFMG – Gentilmente cedeu seus slides para serem

adaptados nesta apresentação

• Profa. Vanessa Braganholo - UFF

O que é computação?

• Antes de entrar na faculdade....

O que é computação?

• Depois de entrar na faculdade....

Escrita de Artigos, Dissertações, TCC e além...

Prepare-se para decorar o próximo slide!

Escrita de Artigos, Dissertações, TCC e além...

Escrita de Artigos, Dissertações, TCC e além...

Escrita = “vender o peixe”

descrevem

definem fornece

para obter a solução do

Exemplo: Resumo [Zhang et al. – SIGMOD 1996]

Finding useful patterns in large datasets has attracted considerable interest recently,

and one of the most widely studied problems in this area is the identification of clusters, or densely populated regions, in a multi-dimensional dataset. Prior work does not adequately address the problem of large datasets and minimization of I/O costs.

This paper presents a data clustering method named BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), and demonstrates that it is especially suitable for very large databases. BIRCH incrementally and dynamically clusters incoming multi-dimensional metric data points to try to produce the best quality clustering with the available resources (i.e., available memory and time constraints). BIRCH can typically find a good clustering with a single scan of the data, and improve the quality further with a few additional scans. BIRCH is also the first clustering algorithm proposed in the database area to handle “noise” (data points that are not part of the underlying pattern) effectively.

We evaluate BIRCH’s time/space efficiency, data input order sensitivity, and clustering quality through several experiments. We also present a performance comparison of BIRCH versus CLARANS, a clustering method proposed recently for large datasets, and show that BIRCH is

consistently superior

Contexto

Problema

Solução

Avaliação

Exemplo: Resumo [Oliveira et al. – CLOUD 2010]

Most of the large-scale scientific experiments modeled as scientific workflows produce a large amount of data and require workflow parallelism to reduce workflow execution time. Some of the existing Scientific Workflow Management Systems (SWfMS) explore parallelism techniques. Cloud computing has become a popular high performance computing model in which (virtualized) resources are provided as services over the Web. Some scientists are starting to adopt the cloud model in scientific domains and are moving their scientific workflows (programs and data) from local environments to the cloud.

Nevertheless, it is still difficult for the scientist to express a parallel computing paradigm for the workflow on the cloud. Capturing distributed provenance data at the cloud is also an issue. Existing approaches for executing scientific workflows using parallel processing are mainly focused on homogeneous environments whereas, in the cloud, the scientist has to manage new aspects such as initialization of virtualized instances, scheduling over different cloud environments, impact of data transferring and management of instance images.

In this paper we propose SciCumulus, a cloud middleware that explores parameter sweep and data fragmentation parallelism in scientific workflow activities (with provenance support). It works between the SWfMS and the cloud. SciCumulus is designed considering cloud specificities.

We have evaluated our approach by executing simulated experiments to analyze the overhead imposed by clouds on the workflow execution time.

Contexto

Problema

Solução

Avaliação

Escrita é algo muito difícil!

Título: keyword1 keyword2

Resumo: linha1 linha2 linha3

Intro: parag1 parag2 parag3 parag4

Conclusão: parag1 parag2 parag3

• Contexto • Problema • Solução p1 • Solução p2 • Avaliação

Apresentação de Artigos, Dissertações e TCC

Prepare-se para decorar o próximo slide!

Apresentação de Artigos, Dissertações e TCC

O que apresentar?

O que apresentar?

Dicas de Estilo

• Sete pecados principais da apresentação

– Frases completas e longas

– Slides poluídos – Fonte pequena

– Fontes difíceis

– Imagens ilegíveis

– Animações malucas

– Falta de Fluxo

Dicas de Estilo

• Frases completas

• Slides poluídos

• Fontes pequenas

• Fontes difíceis

• Imagens ilegíveis

• Animações malucas

• Falta de fluxo

• Palavras-chave

• 1 slide = 1 info

• Fonte tamanho > 20

• Arial, sans-serif

• Novas imagens

• Evitar animações

• Revisão, revisão, revisão, revisão e mais revisão!

Exemplo: muita informação • The widespread employment of XML motivates the development of efficient methods for

manipulating XML data.

• Query languages (e.g. XQuery, XPath) take into consideration the structure of the data and enable querying both on its structure and simple values.

• Tree-pattern queries are considered among the most important and yet more complex queries to process.

• Holistic processing techniques have outperformed more conventional solutions.

• Many techniques have been proposed to handle tree-pattern queries holistically (e.g. TwigStack, XML filtering, ViST, PRIX).

• Index structures (e.g. B+-tree, XR-tree, XB-tree) have been introduced to further improve performance.

• A common characteristic for all holistic approaches is that some preprocessing is required, either on the data (e.g. TwigStack) or both the data and query (e.g. ViST, PRIX).

• Thus the need for a “dedicated” (native or relational) XML storage manager where all data resides and can be preprocessed.

• Problem: While many processing methods have already been proposed for such queries (and were shown to have promising performance and potential), none of them has found its way to any of the existing lightweight XML engines (e.g. Galax XQuery processor, eXist).

Exemplo: uso de cores

Exemplo: uso de cores

Exemplo: imagens ilegíveis

Dicas de Estilo

• Sete pecados principais do apresentador

– Monotonia, falar baixo

– Falta de ensaio, ãããã

– Tiques

– Relógio

– Exagero nos gestos

– Falar rápido

– Falar de costas

Dicas de Estilo

• Evite termos de telemarketing!!!

• “Aqui é o projeto final que eu vou estar apresentando”

Dicas de Estilo

• Evite termos de telemarketing!!!

• “Aqui é o projeto final que eu vou estar apresentando”

É assim que o seu professor, a banca e a

plateia se sentem!!

Um pouco de motivação

Graduação – M.Sc – D.Sc

Por que?

Por que?

Cuidado!!

Cuidado com quem quer atrapalhar sua graduação ou pós-graduação!

Estudo é leitura

Estudo é sozinho e em grupo

Estudo é publicação

Recife 2013 Olinda 2013

SLC 2009

Londres 2009

LA 2009

NYC 2013

Natal 2010 Washington 2011

Oxford 2009

Paris 2010 Ottawa 2012

Amsterdam 2010

Paris 2010

Miami 2010 Fortaleza 2009 Portland 2009

Estudo é difícil

Nunca desista!!!

Estudo é motivação e reflexão

O professor pode falar coisas que você não entende agora, mas que certamente são

importantes!

Processo seletivo PPTEC/CEFET

• De 02 de Setembro a 31 de Outubro

• Candidatos com dedicação exclusiva poderão pleitear as bolsas de estudo da CAPES ou do CNPq.

Processo seletivo IC/UFF

• De 14 de outubro a 19 de novembro

• O Programa oferece um significativo (mas limitado) número de bolsas para os candidatos mais bem classificados.

• Veja mais em www.ic.uff.br

Obrigado! Daniel de Oliveira

danielcmo@ic.uff.br

1º Dia da Computação 24 de outubro de 2013