Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf ·...

66
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA CURSO DE ENGENHARIA DA COMPUTAÇÃO Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer Pedro de Botelho Marcos 1

Transcript of Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf ·...

Page 1: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SULINSTITUTO DE INFORMÁTICA

CURSO DE ENGENHARIA DA COMPUTAÇÃO

Trabalho de Conclusão de Curso

Flavio Alles RodriguesClaudio Geyer

Pedro de Botelho Marcos

1

Page 2: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Caracterização do Consumo Energético do

Hadoop MapReduce

Flavio Alles RodriguesClaudio Geyer

Pedro de Botelho Marcos

2

Page 3: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

3

Page 4: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

4

Page 5: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação

• Crescimento dos conjuntos de dados (GORTON et al., 2008) (KOUZES et al., 2009) (WHITE, 2012)

• Computação Intensiva em Dados

• Modelos de programação paralela e distribuída para o desenvolvimento aplicações intensivas em dados

• MapReduce (DEAN; GHEMAWAT, 2008)

• Dryad (ISARD et al., 2007)

• Spark (ZAHARIA et al., 2010)

5

Page 6: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação• Programas desenvolvidos com estes frameworks são

altamente escaláveis, podendo utilizar milhares de máquinas em uma computação (DEAN; GHEMAWAT, 2008)

• Computação intensiva em dados demanda muitos recursos computacionais

• Alto consumo energético

• Problemas

• Financeiro

• Ambiental

6

Page 7: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação

(BARROSO, 2005)

7

Page 8: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação

• Queima de combustíveis fosséis é um dos fatores chave para mudanças climáticas (IPCC, 2013)

• Nos EUA, 68% da eletricidade é gerada a partir de combustíveis fosséis (EIA, 2013)

• Data centers localizados nos EUA foram responsáveis pelo consumo de ~1.5% da eletricidade gerada no país - com uma tendência de crescimento neste consumo de 12% ao ano (KURP, 2008)

8

Page 9: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação

• Sistemas computacionais (hardware e software) devem ser projetados para serem eficientes energeticamente

9

Page 10: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

10

Page 11: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Objetivos

• Caracterizar o consumo energético de um sistema de processamento de grandes quantidades de dados

• Hadoop - implementação de código aberto do modelo de programação MapReduce - é o sistema escolhido para a caracterização

• A caracterização será acompanhada de considerações sobre o desempenho do framework

11

Page 12: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

12

Page 13: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

MapReduce/Hadoop• Google (DEAN; GHEMAWAT, 2008)

• Duas funções: map & reduce

• Runtime

• Distribuição de dados

• Escalonamento de tarefas

• Comunicação entre nós

• Tolerância a falhas

• Sistema de arquivos distribuído (GHEMAWAT; GOBIOFF; LEUNG, 2003)

• Hadoop

• Implementação do modelo de programação MapReduce mais popular (WHITE, 2012), inspirado em (DEAN; GHEMAWAT, 2008)

13

Page 14: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

MapReduce/Hadoop

(DEAN; GHEMAWAT, 2008)

14

Page 15: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

15

Page 16: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Estado da Arte

• Avaliação de Consumo Energético

• (CHEN; GANAPATHI; KATZ, 2010)

• Compressão de dados

• (LANG; PATEL, 2010)

• (WIRTZ; GE, 2011)

• O MapReduce é apenas uma carga de trabalho para avaliar diferentes mecanismos de gerenciamento energético de clusters.

16

Page 17: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Estado da Arte

• Avaliação de Consumo Energético (cont.)

• (LEVERICH; KOZYRAKIS, 2010)

• (KAUSHIK; BHANDARKAR, 2010)

• (MAHESHWARI; NANDURI; VARMA, 2012)

• Alterações sobre distribuição de dados para possibilitar que diferentes mecanismos de gerenciamento de energia de clusters que ligam/desligam nós com base na utilização

17

Page 18: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

18

Page 19: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia

1. Metodologia de Testes (JAIN, 1991)

2. Metodologia de Mensuração de Consumo Energético

19

Page 20: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)• Objetivo: Caracterização do consumo energético e do desempenho

de um framework para desenvolvimento de aplicações intensivas em dados

• Sistema: Hadoop

• HDFS não faz parte da avaliação

• Métricas

• Consumo de Energia [J]

• Tempo de Execução [s]

• Técnica de Avaliação

• Experimentação

20

Page 21: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

• Aproximadamente 190 parâmetros de configuração

• (HERODOTOU; BABU, 2011)

• (ZAHARIA et al., 2010)

21

Page 22: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

(HERODOTOU; BABU, 2011)

22

Page 23: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

(HERODOTOU; BABU, 2011)

23

Page 24: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)• mapred.jobtracker.taskScheduler

• FIFO (Padrão)

• HFS (ZAHARIA et al., 2010)

• Escalonamento justo (compartilhamento de recursos)

• Maximizar escalonamento local (Delay Scheduling)

• «HFS can increase throughput by up to 2x while preserving fairness»

24

Page 25: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

• Aplicações

• CPU Bound & IO Bound

• (HUANG et al., 2010)

• CPU Bound: WordCount

• IO Bound: Sort

25

Page 26: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

26

Page 27: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Testes)

1. 2KR (HERODOTOU; BABU, 2011)

2. Escalonadores com Uma Aplicação

3. Escalonadores com Múltiplas Aplicações

27

Page 28: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)

• Baseado em estatísticas de uso (MOUW, 2001)

• Monitor distribuído (DUSSO, 2012)

28

Page 29: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)

• Energy-proportional (BARROSO; HÖLZLE, 2007)

• CPU (FAN; WEBER; BARROSO, 2007)

• Comportamento Estático

• Memória (HÄRDER et al., 2011)

• Disco (FAN; WEBER; BARROSO, 2007)

• Interface de Rede (SOHAN et al., 2010)

29

Page 30: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)

• TDP (Thermal Design Power) usualmente possui valores conservadores (FAN; WEBER; BARROSO, 2007)

• Modelo produz resultados com erro inferior à 10% (FAN; WEBER; BARROSO, 2007) (RIVOIRE; RAN- GANATHAN; KOZYRAKIS, 2008)

30

Page 31: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)• KCPU & KMISC (ECONOMOU et al., 2006)

• Processo de calibragem

• Correlação entre medidas em nível de hardware (PMEAS) e estatísticas de uso (M)

• Programa linear produz um resultado (s) a partir de uma função objetivo que busca minimizar o erro entre as medidas em nível de hardware (PMEAS) e a potência calculada pelo modelo (PPRED)

31

Page 32: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)

32

Page 33: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Metodologia (Consumo)

33

Page 34: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

34

Page 35: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Testes & Resultados

1. 2KR

2. Escalonadores com Uma Aplicação

3. Escalonadores com Múltiplas Aplicações

35

Page 36: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

2KR

• Metodologia 2KR (Jain, 1991)

• (HERODOTOU; BABU, 2011)

• FIFO & HFS

• CPU Bound & IO Bound

• Entrada: 1 GB

• Replicações: 10

36

Page 37: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

2KR

(HERODOTOU; BABU, 2011)

37

Page 38: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

2KR

38

Page 39: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

2KR

39

Page 40: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

2KR

• Existe uma similaridade muito evidente entre os efeitos de cada fator para o consumo de energia e os efeitos de cada fator para o desempenho do sistema MapReduce

• Em linhas gerais, os parâmetros mais influentes para cada escalonador em ambas aplicações testadas - e, também, o grau de influência destes parâmetros - são semelhantes

40

Page 41: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

• FIFO & HFS

• CPU Bound & IO Bound

• Entradas: 256 MB, 4 GB & 10 GB

• Pequena, Média & Grande

• Replicações: 10

41

Page 42: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

• Não é possível estabelecer que um escalonador é superior ao outro para o escalonamento de uma aplicação que executa sem concorrência com outras requisições ao sistema MapReduce.

• Apesar de alcançar um de seus objetivos (maior localidade no escalonamento de tarefas map), HFS não obtém melhor desempenho ou menor consumo energético no contexto avaliado.

42

Page 43: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Múltiplas Aplicações

• FIFO & HFS

• 20 Aplicações

• Workload CPU Bound

• Workload IO Bound

• Entradas: 256 MB (14), 4 GB (5) & 10 GB (1)

• Workload Heterogênea (50-50)

• Entradas: 256 MB (14), 4 GB (4) & 10 GB (2)

• Replicações: 10

43

Page 44: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Múltiplas Aplicações

44

Page 45: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Múltiplas Aplicações

45

Page 46: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Múltiplas Aplicações

• Workload CPU bound e a workload heterogêna, HFS é a opção de escalonamento de tarefas que apresenta melhores resultados de consumo de energia e desempenho para a situação de escalonamento de múltiplas aplicações apresentadas

• O escalonamento justo e com preferência para tarefas locais produz resultados melhores do ponto de vista de eficiência energética nas workloads citadas

• Workload IO bound não apresentou diferenças estatísticas no consumo de energia

46

Page 47: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Sumário1. Motivação

2. Objetivos

3. MapReduce/Hadoop

4. Estado da Arte

5. Metodologia

6. Testes & Resultados

7. Conclusões & Trabalhos Futuros

47

Page 48: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Conclusões & Trabalhos Futuros

• Caracterizar o consumo energético de um framework para computação intensiva em dados

• 6440 Execuções MapReduce

• 6755 GB (~6.6 TB)

48

Page 49: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Conclusões & Trabalhos Futuros

• Usuários podem utilizar o Hadoop com maior eficiência energética

• Desenvolvedores podem tornar o sistema ciente de seu consumo de energia

49

Page 50: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Conclusões & Trabalhos Futuros

• Trabalhos Futuros

• Desenvolvimento de novo escalonador de tarefas MapReduce

• Adicionar funcionalidades relacionadas ao consumo de energia ao simulador MRSG (KOLBERG et al., 2013)

• Caracterização do consumo energético do HDFS

50

Page 51: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Agradecimento

• Este trabalho foi realizado com apoio do projeto G R E E N - G R I D : C o m p u t a ç ã o d e A l t o Desempenho (FAPERGS)

51

Page 52: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Referências• BARROSO, L. A. The price of performance. Queue, [S.l.], v.3, n.7, p.48–53, 2005.

• BARROSO, L. A.; HÖLZLE, U. The case for energy-proportional computing. Computer, [S.l.], v.40, n.12, p.33–37, 2007.

• CHEN, Y.; GANAPATHI, A.; KATZ, R. H. To compress or not to compress-compute vs. IO tradeoffs for mapreduce energy efficiency. In: ACM SIGCOMM WORKSHOP ON GREEN NETWORKING . Proceedings. . . [S.l.: s.n.], 2010. p.23–28.

• DEAN, J.; GHEMAWAT, S. MapReduce: simplified data processing on large clusters. Communications of the ACM, [S.l.], v.51, n.1, p.107–113, 2008.

• DUSSO, P. M. A monitoring system for WattDB: an energy-proportional database cluster. Trabalho de Graduaç ́ão, [S.l.], 2012.

• ECONOMOU, D. et al. Full-system power analysis and modeling for server environments. In: IN PROCEEDINGS OF WORKSHOP ON MODELING, BENCHMARKING, AND SIMULATION. Anais. . . [S.l.: s.n.], 2006. p.70–77.

52

Page 53: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Referências• EIA. http://www.eia.gov/tools/faqs/faq.cfm?id=427&t=3. 2013.

• FAN, X.; WEBER, W.-D.; BARROSO, L. A. Power provisioning for a warehouse-sized computer. ACM SIGARCH Computer Architecture News, [S.l.], v.35, n.2, p.13–23, 2007.

• GHEMAWAT, S.; GOBIOFF, H.; LEUNG, S.-T. The Google file system. In: ACM SIGOPS OPERATING SYSTEMS REVIEW. Anais. . . [S.l.: s.n.], 2003. v.37, n.5, p.29– 43.

• GORTON, I. et al. Data-intensive computing in the 21st century. Computer, [S.l.], v.41, n.4, p.30–32, 2008.

• GHEMAWAT, S.; GOBIOFF, H.; LEUNG, S.-T. The Google file system. In: ACM SIGOPS OPERATING SYSTEMS REVIEW. Anais. . . [S.l.: s.n.], 2003. v.37, n.5, p.29– 43.

• HÄRDER, T. et al. Energy efficiency is not enough, energy proportionality is needed! In: Database Systems for Adanced Applications. [S.l.]: Springer, 2011. p.226–239.

53

Page 54: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Referências• HERODOTOU, H.; BABU, S. Profiling, what-if analysis, and cost-based optimization

of MapReduce programs. Proc. of the VLDB Endowment, [S.l.], v.4, n.11, p.1111–1122, 2011.

• HUANG, S. et al. The HiBench benchmark suite: characterization of the mapreduce-based data analysis. In: DATA ENGINEERING WORKSHOPS (ICDEW), 2010 IEEE 26TH INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. p.41–51.

• IPCC. http://www.ipcc.ch/report/ar5/. 2013.

• ISARD, M. et al. Dryad: Distributed Data-parallel Programs from Sequential Building Blocks. Proceedings of the 2nd ACM SIGOPS/EuroSys European Conference on Computer Systems. [S.l.: s.n.], p. 59–72, 2007.

• JAIN, R. The art of computer systems performance analysis. [S.l.]: John Wiley & Sons Chichester, 1991. v.182.

• KAUSHIK, R. T.; BHANDARKAR, M. GreenHDFS: Towards an Energy-Conserving Storage-Efficient, Hybrid Hadoop Compute Cluster. Proceedings of the USENIX Annual Technical Conference, [S.l.], p.1-9, 2010.

54

Page 55: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Referências

• KOLBERG, W. et al. MRSG: a MapReduce simulator over SimGrid. Parallel Computing, [S.l.], v.39, n.4-5, p.233–244, 2013.

• KOUZES, R. T. et al. The changing paradigm of data-intensive computing. Computer, [S.l.], v.42, n.1, p.26–34, 2009.

• KURP, P. Green computing. Communications of the ACM, [S.l.], v.51, n.10, p.1–13, 2008.

• LANG, W.; PATEL, J. M. Energy management for mapreduce clusters. Proceedings of the VLDB Endowment, [S.l.], v.3, n.1-2, p.129–139, 2010.

• LEVERICH, J.; KOZYRAKIS, C. On the energy (in) efficiency of hadoop clusters. ACM SIGOPS Operating Systems Review, [S.l.], v.44, n.1, p.61–65, 2010.

• MAHESHWARI, N.; NANDURI, R.; VARMA, V. Dynamic energy efficient data place- ment and cluster reconfiguration algorithm for MapReduce framework. Future Generation Computer Systems, [S.l.], v.28, n.1, p.119–127, 2012.

55

Page 56: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Referências• MOUW, E. Linux kernel procfs guide. Faculty of Information Technology and

Systems, [S.l.], 2001.

• RIVOIRE, S.; RANGANATHAN, P.; KOZYRAKIS, C. A Comparison of High-Level Full-System Power Models. HotPower, [S.l.], v.8, p.3–3, 2008.

• SOHAN, R. et al. Characterizing 10 Gbps network interface energy consumption. In: LOCAL COMPUTER NETWORKS (LCN), 2010 IEEE 35TH CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. p.268–271.

• WHITE, T. Hadoop: the definitive guide. [S.l.]: O’Reilly, 2012.

• WIRTZ, T.; GE, R. Improving MapReduce energy efficiency for computation intensive workloads. In: GREEN COMPUTING CONFERENCE AND WORKSHOPS (IGCC), 2011 INTERNATIONAL. Anais. . . [S.l.: s.n.], 2011. p.1–8.

• ZAHARIA, M. et al. Delay scheduling: a simple technique for achieving locality and fairness in cluster scheduling. In: EUROPEAN CONFERENCE ON COMPUTER SYS- TEMS, 5. Proceedings. . . [S.l.: s.n.], 2010. p.265–278.

• ZAHARIA, M. et al. Spark: cluster computing with working sets. Proceedings of the 2nd USENIX conference on Hot topics in cloud computing, [S.l.: s.n.] , p.10–10, 2010.

56

Page 57: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Caracterização do Consumo Energético do

Hadoop MapReduce

Flavio Alles RodriguesClaudio Geyer

Pedro de Botelho Marcos

57

Page 58: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Motivação• Computação Intensiva em Dados

• O sistema de indexação de páginas web do Google processa aproximadamente 20 TB em documentos a cada iteração (DEAN; GHEMAWAT, 2008)

• Facebook armazena aproximadamente 700 TB em bancos de dados relacionais (THUSOO et al., 2009)

• Experimentos em física de partículas em um dos quatro equipamentos que compõem o acelerador de partículas Large Hadron Collider no CERN geram 2 PB/s (KOUZES et al., 2009)

58

Page 59: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Estado da Arte• Avaliação de Desempenho

• (JIANG et al., 2010)

• Estudo do desempenho do MapReduce no contexto da área de bancos de dados. Todos os fatores considerados no artigo tem relação com o sistema de arquivos distribuído.

• (HUANG et al., 2010)

• (AGGARWAL; PHADKE; BHANDARKAR, 2010)

• Não explicam os resultados em termos de características próprias do sistema de execução MapReduce.

59

Page 60: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

60

Page 61: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

61

Page 62: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

62

Page 63: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

63

Page 64: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

64

Page 65: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Uma Aplicação

65

Page 66: Trabalho de Conclusão de Curso - inf.ufrgs.brfarodrigues/ECP-TG2-FlavioAlles-Keynote.pdf · Trabalho de Conclusão de Curso Flavio Alles Rodrigues Claudio Geyer ... • Sistemas

Escalonadores com Múltiplas Aplicações

66