© Copyright 2012 EMC Corporation. Todos os direitos reservados. 1 · – 12.000 funcionários em...

39
1 © Copyright 2012 EMC Corporation. Todos os direitos reservados.

Transcript of © Copyright 2012 EMC Corporation. Todos os direitos reservados. 1 · – 12.000 funcionários em...

1© Copyright 2012 EMC Corporation. Todos os direitos reservados.

2© Copyright 2012 EMC Corporation. Todos os direitos reservados.

A INFRAESTRUTURA DO FUTURO, HOJEIntegrando Greenplum DCA e SAS para permitir estudos analíticos embig data

Rafael AieloTechnology Consultant

3© Copyright 2012 EMC Corporation. Todos os direitos reservados.

O que é Greenplum? Adquirida pela EMC em julho de 2010

– Parte do quadrante de líderes do Gartner DW Magic Quadrant, Jan/2011 e Fev/2012

– Líder Forrester Wave em Hadoop, fevereiro de 2012

Missão: Fornecer produtos e serviços que ajudem as empresase provedores de serviços a obter os benefícios de negócios com análises em big data

Mais de 400 clientes globais em todos os setores

Oferece a única plataforma analítica integrada do setor

4© Copyright 2012 EMC Corporation. Todos os direitos reservados.

SAS: Software líder em análise de negócios

Desempenho– N° 1 em análise de negócios– Mais de 50.000 clientes– 12.000 funcionários em todo

o mundo

Cultura– Empresa n° 1 para trabalhar

nos EUA (2010, 2011)– Parceiro confiável de grandes

empresas e governos

Experiência– 50.000 locais com SAS em

127 países– Implementado em 93 das

100 maiores empresas– 35 anos, líder em soluções

analíticas

Líder inovador– Laboratório de análises

avançada da SAS– Cultura de inovação: 24%

de reinvestimento em P&D

Uma parceria estratégica para computaçãode alto desempenho em ambientes

analíticos

QUE PROBLEMAS LEVARÃO SEUS

CLIENTES A REPENSAR A SUA

PLATAFORMA ANALÍTICA?

• Não têm capacidade de expansão para os volumes de big data

• Não conseguem dar suportecompleto ao processo de modelagem de análisesestatísticas

• O carregamento de dados émuito lento

• A plataforma atual só é compatívelcom OLAP e eles precisam de análises avançadas

- Relatório TDWI sobre práticas recomendadas para lógica de big data, quarto semestre 2011

7© Copyright 2012 EMC Corporation. Todos os direitos reservados.

A Plataforma Analítica Integrada GREENPLUM

Dispositivos físicos ou infraestrutura em nuvem privada/híbrida

Camada de acesso e consulta aos dados

Ferramentas e serviços de terceiros/parceiros

Greenplum Chorus – camada de produtividade analítica

Greenplum Hadoop

Cientista de dados

Engenheiro de dados

Analista de dados

Analista de BI

Usuário de LOB

Greenplum DatabaseAdmin. da plataforma de dadosE

QU

IPE D

E C

IÊN

CIA

DE D

AD

OS

8© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum DatabaseDesempenho por meio do paralelismo• Arquitetura Scale-Out em hardware “commodity”

• Paralelização automática

– Carregue e consulte como qualquer banco de dados

– Distribua tabelas por todos os nós automaticamente

– Sem necessidade de particionamento nemde ajuste manual

• Arquitetura MPP sem compartilhamentoe extremamente escalável

– Todos os nós executam as rotinas paralelamente

– Capacidade de expansão linear por meio da adição de nós

– Expansão on-line ao adicionar novos nós de processamento

Carregamento

Interconexão

9© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum HD Solução Hadoop pronta para uso corporativo

Apache Hadoop– Baseado na versão estável mais recente

Suporte corporativo

– Suporte mundial da EMC, 24h x 7d

Comprovação em escala– Certificado em escala pela EMC

Opção de armazenamento Isilon– Aproveite o que há de melhor sem alterações

nos aplicativos

10© Copyright 2012 EMC Corporation. Todos os direitos reservados.

GPDB compartilhamento de dados do GPHD

GPDBExternal Tables

GPHDArquivo no

HDFS

Entrada/saídade dados do GPHDem consultas do GPDB

11© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum Chorus Agilidade em Big Data

Primeira Plataforma de Produtividade Analítica do Mundo

– Busque, explore, visualize e importe dados de toda a corporação

– Provisionamento self-service de áreas de trabalho para estudos analíticos

– Crie, compartilhe e publique descobertaspara Estudos Analíticos mais ágeis

12© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Soluções de Software Greenplum

Greenplum Database, Hadoop, & Chorus emseu hardware x86

Flexibilidade paraqualquer ambiente

Licenças de usopermanente

EMC GreenplumPermite a escolha de formas de implementação

Greenplum Data Computing Appliance

Escolha a composiçãodos módulos emincrementos de ¼ de rack

Cresça adicionandonovos módulos

Uso imediato dos rescursos

13© Copyright 2012 EMC Corporation. Todos os direitos reservados.

GreenplumData Computing Appliance

Arquitetura Totalmente Modular

14© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum Data Computing ApplianceArquitetura Modular Única

Módulo GreenplumDatabase Standard

9TB capacidade (semcompressão)/36TB (com compressão)

Cada servidor contém:• 2 sockets/12 cores• 48GB de memória• 12 discos x 600GB

Módulo GreenplumDatabase High Capacity

31TB capacidade (semcompressão)/124TB (com compressão)

Cada servidor contém:• 2 sockets/12 cores• 48GB de memória• 12 discos x 2TB

Módulo Greenplum HD 28TB capacidade (3 cópias, sem compressão)

Cada servidor contém:• 2 sockets/12 cores• 48GB de memória• 12 discos x 2TB

Módulo Greenplum DataIntegration Accelerator

(DIA)

70TB capacidadeCada servidor contém:• 2 sockets/12 cores• 48GB de memória• 12 discos x 2TB

HD

DIA

GPDB

GPDB

15© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Inicie com uma interconexão de alta velocidade...

2 servidores master do GPDB

2 switches 10 GE

Switch administrativo

Módulofuncional

Módulofuncional

Módulofuncional

Módulofuncional

16© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Adicione módulos de 1/4 de rack e expanda até doze racks

1º rack

+

Rack de Agregação e Expansão

+ …Módulo

funcional

Módulofuncional

Módulofuncional

DIA

GP DB

ou

ou

GP HD

DIA

GP DB

ou

ou

GP HD

Módulofuncional

Módulofuncional

Módulofuncional

MódulofuncionalGP DB

17© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Especificações do Greenplum Database Module

Tipo de módulo Greenplum DB Módulo padrão

Greenplum DB Módulo de alta capacidade

Número de servidores 4

Número total de núcleos 48 núcleos

Memória total 192 GB

Tipo de armazenamento 600 GB 2 TB

Número total de drives de armazenamento 48

Capacidade utilizável (sem compactação) 9 TB 31 TB

Capacidade utilizável (com compactação) 36 TB 124 TB

Taxa de varredura (Full Rack) 24 GB/s 14 GB/s

Taxa de carregamento de dados (Full Rack) 10 TB/hora 10 TB/hora

18© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum DIA Data Integration Accelerator Module

Desenvolvido especificamente para fornecer integraçãorápida com o Greenplum DB e hospedar aplicativos de parceiros

19© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Alta disponibilidade – em todas as camadas

Redundância em todos os componentes de hardware

Espelhamento no banco de dados Greenplum

Redistribuição automática do workload

Failover automático dos nodes Greenplum DB

Opções de implementeção de Disaster Recovery

20© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Detalhes de configuração do servidor GPDB

21© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Configuração de espelhamento do GPDB

P1 P2 P3 M6 M8 M10

P4 P5 P6 M1 M9 M11

P7 P8 P9 M2 M4 M12

P10 P11 P12 M3 M5 M7

Servidor de segmento 1

Servidor de segmento 2

Servidor de segmento 3

Servidor de segmento 4

Conjunto de instânciasde segmentos ativos

Os números de serviços primários e de espelhos são apenas exemplos.

GP DB

GP DB

GP DB

GP DB

22© Copyright 2012 EMC Corporation. Todos os direitos reservados.

O DCA pode sustentar até quatro falhas de servidor por rack, uma por módulo

P1 P2 P3 M6 M8 M10

P4 P5 P6 M1 M9 M11

P7 P8 P9 M2 M4 M12

P10 P11 P12 M3 M5 M7

Conjunto de instânciasde segmentos ativos

GP DB

GP DB

GP DB

GP DB

Servidor de segmento 1

Servidor de segmento 2

Servidor de segmento 3

Servidor de segmento 4

23© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Failover automático do Master Node - DCA

Servidormaster

Servidor master em standby

Interconexãode redes

Replicação das transações

Endereço IP virtual

24© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Greenplum Data Computing AppliancePlataforma unificada de análise de dados Trabalhe com dados estruturados e não estruturados Perfeito fluxo de dados entre o GPDB e o GPHD Execute SAS e outras soluções no DIALiderança em desempenho e capacidade Execução rápida de consulta de dados Carregamento de dados de alta capacidade Capacidade de vários petabytes em um único cluster Gerenciamento e suporte integrados Suporte e serviço 100% EMC Integração fácil com datacenters corporativos O Command Center fornece uma visão eficiente

sobre todo o ambiente do DCA

25© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Arquitetura integrada UAP Greenplum e SASCientista de dados

Engenheiro de dados

Analista de dados

Analista de BI

Usuário de LOB

Admin. da

plataforma de dados

EQ

UIP

E D

E C

IÊN

CIA

DE

DA

DO

S

Greenplum Chorus – camada de produtividade analítica

Análise Estatística SAS

Infraestrutura Física de Servidores ou em nuvem privada/híbrida

Business Intelligence SAS

Gerenciamento de informações da SAS

Greenplum Database Greenplum Hadoop

Camada de acesso e consulta aos dados (SAS Access, SQL, MapReduce)

26© Copyright 2012 EMC Corporation. Todos os direitos reservados.

ANÁLISE LÓGICA DE ALTO

DESEMPENHO DA SAS®

COMPONENTES-CHAVE SAS HPA

27© Copyright 2012 EMC Corporation. Todos os direitos reservados.

ANÁLISE LÓGICA DE ALTO

DESEMPENHO DA SAS®

COMPUTAÇÃO EM GRID SAS®

28© Copyright 2012 EMC Corporation. Todos os direitos reservados.

ANÁLISE LÓGICA DE ALTO

DESEMPENHO DA SAS®

IN-DATABASE SAS®

29© Copyright 2012 EMC Corporation. Todos os direitos reservados.

ANÁLISE LÓGICA DE ALTO

DESEMPENHO DA SAS®

ANÁLISE ESTATÍSTICA IN-MEMORY DA SAS®

30© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Ponto inicial central Integração Visualizações baseadas em função

BI MÓVELGERENCIADOR DE AMBIENTES

EXPLORADOR VISUAL DE ANÁLISES

DESIGNER VISUAL

• Relatórios nativos interativos

• iOS, Android

• Plataforma In-Memory de análises

• Segurança• Monitoramento

• Análise específica• Detecção de dados

• Relatórios para a Web ou celular

Visualização de negócios: SAS Visual Analytics

31© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Melhorando o desempenho e a facilidade de gerenciamento do ambiente SAS

32© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Componentes básicos da solução integrada

Etapa 1: Nova visão da arquitetura analítica

EMC Greenplum UAP

Análise estatística corporativa da SAS

Sol

uçõe

sS

AS

BI S

AS

• Solução totalmente integrada

• MPP em todo repositório

• Resultados analíticos maisrápidos e mais precisos sobretodos os dados

• Flexibilidade com balanceamento dinâmico de cargas de trabalho

• Continuidade dos aplicativosatuais SAS

Ger

enci

amen

to d

ein

form

açõe

s

In-m

emor

y S

AS

In-D

atab

ase

SA

S

Com

puta

ção

emG

RID

SA

S

33© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Soluções SASGerenciador de grid

SAS (x86/Linux)In-Memory SAS In-Database SAS BI SAS

Gerenciamento de informações da SAS

SAS

Soft

war

e

SAS Fraud Framework

SAS Grid Manager for Linux

SAS HPA (High Performance

Analytics) SAS Access for Greenplum

(Processos básicos)

SAS Visual Analytics (SA VA)

SAS Data Integration Studio

SAS Metadata Manager

SAS HPMO (High Performance

Marketing Optimization)

SAS EDI (Enterprise Data Integration) SAS HP Risk (High

Performance Risk)

SAS SA (Scoring Accelerator) for

GreenplumSAS Dataflux

SAS Model Manager

Foco no problema de negócios

Etapa 2: Seleção dos componentes de produtos da SAS

34© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Etapa 3: A Greenplum entrega a infraestrutura do ambiente analítico

Ger. de grid da SAS no GP DIA

Ger. de grid da SAS no GP DIA

Ger. de grid da SAS no GP DIA

Ger. de grid da SAS no GP DIA

192 núcleos de CPU Grid SAS

SAS HPA no GP DCA

SAS HPA no GP DCA

SAS HPAno GP DCA

SAS HPA no GP DCA

Rack completo para HPA – des. de modelo

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Armazenamento NAS

Isilon

Isilon de 300 TB para conjuntos de dados SAS e Greenplum HD

Nós GPHadoop

Nós GPHadoop

SAS VA noGP DIA

SAS VA no GP DIA

Nós do GP Hadoop c/ SAS VA

35© Copyright 2012 EMC Corporation. Todos os direitos reservados.

SAS Grid e outras soluções no GP DIA

Isilon para programas SAS

Isilon para Greenplum HD

38© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Resumo

A SAS e a EMC Greenplum têm estratégias de soluções altamente alinhadas e complementares

A integração atual dos produtos permite que as empresas comecem sua jornada rumo à análises de big data hoje

A integração futura dos produtos aumentará o valor que pode ser extraído da Plataforma AnalíticaIntegrada

39© Copyright 2012 EMC Corporation. Todos os direitos reservados.

Twite por uma chance de ganhar um Iomega Desktop Hard Drive 1TB!

As respostas corretas participarão do sorteio acima.O ganhador será anunciado no fim do evento.

É preciso estar presente para receber o prêmio.

40© Copyright 2012 EMC Corporation. Todos os direitos reservados.

OBRIGADO