Fundamentos Nazareno Andrade Universidade Federal de Campina Grande 02/2008 Sistemas Distribuídos.

Fundamentos

Nazareno AndradeUniversidade Federal de Campina Grande

02/2008

Sistemas Distribuídos

FundamentosCoordenando processosConstruíndo sistemasSistemas construídos

Fundamentos– O que são sistemas distribuídos– Para que distribuímos sistemas– Referências de sistemas distribuídos– Vocabulário sobre sistemas distribuídos– Arquiteturas de sistemas distribuídos– Modelos de sistemas distribuídos

Coordenando processosConstruíndo sistemasSistemas construídos

Objetivos

Idéia clara do que são sistemas distribuídos– Propósito– Vantagens & desvantagens

Repertório de sistemasVisão de questões de projeto

Que sistemas distribuídos nós usamos?

O que é um sistema distribuído?

Em comum:

Componentes independentesCanais de comunicaçãoImagem única

Hardware independente + software unificando

“Conjunto de computadores independentes que se apresenta a seus usuários como um sistema único e coerente” -Tanenbaum

“Sistema em que componentes de hardware e software localizados em diferentes computadores interconectados se comunicam e coordenam suas ações trocando mensagens” – CDK

“Sistema onde você não consegue trabalhar por causa de uma falha em um computador que você nunca viu” – Lamport

Por que sistemas distribuídos?Compartilhamento

– Documentos, impressoras, telescópios, ...

Escalabilidade– Mais carga → Mais recursos

Custo x benefício– Um PC: dinheiro em dobro ≠ desempenho em dobro

Robustez– Redundância

Limitações da Física– Corpos se movem– Corpos não se movem rápido o suficiente

E nós, projetistas?

ConcorrênciaCanais de comunicaçãoFalhas parciaisDescoberta de recursosCoordenação

Fundamentos– O que são sistemas distribuídos– Para que distribuímos sistemas– Referências de sistemas distribuídos– Vocabulário sobre sistemas distribuídos– Arquiteturas de sistemas distribuídos– Modelos de sistemas distribuídos

Coordenando processosConstruíndo sistemasSistemas construídos

Sistemas de arquivos distribuídos: NFS

Compartilhar arquivos, compartilhar um servidor

Compartilhamento de documentos (ao menos inicialmente)Navegadores e servidoresHTTP

http://www.google.com

http://lsd.ufcg.edu.br/~nazareno/xpto.html

Google

nazareno

xpto.html

Sistemas N-camadas

Amazon, Google e quase todo e-commerce que você vir poraí...Tecnologia popular: LAMP - Linux, Apache, MySQL,

Perl/PHP/Python

ApresentaçãoLógica

Banco de dados

Computação paralela: clusters

Alta performance, computação paralelaProcessamento numérico, processamento de dados, ...

Tecnologias: PBS, Bewuolf, MapReduce, Hadoop

Computação paralela: grids/grades

Alto desempenho, plataforma mais ampla, compartilhamentoTecnologias: Globus, Condor, OurGrid

Domínios administrativos

Computação entre-pares, peer-to-peer

Compartilhamento, “bordas” da redeGnutella, Kazaa, BitTorrent, Skype, MSN, ...

Computação pervasiva / ubíqua

Computadores estão em todo lugar, e conectados

Celulares, carros, marcapassos, ...

Imagem única transparência

Fornecendo uma imagem única

Transparência O que é

Acesso Escondemos se recursos são remotos

Localização Escondemos onde eles estão

Migração Escondemos se eles mudam de máquina

Relocação Escondemos se eles se movem

Replicação Escondemos redundância

Concorrência Escondemos compartilhamento

Falha Escondemos falhas

Embora isso não seja tão simples

Heterogeneidade– Plataforma, clientes, conexões

Sistemas abertos– Diversas implementações de clientes

Segurança– Nos componentes, nas comunicações, DoS

Escalabilidade – Evitar gargalos

Tolerância a Falhas– Componentes devem lidar com falhas dos demais

Concorrência– Concorrência é a norma

Alguns princípios de projeto de SD

TransparênciaTransparência para programa, usuário ou programador?

Envolve ao menos:Nomes lógicos

– http://www.google.com– Réplicas têm mesmo nome lógico

Exclusão mútua distribuída– Lembram de SO?Eficiência na comunicação

Transparência é um contínuo, e não binário

Transparência limitada pode ser necessária ou útil– A Física impõe limites– O usuário pode entender melhor o que está acontecendo

Desempenho

Medido através de métricas:– Vazão (throughput)– Tempo de resposta (response time, makespan)– Latência– Utilização dos recursos(nem sempre são independentes...)

O custo da comunicação em geral é importante

Desempenho e comunicação

Em geral, queremos minimizar comunicação– Overhead de comunicação >> outros overheads

• Canais são recurso mais escasso no sistema– Comunicação == tamanho e freqüência de mensagens

Granulosidade do paralelismo (parallelism granularity)– Fine granularity – grãos pequenos comunicação freqüente– Coarse granularity – grãos grandes comunicação

infreqüente

Escalabilidade

Existem SDs em 2, 10 e 10^6 computadores– Google, Amazon EC2, Skype, ...

Métodos para construir sistemas pequenos podem não valer para outras escalas

Escalabilidade == É possível alterar a escala do sistema– Quantidade de usuários ou recursos (custo x benefício)– Escala geográfica– Manter o sistema gerenciável a medida que cresce

Em geral depende de não haver gargalos descentralização

Escalabilidade: por que não é simples

Escalabilidade Descentralização Descentralização Complexidade

Princípios de algoritmos descentralizados escaláveis:– Nenhum componente tem informação sobre todo o

sistema– Componentes tomam decisões baseadas em informações

locais– Falhas parciais não inviabilizam resultado– Não há um relógio global único

• Há aproximações bem imperfeitas, como o NTP

Mais sobre escalabilidade e o mundo real

Duas lições recentes

1. Quando a escala é grande o suficiente, qualquer coisa acontece

– Mensagens de controle corrompidas na Amazon e no PlanetLab

2. Ações coordenadas de componentes podem ser catastróficas

– Problema do Skype em 2008

HeterogeneidadeHardware independente Configurações independentes

Como sempre: níveis de indireçãoNeste caso, middleware

Confiabilidade

Confiabilidade = disponibilidade + integridade + segurança

Um sistema distribuído pode ser mais confiável que um monolítico– Tolerância a falhas parciais

Um sistema distribuído não é necessariamente mais confiável– Falhas independentes?– Segurança agora de diversos pontos– Integridade mais complexa

Como resolver tudo isso? Neste curso!

Recapitulando

TransparênciaDesempenhoEscalabilidadeHeterogeneidadeConfiabilidade

Vamos usar bastante isso durante o curso...

Ciladas em projetos de SD

Não assuma que

A rede é confiávelA rede é segura A rede é homogêneaA topologia da rede não mudaA latência é zeroA largura de banda é infinitaO overhead de transporte é zeroHá um só administrador

Fim da introdução

Recapitulando...

• O que são sistemas distribuídos• Por que distribuir um sistema• Visão geral dos tipos de sistemas distribuídos• Objetivos comuns no projeto de sistemas distribuídos• Desafios particulares nesse projeto• O que não assumir

Em resumo: o que sistemas distribuídos têm de particular

Mais sobre esse assunto

End-to-end arguments in computer design– Onde devem ficar as funcionalidades?

A note on distributed computing – Quão transparente deve ser a distribuição para o

programador?

Cenas do próximo capítulo

Quais as formas de dividir responsabilidades em um SD? Qual o espaço de projeto?– Centralizado, descentralizado, peer-to-peer, híbridos...

Como estudamos um sistema distribuído analiticamente?– Modelos, dimensões úteis de SDs, resultados...

Fundamentos Nazareno Andrade Universidade Federal de Campina Grande 02/2008 Sistemas Distribuídos.

Documents

Transcript of Fundamentos Nazareno Andrade Universidade Federal de Campina Grande 02/2008 Sistemas Distribuídos.

Aula02 Sistemas Distribuídos - Caracterização de sistemas distribuídos

Representação do Nazareno

Judaismo Nazareno

Fotos o pequeno nazareno

Nazareno Fonteles (Brasil). Alimentação escolar en Brasil

Igor Nazareno Soares

IGREJA DO NAZARENO

Alimentaoescolar nazareno-130307090147-phpapp01

Sistemas Distribuídos - walderson.comwalderson.com/2010-1/icec/sd/10_Transacoes.pdf · Transações Atômicas em Sistemas Distribuídos Transações Atômicas em Sistemas Distribuídos

Igreja do Nazareno Registro de Aprendizagem Contínua

Caravana Igreja do Nazareno 2013

Consultas em Banco de Dados Amplamente Distribuídos Cláudio E. C. Campelo Helton Santa Cruz UNIVERSIDADE FEDERAL DE CAMPINA GRANDE PÓS-GRADUAÇÃO EM CIÊNCIA.

04 - Artigo - Silva e Nazareno

REDENTOR, Y PADRE JESUS NAZARENO,

Arquiteturas e Modelos Nazareno Andrade Universidade Federal de Campina Grande 02/2008 Sistemas Distribuídos.

Sistemas Distribuídos

Laboratório de Sistemas Distribuídos (LSD) – Universidade Federal de Campina Grande (UFCG)EELA Grid School – December 04, 2006 Enhancing SegHidro/BRAMS.

OurGrid O que são Grids? Walfredo Cirne walfredo@dsc.ufcg.edu.br Laboratório de Sistemas Distribuídos - LSD Universidade Federal de Campina Grande - UFCG.

Objetos Distribuídos Nazareno Andrade. O Problema Orientação a objetos é um paradigma poderoso Modularidade, extensibilidade, manutenibilidade Porque.

Sistemas Distribuídos Jorge Surian jsurian@uol.com.br Sistemas Distribuídos: Tipos de Sistemas Distribuídos, Tipos de Arquiteturas e Sistemas Pervasivos.