[ Services ] Grid Computing
-
Author
robson-silva-espig -
Category
Documents
-
view
1.485 -
download
0
Embed Size (px)
Transcript of [ Services ] Grid Computing
Grid Computing Mdulo 1 - Introduo Grid Computing, ou computao em grade, um dos mais novos conceitos presentes para os executivos de Tecnologia da Informao. A idia, de fato, extremamente sedutora: utilizar os recursos ociosos de computadores independentes, sem a preocupao de localizao fsica e sem investimentos em novos hardwares. A criao de um supercomputador virtual, com a utilizao dos recursos prexistentes, permite o desenvolvimento de aplicaes antes restritas a carssimos supercomputadores. Abre-se uma nova perspectiva e certamente estamos diante de mudanas nos paradigmas computacionais. O mdulo Grid Computing sugere o debate sobre os principais aspectos de uso desse modelo computacional, bem como suas potencialidades e restries. Trata-se de um modelo capaz de lidar com uma alta taxa de processamento, dividida em diversas mquinas que formam uma nica mquina virtual, podendo ser em rede local ou rede de longa distncia. Tais processos so executados quando as mquinas no esto em uso, evitando dessa forma o desperdcio de processamento. Essa nova infra-estrutura de computao distribuda foi proposta nos anos 90, com o objetivo de auxiliar atividades de pesquisa e desenvolvimento cientfico. Vrios modelos dessa infra-estrutura foram especificados. A tecnologia em grade faz analogia s redes eltricas (power grids) e apresenta-se ao usurio como um computador virtual, mascarando toda a infra-estrutura distribuda, assim como a rede eltrica para uma pessoa que utiliza uma tomada, sem saber exatamente como a energia chega a ela. Seu objetivo inicial era casar tecnologias heterogneas (e muitas vezes geograficamente dispersas), formando um sistema robusto, dinmico e escalvel, para compartilhar processamento, espao de armazenamento, dados, aplicaes e dispositivos. Pesquisadores da rea acreditam que a tecnologia de grades computacionais seja a evoluo dos sistemas computacionais atuais, no sendo apenas um fenmeno tecnolgico mas tambm social pois, num futuro prximo, reuniria recursos e pessoas de vrias localidades, com diversas atividades diferentes, em uma mesma infra-estrutura. Isso possibilitaria sua interao, de forma antes inimaginvel. A computao em grade vem ganhando destaque nos ltimos tempos. Algumas empresas esto apostando alto nessa tecnologia. No meio cientfico, pode-se encontrar vrias grades em funcionamento, espalhadas por inmeros pases. Muitos projetos so multi-institucionais.
-1
Como exemplo, h o Datagrid, do CERN (Organizao Europia de Pesquisa Nuclear), projeto financiado pela Comunidade Europia, com o objetivo de atuar em reas de pesquisa como Astronomia, Fsica e Biologia. Outro exemplo o BIRN, projeto multi-institucional, que conta com quinze universidades norte-americanas, voltado para a pesquisa neurolgica. H ainda o Mammogrid, iniciativa da comunidade europia para formar uma base de mamografias que abranja toda a Europa, com intuito de fornecer material de estudo e campo para o desenvolvimento de tecnologias em grade. No Brasil, um bom exemplo o Sprace, projeto de um grade do Instituto de Fsica da USP (Universidade de So Paulo), que participa do processamento dos dados provenientes do projeto D0, que rene pesquisadores do mundo todo, para analisar os dados gerados pelo acelerador de alta energia Tevatron Collider, localizado em Illinois, Estados Unidos. O aperfeioamento da tecnologia em grade resultado, em grande parte, do esforo do Global Grid Forum (GGF), comunidade formada por entidades do meio cientfico e corporativo que criam e padronizam tecnologias para ambientes em grade. Um dos trabalhos mais importantes do GGF atualmente o desenvolvimento do OGSA (Open Grid Service Architecture), padro cujo objetivo permitir interoperabilidade, portabilidade e reutilizao de servios em grade, por intermdio da padronizao de interfaces, comportamentos e servios bsicos obrigatrios, viabilizando dessa forma a utilizao conjunta de servios desenvolvidos em diferentes ambientes, por desenvolvedores distintos. Permanentes ou temporrios A idia por trs dos grids combinar o poder de processamento de vrios computadores ligados em rede para conseguir executar tarefas que no poderiam ser realizadas, ou pelo menos no com um desempenho satisfatrio, em um nico computador e, ao mesmo tempo, execut-las a um custo mais baixo do que o de um supercomputador de potncia semelhante. Os grids podem ser permanentes ou temporrios. Podem ser formados para executar uma tarefa especfica e, em seguida, serem desfeitos. Presumindo que todos os computadores estejam previamente ligados em rede, a criao e dissoluo apenas questo de ativar e depois desativar o software responsvel em cada computador. A principal diferena entre um cluster e um grid que um cluster possui um controlador central, um nico ponto de onde possvel utilizar todo o poder de processamento do cluster. Os demais ns so apenas escravos que servem a esse n central. Os clusters so mais usados em atividades de pesquisa, resolvendo problemas complicados e na renderizao de grficos 3D.
-2
Os grids, por sua vez, contam com uma arquitetura mais democrtica, em que, embora possa existir algum tipo de controle central, existe um ambiente fundamentalmente cooperativo, onde empresas, universidades ou mesmo grupos de usurios compartilham os ciclos ociosos de processamento em seus sistemas em troca de poder utilizar parte do tempo de processamento do grid. Por exemplo, duas empresas sediadas em pases com fusos horrios diferentes poderiam formar um grid, combinando seus servidores web, de modo que uma utilizasse os ciclos ociosos de processamento da outra, em seus horrios de pico, j que, com horrios diferentes, os picos de acessos aos servidores de cada empresa ocorreriam em momentos distintos. Programa Above Larry Ellison, CEO da Oracle, mostrou recentemente, em evento mundial da empresa nos Estados Unidos, sua viso sobre o futuro tecnolgico da empresa. O grid computing, nova palavra mgica incorporada ao dicionrio da companhia, um dos conceitos presentes no horizonte futuro da companhia. O CEO foi enftico ao afirmar que qualquer iniciativa de produto passa pelo grid, capaz de levar aos ambientes de computao a liberdade que as empresas sempre sonharam. Ellison acredita que dentro dessa viso, os clientes s precisam se preocupar com as solues, uma vez que o prprio sistema se encarrega de process-las da melhor maneira possvel. Nesse sentido, o Oracle Database 11, verso beta do novo sistema de banco de dados da empresa, promete trazer o novo conceito no seu DNA. A Mega Sistemas foi o primeiro desenvolvedor independente de software do programa Oracle PartnerNetwork (OPN) no Brasil a participar do projeto Above (acrnimo de Accelerated Business Offerings with Value-added Enhancements). A iniciativa, patrocinada pela Oracle e Intel, testa a funcionalidade das solues de software-houses latino-americanas em uma arquitetura de grid computing com recursos de RAC (Real Application Cluster) em servidores Intel, que garantem alta disponibilidade em uma plataforma aberta. Os testes acontecem nos laboratrios da Intel em So Paulo, Buenos Aires e na Cidade do Mxico. O objetivo do programa Above demonstrar os benefcios da adoo de cluster com servidores baseados na arquitetura Intel e Oracle, aos clientes e a desenvolvedores do Brasil, da Argentina e do Mxico. A parceria entre as duas empresas garante mais segurana, disponibilidade, escalabilidade, alm da liberdade de escolha de fornecedores de hardware e acesso a servios de suporte a diversas plataformas como Linux, Windows e HP-UX. O programa teve incio em outubro de 2005 e at o final daquele ano, pelo menos 20 solues passaram pelos laboratrios da Intel, em So Paulo e no Mxico. A Oracle e a Intel apiam as software-houses aprovadas, dando a elas um certificado de participao no programa para as solues testadas. -3
O programa prev ainda a realizao de eventos para clientes, assim como a permisso do uso do logo Above nas comunicaes para o mercado e marketing cooperado. As solues que j passaram pelo programa so das seguintes empresas: Arango, Bohm Solues Corporativas, CM Solues, DB1 Informtica, Delta, DTC, Expert, Gemco, Gobtec, Grande, Innersoft, Integry, Jatafi, Matera Snior Sistemas, Mega Sistemas, Microsiga, MSM, MSV Solues, Opencard, Opensystems, Sistemas Compartidos, Socase, Softcomex, Solur e Trust. Disponibilidade e custo acessvel A Oracle e a Intel h mais de dez anos desenvolvem trabalhos em conjunto e produzem solues para o mercado corporativo. Com esse programa, ambas as empresas sinalizam que as software-houses latino-americanas tambm tm muito a oferecer com seus produtos, com os recursos de ponta, como o grid computing, e rodando com segurana, em plataforma Intel, com um custo mais acessvel. O objetivo desse programa agregar padres de segurana, disponibilidade e escalabilidade s solues existentes no mercado latino-americano. Alm disso, a possibilidade de escolha de fornecedores de hardware e sistemas operacionais reduz custos, diminui riscos e permite crescimento planejado.
-4
Mdulo 2 - Organizao Virtual Esse mdulo ir explicar o que constitui uma organizao virtual e porque esse conceito importante para grid computing. Alguns exemplos so ASP (aplication service providers), SSP (storage service providers) e cycle providers. Saindo do mbito da tecnologia, tambm podem ser consideradas organizaes virtuais os membros de um consrcio para aquisio de um veculo, membros de uma cooperativa para aquisio de uma casa ou apartamento, entre outros. O conceito de grid computing permite que diversas entidades disponibilizem seus recursos no mbito de uma organizao virtual, de forma a otimizar a sua utilizao. Essa possibilidade permitiu a rentabilidade de projetos que, de outro modo, seriam inviveis em termos financeiros ou de complexidade tcnica. A computao em grid uma forma de computao distribuda que permite a partilha e coordenao de recursos para a resoluo de problemas complexos. No entanto, a possibilidade de introduzir novos usurios e recursos na grid de forma dinmica, em paralelo com a necessidade de cada administrador manter o controle sobre os seus recursos, incrementa substancialmente a complexidade na gesto dos mesmos recursos. necessrio levar em conta que, apesar de todas as organizaes acordarem no estabelecimento de polticas de utilizao dos recursos (usualmente designadas como contratos, no seu conjunto), situaes excepcionais podero conduzir uma organizao a quebrar os acordos realizados, sendo necessrio implementar mecanismos de controle e monitorao, que garantam uma partilha justa dos recursos. Uma Organizao Virtual (OV) uma agregao de organizaes autnomas e independentes ligadas entre si por intermdio de uma rede de comunicao (possivelmente a Internet). A existncia da Organizao Virtual limitada a um perodo temporal, correspondente ao tempo necessrio satisfao do seu propsito. O ciclo de vida de uma Organizao Virtual pode ser decomposto em quatro fases a seguir definidas: Identificao da necessidade: A Organizao Virtual construda com o propsito de satisfazer uma necessidade que pode ser explicitamente expressa por um cliente, ou derivada da resposta a uma oportunidade de negcio. Seleo de parceiros: A formao da OV baseada em uma seleo racional de parceiros de acordo com as suas capacidades, disponibilidades, recursos e custos. Operao: Essa fase inclui o controle e a monitorao das atividades realizadas pelas organizaes individuais, incluindo resoluo de conflitos, e possvel necessidade de reconfigurao da OV devido a falhas parciais.
-5
Dissoluo: Distribuio de lucros obtidos, e armazenamento de informao relevante. Esse projeto incide na fase de seleo de parceiros da OV, e encontra-se presentemente em desenvolvimento. A seleo de parceiros em uma Organizao Virtual resultado de um complexo processo de negociao entre as diversas organizaes presentes no mercado. Essa negociao realizada em mltiplas rodadas (propostas e contrapropostas), e deve responder a duas importantes caractersticas: Multicritrio: A seleo de parceiros realizada com base no apenas em um nico critrio, mas sim em mltiplos critrios: preo, tempo realizao, qualidade, outras caractersticas especficas de determinado produto/servio. Os diferentes critrios possuem importncia distinta e so codificados em uma funo de utilidade que determina o valor das propostas recebidas. Satisfao de restries distribudas: Mltiplas negociaes ocorrem em simultneo, podendo existir restries entre critrios a negociar. Essas restries so resolvidas por um processo de satisfao de restries distribudas. Por exemplo, suponha que constituda uma OV para a construo de um automvel. Entre outras negociaes, inclui-se a negociao para produo de pneus e parafusos. A seleo do critrio dimenso de um pneu condiciona a seleo do critrio material dos parafusos a utilizar na fixao dos pneus. Dificuldades Dada a complexidade, nmero e heterogeneidade de mecanismos e regras para controle dos recursos, a necessidade de utilizao de polticas de alto nvel surge naturalmente. Essas polticas devem facilitar a tarefa dos administradores de polticas, tanto a nvel de cada organizao individual, quanto ao nvel central da organizao virtual. No entanto, as plataformas de grid existentes atualmente, como o Globus e o Condor, disponibilizam apenas mecanismos simples de controle de acesso (baseados por exemplos em ACLs ou modelos Role-based). Diversos motores de polticas foram integrados com essas plataformas, mas tambm esses no suportam polticas de segurana avanadas. Como exemplos, podemos citar as polticas baseadas em histrico (como quando cada usurio s pode ocupar 10 horas de CPU por semana) ou em obrigao (quando, aps pagar um determinado nvel de servio, a organizao obrigada a cumpri-lo), que possibilitam a definio de contratos entre as organizaes. Tais limitaes obrigam a definio e implementao ad-hoc desse tipo de restries de utilizao e acesso, introduzindo vulnerabilidades na arquitetura de segurana.
-6
O Grupo de Sistemas Distribudos do INESC-ID tem participado ativamente na definio e implementao do [email protected], na qual pretende testar modelos inovadores de polticas de controle de acesso e utilizao de recursos. Para isso encontra-se em desenvolvimento a plataforma Heimdall, que suporta a definio, implementao e auditoria de polticas avanadas. Engenharia da linguagem Quando se compara com reas como a Biologia ou a Fsica, o uso de grids computacionais em aplicaes de engenharia da linguagem (NLE) ainda est numa fase muito preliminar. Essa situao se deve falta de normalizao, o que dificulta a interoperabilidade das ferramentas computacionais utilizadas no processamento de lngua natural. O nmero de ferramentas e mdulos de processamento elevado e por vezes surge o problema de reutilizao de recursos, sejam eles locais ou produzidos por terceiros. Muitas das dificuldades de interoperabilidade e reutilizao so devidas a diferentes descries para dados relativos a um mesmo domnio. Para combater essas dificuldades, esto sendo dados os primeiros passos, no sentido de utilizar os grids no processamento de lngua natural. Assim, est em curso um projeto destinado a estudar o impacto de utilizao de grids no que respeita a arquiteturas de aplicaes, descoberta automatizada de recursos e formas flexveis de incorporar e coordenar os diferentes componentes de uma aplicao geograficamente dispersa, tanto na sua execuo, quanto no armazenamento dos resultados produzidos. O objetivo permitir que investigadores possam usar as grids computacionais sem terem de dominar todos os conceitos envolvidos na infraestrutura. Mais do que tirar partido da tecnologia das grids computacionais, esperamos que o projeto contribua para que surjam novas formas de interao entre os vrios grupos e potencialize a reutilizao de recursos pela comunidade de NLE: com a abordagem proposta, os dados, ferramentas e componentes reutilizveis podem ser facilmente partilhados e comparados. Esses aspectos so muito importantes, dada a dependncia da rea relativamente lngua: aplicaes multilnges podem ser construdas, utilizando componentes de vrias procedncias, tanto dependentes, quanto independentes da lngua. Simulao e extrao de modelos de circuitos As ferramentas atuais de simulao lidam com modelos de circuitos de grande dimenso. Esses modelos exigem uma computao intensiva e requisitos de memria que chegam a atingir vrios gigabytes. Uma das solues possveis para o acrscimo da eficincia das ferramentas de simulao a sua paralelizao. Por intermdio de tcnicas criteriosas de diviso do problema, possvel paralelizar a resoluo dos modelos, obtendo-se no s uma reduo na memria necessria por unidade de computao, como tambm no tempo de execuo total. -7
Os principais obstculos execuo distribuda das ferramentas de simulao so: a correta diviso dos problemas pelas vrias mquinas disponveis no grid e o balano entre a computao local e a comunicao entre mquinas. Algoritmos de transcodificao de vdeo Os sinais de vdeo apresentam-se, em geral, sob um formato codificado, segundo as normas atuais (MPEG-x/H.26x), sendo necessrio freqentemente aplicar tcnicas de transcodificao, de forma a adaptar as tramas de bits ao canal de transmisso e s caractersticas dos terminais de recepo. Nos ltimos anos, foram propostos vrios algoritmos que visam implementar esses ajustes diretamente no sinal codificado, oferecendo, por isso, vantagens significativas do ponto de vista da complexidade computacional e da distoro do sinal de vdeo. Sendo o sinal de vdeo tridimensional, verifica-se quase sempre a necessidade de utilizar recursos computacionais elevados para implementar os algoritmos de processamento das tramas de vdeo. Em particular, o ambiente de processamento em grid proporciona as condies e recursos necessrios para implementar, em paralelo, as diferentes tcnicas e algoritmos considerados, explorando tambm as diferentes sees temporais da trama de vdeo sob processamento. Os recursos computacionais oferecidos pelo grid podem ser utilizados para o desenvolvimento de algoritmos e arquiteturas de transcodificao de vdeo no domnio do sinal codificado, utilizando diretamente os coeficientes DCT recebidos da trama de vdeo. A Comisso Europia tem financiado vrios projetos que se baseiam nos avanos recentes na rea dos grids computacionais. O objetivo o desenvolvimento de uma infra-estrutura na Europa que esteja disponvel 24 horas por dia. Esse esforo explora as ligaes multigigabit da rede pan-europia GEANT, que est sendo ampliada tambm na Amrica do Sul, Norte de frica e sia.
-8
Mdulo 3 - Benefcios A tecnologia grid computing foi uma das respostas a um problema muito comum no meio acadmico: a escassez de verba para pesquisa. Nos anos 90, aps perder seu financiamento governamental, um projeto norte-americano que buscava por sinais de vida inteligente em outros planetas o SETI (Search for Extra-Terrestrial Intelligence) teria apostado na abordagem da computao distribuda para no abandonar suas pesquisas. No lugar de supercomputadores protegidos pelos muros dos institutos de pesquisa, os cientistas passariam a contar com milhares de computadores comuns de voluntrios, espalhados pelos locais mais variados do mundo, para processar pequenos pacotes de dados vindos do espao, nos perodos de ociosidade do sistema, e devolver os resultados aos pesquisadores. Caso um extraterrestre resolvesse telefonar para casa, como na clebre cena do filme ET, os computadores interligados em todo o planeta poderiam identificar essa chamada inusitada. O SETI foi o primeiro grande projeto de grid. Os sinais recebidos por radiotelescpios so canalizados para PCs individuais por intermdio da Internet. Todos os computadores ligados Internet e ao projeto SETI procuram padres em listas de nmeros em busca de algo que poder ser um sinal de vida extraterrestre. O projeto muito interessante e intelectualmente estimulante porque utiliza a Internet com dados acessveis a todos e com a possibilidade de qualquer tipo de informao ser partilhada. A unio faz a fora No grid, a capacidade de processamento permanece segmentada nas diferentes mquinas, fragmentam-se assim os pacotes de dados a serem processados durante os perodos de ociosidade do sistema. Por isso, o processo de adoo est mais maduro nas organizaes que tm aplicaes que podem operar de forma paralela, como no caso de empresas que fazem anlises ssmicas, simulaes meteorolgicas e financeiras, por exemplo. O processo gerenciado por uma infra-estrutura de software que distribui os pacotes de dados o chamado middleware. Mas especialisttas afirmam que ainda faltam aplicaes na ponta, que permitam adaptar esse poder de distribuio do processamento necessidade das empresas. Um dos benefcios do grid computing permitir que as organizaes agreguem recursos com toda a infra-estrutura de TI, no importando sua localizao global. Isso elimina situaes em que um site esteja sendo executado com sua capacidade mxima, enquanto outros tenham ciclos disponveis.
-9
Imagine o que significa, para uma empresa de telecomunicaes, a possibilidade de reduzir de uma semana para um dia o processo de fechamento das faturas dos seus clientes. Quando se adota o grid, um dos benefcios uma economia de tempo dessa escala. O grid mais uma das respostas tecnolgicas demanda crescente no mercado pela distribuio de cargas de trabalho de forma mais eficiente pelo hardware, simplificando o gerenciamento e diminuindo os custos. Embora oferea tais benefcios, o grid s agora comea a ser percebido como uma soluo para aplicaes comerciais mais tradicionais e no apenas uma aplicao do mundo acadmico -, segundo um estudo da Insight Research. Os benefcios ficam mais claros para empresas cujo negcio principal a prpria tecnologia. A tecnologia ser to mais til quanto maior for o volume de dados e a necessidade de agilidade da empresa que a adotar. Cabe fazer as contas para saber se o benefcio compensa os custos. Flexibilidade na infra-estrutura Aps registrar um faturamento de 975 milhes de reais em 2005, valor 14% superior ao do ano anterior, a GRSA, empresa do grupo Accor e do Compass Group, especializada em servios de alimentao, viu-se diante de um desafio: como preparar a TI para o crescimento? Formada por sete marcas que servem escolas, aeroportos, terminais rodovirios e hospitais, a GRSA atende 700 mil refeies por dia em todo o Pas. Depois de analisar quais seriam os investimentos necessrios para melhorar a capacidade dos sistemas cruciais para o negcio, a GRSA decidiu adotar a arquitetura de grid computing. Um dos objetivos era obter o balanceamento automtico da infra-estrutura, em funo da ociosidade e da capacidade de recursos existentes, evitando assim a subutilizao de servidores e equipamentos de storage. Hoje, a empresa possui uma infra-estrutura tecnolgica flexvel que permitir ao grupo se preparar para o crescimento que se planeja para os prximos anos. A rea de tecnologia est pronta para atender 2 mil usurios, o que corresponde a mais que o dobro da base atual. Quinta gerao da computao aps a arquitetura cliente/servidor e multicamadas, o grid computing est evoluindo aos poucos. Cerca de 40% das empresas com operaes globais esto implementando ou j utilizam algum tipo de soluo baseada na tecnologia, segundo estudo do instituto Forrester Research. O levantamento mostra que entre os principais benefcios citados esto a escalabilidade e a disponibilidade. No Brasil, h poucos casos de computao em grade nas empresas. A GRSA uma das pioneiras. A empresa decidiu investir em grid, a partir da necessidade de elevar o poder computacional e tambm de adotar uma soluo que trouxesse alguma redundncia, pensando no incremento dos nveis de servios, conforme o avano dos negcios. Orado em cerca de 1 milho de reais, o projeto de grid computing entrou no ar em dezembro de 2005. - 10
Rpido de instalar O tempo de implementao do grid na GRSA foi de apenas duas semanas. Mas a equipe de TI se preparou com dois meses de planejamento. Esse perodo envolveu o desenho de uma infra-estrutura robusta para rodar o sistema de misso crtica, o ERP TecFood Web, fornecido pela empresa Teknisa. O sistema de gesto conta com 1.044 usurios dos restaurantes do grupo, distribudos pelo Brasil, alm de outras 411 pessoas na sede da empresa, em So Paulo. Um dos principais benefcios da nova arquitetura foi o salto de 104% na capacidade de processamento do banco de dados do ERP. Isso praticamente eliminou gargalos de performance. Considerando todos os ativos envolvidos, como servidores, licenas de uso e storage, uma das maiores vantagens do projeto o custo/benefcio da nova arquitetura. Assim, o crescimento em hardware poder ser mais racional daqui para frente, uma vez que podero ser adquiridos servidores de menor porte. A infra-estrutura da GRSA hoje composta de 85 servidores Intel e IBM/AIX, com 1.500 pontos de rede que garantem a conexo de 17 escritrios regionais. Antes, a GRSA tinha apenas um servidor para banco de dados, com ociosidade mdia de 2%. A nova infra-estrutura de hardware inclui dois servidores IBM, um storage, quatro switches Giga e o banco de dados Oracle, migrado da verso 9i para a 10g, com servios de segurana e gerenciamento de identidade. Agora, a GRSA segue para a segunda fase do projeto de grid computing, na qual pretende colocar o backoffice e os demais ambientes de desenvolvimento e homologao em grade. Outra empresa que aposta no grid computing a Lehman Brothers, que adota solues de grid desde 1990. Nos ltimos anos, a empresa de servios financeiros aborda de forma ainda mais estratgica essa opo. A empresa acredita que um dos benefcios bvios de uma soluo em grid a possibilidade de distribuir vrias tarefas para serem processadas em milhares de CPUs. Como resultado direto disso, o que se v no mercado que as solues corporativas de grid computing e de arquitetura orientada a servios (SOA) esto ganhando maturidade juntas. Essa a estratgia da Lehman Brothers, que migrar seus grids isolados, que funcionam em tecnologia desenvolvida internamente pela empresa, para uma arquitetura estruturada. Hoje, a Lehman conta com trs grids com cerca de 1.500 servidores blade rodando software e aplicaes de anlise de derivativos, hipotecas e crdito corporativo. A idia criar uma plataforma para suportar SOA e oferecer um uso mais flexvel dos recursos de TI a todos os usurios da empresa baseados em Nova York, Londres ou Tquio.
- 11
Mdulo 4 - Formao de um grid e pr-requisitos Uma grade computacional agrega recursos de alto desempenho computacional e tambm permite a formao de Organizaes Virtuais para a realizao de projetos temticos baseados em ambientes de computao distribuda. Organizaes Virtuais so grupos de atuao em um determinado tema podendo estar geogrfica e institucionalmente dispersos. Para a operacionalidade de tais organizaes precisamos de ambientes colaborativos, seja na elaborao e desenvolvimentos de aplicaes associados, seja na utilizao das aplicaes desenvolvidas ou de aplicaes de terceiros. Implica tambm em uma grade de computadores e redes, e respectivas configuraes. No exterior se verifica a organizao de grades computacionais a partir da integrao de centros de supercomputao e suas aplicaes. Como exemplo, podemos citar o projeto TeraGrid da NSF (National Science Foundation), que cria o primeiro ambiente de computao distribuda em escala de Teraflops unindo centros numa estrutura de escala nacional (NCSA, SDSC, Argonne e Caltech). Esse projeto resulta de iniciativas desses centros em projetos da NSF desde 1997 em infra-estrutura de informao, como, por exemplo, software de grade, ambientes escalveis em clusters, ferramentas de softwares, gerenciamento de dados e visualizao e cdigos de aplicao). O centro de operaes do TeraGrid (TOC) estabelece um conjunto de polticas que guiam o TeraGrid em termos de operao, uso e transferncia de tecnologia. Operacionalmente o TOC oferece suporte online 24 horas, sete dias por semana, disponibilizando ferramentas de monitorao para verificao de desempenho e coordenao de atualizaes de hardware e software distribudos. Como plataforma de software de grade computacional, encontramos diversos projetos e podemos definir trs principais tendncias: a clssica, a orientada a objetos e a orientada a servios (de web). A primeira trata principalmente os aspectos de alocao de recursos e monitorao de filas de processos a serem submetidos. A segunda considera um ambiente onde as unidades de processamento so objetos distribudos que se intercomunicam e dependem de suporte a localizao (transparente ou no), a migrao, a transao, entre outros. A terceira, e mais atual, soma as caractersticas das duas primeiras com as caractersticas encontradas em sistemas de informao baseados em infra-estrutura de web, e segue na linha de componentes e servios ativos. Em todas as trs, a segurana parte fundamental e imprescindvel, pois atualmente no mais vivel tratar computao distribuda sem mecanismos e polticas mnimas de segurana.
- 12
Grid nacionals O objetivo do projeto GRADE servir de base para a construo de uma base computacional de malha a nvel nacional. Seu objetivo geral a implementao, em nvel nacional, de uma GRADE integrada por uma infra-estrutura computacional escalvel de clusters geograficamente distribudos (homogneos e heterogneos), em diversos centros do pas, capaz de permitir o acesso s facilidades computacionais (hardware, software e servios) de forma confivel, consistente, ubqua e de custo acessvel. Deve-se contemplar ainda o desenvolvimento do ambiente computacional da GRADE e de diferentes aplicaes em reas tais como: bioinformtica, ambiental, banco de dados, datamining, petrleo, ocenica, Meteorologia, Qumica, Fsica, Engenharia, entre outras. Uma vez implementada a GRADE, espera-se estimular o desenvolvimento de middleware e de aplicaes especficas para o mesmo, implantando-se diferentes camadas e verses de plataforma de grade, que atendam s distintas vocaes do projeto. As duas camadas principais do projeto GRADE sero: camada de produo, para o desenvolvimento das aplicaes interessadas; e uma camada de desenvolvimento do middleware e servios associados. A estrutura proposta para uma GRADE Nacional inclui a RNP, os centros de computao de alto desempenho, e alguns centros institucionais. Sendo assim teramos um cluster nacional (nvel-1), clusters regionais (nvel-2) nos CENAPADs e ainda clusters institucionais (nvel-3). O uso de clusters maiores e menores permite a convivncia de aplicaes que requerem computao fortemente acoplada, como por exemplo, Meteorologia, Ambiental, Engenharia, Petrleo, entre outras, com aplicaes que toleram computao fracamente acoplada, por exemplo, Bioinformtica, Genmica, Fsica de altas energias, datamining, entre outras. Alm disso, a estrutura proposta na etapa inicial da GRADE capaz de permitir sua ampliao, seja com a incorporao de novos clusters, seja com a incorporao do legado j existente nos centros participantes. O uso de clusters de PCs foi baseado na sua difuso devido ao baixo custo, escalabilidade e alternativas de comunicao baratas intra-clusters, alm de cada cluster s contar com o seu sistema operacional prprio para interligao com o software de Grade. O uso de clusters de baixo custo representa uma inovao tecnolgica atraente para o setor empresarial, que demonstra interesse em participar.
- 13
Alm da infra-estrutura de clusters mencionada, necessrio que haja pesquisa e desenvolvimento de servios bsicos a serem incorporados na rede de interconexo (RNP), baseados na proposta da Internet2, que apresenta um middleware bsico com os seguintes servios: Identificadores: Um conjunto de cdigo que especifica de forma nica um determinado item. Um item pode ser um servio, um objeto, um agente, ou um processo. Autenticao: O processo de comprovao eletrnica de que um determinado item de fato o item associado ao identificador em particular. Diretrios: Repositrio central que contm a informao e dados associados com identidades. Esses repositrios so acessados por pessoas e por aplicaes para, por exemplo, obter informao, particularizar ambientes genricos a preferncias individuais, e rotear mensagens e documentos. Autorizao: So aquelas permisses e mquinas de workflow envolvidas no tratamento de transaes, aplicaes administrativas e automao de processos comerciais. Certificados e infra-estruturas de chaves pblicas (PKI): certificados e PKI esto relacionados aos servios anteriores de formas importantes e diferentes. Outro aspecto a ser pesquisado na implementao da infra-estrutura so as interconexes internas de aplicaes (e servios) que demandem exclusivamente redes de alta velocidade ou ainda esto restritas a segmentos de baixa velocidade. MegaGrid: projeto conjunto Em 2004, Dell, EMC, Intel e Oracle lanaram o projeto Megagrid, para desenvolver empreendimento grid computing. Empresas-lderes da indstria combinam recursos tcnicos e experincia para recorrer s necessidades do mercado em acesso testado e validado para empreendimentos de grid computing. A idia criar um padro de desenvolvimento e implantao de um empreendimento de infra-estrutura grid computing . As quatro empresas esto combinando algumas das principais tecnologias e recursos tcnicos para diminuir a responsabilidade de integrao de seus clientes, e desenvolver um completo empreendimento de solues grid computing que executam ofertas SMP tradicionais a um custo menor. A fase inicial do MegaGrid ficou e teste e a documentao do padro de prtica da indstria para construo de um empreendimento de infra-estrutura grid computing eficiente, levando-se em conta as exigncias de custo e performance.
- 14
Essas prticas tambm incluem a conduo de uma srie de testes para possibilidades de ajustes, desempenho e gerenciamento de uma base de dados compreensvel, configuraes de armazenamento do servidor e das redes. A infra-estrutura do trabalho arquitetada, configurada e validada no centro de dados de TI da Oracle Global. As responsabilidades de cada uma das empresas nesse projeto so: Dell Fornece uma completa classe de infra-estrutura de servidores em rede, que consiste em dois Intel Xeon e servidores 4-way Intel Itanium processor-based PowerEdge, e suas tecnologias I/O relacionadas EMC Entrega uma infra-estrutura de armazenamento em rede que consiste nos sistemas de armazenamento em rede EMC CLARiiON CX e EMC Symmetrix DMX , sistema NAS (armazenamento com rede interligada) EMC Celerra NS Series/Gateway , EMC ControlCenter e o software de gerenciamento de informaes EMC Navisphere Intel Contribui com a experincia de gerenciamento de processador e servidor para o Intel Xeon e arquitetura de processadores Intel Itanium , ferramentas de otimizao, e outros recursos que permitem uma integrao de design imperceptvel Oracle: Fornece a tecnologia Oracle 10g (Servidor Oracle 10 g , Base de Dados Oracle 10 g , Unidade para armazenamento de dados no disco Oracle 10 g , Gerente de Empreendimento Oracle 10 g ) e sedia o Centro de Desenvolvimento para o Projeto MegaGrid em seu Centro Global de Informaes de TI. Alm da tecnologia oferecida pelas quatro empresas, Cramer e F5 Networks, Inc. (NASDAQ: FFIV) esto contribuindo para o projeto MegaGrid. Cramer, uma empresa de telecomunicaes desenvolvedora de aplicaes de software, fornece aplicaes comerciais altamente escalveis para o MegaGrid apresentando dados completos e processamento de transaes de negcios praticamente reais. F5 Networks fornece switches BIG-IP para o projeto, a fim de garantir disponibilidade da aplicao e acelerar a performance da aplicao.
- 15
Alto Nvel de Servio O objetivo do projeto MegaGrid permitir que organizaes empreendedoras e comerciais em todos os segmentos da indstria vertical tirem vantagem do empreendimento grid computing. Ao unir diferentes recursos de TI que podem fornecer servios em demanda automaticamente, as organizaes podem se beneficiar do empreendimento grid para melhorar o nvel do servio de aplicao, para melhor gerenciar seus sistemas, e ajudar a reduzir os custos dos seus sistemas de TI. Organizaes empreendedoras e comerciais podem comear a adotar tecnologias grid com investimentos mnimos e a padronizao de servidores de custo efetivo e infra-estrutura de armazenamento, usando a plataforma dos processadores Intel, Linux e um acesso a uma rede de armazenamento de alto nvel, consolidar base de dados, aplicaes, servidores e armazenamento a uma plataforma comum e automatizar tarefas dirias de armazenamento para que um nico administrador possa controlar simultaneamente centenas de servidores e terabytes. O projeto MegaGrid foi demonstrado pela primeira vez na Oracle OpenWorld So Francisco, no Centro de Convenes Moscone, em So Francisco. Demonstraes tcnicas foram destacadas em cada um dos stands do Projeto MegaGrid existentes no espao de exibio:
- 16
Mdulo 5 - Diferena entre Cluster e Grid Computing Um dos caminhos mais efetivos para se entender as diferenas entre as tecnologias de Grid Computing e Cluster analisando suas origens. Com definies diferentes, cada um desses conceitos foi criado para atender determinadas necessidades. Esse o primeiro ponto para diferenciar esses dois conceitos de maneira eficiente. O Grid Computing surge em meados de 1990 com a inteno de passar a simplicidade, eficincia e flexibilidade das redes de energia eltrica e de gua encanada para o mundo da computao. Com o tempo, o conceito foi sendo desenvolvido e aprimorado, ganhando novos significados e incumbncias, tornandose hoje uma grande aposta de diversos fornecedores de tecnologia. De maneira geral, o Grid um modelo de computao que tem a capacidade de fornecer maior rendimento ao combinar os esforos de diversas mquinas espalhadas pela rede em uma arquitetura virtual que capaz de distribuir a execuo de processos atravs de toda a infra-estrutura. Assim, resumidamente, uma estrutura em Grid pode resolver problemas computacionais em larga escala sem necessitar de um grande servidor com seu processador, mas aproveitando os recursos disponveis nos diversos computadores espalhados pela rede. Uma das definies mais aceitas est no artigo O que o Grid?, do especialista Ian Foster define Grid Computing. Para ele, a tecnologia pode ser resumida em trs grandes tpicos: Os recursos computacionais no so administrados de maneira central, so utilizados padres abertos e a qualidade de servio chamada nontrivial garantida. Mesmo despertando debates, essa definio bem aceita no mercado. Alm desse, outros especialistas se debruaram sobre o problema em busca de criar alguma conceituao que abarque de maneira satisfatria o escopo total do significado do conceito de Grid Computing. Para Plaszczak e Wellner, a tecnologia Grid pode ser definida como o modelo que fornece virtualizao de recursos, provisionamento sob demanda e compartilhamento de servios entre as organizaes. Grid Histrico Historicamente, uma primeira noo documentada sobre o uso da computao como uma utilidade pblica aconteceu em 1965 no Massachusetts Institute of Technology (MIT), por intermdio do especialista Fernando Corbat. Em declarao, o estudioso definiu que o sistema operacional chamado Multics deveria ser a ponta de lana de uma infra-estrutura de computao que iria operar como se fosse uma companhia de energia eltrica ou de fornecimento de gua. Nessa linha, a atual diviso do Grid tambm fornece caractersticas fundamentais para entender a separao entre as duas tecnologias. O Grid Computing pode ser definido em ordem de tamanho: Grids departamentais; Grids empresariais; Grids Globais. - 17
No primeiro, apenas uma rea ou um grupo conecta via rede seus desktops, clusters e equipamentos para desempenhar uma funo que demanda mais capacidade operacional; o segundo uma evoluo para toda a empresa, que pode utilizar os recursos computacionais em Grid para armazenamento e cycle-stealing; j o Grid global uma conexo entre os outros Grids que podem ser usados de maneira colaborativa ou para resultados comerciais. Origem do Cluster A histria do cluster comea, em meados de 1967, com o desenvolvimento do conceito de processamento paralelo. Nesse ano, Gene Amdahl, da IBM, divulgou um estudo matemtico em que prova o aumento de velocidade ao se paralelizar qualquer tarefa computacional que seria realizada de maneira serial. Chamado da Lei de Amdahl, o artigo forneceu a base de engenharia tanto para a computao com mltiplos processadores quanto para o cluster. Nessa linha de raciocnio, o primeiro se diferencia do segundo por encontrar-se na mesma mquina. As redes de computador tm um papel fundamental na divulgao dos clusters. A capacidade de ligar vrios computadores em rede para desempenhar uma mesma tarefa foi um impulso primordial que somada ao desenvolvimento do software Parallel Virtual Machine (PVM) em 1989 abriu espao para que o cluster pudesse atingir seu estgio atual, configurando-se como uma opo interessante para os departamentos de tecnologia das corporaes. A evoluo foi tamanha que o cluster mudou a idia sobre supercomputadores. Se, antes, um supercomputador era uma mquina com processamento extraordinrio atingido custas de muito poder de processamento e, por conseqncia, investimento equivalente, o conceito de cluster muda drasticamente essa realidade. Esse conceito j foi somado construo dos novos supercomputadores, o que reduziu o custo de produo, alm de aumentar o aproveitamento do poder de processamento das mquinas que esto em uso. Tipos de Cluster Na prtica, os clusters podem ser divididos em trs grandes tipos. O primeiro, Highavailability clusters (HA clusters de alta disponibilidade), so implementados para aumentar a disponibilidade dos servios atravs da criao de ns redundantes, que so utilizados para manter o servio mesmo em caso de falha de componentes do sistema. Normalmente, os HA possuem o mnimo para prover a redundncia: dois ns. O segundo o Cluster de Load-balancing (balanceamento de carga). Implementados para melhorar a performance, esses clusters cuidam de equilibrar a carga de trabalho entre os diversos elos da cadeia. comum encontrar esse tipo de cluster com funcionalidades de alta disponibilidade tambm. - 18
J o terceiro tipo, High-performance clusters (HPC cluster de alta performance), so implementados para prover mais performance ao dividir a tarefa computacional em diversos ns no cluster. Usados comumente para computao cientifica, o HPC tem um de suas implementaes mais conhecidas no Beowulf Cluster. Funes Diferentes Nesse momento, aparece outra diferena fundamental entre os dois conceitos. Enquanto o cluster demanda que toda a cadeia de processamento seja repleta de mquinas semelhantes tanto em software quanto em hardware , o Grid Computing admite ambientes heterogneos que podem ter mquinas rodando diversos tipos de sistemas operacionais e possuir diferentes hardwares. Na prtica, as mquinas reunidas para trabalhar como um Cluster formam uma unidade nica e nada mais do que isso; enquanto o Grid pode fazer uso de um poder excedente de processamento em vrios desktops distantes um dos outros. Resumidamente, o Cluster opera como um grande computador formado por processamento de vrios menores; o Grid Computing est mais prximo de um servio computacional que mais flexvel pois garante a melhora na disponibilidade e no processamento ao utilizar recursos de diversos locais heterogneos. As diferenciaes se repetem na forma com que as duas tecnologias tratam os recursos que vo utilizar. No caso do Cluster, o gerenciamento centralizado, todos os ns oferecem a viso de um sistema nico, se comportando como partes de uma mesma grande mquina. O Grid diametralmente oposto, j que cada nico n funciona como um autnomo, como se ele fosse responsvel pelo gerenciamento e se comportasse como uma entidade independente. O controle tambm realizado de maneira diferente. No cluster, o fato de ser um ambiente homogneo, faz com que a tecnologia tenha uma administrao centralizada, via um n central, o que coloca todas as outras partes dessa cadeia como ns escravos do processamento central. O Grid, por sua vez, no tem mltiplos processadores unidos por um system bus ou por uma alternativa como o iSCSI ou Fibre Channel. Os computadores em Grid podem funcionar separados por quilmetros de distncia e ser conectado por rede convencional de internet. Nesse sentido, o Grid Computing muito mais flexvel ao permitir conexo entre computadores que no confiam plenamente entre si, ou melhor, que no compartilham a mesma rede interna. Assim, o Grid pode ser indicado para cargas de trabalho que tenham diversas tarefas independentes acontecendo simultaneamente; recomendvel que elas, contudo, no demandem compartilhamento de dados entre os trabalhos durante o processo de computao.
- 19
Isso garante que cada computador em Grid realize seu trabalho independente do resto da cadeia. Apesar das diferenas, no possvel negar, contudo, que as duas tecnologias tm origens muito prximas. A aplicabilidade de cada uma das tecnologias depende substancialmente das necessidades do usurio e, para a deciso, elas precisam ser levadas em conta. Conhecendo as origens, as capacidades e limitaes de cada uma dessas tecnologias, o gestor de Tecnologia da Informao pode tomar uma deciso mais madura sobre qual a melhor resposta para suas necessidades.
- 20
Mdulo 6 - As pequenas e mdias empresas no contexto do GRID O Grid Computing, tecnologia que amplia o compartilhamento de recursos de computadores interligados por redes, uma opo no somente para grandes empresas, centros de pesquisas e universidades. Com a utilizao crescente, a demanda comea surgir por parte das pequenas e mdias empresas, mas que por hora, ainda no tem capital para adquirir a infra-estrutura da tendncia. Por outro lado, governos e a iniciativa privada comeam a se movimentar de modo a possibilitar a insero dessa classe corporativa no contexto de avano tecnolgico. Neste ponto, a Dell, EMC, Intel e Oracle anunciaram um projeto conjunto para criar um padro de desenvolvimento de infra-estrutura de Grid Computing. O Projeto, denominado de MegaGrid teve incio em 2004 tinha o objetivo de fazer uma combinao de tecnologias e recursos das quatro gigantes de TI para facilitar a implementao e a utilizao de sistemas Grid, principalmente pelas pequenas e mdias empresas. Mais tarde, a Cisco, comporia a equipe do Megagrid junto s j citadas companhias. Primeira fase O projeto teve uma primeira fase em que o foco foi concentrar foras no desenvolvimento, com testes e documentao de melhores prticas. Com isso, seria possvel, segundo as companhias, construir uma consolidada infra-estrutura que fosse efetiva e trouxesse valor agregado ao Grid. Entre as aes de performance, foram feitos testes de desempenho, aumento de capacidade de processamento dos sistemas e gerenciamento das redes corporativas. O objetivo principal desse projeto, segundo as empresas envolvidas, reduzir os custos ao mesmo tempo em que a qualidade da infra-estrutura de grid computing expandida. Isso garante uma maior possibilidade de uso para as pequenas e mdias empresas, que no possuem, evidentemente, o mesmo poder de compra das grandes companhias e pelo atraso tecnolgico acabam por perder competitividade. Neste contexto, vale destacar que a unio das quatro empresas para o mesmo fim, um sinal de que de alguma forma elas esto alinhadas nesse conceito de Grid e se preocupam com a adoo em larga escala e com a consolidao da tendncia de forma igualitria.
- 21
Em Ao Para colocar em prtica esse projeto, as empresas participantes forneceram equipamentos para os testes. Com isso, foi possvel criar um guia de melhores prticas. A Dell colaborou, por exemplo, com a o fornecimento de infra-estrutura de servidores para que os testes pudessem sem efetivados. Do outro lado, a EMC ofereceu a estrutura de armazenamento, enquanto a Intel colaborou com os servidores e a Oracle com tecnologia 10g (aplicativos e servidores). Vale destacar o discurso dos envolvidos de que a inteno no usar o projeto para promover lanamentos de produtos conjuntos das quatro companhias envolvidas, e sim fazer a divulgao de guias de conduta para que as empresas saibam como gerenciar melhor a tecnologia. Grid em pauta O Grid est em alta e as empresas esto se empenhando para oferecer tecnologias que atendam essa demanda e consolidem a infra-estrutura. A Oracle, por exemplo, oferece um banco de dados relacional desenhado especialmente para Grid Computing, de forma que a informao ganha o escopo de estar sempre disponvel e segura. Alm disso, a verso do Oracle Database Standard Edition One indicado para pequenas e mdias empresas com sistemas e aplicaes rodando em servidores com at dois processadores dual core. Com isso, essas empresas, que apesar de serem se menor porte, tambm precisam de alta performance, ganham aumento no desempenho, confiabilidade, segurana e escalabilidade juntamente com a ao da computao em grade. Grid fora do Brasil Os projetos de Grid esto se expandindo para as fronteiras governamentais, porm no Brasil a iniciativa ainda est em fase experimental pois ainda no h uma consolidao sobre como e para que fim investir na tecnologia quando o assunto governo federal. As empresas de menor porte ficam merc de alguma iniciativa governamental que possa favorec-las. A situao diferente quando nos deslocamos para o topo do continente. Os Estado Unidos j contam com a apresentao de estratgias claras com relao implementao da tecnologia. Um exemplo bem sucedido acontece na cidade de Nova Iorque. O governo da localidade est investindo aproximadamente 500 mil dlares na criao de um sistema grid com 3 terabytes para realizar backups destinados s pequenas e mdias empresas. A expectativa que o sistema recupere informaes perdidas em casos de tragdias.
- 22
Segundo o Departamento de Cincia e tecnologia, a necessidade de se fazer valer da tecnologia comeou a fazer sentido, principalmente aps os atentados de 11 de setembro, afinal a computao colaborativa tornou-se essencial para controlar crises, garantir a continuidade dos negcios e assegurar as informaes crticas. Na regio da Virgnia, alm de ter o impacto da preveno garantida, o projeto de Grid tem a inteno de permitir que as empresas locais tenham poder computacional e possam competir igualmente no mercado tecnolgico. J em Cleveland, as autoridades esto estudando a possibilidade de desenvolver grid de mltiplos dados para criar uma ponte de servios de sade , escolas e agncias municipais. Assim como j acontece no Brasil, no pas tambm de extrema importncia as parcerias estabelecidas com universidades e instituies de pesquisa para expandir o desenvolvimento deste tipo de tecnologia.
- 23
Mdulo 7 - Perspectivas A definio de padres est entre os desafios para o futuro que a Grid Computing ter de enfrentar. Conceitos como a OGSA e o Globus Toolkit permitiro a interoperabilidade em sistemas heterogneos de forma efetiva e a possvel criao da Global Grid em um futuro prximo. J se sabe que Grid Computing um modelo computacional capaz de oferecer uma alta taxa de processamento dividida em diversas mquinas, podendo ser em rede local ou rede de longa distncia, que formam uma mquina virtual. Esses processos sero executados no momento em que as mquinas no esto sendo utilizadas pelo usurio, assim evitando o desperdcio de processamento da mquina usada. Porm, nesse contexto importante que haja a definio de padres para o futuro que o conceito de Grid Computing ter de enfrentar. A partir dos anos 90, portanto, uma nova infra-estrutura foi proposta para auxiliar atividades de pesquisa e desenvolvimento cientfico. Vrios modelos dessa infraestrutura foram especificados, dentre eles, a Tecnologia em Grade. O objetivo era reunir tecnologias heterogneas (e muitas vezes geograficamente dispersas) formando um sistema robusto, dinmico e escalvel para compartilhamento de processamento, espao de armazenamento, dados, aplicaes, dispositivos, entre outros. A opinio de grande parte dos pesquisadores que esse tipo de tecnologia seja a evoluo dos sistemas computacionais atualmente em execuo, o que significa no apenas um fenmeno tecnolgico, mas tambm social, pois rene recursos e pessoas de vrias localidades, com vrias atividades diferentes. Nos ltimos anos, algumas empresas esto investindo nessa tecnologia e tendncia computacional. A IBM, por exemplo desenvolve um trabalho de pesquisa e desenvolvimento de ferramentas em Grid focado em ambientes corporativos. Alm disso, a empresa trabalha em cima do conceito de Globus Toolkit, extremamente importante para a evoluo do Grid Computing. Padro Globus Toolkit Trata-se de um conjunto de servios que facilita os processos do Grid. Com o uso do Globus Toolkit, os servios permitem a submisso e controle de aplicaes, descobertas de recursos, movimentao de dados e segurana no ambiente Grid. O Globus e os protocolos por ele definidos na arquitetura transformaram-se em padro de infra-estrutura para a computao em Grid, o que pode ser considerado uma soluo de grande impacto nesse contexto.
- 24
O uso dos servios do Globus requer a instalao e a configurao de uma infraestrutura de suporte. Nesse cenrio, cada recurso gerenciado por uma instncia do Globus Resource Allocation Manager, que responsvel por direcionar, monitorar e reportar o estado das tarefas alocadas para o recurso. O processo funciona da seguinte forma: as requisies do cliente so recebidas pelo Gatekeeper que consulta o Globus Security Infrasctructure (GSI). Este servio permite uma autenticao nica do usurio no Grid. A partir dessa autenticao, o GRAM verifica se o usurio pode executar no recurso em questo. Caso o usurio tenha o acesso permitido, criado um Job Manager, que responsvel por iniciar e monitorar a tarefa submetida. As informaes sobre o estado da tarefa e do recurso so constantemente reportadas ao servio de informao e diretrio do Globus, o Metacomputing Directory Service (MDS). Apesar do funcionamento e do fato de resolver muitas questes do aspecto operacional, o Globus no ataca o problema do Grid no que se refere ao gerenciamento. Para obter acesso a alguns recursos, necessrio que haja negociao com os donos dos recursos, alm de fazer o mapeamento dos clientes para usurios locais, o que involuntariamente limita a escalabilidade desse mecanismo. Global Grid Frum e o OGSA O aperfeioamento do conceito de Grid j uma necessidade e est sendo levado em considerao, principalmente pelo Global Grid Frum (GGF), comunidade formada por entidades do meio cientfico e corporativo que criam e padronizam tecnologias para ambientes em grade. Recentemente, uma importante ao do GGF est no desenvolvimento do OGSA (Open drive Service Architecture), um padro com o objetivo de permitir interoperabilidade, portabilidade e reutilizao de servios em grade apor meio da padronizao de interfaces, comportamentos e servios bsicos obrigatrios, APIs etc. Isso viabiliza a utilizao conjunta de servios desenvolvidos em diversos ambientes, por diferentes desenvolvedores. Para simplificar, trata-se de uma definio de arquitetura de servios bsicos para a construo de uma infra-estrutura de Grades de servios. Isso permite definir mecanismos padro para criao, nomeao e descoberta de servios de grade. O conceito baseado na idia de interconexo de sistemas e na criao de organizaes virtuais. Uma organizao virtual um conjunto de instituies definidas por regras de compartilhamento. Sendo assim, a expectativa permitir que membros de grupos distintos compartilhem recursos de uma forma controlada e atinjam um objetivo comum.
- 25
A OGSA tem por objetivo padronizar os diferentes servios que so freqentemente encontrados em uma aplicao de Grid por meio de uma especificao de um conjunto de interfaces. Em OGSA, esses servios so chamados de servios de Grade e correspondem a uma extenso da tecnologia de servios Web. O conceito define o que pode ser chamado em uma grade de servios. Um OGSA poderia, em teoria, ser baseado em qualquer middleware distribudo (CORBA, RMI etc). A opo por servios Web foi, principalmente, porque essa tecnologia a mais adequada para implementar sistemas fracamente acoplados entre si. Grid no mundo afora Com essa necessidade de padres, j se pode ver pelo mundo diversas grades em funcionamento, projetos que se tornam, inclusive, multi-institucionais. O Datagrid um deles. A estratgia da CERN (Organizao Europia de Pesquisa Nuclear) e financiado pela Comunidade Europia. O objetivo utilizar o grid de forma eficiente como apoio em reas de pesquisa como astronomia, fsica e biologia. Alm dessa iniciativa, h tambm o BIRN, projeto multiinstitucional que conta com o apoio de quinze universidades norte-americanas e que voltado para pesquisa neurolgica e Mammogrid, uma iniciativa da comunidade europia para formar uma base de mamografias que abrange toda a Europa com intuito de fornecer material de estudo e campo para o desenvolvimento de tecnologias em grade. No Brasil, o exemplo mais relevante o Sprace, projeto de Grid do Instituto de Fsica da USP que est inserido no processamento dos dados provenientes do projeto D0 (projeto que rene pesquisadores do mundo todo para analisar os dados gerados pelo acelerador de alta energia Tevatron Collider, localizado em Illinois, Estados Unidos).
- 26
Mdulo 8 - Tendncias Quando o tema Grid Computing, h uma preocupao em descobrir novos recursos, monitorar e acompanhar os servios executados, medir a utilizao e balancear o uso dos recursos alocados na grade. Estima-se que, a partir de 2008, as fornecedoras de servios de Utility Computing adotaro a tecnologia de grades computacionais. Grid Computing, conceito surgido h mais de trs dcadas, em 1969, volta tona e desponta como futuro da Tecnologia da Informao nas corporaes bem planejadas. Passou a chamar a ateno de CEOs e Chairmans de empresas de TI e grandes corporaes. Uma srie de artigos publicados pelo pesquisador e professor de cincias da Computao da Universidade de Chicago Ian Foster ao longo dos ltimos dez anos deram ao tema uma nova dimenso mais palpvel e aplicvel no ambiente da informtica corporativa. Afinal, o Grid permite a transformao de custos fixos em variveis. Esta tendncia inevitvel e bem-vinda, graas aos ganhos de produtividade que ela proporciona na concepo dos usurios. Nascido no bero da pesquisa cientfica, o Grid Computing, ou como preferem alguns, a computao distribuda, comea a ganhar importncia no mundo corporativo. A tecnologia foi uma resposta a um dos problemas mais comuns no meio acadmico: a escassez de verba para pesquisa. Nos anos 90, aps perder seu financiamento governamental, um projeto norteamericano que buscava por sinais de vida inteligente em outros planetas o SETI (Search for Extra-Terrestrial Intelligence) teria apostado na abordagem da computao distribuda para no abandonar suas pesquisas. No lugar de supercomputadores protegidos pelos muros dos institutos de pesquisa, os cientistas passariam a contar com milhares de computadores comuns de voluntrios, espalhados pelos locais mais variados do mundo, para processar pequenos pacotes de dados vindos do espao, nos perodos de ociosidade do sistema, e devolver os resultados aos pesquisadores. Unio que faz a fora A idia que em vez de uma pessoa fazendo dez contas, voc tenha dez pessoas, cada uma fazendo uma conta. Quem resolve mais rpido? Na prtica, so vrias estaes em rede rodando pores diferentes de uma mesma aplicao. A capacidade de combinar o poder de processamento distribudo em diversas mquinas para realizar tarefas que exigem mais do hardware comumente confundida com o conceito de cluster de servidores, que tambm envolve equipamentos interligados de novo, a idia da unio que faz a fora.
- 27
Porm, enquanto no cluster todos os recursos do hardware passam a ser enxergados como um nico supercomputador, somando-se recursos de memria, armazenamento e processamento, no grid a capacidade permanece segmentada, o que se fragmentam so os pacotes de dados a serem processados durante os perodos de ociosidade do sistema. Por isso, o processo de adoo est mais maduro nas organizaes que tm aplicaes que podem operar paralelamente. Empresas que fazem anlises ssmicas, simulaes meteorolgicas e financeiras, por exemplo. O processo gerenciado por meio de uma infra-estrutura de software que distribui os pacotes de dados o chamado middleware. Nesse segmento, j h solues disponveis, o que faltam so aplicaes na ponta, que permitam adaptar esse poder de distribuio do processamento necessidade das empresas. Imagine o que significa para uma empresa de telecomunicaes poder reduzir de uma semana para um dia o processo de fechamento das faturas dos seus clientes? de uma economia de tempo dessa escala que estamos falando quando se adota grid. Ele mais uma das repostas tecnolgicas demanda crescente no mercado por distribuir as cargas de trabalho de forma mais eficiente pelo hardware, simplificando o gerenciamento e diminuindo os custos. Ganhando espao Embora oferea tais benefcios, o Grid s agora comea a ser percebido como uma soluo para aplicaes comerciais mais tradicionais, e no apenas uma aplicao do mundo acadmico, segundo estudo da Insight Research. A consultoria aponta alguns marcos atingidos no ltimo ano que atestam essa tendncia. Entre eles esto a escolha por grandes empresas de telecom, incluindo a British Telecom e a Telefnica, de parceiros de software de middleware para grid para a criao de servios baseados na tecnologia; um nmero de empresas iniciantes de grid que receberam investimentos de grupos de capital de risco; e a implementao de projetos de grid parciais ou experimentais em uma srie de grandes companhias. Por outro lado, a consultoria lista tambm alguns empecilhos para a adoo do grid nas empresas. Segundo a pesquisa, ainda faltam modelo estveis de aplicaes noacadmicas de grid para serem usadas como referncias. Alm disso, na cincia, os grids j cruzam as fronteiras das organizaes, enquanto no mundo corporativo o grid fica amarrado atrs dos firewalls de um endereo fsico da empresa. H apenas alguns exemplos de grids espalhados por mais de um ponto de presena fsica da mesma empresa. Ainda assim, o relatrio aponta para uma forte curva de crescimento do mercado de Grid nos prximos cinco anos. A estimativa que o setor, que em 2006 deve movimentar 1,8 bilho de dlares, cresa, em 2011, para cerca de 24,5 bilhes de dlares. - 28
De acordo com o Insight, alguns mercados devem fazer a transio da fase experimental para os projetos de fato com maior antecedncia entre eles, o de engenharia tcnica, o de farmacutica e, em menor escala, o financeiro. A tendncia que os provedores de infra-estrutura terceirizada sejam os primeiros a empregar a tecnologia no Brasil, mesmo que de forma transparente ao usurio.Os benefcios ficam mais claros para empresas em que o negcio principal a prpria tecnologia. Contudo, alguns analistas afirmam que o Grid no para todos. A tecnologia ser to mais til quanto maior for o volume de dados e a necessidade de agilidade da empresa que a adotar. Cabe fazer as contas para saber se o benefcio compensa os custos. Segunda do ranking Na abertura da XI Conferncia Anual do Gartner, em 2006, o vice-presidente de pesquisa da IDC, Carl Claunch, destacou os sistemas que estaro em 2007, como o EMI (Enterprise Information Management) e o aumento do esclarecimento em relao ao grid computing (portais, sistemas de mensagens instantneas), assim como virtualizao. O analista acredita que a inovao da TI se manter no atual ambiente econmico e que haver ainda uma reduo de produtividade em relao ao open-source, apesar de a tecnologia aparecer na lista de destaques para o prximo ano. Em evidncia , portanto, esto virtualizao, grid computing, service-oriented architecture (SOA) e open source, somados a outras tendncias de longo prazo, como o AJAX. Ele afirma que hoje as empresas esto mais familiarizadas com grandes servidores divididos em vrios outros. O que perceberemos a integrao e a virtualizao dessas estruturas fsicas, o que facilitar o trabalho dos operadores e usurios. Entre as tecnologias que estaro em destaque em 2007, o Grid Computing ocupa a segunda colocao. As 10 tecnologias destaques em 2007 para o Gartner 1. Virtualizao, 2. Grid Computing, 3. Arquitetura orientada a servios (SOA), 4. Enterprise Information Management (EIM), 5. Cdigo aberto, 6. Acesso informao, 7. Ajax, 8. Mashup Composite Model, 9. Computao Distribuda no Ambiente (do ingls, Pervasive Computing), 10. Coleta inteligente de dados. - 29