Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008...

81
Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP GridBrazil Sérgio F. Novaes Eduardo de M. Gregores

Transcript of Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008...

Page 1: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

Projeto Temático Processo 03/04519-9 Abril 2008

Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

Sérgio F. Novaes Eduardo de M. Gregores

Page 2: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

2

Índice

I.  RESUMO DO PROJETO INICIAL ........................................................................................... 4 

II.  RESUMO DOS PRINCIPAIS RESULTADOS OBTIDOS DURANTE O PROJETO TEMÁTICO . 7 

Implantação do Centro Regional de Análise de São Paulo ..................................... 7 

Processamento de Dados ............................................................................................. 7 

Treinamento de Pessoal e Subvenção Externa ........................................................... 7 

Doações de Hardware Recebidas do Exterior ............................................................ 8 

Colaborações Internacionais ....................................................................................... 9 

Crescimento do Grupo ................................................................................................. 9 

Eventos Realizados ...................................................................................................... 10 

Análise de Dados ......................................................................................................... 10 

Produção Científica ..................................................................................................... 10 

Projetos Induzidos ........................................................................................................ 10 GridUNESP ....................................................................................................................... 10 Grid Educacional .......................................................................................................... 10 

Divulgação Científica .................................................................................................. 11 Um Cartaz em Cada Escola ....................................................................................... 11 MasterClass .................................................................................................................... 11 

Outras Atividades ........................................................................................................ 11 

III.  ANÁLISES FÍSICAS ............................................................................................................... 12 

Introdução .................................................................................................................... 12 

Análises Físicas no DZero. ........................................................................................... 12 Aquisição de dados ..................................................................................................... 12 Acesso aos dados: SAM ............................................................................................... 13 O Ambiente de Análise................................................................................................ 13 Dimensões Extras Universais: Resultados preliminares ............................................. 14 

Análises Físicas no CMS .............................................................................................. 19 O Sistema de Software do CMS ................................................................................. 19 Participação no Grupo de Bósons Vetoriais e Jatos .............................................. 22 Busca por Dimensões Extras em Colisores Hadrônicos ........................................... 25 

Page 3: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

3

IV.  PROCESSAMENTO DE DADOS .......................................................................................... 26 

O SPRACE e o Processamento no CMS ...................................................................... 26 

Infra-estrutura Física .................................................................................................... 27 

Infra-Estrutura de Software .......................................................................................... 29 Elemento de Computação ......................................................................................... 30 Nós de Trabalho ............................................................................................................ 31 Elemento de Armazenamento ................................................................................... 31 Nós de Armazenamento do dCache ....................................................................... 32 

Planejamento para o Futuro ....................................................................................... 32 

V.  EDUCAÇÃO E DIVULGAÇÃO CIENTÍFICA ...................................................................... 35 

Grid Educacional ......................................................................................................... 35 

Um Cartaz em Cada Escola ....................................................................................... 39 

MasterClass .................................................................................................................. 41 

APÊNDICES ....................................................................................................................................... 43 

A. ARTIGOS PUBLICADOS DURANTE A VIGÊNCIA DO PROJETO TEMÁTICO ........................... 44 

B. MINUTA DA DZERO NOTE ........................................................................................................... 53 

C. MINUTA DA CMS NOTE .............................................................................................................. 63 

Page 4: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

4

I. Resumo do Projeto Inicial Anéis de colisão são importantes instrumentos na investigação das interações

fundamentais e da estrutura da matéria. O Tevatron do Fermilab e o Large Hadron Collider (LHC) do CERN desempenharão um papel fundamental para estas investigações durante os próximos 20 anos.

Estes aceleradores deverão produzir uma quantidade de dados sem precedentes, devendo atingir 109 GB durante a próxima década. Estes dados deverão ser armazenados, processados e analisados por milhares de pesquisadores ao redor do mundo. Para alcançar este objetivo de forma eficiente, as colaborações internacionais estão desenvolvendo a arquitetura Grid de processamento distribuído.

Como membros das colaborações DØ do Fermilab e CMS do CERN, pretendemos nos unir aos esforços internacionais no sentido de implementar centros de análise distribuídos destes experimentos. Planejamos construir um centro de processamento em São Paulo que servirá inicialmente como Centro Regional de Análise da Colaboração DØ e posteriormente como elemento do HEP Grid do CMS.

Em sua primeira etapa, esta unidade deverá prover serviços tais como distribuição do código computacional do DØ, simulação de Monte Carlo do experimento, administração de submissão e execução de processos, acesso ao banco de dados do DØ e reprocessamento e análise dos dados obtidos. Em uma segunda etapa, deveremos nos engajar nas iniciativas relacionadas ao HEP Grid da Colaboração CMS do CERN que deverá estar produzindo dados a partir de 2007.

Uma das grandes vantagens da arquitetura Grid é que um investimento inicial relativamente modesto garante nossa inserção na comunidade internacional de usuários de Grid, tornando acessível o poder de processamento representado pelo conjunto das demais unidades interligadas ao redor do mundo.

Este centro de processamento terá sua principal aplicação voltada para o processamento dos dados produzidos pelos experimentos de Altas Energias dos quais fazemos parte. No entanto, nada impede que outros grupos possam vir a fazer uso deste equipamento. Podemos antever alguns usuários em potencial, tais como: instituições responsáveis pela previsão de tempo (INPE/MCT, IPMET/UNESP), projetos internacionais em Astronomia (SOAR, Gemini), grupos voltados para o seqüenciamento genético (Rede ONSA), pesquisa em prospecção de petróleo e modelagem geológica, instituições de pesquisa em modelagem molecular e celular, instituições médicas envolvidas na reconstrução de imagens tomográfica (PECT, PET).

Além de sua importância para o desenvolvimento científico e tecnológico, esta iniciativa deverá desempenhar um importante papel na formação de recursos humanos. Ela deverá gerar competência não apenas na Física de Altas Energias mas também em áreas correlatas tais como redes de altas velocidades, processamento de alto desempenho e, acima de tudo, na arquitetura Grid.

Page 5: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

5

Similarmente ao que ocorreu com a World Wide Web, cuja ubiqüidade vem promovendo uma revolução em todos os setores da sociedade, espera-se que os reflexos dos Grids se façam sentir muito além da Física de Altas Energias. O processo de desenvolvimento do Grid já envolve profissionais de diversas especialidades (computação, eletrônica, redes ópticas, desenvolvimento de software, banco de dados, etc.), permitindo gerar capacitação nessas diferentes áreas.

Detalhamos a seguir o cronograma de execução do projeto original, tanto no que se refere à aquisição, instalação e teste do hardware como ao desenvolvimento de software e uso do cluster para simulação de eventos de Monte Carlo dos experimentos DØ e CMS, bem como análise dos dados coletados.

Planejamento para 2003 – 2004

• Preparação da infra-estrutura para implantação do projeto (instalação de conexão óptica de rede, elétrica, ar condicionado, etc.);

• Implantação do projeto com a aquisição do material correspondente à primeira unidade de processamento paralelo (Fase I) com 16 CPU’s e 292 GB de disco;

• Instalação e teste do equipamento;

• Reavaliação das tarefas específicas para o desenvolvimento do projeto nesta primeira fase;

• Estabelecimento de cronograma de viagens e de visitantes nacionais e internacionais;

• Assinatura de Memorandum of Understanding com a Colaboração DØ e com o Fermilab regulando a existência do Centro Regional de Análise de São Paulo (SPRACE);

• Instalação do software DØ Run II no cluster, que inclui:

o DØ Software Release e software de análise;

o Ferramentas para desenvolvimento de código do DØ;

o Sistema de Acesso a Dados Remotos (SAM);

• Início da produção de eventos de Monte Carlo do DØ na Fase I do cluster;

• Revisão dos cronogramas e Relatório da Fase I.

Planejamento para 2004 – 2005

• Aquisição das 32 CPU’s e 1,6 TB de disco correspondentes à Fase II do projeto;

• Instalação e teste do novo equipamento e integração ao equipamento da Fase I;

Page 6: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

6

• Instalação e início dos testes do software da Colaboração DØ responsável pela distribuição de tarefas entre os Centros de Análises Regionais;

• Nova fase de produção de eventos de Monte Carlo do DØ no cluster integrado (Fase II);

• Início dos trabalhos de análise de dados e produção de resultados físicos com o cluster;

• Revisão dos cronogramas e relatório da Fase II.

Planejamento para 2005 – 2006

• Aquisição do material correspondente à Fase III, composta de 32 CPU’s e de 1,6 TB de disco;

• Instalação e teste do novo equipamento e integração ao parque computacional das Fases I e II;

• Testes de hardware e software com todas as 80 máquinas integradas;

• Nova fase de produção de eventos de Monte Carlo e análise de dados do DØ no cluster integrado (Fase III);

• Instalação e início dos testes do software da Colaboração CMS do CERN;

• Instalação e configuração de software para atendimento das necessidades do trabalho no CMS;

• Início da produção de eventos de Monte Carlo do CMS;

• Início da simulação para os detectores do CMS;

• Revisão dos cronogramas e relatório da Fase III.

Planejamento para 2006 – 2007

• Produção de eventos de Monte Carlo do CMS;

• Testes de novos softwares e da performance do cluster;

• Distribuição de tarefas e preparação para trabalhos de análise física no CMS;

• Integração do cluster ao Grid da Colaboração CMS;

• Revisão dos cronogramas e responsabilidades;

• Avaliação Geral do Projeto e Relatório Final;

• Apresentação de nossa proposta de continuidade dos trabalhos às Colaborações DØ e CMS.

Page 7: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

7

II. Resumo dos Principais Resultados Obtidos Durante o Projeto Temático

Nesse último relatório do Projeto Temático, que se iniciou em novembro de 2003, é importante fazer um balanço das principais realizações. Vale ressaltar que fomos capazes não só de atingir todos os objetivos propostos inicialmente como demos um passo além, formando ou induzindo vários projetos correlatos. Dentre eles, vale à pena mencionar:

Implantação do Centro Regional de Análise de São Paulo

Foi implantada a infra-estrutura física (rede óptica, rede elétrica, ar condicionado, etc.) do datacenter do SPRACE no Centro de Ensino e Pesquisa Aplicada (CEPA) do Instituto de Física da USP.

A primeira etapa do cluster do SPRACE foi adquirida, instalada, configurada, testada e entrou em operação no dia 23 de março de 2004 com a realização da primeira simulação de Monte Carlo para o DZero. O tempo recorde de implantação do nosso sistema foi mencionado em sessão plenária da conferência Computing in High Energy Physics de 2004, em Interlaken, Suíça por Amber Boehnlein.

O cluster do SPRACE foi ampliado, conforme o projeto inicialmente proposto, em duas etapas subseqüentes atingindo um total de 86 nós com um total de 240 núcleos de processamento.

Processamento de Dados O SPRACE teve uma participação destacada nos reprocessamentos de dados,

com clusters dos EUA, Canadá e Europa, e na produção de dados de Monte Carlo da colaboração DZero. O SPRACE tornou-se em 2005 um site do Open Science Grid e passou a atuar como uma Tier 2 dentro da estrutura hierárquica de processamento do LHC.

Uma demonstração de prestigio e competência do trabalho que vínhamos desenvolvendo foi dada quando um dos membros do grupo (Eduardo Gregores) foi enviado pela colaboração DZero para implantar o cluster de processamento do grupo da University of Science and Technology da China em Hefei, capital da província de Hanui.

O SPRACE participou de vários desafios de transmissão de dados (Bandwidth Challenges) tendo batido o recorde de velocidade de transmissão entre os Hemisférios Norte e Sul com uma taxa sustentada de 2,93 Gbps em 2004.

Participamos ainda do Computing, Software, & Analysis Challenge 2006 da Colaboração CMS do CERN em preparação para o processamento de dados do LHC;

Treinamento de Pessoal e Subvenção Externa O SPRACE promoveu o treinamento e participação em eventos realizados no

Brasil e no exterior, de diversos de seus membros, sempre com financiamento externo ao projeto:

Page 8: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

8

• Pan-American Advanced Studies Institute (PASI), "Grid Computing and Advanced Networking Technologies for e-Science”, Mendoza, Argentina, de 15 a 22 de maio de 2005 – financiamento National Science Foundation (NSF);

• UltraLight Summer Workshop Tutorial, Miami, Flórida, de 8 a 10 de junho de 2005 – financiamento CHEPREO Project;

• Grid Summer Workshop 2005, South Padre Island, Texas, de 11 a 15 de julho de 2005 – financiamento da University Texas at Brownsville e NSF;

• CERN School of Computing 2006, Helsinki, Finland, de 21 de agosto a 01 de setembro de 2006 – financiamento da European Union (Marie Curie program);

• LISHEP Advanced School on Collider Physics, Rio de Janeiro, 26 a 31 de março de 2006 – financiamento do comitê organizador;

• The Hadron Collider Physics Summer School – Fermilab, 9 a 18 agosto de 2006 – financiamento CNPq e comitê organizador;

• 2nd Southeastern CMS Physics Analysis Workshop, Miami, EUA, de 7 a 9 fevereiro de 2007 – finaciamento projeto CHEPREO;

• BELIEF-EELA e-Infrastructures Conference, Rio de Janeiro, 25 a 28 junho de 2007 – financiamento EELA Project;

• 2nd EELA Workshop e 3rd EELA Tutorial for Users and Administrators, Rio de Janeiro, 24 a 30 de junho de 2006 – financiamento EELA Project;

• 1st EELA Grid School, Ilha de Itacuruçá, Rio de Janeiro, de 4 a 15 de dezembro de 2006 – financiamento: CTI / USP;

• 7th IEEE International Symposium on Cluster Computing and the Grid (CCGrid'07), Barra da Tijuca, Rio de Janeiro, de 14 a 17 de maio de 2007 – financiamento Sociedade Brasileira de Computação (SBC);

• Workshop de Pesquisa & Desenvolvimento do Projeto GIGA / RNP, LNCC, Petrópolis, Rio de Janeiro, de 3 a 6 de setembro de 2007 – financiamento Projeto GIGA;

• 19th Symposium on Computer Architecture and High Performance Computing (SBAC-PAD'07), Gramado, Rio Grande do Sul, de 24 a 27 de outubro de 2007 – financiamento do próprio participante;

• Short-Term Training (STT), CERN, Genebra, Suíça, várias visitas – financiamento High Energy Physics Latinamerican-European Network (HELEN);

• Florida International Grid School 2008, Miami, de 23 a 25 de janeiro de 2008 – financiamento do projeto CHEPREO.

• US CMS Tier 2 Workshop, Purdue University, 11 de abril 2008 – financiado pelo consórcio USCMS.

Doações de Hardware Recebidas do Exterior O SPRACE recebeu as seguintes doações:

• Seis servidores de processamento Infoserver 1252 através de convênio de cooperação científica e tecnológica que foi assinado com a Itautec Philco S.A – valor estimado R$ 82.300,00;

Page 9: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

9

• Um switch Cisco Catalyst 3750G-24TS-24 com 24 portas 10/100/1000 e 4 small form-factor pluggable (SFP) uplinks do Prof. Harvey Newman do Caltech – valor estimado US$ 14.200,00;

• Um GBic de curto alcance do Prof. Harvey Newman do Caltech – valor estimado de US$ 1.300,00;

• Um GBic de longo alcance do Prof. Harvey Newman do Caltech – valor estimado de US$ 5.100,00.

Colaborações Internacionais Foram estabelecidas várias colaborações nacionais e internacionais:

• Giga/RNP; • Kyatera/FAPESP; • Distributed Organization for Scientific Analysis and Research – DOSAR; • Open Science Grid – OSG; • Center for High Energy Physics Research, Education and Outreach –

CHEPREO; • E-Infraestructure shared between Europe and Latin America – EELA2; • Ultrascale Information System for Data Intensive Research – UltraLight.

Crescimento do Grupo Vale lembrar que houve um expressivo crescimento do grupo durante o perído

do projeto. Ele pode se apreciado no diagrama abaixo:

Page 10: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

10

Eventos Realizados Foram promovidos vários eventos científicos, entre eles:

• VI DOSAR Workshop; • I Brazilian LHC Computing Workshop; • I Workshop do SPRACE; • CMS Tutorial.

Análise de Dados O grupo do SPRACE participa da análise física de dados buscando evidência de

dimensões extras nos eventos do DZero e está iniciando a análise das conseqüências do modelo de Randall-Sundrun na escala de 1 TeV, o que será estudado com a ajuda dos dados do CMS.

Produção Científica Os pesquisadores do SPRACE foram co-autores de quase 100 artigos científicos

publicados em revistas internacionais arbitradas, tendo recebido quase 2000 citações conforme o SPIRES/SLAC, com fator h igual a 22:

Revista N0 de Artigos Physical Review Letters 51 Physical Review D 23 Physics Letters B 21 Nuclear Instrumentation and Methods 1 Journal of Physics G 1

Total de Artigos Publicados 97

Total de Citações (SPIRES/SLAC) 1984

Projetos Induzidos

GridUNESP O SPRACE foi o idealizador e coordenador do GridUNESP, onde o conceito de

computação de alto desempenho em grid foi empregado para implantar o primeiro Campus Grid da América Latina. Este projeto teve o maior orçamento aprovado (R$ 4,4 milhões) pelo MCT/FINEP/CT-INFRA dentre todos os projetos concedidos pelo PROINFRA de 2005.

Grid Educacional Atualmente tem-se utilizado o conceito de “Grid ia a Box” com propósito de

treinamento e testes em um ambiente virtual de Grid. Nosso grupo está empregando esse conceito, aliado à doação de equipamentos por um pool de empresas (Intel, SGI,

Page 11: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

11

Sun, Kingston, Seagate) com o propósito de implantar um Grid Educacional em São Paulo.

Divulgação Científica

Um Cartaz em Cada Escola O projeto “Estrutura Elementar da Matéria: Um Cartaz em Cada Escola”,

implementado pelo SPRACE, elaborou e distribuiu cartazes para todas as escolas do Ensino Médio do país contendo informação sobre os constituintes da matéria e suas interações, além de manter um Fórum de Discussão para estudantes e educadores.

MasterClass O programa internacional “MasterClass: Trabalhando em Física de Altas

Energias” (Hands on Particle Physics – International MasterClasses for High School Students ) de 2008 contou pela primeira vez com a participação do Brasil, tendo sido uma iniciativa do SPRACE trazê-lo para São Paulo . O evento contou com a presença de estudantes do Colégio Dante Alighieri e da Escola de Aplicação da Faculdade de Educação da Universidade de São Paulo, os quais se juntaram, através de videoconferência, com estudantes de Dortmund na Alemanha, Padova e Pisa na Itália, Presov na Eslováquia, Witwatersrand na África do Sul e Berna na Suíça.

Outras Atividades Os pesquisadores principais do projeto SPRACE foram convidados pela Editora

da UNESP a escrever o livro “Da Internet ao Grid: A Globalização do Processamento” (ISBN: 9788571397378), volume da série Novas Tecnologias da “Coleção Paradidáticos”1;

Além da webpage do projeto, foi implantada ferramenta colaborativa do tipo Wiki que tem servido como repositório de informação. O site contém inventário completo do cluster, descrição detalhada da infra-estrutura física, instruções e logbook da operação do cluster, agenda de reuniões e relação de tarefas, etc.;

O SPRACE foi objeto de matéria em diversos órgãos da imprensa, entre eles: • Folha de São Paulo; • Revista INFO Exame; • Science Grid This Week; • Revista Pesquisa da FAPESP; • Revista Siga.

1 http://www.editoraunesp.com.br/titulo_view.asp?IDT=757

Page 12: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

12

III. Análises Físicas Introdução

Em um experimento de grande porte os dados passam por um longo processo antes de serem utilizados para a análise. A quantidade de dados gerados é enorme, sendo crucial um procedimento de seleção (Trigger) antes da gravação em fita magnética. Outro aspecto fundamental é a necessidade de padronização dos procedimentos de acesso aos dados e de análise, tendo em vista a grande quantidade de físicos participantes do experimento. É desejável um mecanismo robusto e, ao mesmo tempo, de fácil acesso para que os diversos grupos possam fazer suas análises de forma independente e padronizada.

As atividades de análise podem ser separadas em duas grandes categorias: existem as atividades ligadas a definições dos objetos físicos (elétrons, fótons, jatos, etc.) que ficam por conta de subgrupos responsáveis por definir uma padronização nas características desses objetos que serão utilizados em todas as análises, e existem os grupos de análise (grupos de Física do top, eletrofraca, Física além do Modelo Padrão etc.) em que a análise final é executada.

Aproveitando a grande experiência dos membros do grupo em fenomenologia das partículas elementares, mais precisamente na busca de alternativas ao Modelo Padrão, participamos do grupo de análise de Novos Fenômenos do DZero e estamos desenvolvendo uma análise buscando dimensões extras universais (UED). No CMS estamos nos engajando no grupo de Supersimetria e Física Além do Modelo Padrão e participamos do grupo de Bósons Vetoriais e Jatos.

No período deste relatório, desenvolvemos a simulação completa do sinal de UED no DZero e analizamos os dados referentes a versão P17 do software de reconstrução de dados do DZero. Elaboramos uma nota de análise que será submetida para apreciação da colaboração. No CMS, preparamos uma nota relativa ao nosso trabalho no grupo de Bósons Vetoriais e Jatos. As versões iniciais de ambas as notas seguem em anexo.

Análises Físicas no DZero.

Aquisição de dados A aquisição de dados começa com os Triggers dos detectores. O sistema de

Trigger do DZero é um sistema altamente flexível desenvolvido para selecionar os dados a serem gravados. Essa seleção é feita por um sistema seqüencial de três níveis. O primeiro nível processa rapidamente sinais dos detectores com base na eletrônica e é capaz de reduzir a taxa de eventos de 2,5 MHz para 1,5 KHz. O segundo nível utiliza informação do primeiro nível e forma objetos físicos simples para reduzir a taxa de eventos para cerca de 800 Hz. O terceiro nível realiza a reconstrução dos eventos em um cluster de computadores utilizando algoritmos parecidos com os que serão posteriormente utilizados na análise dos eventos. Neste trigger são aplicados algoritmos de seleção capazes de reduzir a taxa de eventos para 50 Hz. Estes eventos assim selecionados são então armazenados em fitas magnéticas.

Além de serem armazenados em sua forma bruta (informações diretas dos detectores) estes eventos são também processados (reconstruídos) para a obtenção do seu significado físico, sendo então gravados também neste formato apropriado para sua posterior análise. Os programas de reconstrução (d0reco) produzem dados do tipo

Page 13: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

13

Thumbnail (TMB) contendo os objetos físicos e não mais os hits nos detectores. Estes são, eventualmente, transformados posteriormente em outros formatos de dados (como o formato Root) com o objetivo de facilitar a análise dos dados e, principalmente, tornar mais rápido e homogêneo este processo.

Acesso aos dados: SAM Além de um sistema de aquisição e seleção de dados, é fundamental a

existência de um sistema para seu armazenamento e acesso. O Sequential Access via Metadata (SAM) foi concebido no Fermilab em 1997 visando solucionar o desafio que seria o manuseio dos dados a serem obtidos pelo experimento DZero durante a década seguinte. O sistema mostrou-se estável e confiável, levando o experimento CDF a também adotá-lo. Atualmente o sistema gerencia um fluxo de dados da ordem de dezenas de Terabytes por semana, movimentados entre diversos locais nas Américas, Europa e Ásia.

O SAM é um sistema de manuseio de dados organizado como um conjunto de servidores geograficamente distribuídos que operam em conjunto para armazenar e acessar arquivos, incluindo uma caracterização exaustiva de suas características (meta dado) e um histórico completo de como esses dados foram gerados. Ele foi projetado tendo-se em vista a implantação dos seguintes objetivos:

• Prover armazenamento confiável e permanente dos dados coletados do detector e dos diversos centros de processamento espalhados ao redor do mundo, proporcionando a interface com o sistema robótico de armazenamento de dados em fitas magnéticas.

• Disponibilizar a distribuição dos dados armazenados para as cerca de 70 instituições de ensino e pesquisa participantes do experimento através da utilização de áreas locais de armazenamento em disco.

• Catalogar as características dos dados armazenados, tais como conteúdo, origem, status, localização, histórico do processamento, conjuntos definidos pelo usuário, etc.

• Gerenciar a distribuição dos recursos de armazenamento de modo a otimizar o seu uso e o fluxo dos dados, bem como implantar a política de administração dos dados dos experimentos.

• Entregar e transportar os dados entre os diversos servidores locais, bem como entre os servidores locais e o local de armazenamento permanente no Fermilab.

O Ambiente de Análise O ambiente computacional de análise do DZero, simplesmente chamado

Framework, é um sistema orientado a objeto que provê uma interface comum e uma determinada metodologia para fazer análise de eventos. O Framework define o caminho que o evento percorre nos programas aplicativos dos usuários. O objetivo do Framework é passar os dados do evento de um programa a outro, na ordem e configuração estabelecida pelo usuário na hora de executar o programa.

Desde 2005 a colaboração do DZero vem utilizando amplamente o CAFÉ (Common Analysis Format Environment), conjunto de ferramentas utilizado pelos diversos grupos de análise. Em uma análise típica os dados passam por processos para analisar a qualidade dos dados, selecionar objetos físicos de interesse, selecionar os eventos e, por fim, realizar a análise. Em cada um desses processos são utilizados programas

Page 14: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

14

desenvolvidos pelos diversos grupos de algoritmo, sendo possível selecionar os parâmetros apropriados para cada análise.

Dimensões Extras Universais: Resultados preliminares Aproveitando a experiência anterior de membros do grupo em Fenomenologia

de Partículas, estamos desenvolvendo uma análise onde buscamos sinais de existência de Dimensões Extras Universais (Universal Extra Dimensions – UED)2 em colaboração com o Prof. Greg Landsberg, ex-coordenador do grupo de Novos Fenômenos (New Phenomena) do DZero e renomado especialista na procura de dimensões extras em aceleradores3. Esse tipo de modelo tem sido bastante estudado recentemente, tendo recebido atenção de teóricos trabalhando no Brasil4.

Fenomenologia do Modelo Nos modelos de UED todas as partículas podem se propagar nas dimensões

extras. Como conseqüência, cada partícula possui parceiros de Kaluza Klein (KK), formando vários estados excitados. Devido à conservação de momento nas dimensões extras existe a conservação em nível de árvore do número de KK, definido como sendo o número do estado excitado de cada partícula. No entanto, correções no bulk (o espaço das dimensões extras) e nas branas (o espaço limitado nas nossas 4 dimensões usuais) quebram essa conservação que passa a ser apenas uma conservação multiplicativa discreta (do tipo paridade) chamada de paridade KK, (-1)n, sendo n o estado excitado de KK. Como conseqüência, a produção dos parceiros de KK do primeiro estado excitado (os mais leves) só pode ser feita em pares (n=1) e o estado mais leve (LKP) com n=1 é estável, sendo um bom candidato à matéria escura. Vemos nesses dois pontos grandes semelhanças com supersimetria.

O modelo mais popular de UED é o modelo mínimo, com apenas uma dimensão extra. O modelo mínimo pode ser determinado apenas pelos parâmetros R e λ, sendo R a escala de compactificação e λ a escala de energia a partir da qual o modelo não é mais válido. Tipicamente R fornece a escala de massa dos estados excitados e λ está ligado à diferença de massa entre os estados excitados. A fenomenologia do modelo e seus sinais experimentais serão ditados pelo espectro de massa dos estados KK. Em primeira ordem, a massa dos estados KK para o enésimo modo será dada por mn2 = n2 / R2 + m02, sendo R a escala de compactificação e m0 a massa da partícula correspondente no Modelo Padrão.

A degenerescência das massas dos estados KK é quebrada pelas correções de 1-loop, que estabelecem um ordenamento nas massas dos estados excitados. O primeiro estado excitado mais pesado é o do glúon, seguido pelos quarks, bósons W, léptons e fóton, respectivamente.

Como os acoplamentos dos estados excitados são semelhantes aos acoplamentos do Modelo Padrão, espera-se uma grande produção de pares de quarks excitados (Q1) no Tevatron do Fermilab. Após a cadeia de decaimento dos pares Q1, haveria o sinal inclusivo de missing ET acompanhado de jatos. No entanto, as massas dos estados excitados são quase degeneradas de forma que o produto do decaimento

2 T. Appelquist, H. -C. Cheng e B. A. Dobrescu, Phys. Rev. D 64, 035002 (2001). 3 G. Landsberg [CDF e DZero Collaboration], eConf C040802, MOT006 (2004) [arXiv:hep-

ex/0412028] ; K. Cheung e G. Landsberg, Phys. Rev. D 65, 076003 (2002). 4 G. Burdman, B. A. Dobrescu e E. Ponton, JHEP 0602, 033 (2006); A. Alves, O. Eboli e T. Plehn,

Phys. Rev. D 74, 095010 (2006).

Page 15: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

15

não é muito energético, resultando em um sinal difícil de ser visto no Tevatron. Um sinal mais promissor é um sinal envolvendo léptons no estado final.

Em setembro de 2006 apresentamos para o grupo de Novos Fenômenos um estudo fenomenológico para o sinal de dimensões extras universais, estudando possíveis cortes que iremos efetuar para reduzir o background5. Utilizamos um programa de Pythia modificado para incluir o modelo mínimo de UED. Para o Tevatron haviam sido feitos estudos fenomenológicos para um sinal com 4 léptons no estado final, no entanto a grande degenerescência dos estados excitados leva a léptons pouco energéticos diminuindo em muito a eficiência para o sinal de 4 léptons6. Em nosso estudo preliminar verificamos que um sinal com dois léptons de mesma carga permite um alcance bem maior para o modelo. A Figura 1 resume nossos resultados, mostrando o alcance que se pode obter utilizando o sinal com dois léptons de mesmo sinal.

Uma possível fonte de background para esse sinal que não consideramos no estudo fenomenológico provém da produção de pares de jatos que podem ser identificados erroneamente como um elétron. Inicialmente estamos estudando o sinal apenas com múons, por ser um sinal mais limpo. No estudo experimental devemos levar todos os efeitos em consideração devendo utilizar simulações por Monte Carlo bem mais realistas do que as realizadas nesse estudo preliminar.

Figura 1: Alcance do Run II para o modelo mínimo de UED. Em azul temos o sinal

(quadrados) e o background (triângulos) para eventos com dois leptons de mesmo sinal sem efetuar cortes cinemáticos. Em vermelho temos o sinal (quadrados) e o

background (triângulos) após a realização de alguns cortes para otimização do sinal. A linha vermelha tracejada representa o alcance do Run II considerando 5 eventos como

critério de observabilidade.

Simulação de Monte Carlo No período deste relatório iniciamos o estudo dos sinais simulados por Monte

Carlo dentro do ambiente do DZero. Para confrontar os dados experimentais com o modelo teórico são necessárias simulações de Monte Carlo bastante realistas. A simulação no DZero apresenta basicamente 4 etapas:

5 http://www.sprace.org.br/Twiki/Documents/UniversalExtraDimension.pdf 6 H.C. Cheng, K.T. Matchev e M. Schmaltz, Phys. Rev. D 66, 056006 (2002).

Page 16: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

16

• A geração do processo físico, feita através de um programa do tipo Pythia, em que todas as partículas finais do evento são geradas com seus momentos definidos.

• A simulação da passagem dessas partículas pelo detector do DZero, estimando o sinal que cada uma delas deixaria em cada segmento do detector, é baseada no programa GEANT3. Esta etapa informa quanto cada partícula interage com cada pedaço do detector, mas ainda não é a resposta que o detector revela como saída.

• É preciso ainda a conversão do sinal depositado no detector nos sinais digitais, que são o que o detector realmente dá como saída, simulando assim exatamente o sinal registrado por um evento real.

• Finalmente, a conversão desse sinal para os objetos físicos reconstruídos. Cabe ressaltar que essa última etapa é realizada tanto nos dados reais quanto nos eventos simulados por Monte Carlo.

Todas essas etapas foram realizadas pela colaboração na produção oficial de eventos de Monte Carlo. Em especial, eventos do Modelo Padrão foram gerados à exaustão (inclusive nas máquinas do SPRACE). No entanto, para o sinal de UED foi preciso implantar todas essas etapas. Utilizamos um programa do Pythia com o modelo mínimo de UED e a partir desse programa foram gerados eventos que fizemos passar por todas as etapas a que um evento de Monte Carlo deve passar. Os passos para a implementação desse processo estão documentados em nossa página do Twiki7

Na Tabela 1 mostramos a situação preliminar dos eventos de Monte Carlo que estão sendo utilizados, com o número total de eventos gerados, quantos destes eventos têm dois múons e quantos têm dois múons com o mesmo sinal.

Processos σ (fb) Eventos 2μ 2 μss σ 2 μss (fb)

W → νμ 1.82 x 106 4.026.329 255 177 80.0

WZ → inc 2.41 x 103 305.500 4.662 619 4.88

ZZ → 4 μ 1.22 25.250 19.951 16.019 0.77

ZZ → 2e 2μ 2.44 25.000 11.242 180 0.018

ZZ → inc 994 100.250 2.926 95 0.94

Sinal (R=300 GeV-1) 279 24.500 3.456 1.407 16

Tabela 1: Simulação completa de Monte Carlo no DZero dos processos do Modelo

Padrão e do sinal de dimensões extras utilizados em nossa análise. Mostramos a seção de choque, o número de eventos gerados, o número de eventos com dois múons, o número de eventos com dois múons de mesmo sinal e a seção de choque de dois

múons com o mesmo sinal.

Dados Experimentais No decorrer dos últimos meses, após gerar o sinal de Monte Carlo passando por

todas as etapas da simulação do DZero, nos dedicamos a estudar os dados referentes à

7 http://www.sprace.org.br/Twiki/bin/view/Main/AnalysisUED#D0_Detector_Simulation

Page 17: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

17

reconstrução com a versão P17 do software do DZero. Para isso analisamos todos os eventos com múons reconstruídos pelo DZero e selecionamos aqueles com dois múons de mesma carga elétrica.

O background mais importante para os eventos com dois múons de mesma carga elétrica a baixo pT é devido ao decaimento de hádrons, provenientes de quarks pesados, em múons. Denotaremos esse background por background de QCD. Para estimar o background de QCD fizemos uma parametrização a partir dos dados experimentais uma vez que estudar o background a partir do Monte Carlo não seria possível: a enorme seção de choque de produção de jatos exigiria um número exorbitante de eventos gerados. É esperado que múons proveniente desses processos sejam menos isolados do que os múons do sinal, por isso devemos adotar um critério de isolamento para os múons. O que fizemos foi utilizar um conjunto de dados com um múon isolado e o outro não passando no critério de isolamento. Em uma região do espaço de fase dominda pelo background (a saber, caso dos dois múons em direções opostas em φ), fizemos uma parametrização da possibilidade de um múon proveniente de QCD ser considerado isolado. A suposição é que tanto os dados contendo múons isolados quanto os dados com muons não isolados são dominados pelos processos de QCD. Essa parametrização é feita em função do pT do muon. Aplicamos então essa parametrização na região cinemática de interesse e consideramos os dados com múons não isolados, após passar por essa parametrização, como uma estimativa do background de QCD. Para testar a eficiência desse método comparamos os dados do sinal com a estimativa de background para várias distribuições cinemáticas, observamos que para o missing ET a distribuição não era satisfatória (ver Figura 2).

Estudamos a fundo esse problema e percebemos que eventos que apresentavam jatos tinham características diferentes. Propusemos então fazer uma parametrização separada para evento contendo jatos e eventos sem jatos. Apresentamos essa idéia em reunião do grupo de novos fenômenos no final de novembro8. No entanto essa parametrização também não foi plenamente satisfatória, elaboramos um terceiro critério para estimar o background de QCD e continuamos estudando o background de QCD. Devemos notar que o problema da distribuição de missing ET também foi observado em uma análise referente à procura de supersimetria no canal com dois múons de mesma carga elétrica9.

Em nossos estudos verificamos que cortes no pT de cada múon e na massa invariante do par de múons ajudam a separar o sinal do background. Após os cortes observamos uma boa concordância entre os dados experimentais e o background estimado por nós. Com isso foi possível estimar um alcance nesse canal da ordem de 1/R = 230 GeV. Maiores detalhes sobre a análise seguem em anexo em um draft que estaremos submetendo à colaboração para uma apreciação mais detalhada sobre essas questões.

8 http://www-d0.hef.kun.nl///fullAgenda.php?ida=a071983 9 http://www-d0.hef.kun.nl///fullAgenda.php?ida=a072099

Page 18: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

18

Figura 2: Comparação dos dados experimentais com o background para várias

distribuições, considerando a normalização em PT do múon para o background de QCD, como explicado no texto. Notamos que a distribuição de missing ET não apresenta

uma boa concordância entre os dados e o background esperado.

Page 19: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

19

Análises Físicas no CMS Assim como no DZero, o CMS também está organizado em grupos responsáveis

pela construção de objetos físicos (chamados de POG, Physics Object Groups) e grupos de análise (chamados de PAG, Physics Analysis Group). Considerando nossa participação no grupo de Novos Fenômenos no DZero é natural o engajamento no grupo de SUSY e EXÓTICA, onde EXÓTICA é o grupo que trabalha com sinais além do Modelo Padrão mas não SUSY (dimensões extras está encaixado em EXÓTICA).

Em fevereiro de 2007 membros do grupo participaram de um workshop de análise em Miami, FL10 destinado a reunir os grupos da região sul dos EUA que estão interessados em colaborar no CMS. Nesse workshop apresentamos nossos planos de análise e mantivemos as portas abertas para futuras colaborações com os grupos de física de altas energias da Florida. Também mantemos contato com o prof. Greg Landsberg que é membro do CMS.

Como conseqüência deste workshop ficamos encarregados de organizar o workshop seguinte, com auxílio financeiro do CHEPREO. Em agosto de 2007 elaboramos um tutorial11 para análise no CMS, com a participação de estudantes da Flórida International University, além de um pesquisador do CMS, Jorge Rodriguez. Esse tutorial, ministrado por membros de nosso grupo, foi de suma importância para nos familiarizar com o software de análise do CMS. Logo após esse tutorial Thiago Tomei (que ministrou as seções relativas ao software do CMS) foi ao CERN, onde se encontra realizando seu doutorado.

Na próxima seção descrevemos rapidamente o sistema de software do CMS, em seguida descrevemos nossas atividades no grupo de Bósons Vetoriais e Jatos e nosso projeto de análise em dimensões extras.

O Sistema de Software do CMS O sistema de software do CMS deve ser capaz de realizar as seguintes tarefas:

• Processamento e seleção de eventos na High-Level Trigger (HLT) farm, um grupo de computadores dedicado a selecionar, dentre os 109 eventos observados por segundo, aqueles que apresentam algum interesse físico.

• Organização e envio de resultados processados para a análise. Passam pelo Trigger e são armazenados em fita magnética cerca de 100 eventos por segundo. Esses dados devem estar catalogados e acessíveis a toda a colaboração.

• Fornecimento de um conjunto de ferramentas para análise de dados padronizado, abrangente e extensível, para garantir a reprodutibilidade das análises feitas.

Com esses objetivos em mente, o sistema de software do CMS foi estruturado da seguinte maneira:

• Framework (Estrutura) e Serviços. • Simulação. • Filtragem de Eventos e Reconstrução. • Calibração e Alinhamento. • Monitoramento de Qualidade de Dados.

10 Ver agenda da reunião: http://indico.cern.ch/conferenceDisplay.py?confId=10219 11 http://www.sprace.org.br/Twiki/bin/view/Main/CmsTutorial

Page 20: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

20

• Ferramentas de Desenvolvimento de Software e Validação. Os três últimos itens são importantes para o processo de aquisição e validação

dos dados, mas não são utilizados na análise final. Já os três primeiros itens são fundamentais no processo de análise e são detalhados a seguir.

Framework e serviços O processamento de dados do CMS é baseado em uma estrutura chamada

CMS Framework. Nessa estrutura, o conceito principal é o de Evento, um conjunto fechado contendo tanto os dados tomados durante um evento físico (determinado pelo Trigger), quanto os dados derivados destes. Todo o processamento de dados é feito através de módulos, grupos de procedimentos padronizados e encapsulados que agem sobre os dados do evento de acordo com uma ordem definida pelo indivíduo que está executando a análise. Uma característica importante dos módulos é sua incapacidade de intercomunicação, o que diminui a probabilidade de uma interação indesejada entre os módulos. Outra importante é a chamada informação de proveniência, que mantém registros da ação de cada módulo sobre o Evento dentro do próprio Evento, permitindo assim a reprodutibilidade de qualquer análise realizada. Dessa forma, um Evento pode conter objetos representando os dados brutos do detector, objetos reconstruídos, objetos de análise e também os chamados metadados, que descrevem a configuração do software utilizado para a reconstrução de cada objeto assim como as condições de calibração utilizadas em cada reconstrução.

Figura 3: Framework de Software do CMS.

Associados à Framework estão os chamados serviços, que podem ser encarados

como ferramentas que a Framework fornece ao indivíduo que realiza a análise. Existem duas categorias de serviços diferentes:

• Serviços que não têm nenhum efeito sobre resultados físicos: essencialmente, extensões de aplicativos como registros de erros e serviços utilizados para debug de programas. Estes serviços são gerenciados pelo sistema ServiceRegistry.

• Serviços que têm efeito sobre resultados físicos: interfaces para bancos de dados contendo as condições experimentais relativas a um dado Evento, como parâmetros de alinhamento, calibração e medidas de campo magnético. Estes serviços são gerenciados pelo sistema EventSetup.

Simulação Processos de simulação são fundamentais para um projeto do porte do CMS. As

propostas iniciais de detectores são baseadas em cálculos teóricos e simulações dos fenômenos físicos a serem observados, e em uma etapa posterior eventos completos

Page 21: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

21

são simulados, desde o processo fundamental até o conjunto de dados digitalizados análogo àquele que é obtido em uma tomada de dados real. Assim como no DZero, o fluxo detalhado de uma simulação passa por várias etapas. No CMS, consiste nos seguintes passos:

• Configuração e execução de um gerador de eventos de Monte Carlo para produzir arquivos de dados com eventos gerados no padrão HepMC. HepMC é um registro de eventos com orientação a objeto escrito em C++ para Geradores de Monte Carlo em Física de Altas Energias. Seu objetivo é agir tanto como uma “classe container” para armazenar eventos após sua geração, como também como uma estrutura que permita que os eventos possam ser construídos de maneira modular a partir de um conjunto de diferentes geradores. O resultado desta etapa é um conjunto de eventos contendo as partículas observadas no estado final do processo físico de interesse.

• Configuração para a simulação com GEANT4 (configuração dos detectores, cortes de Física, etc.). GEANT4 é um toolkit que fornece os processos físicos necessários para descrever interações eletromagnéticas e hadrônicas em detalhe, além de ferramentas para modelar a geometria dos detectores do CMS. O toolkit também fornece as interfaces exigidas para recuperar as informações de trajetória das partículas através desses detectores e do campo magnético.

• Execução da simulação com GEANT4, com os eventos gerados anteriormente como entrada, para produzir hits persistentes nos detectores. Esta etapa é executada totalmente dentro do arcabouço da CMS Framework.

• Etapa de digitalização (incluindo pile-up12), onde os hits são convertidos em dados digitais (digis) que correspondem à saída da eletrônica de leitura do CMS. As colisões de pile-up são simuladas separadamente do sinal de interesse, e os dois resultados são combinados posteriormente, com a parte de pile-up agindo como uma contribuição dependente da luminosidade. A etapa de digitalização inclui simulações de ruídos e cross-talk, de modo a produzir uma saída tão próxima quanto possível à saída real da eletrônica do CMS.

Os resultados obtidos a partir de simulações utilizando GEANT4 são comparados com dados reais e com resultados obtidos a partir de toolkits diferentes, como GEANT3 (o antecessor do GEANT4) e FAMOS (FAst MOnte-Carlo Simulation, um novo toolkit projetado para ser mais rápido que o GEANT4).

Seleção e reconstrução de eventos Em média, no CMS ocorrem da ordem de 109 colisões por segundo, no entanto

serão gravados em fita eventos a uma taxa de no máximo 100 Hz. Para atingir esse fator de redução o CMS tem um sistema de seleção de eventos em duas etapas. O Level-1 Trigger reduz a taxa inicial para 100 KHz, e após o Level-1 Trigger o evento passa pelo High-Level Trigger que deve reduzir para uma taxa de 100 Hz. Note-se que 100 Hz correspondem aos dados de uma seção de choque de 10 nb, da ordem da seção de choque do processo W → e ν, de forma que o High-Level Trigger tem a função de selecionar eventos interessantes do ponto de vista físico. Dessa forma, o High-Level

12 Pile-up é o fenônemo de interferência entre hits. Devido à alta luminosidade do LHC, duas

partículas podem ativar um mesmo elemento do detector em um intervalo muito curto, de modo que os sinais dos dois hits interfiram entre si.

Page 22: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

22

Trigger deve ser capaz de trabalhar com objetos reconstruídos. Eventos sem interesse são descartados em 2,2 µs, e um sinal é emitido para o Level-1 Trigger para liberar os buffers de dados. Aqui, o conceito de proveniência é utilizado, para garantir a reprodutibilidade da sequência de operações que levou ao aceite ou rejeição do evento.

Reconstrução é a operação de obter quantidades com significado físico (como o momento ou os parâmetros da trajetória de uma partícula) a partir dos dados brutos digitalizados (digis), que podem ser obtidos tanto da eletrônica do experimento como de simulações. No CMS, os mesmos algoritmos de reconstrução são utilizados no High-Level Trigger e na reconstrução offline, mas com parâmetros diferentes. Enquanto na reconstrução offline o objetivo é reconstruir os observáveis com a melhor qualidade possível, no High-Level Trigger a ênfase é dada em descartar eventos de baixo interesse o mais rápido possível. Para esse fim, o High-Level Trigger realiza a chamada reconstrução regional, reconstruindo apenas porções do detector que foram descritas como ativadas pelo Level-1 Trigger.

Na reconstrução offline, o tempo de reconstrução é um problema menor, de maneira que a ênfase é dada à acurácia da reconstrução. Em linhas gerais, o processo de reconstrução pode ser dividido em 3 etapas:

• Reconstrução local: age sobre um conjunto de digis (tanto reais como simulados), e fornece um conjunto de RecHits. RecHits são medidas de posição, no caso do detector em questão ser o Tracker ou o Sistema de Múons, ou clusters calorimétricos, no caso do dos calorímetros Eletromagnético e Hadrônico.

• Reconstrução global: age sobre um conjunto de RecHits, e fornece o resultado final de um subsistema completo. Por exemplo, RecHits do Tracker são utilizados para formar trajetórias de partículas carregadas, e o resultado final é um conjunto de trajetórias.

• Reconstrução final: combina os resultados dos diferentes subsistemas para produzir objetos reconstruídos de alto nível. O exemplo canônico é a combinação de um Muon StandAlone (resultado da reconstrução no Sistema de Múons) e de uma ParticleTrack (resultado da reconstrução no Tracker) compatíveis, de modo a formar um Muon.

De acordo com o processo de reconstrução descrito anteriormente, existem três modos de representar um Evento no CMS:

• FEVT (Full EVent): contém todos os conjuntos de dados de todos os módulos de produção, mais o conjunto de dados brutos. Ocupa de 1 a 2 MB/evento.

• RECO (RECOnstructed Data): contém objetos selecionados, produzidos pelos módulos de reconstrução. Ocupa cerca de 500 kB/evento.

• AOD (Analysis Object Data): um subconjunto do anterior, contem apenas objetos de alto nível. É projetado para ser suficiente para a maioria das análises físicas, e é substancialmente menor que o RECO, ocupando cerca de 50 kB/evento.

Participação no Grupo de Bósons Vetoriais e Jatos Desde setembro de 2007, Thiago Tomei encontra-se no CERN, onde

permanecerá por um ano desenvolvendo seu doutorado. No CERN ele está trabalhando no grupo de Bósons Vetoriais e Jatos. Este grupo, subordinado ao grupo CMG (formado essencialmente por físicos baseados no próprio CERN), tem como objetivo possibilitar uma comparação entre os primeiros dados experimentais a serem

Page 23: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

23

obtidos no CMS e as previsões do Modelo Padrão. Essa comparação é fundamental para qualquer estudo de física além do Modelo Padrão (BSM) que se deseje fazer, em particular um estudo sobre dimensões extras. A existência de assinaturas do tipo léptons + jatos + missing ET em diversos modelos BSM torna necessário o estudo do background W/Z + jatos, com o bóson decaindo leptonicamente. O observável principal do estudo é a razão (dσW/dNj)/(dσz/dNj) (razão W/Z) com ênfase no início da tomada de dados.

A razão W/Z conecta duas teorias que agem em diferentes regimes: a teoria eletrofaca, atuante nos decaimentos leptônicos dos bósons W e Z, e a cromodinâmica quântica (QCD), atuante na formação dos jatos hadrônicos. Em termos de análise, a seleção dos bósons W e Z a partir dos léptons detectados em um dado evento está relacionada com o setor eletrofraco, enquanto a medida do número de jatos no mesmo evento está relacionada com o setor de QCD. A idéia fundamental é utilizar o estudo do setor eletrofraco, que é naturalmente mais preciso, para manter as incertezas do estudo do setor de QCD sob controle.

Um aspecto fundamental desse trabalho é a concordância entre a medida experimental da razão W/Z e o cálculo da previsão teórica do Modelo Padrão, que inclui diferentes ordens da teoria de perturbação. Deve-se, portanto, fazer uma validação dos diferentes geradores de eventos de Monte Carlo: ALPGEN13, SHERPA14, MADGRAPH15 e outros. Essa validação permite identificar quais são os parâmetros ajustáveis relevantes dos geradores (especialmente os relacionados ao setor de QCD) e seus efeitos nos observáveis físicos como a multiplicidade de jatos e as distribuições de momento transversal.

Trabalhamos na validação do gerador ALPGEN para a geração de eventos W/Z+jatos. No CMS é utilizado o ALPGEN v212 para a geração do elemento de matriz da interação dura e PYTHIA v6409 para o párton shower, evento subjacente e hadronização. Para evitar contagens duplas no espaço de fase (eventos com n pártons duros + 1 glúon duro emitido durante o párton shower correspondem a uma fração dos eventos W+n+1 pártons duros fornecidos pelo elemento de matriz), adota-se o procedimento MLM de correspondência16. No entanto, percebemos que mesmo utilizando o procedimento MLM, existem eventos de Monte Carlo onde o número de jatos é muito diferente do número de pártons duros originais (ver Figura 4). Isso mostra que para estudar eventos W+n jatos, não é suficiente partir de eventos W+n pártons duros; uma amostra inclusiva de eventos com W+1, 2, n, ..., n+m pártons deve ser utilizada para obter observáveis com sentido físico. Maiores detalhes desse estudo estão na nota do CMS preparada por Thiago Tomei cuja versão preliminar segue em anexo.

13 http://mlm.home.cern.ch/mlm/alpgen/ 14 http://www.sherpa-mc.de/

15 http://madgraph.hep.uiuc.edu/index.html 16 M. L. Mangano, M. Moretti, F. Piccinini e M. Treccani, JHEP 0701, 013 (2007)

Page 24: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

24

Figura 4: Distribuição do número de jatos obtidos para amostras de W+0 e W+3 partons. Algoritmos Iterative Cone e SISCone, com corte no momento transversal de 20 GeV e

parâmetro R = 0.7. Um resultado deste estudo foi o mapeamento da razão taxa de eventos /

multiplicidade de jatos como função dos parâmetros do algoritmo de jato, considerando os parâmetros de corte no pT X dimensão do jato, para uma série de algoritmos: Iterative Cone, CDF RunII Midpoint, Kt algorithm, SISCone. Entretanto, o comportamento é o mesmo para eventos W+jatos e Z+jatos, de modo que a razão W/Z é relativamente estável com relação a variações desses parâmetros.

O grupo de jatos do CMS tem como um de seus objetivos a validação de certas ferramentas utilizadas para a reconstrução dos eventos, como os algoritmos de jatos: procedimentos que permitem, a partir de uma coleção de objetos de entrada (pártons simulados, hádrons simulados ou atividade calorimétrica) derivados dos pártons do estado final da interação dura, obter uma estimativa para o momento desses pártons. Esses algoritmos têm sido objeto de discussão recentemente, e muita ênfase foi colocada na necessidade de um algoritmo bem definido, que apresente uma série de características: seguro contra emissões infravermelhas e colineares, independente dos detalhes do detector e independente da natureza dos objetos de entrada. Ao trabalhar com jatos e validação de Monte Carlo para processos envolvendo vários pártons no estado final, o grupo de Bósons Vetoriais e Jatos colabora fortemente com o grupo de jatos. Um estudo que estamos realizando refere-se à definição de um fator de qualidade para os algoritmos de jatos, relativo à quão bem um dado algoritmo pode, em função dos seus parâmetros de entrada, reconstruir jatos que representem de maneira fiel os pártons duros.

Page 25: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

25

Outro aspecto do trabalho na colaboração consiste na execução de serviços: estudos pontuais relacionados a necessidades imediatas da colaboração. Um serviço importante do qual Thiago Tomei participou foi a investigação de eventos de Monte Carlo anômalos com W+jatos onde não era detectada nenhuma atividade no calorímetro hadrônico. A fonte do problema revelou-se um erro na interface ALPGEN-PYTHIA-CMSSW, onde o último evento de uma rodada de geração de Monte Carlo, ao não ser aprovado pelo procedimento MLM, era erroneamente mantido na memória, mas não recebia tratamento posterior pelo PYTHIA, i.e. não sofria a hadronização. Dessa maneira, quarks e glúons eram erroneamente rotulados como partículas estáveis, o evento era gravado em disco, e a simulação seguia sem erros. Naturalmente, quando da simulação da interação das partículas com o detector (realizada pelo software GEANT4), a ausência de uma definição para interações entre quarks/glúons e átomos levava a uma total falta de atividade calorimétrica. Esse problema foi estudado e documentado, e um filtro para excluir esses eventos da análise foi proposto.

Busca por Dimensões Extras em Colisores Hadrônicos Nosso grupo está engajado na busca por dimensões extras no CMS, sendo que o

tema da tese de doutorado de Thiago Tomei é a procura por sinais de dimensões extras no modelo de Randal Sundrum17. Esse estudo está sendo realizado em colaboração com o grupo de Bósons Vetoriais e Jatos que apresenta interesses similares para análise de física além do modelo padrão.

Nesse modelo, o problema da hierarquia – a aparente discrepância entre a escala de energia da quebra da simetria eletrofraca e a escala de Planck - é atacado através da proposta de um Universo 5-dimensional do tipo ''braneworld''. Este Universo seria munido de duas 4-branas onde se localizam o Modelo Padrão e a Gravidade Quântica, respectivamente, com a ligação entre essas duas branas sendo feita por uma quinta dimensão de curvatura negativa constante e topologia ''orbifold''. Por sua vez, a curvatura negativa constante da dimensão extra permite uma ligação suave entre a escala eletrofraca e a escala de Planck.

A fenomenologia desse modelo18 consiste na quantização perturbativa da gravidade na escala eletrofraca e na expansão do campo do gráviton em modos de Kaluza-Klein (KK). O primeiro modo KK do graviton aparece na 4-brana do Modelo Padrão (i.e., no nosso Universo observável) como uma ressonância massiva de spin-2 que se acopla de maneira universal com outros campos. A busca por assinaturas experimentais desse modelo consiste em detectar os produtos de decaimento dessa ressonância. O canal que estamos estudando é o decaimento do gráviton em dois bósons Z, com subsequentes decaimentos puramente hadrônicos. A vantagem principal de se optar pelo canal puramente hadrônico é o ganho de um fator de 500 na razão de ramificação com relação aos decaimentos leptônicos (mesmo lépton) de ambos os Zs. Isso se traduz na possibilidade da descoberta do gráviton com apenas 100/pb de luminosidade acumulada, dependendo dos parâmetros do modelo.

Atualmente, estamos estudando a fundo as características do sinal procurado através de simulações de Monte Carlo em busca de variáveis robustas que permitam diferenciar esse sinal dos eventos de QCD, que constituem a maior parte dos eventos observados no LHC. Na Figura 5 mostramos o espaço de parâmetros do modelo, com a

17 L. Randall and R. Sundrum, Phys. Rev. Lett. 83, 3370 (1999) 18 H. Davoudiasl, J. L. Hewett and T. G. Rizzo, Phys D 63, 075004 (2001)

Page 26: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

26

região excluída pelo Tevatron e três pontos do espaço de parâmetros que estamos utilizando nas simulações de Monte Carlo.

Figura 5: Região não-excluída do espaço de parâmetros para o modelo de Randall-Sundrum. Os pontos vermelhos representam três pares de parâmetros (massa, constante de acoplamento do gráviton) que estão sendo estudados na primeira parte

da análise com simulações de Monte Carlo.

IV. Processamento de Dados O SPRACE e o Processamento no CMS

A participação do SPRACE no LHC teve início em janeiro de 2003, quando tanto o acelerador como o detector do CMS já haviam sido completamente financiados pelos demais membros da colaboração. Depois de seguidas discussões com o spokesman e com o Collaboration Board do CMS chegou-se à conclusão de que a melhor forma do Brasil contribuir para o experimento seria através do processamento e armazenamento de dados. Isto levou à nossa iniciativa de implantar um centro de análise em São Paulo operando como uma Tier-2 na estrutura de processamento distribuído em grid do WLCG.

Essa abordagem não só permitiu a participação paulista no experimento como trouxe algumas vantagens importantes. Em primeiro lugar, a verba investida permaneceu no Brasil tendo sido gasta até o momento com a indústria nacional. Ao mesmo tempo em que o hardware permanece no Brasil, somos capazes de gerar competência local em áreas como computação de alto desempenho, processamento em grid, redes de altas velocidades, etc. Por outro lado, a proximidade da infra-

Page 27: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

27

estrutura física do cluster permite que muitos dos serviços que necessitam ser prestados para a colaboração, como forma de manter o experimento em funcionamento (shifts), possam ser executados aqui mesmo no Brasil sem a necessidade de deslocamento dos pesquisadores até o CERN.

A seguir abordaremos as atividades do SPRACE relacionadas ao processamento de dados no que se refere à infra-estrutura física e de software.

Infra-estrutura Física No final de 2006 a infra-estrutura computacional do SPRACE foi completada,

com o término da implantação da fase 3. Assim, iniciamos o ano de 2007 com o cluster operando a plena capacidade, com poder de processamento de cerca de 400 kSPECint2000 e pouco mais de 10 Terabytes de capacidade de armazenamento de dados.

Uma atualização no parque computacional mostrou-se necessária a partir de novembro de 2007, quando detectamos um gargalo na taxa de transferência de dados do subsistema de armazenamento, provocado pela sobrecarga no barramento interno do antigo servidor de armazenamento spraid.if.usp.br, um servidor Dell PowerEdge 2650 gerenciando as 4 unidades de armazenamento Dell PowerVault 220S listadas a seguir.

Em março de 2008, juntamente com o upgrade do middleware do OSG, decidimos substituir o antigo servidor de armazenamento spraid.if.usp.br pelos servidores spraid01.sprace.org.br e spraid02.sprace.org.br abaixo detalhados, cada um controlando apenas duas unidades de armazenamento Dell PowerVault 220S. Substituímos também os antigos servidores que realizam as funções de elemento de computação spgrid.if.usp.br (Dell PowerEdge 1850) e de elemento de armazenamento spdc00.if.usp.br (servidor idêntico a um nó de processamento da primeira fase, abaixo listado) respectivamente pelos servidores osg-ce.sprace.org.br e osg-se.sprace.org.br, também descritos a seguir. Dessa forma os serviços do OSG passaram a ser executados por duas das máquinas com a melhor configuração de hardware de todo o cluster, e os serviços de transferência de dados foram divididos em 2 servidores.

Portanto, desde março de 2008, o cluster conta com 83 servidores (com 224 núcleos de processamento) dedicados exclusivamente ao processamento de jobs, mais 5 servidores principais (com 16 núcleos de processamento). Os servidores principais realizam as funções de front-end, OSG gatekeeper, controle de armazenamento centralizado, e controle dos pools de armazenamento distribuído. Os servidores de processamento são os que efetivamente executam o processamento de jobs. Dentre os 32 servidores adquiridos na fase 3, que incorporam a tecnologia de núcleo duplo (dual-core), 29 foram convertidos em nós de processamento, 2 foram convertidos em servidores de gerenciamento e 1 foi configurado como refletor do EVO, sistema virtual de vídeoconferência dedicado principalmente a comunidade de altas energias, dentre elas o CMS. Logo, a somatória de unidades ou núcleos de processamento perfaz um total de 244. A capacidade da memória principal de cada servidor é tal que para cada núcleo de processamento há pelo menos 1 GB de memória.

Detalhamos a seguir a estrutura computacional do SPRACE, atualmente composta dos seguintes elementos:

1. Nós de processamento • 22 servidores com 2 processadores Intel Xeon de 2.4 GHz cada, com FSB

(Front Side Bus) de 533 MHz, 512 MB de memória cache L2, núcleo

Page 28: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

28

Northwood com Hyper-Threading e tecnologia de 130 nm, lançados pela Intel em 2003 (codinome Prestonia). Estes servidores foram adquiridos na primeira fase do projeto, entre dezembro e janeiro de 2004 (node01.grid a node22.grid).

o Poder de processamento: (44 x 900 SI2K) = 39.6 kSI2K • 32 servidores com 2 processadores Intel Xeon de 3.0 GHz cada, com FSB

de 800 MHz, 1 MB de memória cache L2, com arquitetura EM64T e tecnologia de 90 nm, lançados pela Intel em 2004 (codinome Nocona). Este segundo lote de servidores de processamento foi adquirido na segunda fase do projeto, entre maio e junho de 2005 (node23.grid a node54.grid).

o Poder de processamento: (64 x 1350 SI2K) = 86.4 kSI2K • 29 servidores com 2 processadores Intel Xeon de núcleo duplo (dual-

core) de 2.0 GHz cada, com FSB de 1333 MHz, 4 MB de memória cache L2, com microarquitetura Core 2 e tecnologia de 65 nm, lançados pela Intel em 2006 (codinome Woodcrest). Este terceiro lote de servidores foi adquirido na terceira fase do projeto, entre agosto e setembro de 2006 (node55.grid a node83.grid).

o Poder de processamento: (116 x 2100 SI2K) = 243.6 kSI2K 2. Servidores de gerenciamento • 1 servidor tautec, atualmente acumulando as funções de web server,

servidor de login e console do cluster, com 4 processadores idênticos aos dos nós de processamento da primeira fase (sprace.if.usp.br).

• 1 servidor com 2 processadores idênticos aos dos nós de processamento da terceira fase, que exerce a função de elemento de armazenamento do OSG (osg-se.sprace.org.br).

• 1 servidor com 2 processadores idênticos aos dos nós de processamento da terceira fase, que exerce a função de elemento de computação do OSG (osg-ce.sprace.org.br).

• Dell PowerEdge 2650 com 2 processadores idênticos aos dos nós de processamento da primeira fase, com a função de servidor de armazenamento, gerenciando 2 unidades de armazenamento Dell PowerVault 220S abaixo listadas, adquiridas na primeira fase do projeto (spraid02.sprace.org.br).

• Dell PowerEdge 1850 com 2 processadores idênticos aos dos nós de processamento da segunda fase, com a função de servidor de armazenamento, gerenciando 2 unidades de armazenamento Dell PowerVault 220S abaixo listadas, adquiridas na segunda fase do projeto (spraid01.sprace.org.br).

o Poder de processamento: (6 x 800 SI2K) + (2 x 1350 SI2K) + (8 x 2100 SI2K)= 24.3 kSI2K

3. Servidores de teste e vídeoconferência • 2 servidores Supermicro com 2 processadores Intel Xeon de núcleo

quádruplo (quad-core) de 2.33 GHz cada, com FSB de 1333 MHz, 8 MB de memória cache L2, com microarquitetura Core 2 e tecnologia de 65 nm. Ambos dispõem de 8 GB de memória e 4 discos SATA-II de 750 GB cada. Esses servidores foram doados pelo Caltech, e são usados para gerar tráfego no enlace internacional, como parte da colaboração CHEPREO.

Page 29: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

29

• 1 servidor com 2 processadores idênticos aos dos nós de processamento da terceira fase, que exerce a função de espelho do sistema de vídeoconferência virtual EVO (evo.sprace.org.br).

4. Armazenamento de dados • 2 unidades Dell PowerVault 220S, com 14 discos SCSI Ultra320 de 146 GB x

10.000 rpm cada. Estas unidades foram adquiridas na primeira fase do projeto. Conectadas atualmente ao servidor spraid02.sprace.org.br.

• 2 unidades Dell PowerVault 220S, com 14 discos SCSI Ultra320 de 300 GB x 10.000 rpm cada. Estas unidades foram adquiridas na segunda fase do projeto. Conectadas atualmente ao servidor spraid01.sprace.org.br.

o Capacidade total de armazenamento central: (2 x 1.8 TB + 4 x 1.8 TB = 10.8 TB)

Fazendo a somatória dos valores de SI2K dos servidores adquiridos em cada lote

no decorrer das 3 fases do projeto, obtém-se que o poder de processamento total do cluster atual é de cerca de 400 kSI2K19. A medida SI2K é uma abreviação para SPEC Int 2000, um benchmark publicado pela SPEC20 (Standard Performance Evaluation Corporation), corporação sem fins lucrativos formada para estabelecer e manter um conjunto de benchmarks padronizados relevantes que podem ser aplicados às gerações atuais de computadores. Em particular, o SPEC Int mede a capacidade de processamento aritmético de números inteiros.

Infra-Estrutura de Software Como parte de nossa participação no esforço de processamento para a

Colaboração CMS, o SPRACE passou a fazer parte do Open Science Grid (OSG)21. O OSG é a iniciativa americana de processamento distribuído que apóia a computação científica através da colaboração entre pesquisadores, desenvolvedores de software e engenheiros de rede. O OSG vem operando uma rede internacional de recursos computacionais que permite acesso aos pesquisadores de diversas áreas a esses recursos compartilhados.

Em meados de 2006 o SPRACE passou a produzir os primeiros eventos de Monte Carlo oficiais para a colaboração CMS através da infraestrutura do OSG, trocando dados com as demais Tier1 e Tier2, e realizando trabalhos de análise em Grid. Desde então o SPRACE atua como um Tier2 plenamente funcional do experimento CMS. O T2_BR_SPRACE vem se juntar aos Tier2 de Caltech, MIT, UCSD, Wisconsin, Florida, Purdue, Nebrasca e Rio formando o sistema de processamento das Américas do CMS, sob a centralização do Tier1 do Fermilab.

Além da capacidade de processar os trabalhos de grid da colaboração, outro requisito para a inserção do SPRACE no sistema de processamento distribuído do CMS é ser capaz de transferir grandes volumes de dados. Usando o sistema de gerenciamento de transferência de dados do CMS, o PhEDEx, já transferimos cerca de 100 TB de dados entre o Fermilab e o SPRACE. Em abril de 2008 o software do PhEDEx foi atualizado para

19 http://www.sprace.org.br/Twiki/bin/view/Main/ComputerPower 20 http://www.spec.org/cpu2000/results/cint2000.html 21 http://www.opensciencegrid.org/

Page 30: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

30

a versão 3.0.0 para que o SPRACE participe de diversos testes de larga escala, os chamados “full-scale challenges”, nos quais simulações de transferência de dados serão executadas a uma taxa próxima de 100% (daí o termo “full-scale”) das necessidades de todos os quatro experimentos juntos, durante a operação normal do LHC. Dentre eles o CSA08 (Computing, Software, and Analysis challenge 2008) e o CCR08 (Combined Computing Readiness challenge 2008). O CCR08 será o primeiro grande teste, e está sendo preparado para iniciar em maio de 2008, pouco antes do comissionamento do LHC. Neste grande teste, os quatro experimentos serão exercitados em conjunto. Assim, em meados de 2008, a eficiência, a escalabilidade e a robustez das redes de comunicação internacionais serão testadas ao limite, pois o fator decisivo para o comissionamento de cada centro de processamento será medido pelo número de jobs que este é capaz de completar diariamente.

Desde o início de 2007 o SPRACE vem também realizando suas atividades de processamento de dados para o experimento DZero utilizando a infraestrutura do OSG, tendo produzido desde então (até fevereiro de 2008) aproximadamente 9,5 milhões de eventos de Monte Carlo e reprocessado aproximadamente 18,4 milhões de eventos reais na versão P20 do software de reconstrução da colaboração. Dentro da infra-estrutura de processamento distribuído, tanto o CMS quanto o DZero são organizações virtuais que utilizam os recursos disponibilizados pelo OSG para a execução de seus trabalhos. O SPRACE está hoje completamente inserido dentro do OSG. Mais ainda, em 2007 os grids OSG e EGEE (o grid da comunidade européia) começaram a operar de forma compatível de modo que hoje em dia o SPRACE é capaz de processar indistinta e simultaneamente trabalhos de análise do CMS submetidos por um pesquisador da Itália, tarefas de reprocessamento de dados do DZero gerenciadas centralmente a partir do Fermilab e simulações para membros de organizações virtuais de bioinformática localizados em qualquer ponto do planeta, sem que haja necessidade de intervenção explícita para isso.

O SPRACE participa do Open Science Grid contribuindo com vários elementos que descrevemos a seguir.

Elemento de Computação O Elemento de Computação do Open Science Grid no SPRACE está localizado

na máquina osg-ce.sprace.org.br. No OSG este elemento de computação está registrado como sendo a localidade SPRACE-CE. Ele funciona como gateway dos trabalhadores do cluster e como servidor de login dos usuários locais. Ele serve ao cluster as seguintes funcionalidades:

• Middleware do OSG. Desde março de 2008 está instalada no nosso

elemento de computação a versão 0.8.0 do conjunto de serviços do OSG, o mais recente. Este conjunto de serviços contém os seguintes pacotes: o Globus Toolkit – Middleware básico do sistema de manuseio de

trabalhos do Grid o MonALISA – Ferramenta de monitoramente global o GUMS (Grid User Membership Service) – Verifica a autenticidade

dos requerentes dos serviços de grid consultando seus registros nas diversas Organizações Virtuais atendidas pelo SPRACE e os mapeia em contas locais, determinando suas autorização e política de uso dos recursos do SPRACE

Page 31: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

31

o GIP (Generic Information Provider) – Provê aos serviços de informação do OSG as informações relativas à existência e disponibilidade dos recursos de processamento do SPRACE.

o BDII – Provê ao EGEE, Grid utilizado pelos membros do LHC Computing Grid localizados na Europa, as mesmas funcionalidades do GIP para o OSG. Necessário para compatibilização dos recursos computacionais mundialmente distribuídos do experimento CMS

• Condor: Sistema de gerenciamento, ordenamento e distribuição de trabalho aos nós de processamento. Recebe os trabalhos do middleware do OSG e os executa nos recursos existentes no cluster.

• Ganglia: Sistema de monitoramento do funcionamento do cluster. Provê informação em html do estado dos componentes do cluster, tais como carga de trabalho, ocupação de memória, tráfego de dados etc. Atualiza as informações a cada minuto e mantém um histórico de até um ano.

• CMSSW: Conjunto de pacotes do experimento CMS, utilizado para a realização das simulações de Monte Carlo e processamento dos trabalhos de análise de dados do experimento.

• NFS: Serviço de sistema de arquivos de rede que exporta o software do OSG, o Condor e o CMSSW aos nós de trabalho, bem como o home dos usuários locais aos diversos elementos do cluster que o necessite.

Nós de Trabalho Os serviços oriundos do Grid são executados em partições do disco local dos

trabalhadores e apagados quando do término do trabalho. Os trabalhadores estão localizados na rede local do cluster e se comunicam com a rede mundial através do firewall localizado no gateway do cluster.

Elemento de Armazenamento Desde março de 2008 o Elemento de Armazenamento do Open Science Grid no

SPRACE está localizado na máquina osg-se.sprace.org.br e registrada como sendo a localidade SPRACE-SE. Nele foram instalados as seguintes funcionalidades e serviços:

• pNFS: Sigla de Perfectly Normal File System, o pNFS é um sistema de

arquivo em que recursos de armazenamento fisicamente distribuídos, como discos em máquinas distintas, aparecem como sendo parte de um único sistema de arquivos contínuo. Ele é constituído basicamente por um banco de dados postgresql com interface de acesso similar aos comandos posix usuais de manipulação de arquivos.

• dCache: Sistema de catalogo de arquivos. Utiliza o pNFS para acesso aos recursos de armazenamento em disco, e pode ser utilizado também para armazenamento em fita.

• SRM: O Storage Resource Manager faz parte do middleware do OSG para prover acesso uniforme aos recursos computacionais do Grid. Sua função básica é traduzir o Logical File Name com o qual os arquivos são universalmente identificados no Grid em Physical File Name, que é como os arquivos são identificados e localizados pelos sistemas locais. É também o serviço do Grid encarregado de prestar informações e realizar

Page 32: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

32

operações com os arquivos dos diversos Elementos de Armazenamento do Grid. Faz a interface entre o Grid e o dCache local ao cluster.

• PhEDex: Este é o sistema utilizado pela colaboração CMS para a movimentação de dados entre os diversos elementos de processamento e armazenamento utilizados pelo experimento. Este serviço é encarregado de manter o catálogo com a localização das réplicas dos dados globalmente distribuídos e realizar a sua movimentação para o processamento dos dados que os requisitar. Utiliza o SRM para realizar suas operações.

• Frontier: É o sistema do CMS de acesso e distribuição das informações do banco de dados da calibração do detector e do sistema de aquisição de dados, fundamental para a realização da análise dos dados adquiridos. Este sistema utiliza o squid como cache dos arquivos requisitados pelos trabalhos locais, diminuindo a carga imposta à rede para a execução dos trabalhos.

Nós de Armazenamento do dCache Assim como o Elemento de Computação possui os nós de trabalho que lhe

disponibilizam poder de processamento, da mesma forma o Elemento de Armazenamento possui seus nós de armazenamento que lhe disponibiliza capacidade de armazenamento. No Elemento de Armazenamento do SPRACE cada nó de armazenamento executa seus próprios agentes de transferência de dados e possui conectividade com a rede mundial de modo a aumentar sua capacidade integrada de transferência de dados. Nele estão instalados os pools do dCache para o compartilhamento do armazenamento, e os clientes do SRM para a execução da transferência dos dados para aquele determinado pool. Em sua atual configuração o SPRACE possui apenas dois servidores de armazenamento, aos quais se conectam os módulos RAID, com uma capacidade total de 12 TB. O servidor de melhor configuração fornece 4 pools de 1,5 TB cada ao dCache, enquanto o servidor mais antigo fornece 1 pool de 1,5 TB ao dCache e exporta via NFS, aos demais elementos do cluster, a área onde estão localizados os aplicativos específicos de cada Organização Virtual.

Planejamento para o Futuro Conforme detalhado anteriormente, a somatória dos valores de SI2K estimados

para os servidores adquiridos pelo projeto SPRACE até o presente momento resulta em um poder de processamento total de cerca de 400 kSI2K. Esta capacidade de processamento atual do SPRACE é cerca de 10% menor do que a capacidade do menor dos centros Tier-2 dos EUA – a University of Florida – o qual está na iminência de sofrer um grande upgrade. Uma comparação da capacidade de armazenamento do SPRACE com os centros regionais americanos mostra uma situação ainda mais crítica: o SPRACE tem hoje pouco mais de 10 TB de espaço de armazenamento central, sendo que destes apenas 7.5 TB (5 pools de 1.5 TB cada) estão efetivamente disponíveis para uso externo, acessíveis pela infra-estrutura do OSG. Esta capacidade de armazenamento atual do SPRACE corresponde a cerca de 12.5% da capacidade disponibilizada pelo menor dos centros de classe Tier-2 americanos. Outro grande problema é a defasagem do SPRACE em relação à largura de banda do enlace de rede que liga cada centro Tier-2 ao Fermilab, que dispõe atualmente de um enlace máximo de 1 Gbps, enquanto os centros americanos operam a 10 Gbps.

Embora uma comparação com os centros de processamento Tier-2 americanos seja válida do ponto de vista de avaliação das potencialidades e condições técnicas,

Page 33: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

33

a comparação que de fato deve ser feita é em relação ao que a colaboração CMS define como recursos mínimos para um centro regional operar em classe Tier-2. Esta definição encontra-se no documento CMS: The Computing Project – Technical Design Report22. O capítulo 3 deste documento descreve a infra-estrutura hierárquica distribuída em Tiers, bem como as funções, os serviços e a capacidade de processamento e armazenamento minimamente requerida para cada Tier. Para um centro regional de classe Tier-2, o documento estabelece como capacidade mínima de processamento um valor correspondente a 900 kSI2K, e como capacidade mínima de armazenamento o valor 200 TB. O documento também estabelece como condição minimamente aceitável a disponibilidade de um enlace de rede de 1 Gbps, porém recomenda o uso de um enlace de 10 Gbps.

Todos os centros de classe Tier-2 mundiais ligados à colaboração CMS têm preparado suas infra-estruturas em função dos valores considerados como minimamente aceitáveis: 1.000 kSI2k de poder de processamento, 200 TB de capacidade de armazenamento, e 10 Gbps de largura de banda até o correspondente Tier 1. Um fator a se considerar é que o Technical Design Report é um documento elaborado em 2005. Felizmente, ao menos até o presente momento, os valores definidos naquele documento continuam perfeitamente válidos, mesmo com o rápido avanço da tecnologia.

Levando em conta estas considerações, a partir do segundo semestre de 2007 iniciamos consultas a fornecedores para formulação de uma nova configuração de hardware para o SPRACE, capaz de atender os requisitos mínimos acima citados. Como resultado destas consultas, geramos uma especificação técnica para atualização do parque computacional do SPRACE, detalhada a seguir:

• 32 servidores de processamento, cada um com 2 processadores quad-core de última geração (Intel Harpertown de 2,83 GHz) e 16 GB de memória. Este modelo de processador é o que atualmente apresenta a melhor relação custo x desempenho. A capacidade de memória atende às necessidades exigidas pelos softwares de análise que serão executados nestes equipamentos: 2 GB de memória por núcleo de processamento.

• 4 unidades de armazenamento, cada uma com 48 TB (terabytes) de capacidade, totalizando 192 TB brutos. Considerando a formatação e divisão dos discos em estruturas redundantes (RAID 5), obtém-se uma capacidade líquida de pouco mais de 150 TB, que somada aos atuais 10 TB, resulta numa capacidade total de aproximadamente 160 TB.

• Um equipamento de rede de alta capacidade, com configuração mínima para conectar os servidores principais através de enlaces de 1 + 1 Gbps, os 4 servidores de armazenamento através de enlaces de 10 Gbps, e ao mesmo tempo implementar uma rede interna independente, robusta e segura. O equipamento também dispõe de uma saída externa de 10 Gbps para conexão direta com o backbone da rede ANSP, através do Centro de Computação da USP.

• Um conjunto de servidores de apoio ao processamento, à análise de dados, e à comunicação por videoconferência.

• 2 unidades de apoio ao backup do centro de processamento, uma portátil, baseada em discos magnéticos, para uso diário, e outra de

22 http://cmsdoc.cern.ch/cms/cpt/tdr/cms-ctdr-col.pdf

Page 34: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

34

médio porte, baseada em fita magnética, para armazenamento seguro e de longo prazo.

• Um conjunto de equipamentos, partes e peças auxiliares para o centro de processamento, incluindo no-breaks, rack de rede, cabeamento, unidade de gerenciamento remoto, e peças de reposição.

• Um conjunto de equipamentos auxiliares de apoio à pesquisa, incluindo um sistema de videoconferência, desktops, impressoras e laptops.

A aquisição destes equipamentos para a atualização do parque computacional

do SPRACE é de grande importância para garantir a participação do SPRACE como Tier2 da Colaboração CMS. Um orçamento detalhando destes equipamentos consta de um novo projeto temático recentemente submetido pelo grupo à FAPESP.

Page 35: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

35

V. Educação e Divulgação Científica Grid Educacional23

No decorrer de 2007, elaboramos um projeto de disseminação, em parceria

com a Intel Semicondutores do Brasil, relacionado a atividades de treinamento na área de Grids computacionais. O resultado, que incluiu alguns acordos de doação com renomadas empresas provedoras de tecnologia, culminou numa proposta de construção de uma infra-estrutura computacional – que denominamos Grid Educacional – composta por 10 servidores de última geração, para dar apoio ao ensino e divulgação das tecnologias de Grids.

O projeto nasceu de uma idéia proposta por um engenheiro da Intel Brasil no início de 2007. A partir daí, diversos representantes de empresas multinacionais de alta tecnologia foram contatados, e aqueles que se interessaram pelo projeto repassaram a idéia às suas respectivas matrizes, nos EUA. Desses contatos resultou a doação de 10 servidores de última geração, uma negociação da qual participaram as seguintes empresas: a Intel, que forneceu os processadores, interfaces de rede e ferramentas de software, a SGI, que forneceu o barebone (hardware básico, excetuando-se processador, memória e disco), a Kingston, que ofertou as memórias, e a Seagate, que forneceu os discos rígidos. As negociações ocorreram através dos representantes de vendas dessas empresas no Brasil, mas as doações foram feitas pelas respectivas matrizes nos EUA. As partes e peças doadas encontram-se atualmente na Florida International University em Miami, FL, nos EUA. Em abril deste ano um de nossos estudantes esteve lá e realizou a integração e testes dos servidores deixando-os preparados para serem enviados ao Brasil. Estamos solicitando apoio da FAPESP para a importação desse material.

Uma vez recebidos os servidores, a fase seguinte será a instalação dos mesmos em diferentes pontos geográficos na região metropolitana de São Paulo, de modo a formar uma infra-estrutura distribuída para o treinamento de estudantes, administradores de sistemas e pesquisadores nas tecnologias de computação em Grid. Para otimizar ao máximo o uso desses servidores, pretendemos usar modernas técnicas de virtualização, de modo a permitir que cada servidor real acomode diversos servidores virtuais, multiplicando assim a quantidade total de máquinas disponíveis. Como se trata de uma plataforma educacional, que prescinde de alto desempenho, a técnica de virtualização torna-se bastante adequada. Os pontos geográficos escolhidos são laboratórios de pesquisa situados na USP, UNESP, UFABC e, possivelmente, UFSCAR. A abordagem através da virtualização reduz drasticamente o número de servidores que precisam ser gerenciados, além de trazer grande flexibilidade, pois permite rápida instalação e livre experimentação, em um ambiente seguro e controlado.

Tradicionalmente, construir um site de Grid completo usando middlewares complexos, como os usados pelo OSG e EGEE, requer a instalação de múltiplos serviços distintos, usando diversos servidores. Logo, uma configuração padrão de um Grid site demanda uma quantidade significativa de hardware. Podemos considerar, de forma conceitual apenas, que seria necessário um mínimo de quatro servidores para se construir um Grid site completo:

23 http://www.sprace.org.br/Twiki/bin/view/Main/GridEducacional

Page 36: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

36

• Um Computing Element (CE), responsável por receber os jobs destinados ao seu site e distribuí-los aos servidores de processamento

• Um Storage Element (SE), responsável por centralizar os serviços de armazenamento e recuperação de dados do site

• Um Resource Broker (RB), responsável por examinar os requisitos de cada job submetido e nviá-lo para o Computing Element mais adequado

• Uma User Interface (UI), uma espécie de portal a partir do qual os usuários acessam o site e submetem seus jobs ao Resource Broker

Além desses, obviamente é também necessário dispor de um conjunto de worker nodes (WN), que são os elementos que de fato executam os jobs destinados a este site. A abordagem que usamos neste projeto considera o uso de um par de servidores (reais) para implementar todos esses serviços, através do uso de técnicas de virtualização. Essa idéia foi baseada no conceito conhecido como “Grid-in-a-box”, que considera a instalação de um Grid site completo em um único servidor real, o qual é dividido em vários servidores virtuais. O uso dessa técnica está se disseminando com muita rapidez, devido às vantagens que ela traz: ao invés de se usar várias máquinas trabalhando em conjunto para acomodar toda a infra-estrutura de um Grid site, criam-se várias máquinas virtuais em um só servidor. É uma forma muito econômica de se estabelecer uma infra-estrutura de Grid para fins de treinamento, porque evita não só a aquisição de um grande conjunto de servidores, como também reduz drasticamente o custo total de propriedade (espaço físico, refrigeração, consumo de energia, gerenciamento, manutenção, tempo de preparação do site para o treinamento, etc). Como serão usados para fins de treinamento, não existe a preocupação em se extrair o máximo desempenho desses sistemas.

Nossa proposta está baseada nesse conceito, porém ao invés de usarmos um único “box”, consideramos mais adequado usar um par de servidores para simular um Grid site completo. A Figura 6 a seguir ilustra essa idéia.

Figura 6: Implementação de um Grid site completo em um par de servidores

A tecnologia de virtualização permite que os recursos físicos de um servidor

(núcleos de processamento, memória, disco, rede, etc) sejam compartilhados entre diversos servidores virtuais. Um sistema operacional de base controla e arbitra o acesso ao hardware, evitando que os sistemas que executam em máquinas virtuais distintas interfiram um no outro. As máquinas virtuais têm sua própria fatia de memória e espaço

Page 37: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

37

único em disco, e usam os núcleos de processamento disponíveis de forma compartilhada, como ocorre em qualquer sistema operacional multitarefa moderno. Um micro-kernel de baixo nível conhecido como hypervisor, ou Virtual Machine Monitor, executa direto no hardware e provê uma interface através da qual as máquinas virtuais podem acessar serviços de baixo nível. O hypervisor fornece um isolamento adequado entre as máquinas virtuais, de forma que mesmo uma falha catastrófica em um dos sistemas operacionais não interfere em nada no funcionamento dos demais. Cada máquina virtual aparecerá ao usuário e às aplicações exatamente como se fosse uma máquina física. Os servidores modernos, de múltiplos núcleos, são suficientemente poderosos para fazerem uso efetivo da virtualização. Tudo se passa como se houvesse de fato diversas máquinas com capacidade relativamente menor (menos núcleos de processamento e menos memória), cada uma executando uma instância de sistema operacional independente.

Esse projeto visa, portanto, à criação de um laboratório virtual versátil, formado por uma rede de servidores virtuais localizados em cinco diferentes sites, geograficamente distantes entre si, de modo que tais servidores podem ser disponibilizados para estudantes, pesquisadores e administradores de sistemas através de treinamentos adequados, permitindo que eles experimentem livremente e até mesmo construam uma infra-estrutura de Grid completa. A diminuição dos custos e uma maior flexibilidade na instalação e manutenção são definitivamente os responsáveis pelo crescente interesse das empresas nas tecnologias de virtualização. Entretanto, para os nossos interesses, é importante destacar essas tecnologias tornam trivial o processo de criação de ambientes de treinamento, que podem assim ser criados e destruídos com muita facilidade e sem prejuízo algum. Considerando que cerca de 90% das falhas em provedores de serviços são causadas por erros provocados pelos administradores de sistemas, torna-se fundamental estabelecer processos que minimizem erros de configuração durante os treinamentos. Isso é facilmente implementado em um ambiente virtualizado, pois é possível dispor de sistemas virtuais já pré-configurados que podem ser instanciados em sala de aula, no momento em que o treinamento está ocorrendo. A tecnologia permite que as instâncias de máquinas virtuais possam ser armazenadas como arquivos comuns, de forma que é possível subir instâncias de treinamento preparadas previamente em todos os sites em poucos minutos. A tecnologia também possibilita migrar serviços entre servidores virtuais e realizar backups completos de instâncias intermediárias, tornando o ambiente de treinamento extremamente flexível.

Levando em consideração as afirmações anteriores, os principais objetivos a serem atingidos no decorrer deste projeto são os seguintes:

• Tornar a instanciação dos serviços de Grid a mais efetiva possível em termos de tempo e de custo, usando tecnologia de virtualização para reduzir o número de máquinas que precisam ser dedicadas a cada site.

• Desenvolver ferramentas que permitam aos administradores e instrutores automatizar a inicialização e a configuração das máquinas virtuais, simplificando assim o processo de instalação.

• Fornecer um processo de instalação simples que pode ser executado remotamente por instrutores não familiarizados com administração de sistemas Unix.

• Fornecer um ponto de gerenciamento central de todos os sites, através do qual os demais sites possam ser gerenciados (que denominamos de EGOC – Educational Grid Operations Center).

A Figura 7 a seguir apresenta uma proposta de distribuição dos 10 servidores entre os diversos laboratórios situados em quatro universidades paulistas. Estamos estudando a

Page 38: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

38

possibilidade de se manter um par de servidores no NAP of Americas em Miami, ponto onde chega nossa conexão de rede com os EUA. Essa possibilidade ainda está em discussão e negociação, e o principal entrave é a dificuldade de se manter os servidores operacionais em local tão distante. Caso esta opção se mostre inviável, esse par de servidores será encaminhado para a Universidade Federal de São Carlos (como ilustra a figura).

Figura 7: Instalação dos diversos Grid sites na USP, UNESP, UFABC e UFSCAR

Para tornar o projeto mais adequado aos treinamentos que pretendemos implantar, nossa proposta também inclui a integração desses Grid sites com a infra-estrutura de treinamento do próprio Open Science Grid. Já recebemos apoio integral do OSG Education, Outreach & Training, coordenado pelo Dr. Michael Wilde da University of Chicago / Argonne National Laboratory, que se prontificou a fornecer os certificados de host e os certificados pessoais para os estudantes, que terão acesso, durante o treinamento, à organização virtual OSGEDU. Assim, os estudantes locais poderão não só instalar sua própria infra-estrutura de Grid a partir do zero, como também integrá-la a uma infra-estrutura internacional já existente, e ainda submeter e acompanhar a execução de seus jobs em recursos computacionais disponíveis em diversas universidades americanas.

Os equipamentos, partes e peças doados para o projeto foram os seguintes: • SGI: 5 barebones (chassis de 1U + motherboards + fonte) modelo Altix

XE310, de composto de 2 motherboards e 4 baias para discos. • Intel: 20 processadores Xeon quad-core de 2 GHz modelo E5335 e 5

interfaces de rede quad-gigabit PCI-e • Kingston: 20 pentes de memória DDR2 Fully-Buffered DIMM de 2 GB. • Seagate: 10 unidades de disco rígido SATA-II (3 Gb/s) de 250 GB.

Os servidores Altix XE310 são muito compactos, acomodando, em um único chassis, duas motherboards independentes, permitindo assim acomodar 2 servidores completos, com 2 processadores quad-core cada, num único chassis de 1U (1.75”) de altura. Essas motherboards são o resultado de um projeto colaborativo entre Intel, SGI e Supermicro. Cada servidor SGI acomoda até 4 processadores Intel Xeon em um único

Page 39: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

39

chassis, obtendo-se assim um total de 16 núcleos de processamento em uma única unidade de 1U de altura. Na figura 8 mostramos fotos do material doado.

Figura 8: Fotos do material doado.

Os preços unitários aproximados de cada uma das partes e peças doadas, no mercado americano, são aproximadamente os seguintes:

• Barebone SGI Altix XE 310: ~US$ 2,500.00 • Processadores Intel E5335: ~US$ 350.00 • Interfaces de rede quad-gigabit: ~US$ 300.00 • Pentes de memória Kingston DDR2 FB-DIMM de 2GB: ~US$ 150.00 • Unidades de disco Seagate SATA II de 250 GB: ~US$ 100.00

Assim, o valor total da doação que obtivemos para a implementação deste projeto é de cerca de US$ 25,000.00, considerando-se o preço de cada peça fornecida diretamente pelo fabricante (ou seja, preço ao distribuidor), e no mercado americano. No Brasil, um servidor Altix XE310 com essa configuração custa em torno de R$ 18.000,00, incluídos os impostos de importação. Logo, uma aquisição desse porte sairia em torno de R$ 90.000,00. Cabe mencionar que a Sun Microsystems também demonstrou interesse em fornecer servidores para esse projeto.

Não por acaso, os sites escolhidos têm disponibilidade de conexão com a rede KyaTera. Essa facilidade permitirá que, num futuro próximo, seja possível ampliar o escopo dessa infra-estrutura de treinamento, possibilitando não só a interligação dos diversos sites através de uma rede óptica dedicada, como também permitir que estudantes sejam treinados no uso de uma rede de pesquisa de última geração. O conceito de LambdaGrids, que inclui a rede como um recurso escalonável nas arquiteturas Grid de próxima geração, também poderá ser explorado.

Um Cartaz em Cada Escola24 A tabela periódica dos elementos químicos, introduzida por Mendeleyev no final

do século XIX, representou um importante passo na compreensão da estrutura da

24 http://www.sprace.org.br/eem/

Page 40: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

40

matéria. Além da sua inquestionável importância científica, a tabela periódica desempenha um papel essencial no ensino da Química e Física, fornecendo um panorama completo e organizado do universo da matéria conhecida.

No entanto, o século XX testemunhou um enorme avanço em nossa compreensão da estrutura mais íntima da matéria. O advento da Mecânica Quântica e as importantes descobertas, desde Rutherford até aquelas realizadas nos modernos aceleradores de partículas, permitiram que uma visão mais profunda fosse alcançada. Da escala atômica, característica dos elementos químicos (10-10 m), ao interior dos hádrons (10-18 m), são 8 ordens de magnitude que puderam ser exploradas graças aos avanços científicos desse último século.

Infelizmente os estudantes do ensino médio, bem como a grande maioria do público em geral, não têm acesso a este conhecimento. A visão que os estudantes possuem da estrutura elementar da matéria permanece sendo aquela que se tinha no século XIX.

Com o intuito de tentar melhorar esta realidade, iniciamos o projeto “Estrutura Elementar da Matéria: Um Cartaz em Cada Escola”, financiado pelo MCT/CNPq. Nosso projeto visa sanar esta falha na formação de nossos estudantes com a introdução dos conceitos acerca da estrutura elementar da matéria estabelecidos durante os últimos 100 anos de pesquisa em aceleradores de partículas. Implementamos as seguintes ações:

• Foram distribuidos cartazes25 contendo os conhecimentos básicos sobre os constituintes elementares da matéria e as interações que regem o mundo subatômico a todas as quase 25.000 escolas públicas e privadas de Ensino Médio do Brasil. Os cartazes foram acompanhados de um folheto explicativo, endereçado ao Diretor das escolas, com um apanhado dos objetivos do projeto.

• Implementamos um site26 na Internet que visa prover material didático adicional (“A Aventura das Partículas”27, cursos, livros, links, etc.) e dar suporte aos professores e alunos interessados em saber mais sobre o assunto. O site permitirá que as escolas agendem videoconferências pela internet através do sistema EVO28 que vem dando importante apoio ao projeto.

• Estamos implementando um Fórum de Discussão29 que está permitindo que estudantes, professores e demais interessados interajam entre si e façam perguntas ao moderador do fórum.

Vale lembrar que esta iniciativa do SPRACE segue o exemplo de projetos

semelhantes implantados com sucesso em vários países. O Contemporary Physics Education Project (CPEP)30, uma organização de físicos e educadores americanos, já distribuiu mais de 200.000 cópias de um cartaz descrevendo as partículas elementares e suas interações. Fundado por Michael Barnett do Lawrence Berkeley National

25 http://www.sprace.org.br/eem/files/image/cartaz.jpg 26 http://www.sprace.org.br/eem/ 27 http://www.sprace.org.br/AventuraDasParticulas/ 28 http://evo.caltech.edu/ 29 http://www.sprace.org.br/forum/ 30 http://www.cpepweb.org/

Page 41: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

41

Laboratory em 1986, o CPEP vem sendo financiado pelo Department of Energy (DOE), National Science Foundation (NSF), American Association of Physics Teachers (AAPT), American Institute of Physics (AIP), American Physical Society (APS), entre outros. Em 2005, durante o Ano Mundial da Física, um grupo de físicos e professores franceses, liderado por Guy Wormser, diretor do Laboratoire de l’Accélérateur Linéaire de Orsay, distribuiu para 3.600 escolas do segundo grau francesas 20.000 cópias de um cartaz semelhante, produzido pela École Estienne de design de Paris. O projeto obteve financiamento do Centre National de la Recherche Scientifique (CNRS), do Commissariat à l'Energie Atomique (CEA) e contou com o apoio do Ministère de l'Education Nationale. O Canadá, sob a liderança de William Trischuk ,diretor do Institute of Particle Physics de Toronto, teve iniciativa semelhante e distribuiu um total de 6.000 cartazes em inglês e francês para as escolas de segundo grau. Índia, Argélia, Marrocos, Inglaterra, Romênia, Polônia e Indonésia têm demonstrado interesse de implantar projetos semelhantes.

Esperamos que este projeto, um apanhado do conhecimento atual sobre a estrutura elementar da matéria apresentando de forma sucinta e coerente, possa ampliar o horizonte de conhecimento dos nossos estudantes, aguçando sua curiosidade científica e, possivelmente, despertando vocações para o estudo das ciências.

MasterClass Em 2008 foi realizado o quarto programa internacional “MasterClass:

Trabalhando em Física de Altas Energias” (Hands on Particle Physics – International MasterClasses for High School Students31) onde mais de 6 mil estudantes do Ensino Médio de todo o mundo tiveram a oportunidade de trabalhar com físicos de Altas Energias. Durante duas semanas, cientistas de mais de 70 universidades e laboratórios em 21 países estiveram engajados na organização de uma série de eventos em suas instituições com a participação de estudantes de Ensino Médio, os quais se envolveram diretamente em algumas atividades de pesquisa de fronteira na área.

Originado em um programa de divulgação científica do Reino Unido, o primeiro MasterClass ocorreu em 2005 com a participação de 18 países europeus. O MasterClass tem coordenação geral do Prof. Michael Kobel, da University de Dresden, em cooperação com o Grupo Europeu de Divulgação Científica de Física de Partículas (European Particle Physics Outreach Group, EPPOG) e com o apoio da Sociedade Européia de Física (European Physical Society, EPS).

O programa de 2008 contou pela primeira vez com a participação do Brasil, tendo sido uma iniciativa do SPRACE trazê-lo para São Paulo32. O evento contou com a presença de estudantes do Colégio Dante Alighieri e da Escola de Aplicação da Faculdade de Educação da Universidade de São Paulo, os quais se juntaram, através de videoconferência, com estudantes de Dortmund na Alemanha, Padova e Pisa na Itália, Presov na Eslováquia, Witwatersrand na África do Sul e Berna na Suíça. Como parte do programa, os estudantes receberam previamente um CD com vasto material interativo, traduzido em 16 idiomas, para facilitar o aprendizado dos conceitos fundamentais relacionado à Física de Altas Energias. No dia do evento, eles puderam comparar e discutir os resultados de suas análises, da mesma forma que físicos de Altas Energias fazem cotidianamente em suas colaborações internacionais.

31 http://www.physicsmasterclasses.org 32 http://www.sprace.org.br/Twiki/bin/view/Main/MasterClass08

Page 42: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

42

Temos intenção de dar continuidade à participação de São Paulo nos eventos futuros do MasterClass, possibilitando a estudantes de outras escolas terem acesso os fundamentos da Física de Altas Energias e à prática cotidiana de pesquisa na área.

Page 43: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

43

Apêndices  

 

 

 

 

 

 

 

 

Page 44: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

44

A. Artigos Publicados durante a Vigência do Projeto Temático

Page 45: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

45

ARTIGOS PUBLICADOS

1. Search for Doubly Charged Higgs Boson Pair Production in the Decay to mu+ mu+ mu- mu- in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0404015.

• Phys. Rev. Lett. 93, 141801 (2004)

2. Observation and Properties of the X(3872) Decaying to J / Psi Pi+ Pi- in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0405004.

• Phys. Rev. Lett. 93, 162002 (2004)

3. Search for Supersymmetry with Gauge-Mediated Breaking in Diphoton Events at D0, D0 Collaboration. e-Print Archive: hep-ex/0408146.

• Phys. Rev. Lett. 94, 041801 (2005).

4. Measurement of the B0(s) Lifetime in the Exclusive Decay Channel B0(s) J / Psi Phi, D0 Collaboration. e-Print Archive: hep-ex/0409043.

• Phys. Rev. Lett. 94, 042001 (2005)

5. A Search for the Flavor-Changing Neutral Current Decay B0(s) mu+ mu- in p anti-p Collisions at √s = 1.96 TeV with the D0 Detector, D0 Collaboration. e-Print Archive: hep-ex/0410039.

• Phys. Rev. Lett. 94, 071802 (2005).

6. A Search for W b anti-b and W H Production in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0410062.

• Phys. Rev. Lett. 94, 091802 (2005)

7. Measurement of the Lambda0(b) Lifetime in the Decay Lambda0(B) J / Psi Lambda0 with the D0 Detector, D0 Collaboration. e-Print Archive: hep-ex/0410054.

• Phys. Rev. Lett. 94, 102001 (2005).

8. Search for First-Generation Scalar Leptoquarks in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0412029.

• Phys. Rev. D71, 071104 (2005)

9. First Measurement of Sigma (p anti-p Z) . Br (Z tau tau) at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0412020.

• Phys. Rev. D71, 072004 (2005)

10. Measurement of the WW Production Cross Section in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0410066.

• Phys. Rev. Lett. 94, 151801 (2005)

11. A Search for Anomalous Heavy-Flavor Quark Production in Association with W Bosons, D0 Collaboration. e-Print Archive: hep-ex/0411084.

• Phys. Rev. Lett. 94, 152002 (2005)

Page 46: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

46

12. A Measurement of the Ratio of Inclusive Cross Sections Sigma (p anti-p Z + b-Jet) / Sigma (p anti-p Z + Jet) at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0410078.

• Phys. Rev. Lett. 94, 161801 (2005)

13. Measurement of the p-barp W gamma + X Cross Section and Limits on Anomalous WW gamma Couplings at √s =1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0503048.

• Phys. Rev. D 71, 091108 (2005)

14. Measurement of the Ratio of B+ and B0 Meson Lifetimes, D0 Collaboration. e-Print Archive: hep-ex/0410052.

• Phys. Rev. Lett. 94, 182001 (2005)

15. Measurement of Dijet Azimuthal Decorrelations at Central Rapidities in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0409040.

• Phys. Rev. Lett. 94, 221801 (2005)

16. Measurement of Inclusive Differential Cross Sections for Upsilon(1S) Production in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0502030.

• Phys. Rev. Lett. 94, 232001 (2005)

17. Search for right-handed W bosons in Top Quark Decay, D0 Collaboration. e-Print Archive: hep-ex/0505031. (Name chanced in the publication)

• Phys. Rev. D72, 011104 (R) (2005)

18. Study of Z Gamma Events and Limits on Anomalous Z Z Gamma and Z Gamma Gamma Couplings in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0502036.

• Phys. Rev. Lett. 95, 051802 (2005)

19. Search for Randall-Sundrum Gravitons in Dilepton and Diphoton Final States, D0 Collaboration. e-Print Archive: hep-ex/0505018.

• Phys. Rev. Lett. 95, 091801 (2005)

20. Search for Single Top Production in p anti-p Collisions at √s = 1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0505063.

• Phys. Lett. B622, 265-276 (2005)

21. Production of WZ Events in p anti-p Collisions at √s =1.96 TeV and Limits on Anomalous WWZ Couplings, D0 Collaboration. e-Print Archive: hep-ex/0504019.

• Phys. Rev. Lett. 95, 141802 (2005)

22. Search for Neutral Supersymmetric Higgs Bosons in Multijet Events at √s = 1.96 TeV. D0 Collaboration. e-Print Archive: hep-ex/0504018.

• Phys. Rev. Lett. 95, 151801 (2005)

23. Search for Supersymmetry via Associated Production of Charginos and Neutralinos in Final States with Three Leptons, D0 Collaboration. e-Print Archive: hep-ex/0504032.

• Phys. Rev. Lett. 95, 151805 (2005)

Page 47: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

47

24. Search for Large Extra Spatial Dimensions In Dimuon Production At D0. D0 Collaboration. e-Print Archive: hep-ex/0506063

• Phys. Rev. Lett. 95, 161602 (2005)

25. Measurement of the ttbar Production Cross Section in p anti-p Collisions at √s = 1.96 TeV Using Lepton + Jets Events with Lifetime b-Tagging, D0 Collaboration, e-Print Archive: hep-ex/0504058.

• Phys. Lett. B626, 35-44 (2005)

26. Measurement of the ttbar Cross Section in p anti-p Collisions at √s =1.96 TeV Using Kinematic Characteristics of Lepton plus Jets Events, D0 Collaboration. e-Print Archive: hep-ex/0504043.

• Phys. Lett. B626, 45-54 (2005)

27. Measurement of the ttbar Production Cross Section in ppbar Collisions at √s = 1.96 TeV in Dilepton Final State, D0 Collaboration. e-Print Archive: hep-ex/0505082.

• Phys. Lett. B626, 55-64 (2005)

28. Measurement Of The Lifetime Difference In The B0(S) System, D0 Collaboration. e-Print Archive: hep-ex/0507084

• Phys. Rev. Lett. 95, 171801 (2005)

29. Measurement of Semileptonic Branching Fractions of B Mesons to Narrow D** States, D0 Collaboration. e-Print Archive: hep-ex/0507046

• Phys. Rev. Lett. 95, 171803 (2005)

30. Search for the Higgs Boson in H->WW(*) Decays in ppbar Collisions at sqrt(S)=1.96 TeV, D0 Collaboration. e-Print Archive: hep-ex/0508054

• Phys. Rev. Lett. 96, 011801 (2006)

31. Search for pair production of second generation scalar leptoquarks in p anti-p collisions at s**(1/2) = 1.96-TeV, D0 Collaboration, e-Print Archive: hep-ex/0601047

• Phys. Lett. B636, 183 (2006) - doi:10.1016/j.physletb.2006.03.056

32. Search for excited muons in p anti-p collisions at s**(1/2) = 1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0604040

• Phys.Rev. D73, 111102 (2006)

33. Search for squarks and gluinos in events with jets and missing transverse energy in p anti-p collisions at s**(1/2) = 1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0604029

• Phys. Lett. B638, 119-127 (2006) - doi:10.1016/j.physletb.2006.05.030

34. Direct Limits on the B_s^0 Oscillation Frequency, D0 Collaboration, e-Print Archive: hep-ex/0603029

• Phys. Rev. Lett. 97, 021802 (2006)

35. Search for a heavy resonance decaying into a Z+jet final state in p-pbar collisions at sqrt(s) = 1.96 TeV using the D0 detector, D0 Collaboration, e-Print Archive: hep-ex/0606018

• Phys. Rev. D74, 011104 (2006)

Page 48: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

48

36. Search for R-parity violating supersymmetry via the LL anti-E couplings lambda(121), lambda(122) or lambda(133) in p anti-p collisions at s**(1/2) = 1.96-TeV, D0 Collaboration, e-Print Archive: hep-ex/0605005

• Phys. Lett. B638, 441-449 (2006) - doi:10.1016/j.physletb.2006.05.077

37. Measurement of the Isolated Photon Cross Section in ppbar Collisions at sqrt{s}=1.96 TeV,, D0 Collaboration, e-Print Archive: 0511054

• Phys. Lett. B639, 151-158 (2006)

38. Search for the Rare Decay B0_s -> phi mu^+ mu- with the D0 Detector, D0 Collaboration, e-Print Archive: 0604015

• Phys. Rev. D74, 031107 (2006)

39. Measurement of B(t->bW)/B(t->qW) at sqrt(s) = 1.96 TeV, D0 Collaboration, e-Print Archive: 0603002

• Phys. Lett. B639, 616-622 (2006) - doi:10.1016/j.physletb.2006.07.019

40. Limits on Anomalous Trilinear Gauge Couplings from WW -> e+ e-, WW -> e \mu, and WW -> \mu+ \mu- events from ppbar collisions at sqrt(s) = 1:96 TeV. e-Print Archive: physics/0608011

• Phys. Rev. D 74, 057101 (2006)

41. The Upgraded DØ Detector, D0 Collaboration. e-Print Archive: physics/0507191

• Nucl. Instrumentation and Methods A565, 463-537 (2006) - doi:10.1016/j.nima.2006.05.248

42. Search for Resonant Second Generation Slepton Production at the Tevatron, D0 Collaboration, e-Print Archive: 0605010

• Phys. Rev. Lett. 97, 111801 (2006)

43. Search for Scalar Leptoquarks in the Acoplanar Jet Topology in ppbar collisions at sqrt(s)=1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0607009

• Phys. Lett. B640, 230-237 (2006) - doi:10.1016/j.physletb.2006.08.020

44. Search for Neutral Higgs Bosons Decaying to Tau Pairs in ppbar Collisions at sqrt(s)=1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0605009

• Phys. Rev. Lett. 97, 121802 (2006)

45. Search for associated Higgs boson production WH->WWW*->l^ pm nu l'^ pm nu'+X in p bar p collisions at sqrt s =1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0607032

• Phys. Rev. Lett. 97, 151804 (2006)

46. Search for Neutral, Long-lived Particles Decaying into Two Muons in p-pbar Collisions at sqrt(s) = 1.96 TeV, D0 Collaboration, e-Print Archive: hep-ex/0607028

• Phys. Rev. Lett. 97, 161802 (2006)

47. Search for the Standard Model Higgs Boson in the p-pbar -> ZH -> neutrino-antineutrino-b-bbar Channel, D0 Collaboration, e-Print Archive: hep-ex/0605022

• Phys. Rev. Lett. 97, 161803 (2006)

Page 49: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

49

48. Search for Particles Decaying to a Z Boson and a Photon in ppbar Collisions at sqrt(s)=1.96 TeV, D0 Collaboration, e-Print Archive: 0605064

• Phys. Lett. B 641, 415-422 (2006) - doi:10.1016/j.physletb.2006.08.079

49. Search for W' boson production in the top quark decay channel., D0 Collaboration, e-Print Archive: hep-ex/0607102

• Phys. Lett. B 641, 423-431 (2006) - doi:10.1016/j.physletb.2006.09.021

50. Search for Pair Production of Scalar Bottom Quarks in p-pbar Collisions at sqrt(s)=1.96 TeV , D0 Collaboration,

• Phys. Rev. Lett. 97, 171806 (2006)

51. Measurement of the CP-violation parameter of B0 mixing and decay with ppbar \mu\mu X data, D0 Collaboration,

• Phys. Rev. D74, 092001 (2006)

52. Measurement of the top quark mass in the lepton + jets final state with the matrix element method, D0 Collaboration.

• Phys. Rev. D74, 092005 (2006)

53. Measurement of the B0s Lifetime Using Semileptonic Decays, D0 Collaboration.

• Phys. Rev. Lett. 97, 241801 (2006)

54. Measurement of Bd mixing using opposite-side flavor tagging, D0 Collaboration.

• Phys. Rev. D74, 112002 (2006)

55. Measurement of the t t bar production cross section in ppbar collisions at sqrt(s)=1.96 TeV using secondary vertex b tagging, D0 Collaboration.

• Phys. Rev. D74, 112004 (2006)

56. Experimental Discrimination between Charge 2e/3 Top Quark and Charge 4e/3 Exotic Quark Production Scenarios, D0 Collaboration.

• Phys. Rev. Lett. 98, 041801 (2007)

57. Measurement of the W boson helicity in top quark decays at D0, D0 Collaboration.

• Phys. Rev. D75, 031102 (2007)

58. Search for the pair production of scalar top quarks in the acoplanar charm jet final state in p pbar collisions at \sqrt{s} = 1.96 TeV, D0 Collaboration.

• Phys. Lett. B645, 119-127 (2007) - doi:10.1016/j.physletb.2006.12.024

59. Lifetime Difference and CP-Violating Phase in the B0s System, D0 Collaboration.

• Phys. Rev. Lett. 98, 121801 (2007)

60. Search for Single Production of Scalar Leptoquarks in ppbar Collisions Decaying into Muons and Quarks with the D0 Detector, D0 Collaboration.

• Phys. Lett. B647, 74–81 (2007)

61. Measurement of the Charge Asymmetry in Semileptonic B0s Decays, D0 Collaboration.

• Phys. Rev. Lett. 98, 151801 (2007)

Page 50: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

50

62. CMS Physics Technical Design Report, Volume II: Physics Performance, CMS Collaboration

• J. Phys. G: Nucl. Part. Phys. 34, 995–1579 (2007)

63. Evidence for Production of Single Top Quarks and First Direct Measurement of |Vtb|

• Phys. Rev. Lett. 98, 181802 (2007)

64. Measurement of the Top Quark Mass in the Lepton + Jets Channel Using the Ideogram Method, D0 Collaboration.

• Phys. Rev. D75, 092001 (2007)

65. Multivariate searches for single top quark production with the D0 detector, D0 Collaboration

• Phys. Rev. D75, 092007 (2007)

66. Search for Techniparticles in e + jets Events at D0, D0 Collaboration

• Phys. Rev. Lett. 98, 221801 (2007)

67. Measurement of the Shape of the Boson Rapidity Distribution for p anti-p -> Z/gamma* -> e+ e- + X Events Produced at s**(1/2) of 1.96 TeV, D0 Collaboration

• Phys. Rev. D76, 012003 (2007) – doi:10.1103/PhysRevD.76.012003

68. Direct Observation of the Strange b Baryon \Xi_b

• Phys. Rev. Lett. 99, 052001 (2007) – doi: 10.1103/PhysRevLett.99.052001

69. Search for Third-Generation Scalar Leptoquarks in p_pbar at s**(1/2) of 1.96 TeV

• Phys. Rev. Lett. 99, 061801 (2007) – DOI: 10.1103/PhysRevLett.99.061801

70. Combined D0 Measurements Constraining the CP-Violating Phase and Width Difference in the B0(s) System.

• Phys. Rev. D76, 057101 (2007) – DOI: 10.1103/PhysRevD.76.057101

71. Z gamma Production and Limits on Anomalous Z Z gamma and Z gamma gamma Couplings In panti-p Collisions at s**(1/2) = 1.96 TeV.

• Phys. Lett. B653, 378-386 (2007) – doi:10.1016/j.physletb.2007.08.035

72. Measurement of the t tbar production cross section in ppbar collisions using dilepton events

• Phys. Rev. D76, 052006 (2007) – DOI: 10.1103/PhysRevD.76.052006

73. Search for Stopped Gluinos from p-anti-p Collisions at s**(1/2) = 1.96 TeV.

• Phys. Rev. Lett. 99, 131801 (2007) – DOI: 10.1103/PhysRevLett.99.131801

74. Measurement of the \Lambda_b Lifetime in the Exclusive Decay \Lambda_b to J/\Psi \Lambda

• Phys. Rev. Lett. 99, 142001 (2007) – DOI: 10.1103/PhysRevLett.99.142001

75. Measurement of the p pbar to t tbar + X production cross section at s**(1/2) = 1.96 TeV in the fully hadronic decay channel

• Phys. Rev. D76, 072007 (2007) - DOI: 10.1103/PhysRevD.76.072007

Page 51: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

51

76. Measurement of the top quark mass in the dilepton channel

• Phys. Lett. B655, 7-14 (2007) – doi:10.1016/j.physletb.2007.08.074

77. Properties of L = 1 B_1 and B_2 Mesons

• Phys. Rev. Lett. 99, 172001 (2007) – DOI: 10.1103/PhysRevLett.99.172001

78. Measurement of the \Lambda_b Lifetime Using Semileptonic Decays

• Phys. Rev. Lett. 99, 182001 (2007) – DOI: 10.1103/PhysRevLett.99.182001

79. Search for a Higgs boson produced in association with a Z boson in ppbar collisions

• Phys. Lett. B655, 209-216 (2007) - doi:10.1016/j.physletb.2007.08.070

80. Search for B^0_s \to \mu^+ \mu^- decays at D0

• Phys. Rev. D76, 092001 (2007) - DOI: 10.1103/PhysRevD.76.092001

81. Search for Production of Single Top Quarks Via tcg and tug Flavor-Changing-Neutral- Current Couplings

• Phys. Rev. Lett. 99, 191802 (2007) - DOI: 10.1103/PhysRevLett.99.191802

82. Measurement of the t tbar production cross section in p pbar collisions at \sqrt = 1.96 TeV using kinematic characteristics of lepton + jets events

• Phys. Rev. D76, 092007 (2007) - DOI: 10.1103/PhysRevD.76.092007

83. Study of the Decay B^0_s -> D_s^* D_s^*

• Phys. Rev. Lett. 99, 241801 (2007) - DOI: 10.1103/PhysRevLett.99.241801

84. Measurement of the ppbar -> WZ+X Cross Section at sqrt(s)=1.96 TeV and Limits on WWZ Trilinear Gauge Couplings

• Phys. Rev. D76, 111104 (2007) - DOI: 10.1103/PhysRevD.76.111104

85. Measurement of the ratios of the Z/\gamma^ + > n jet production cross sections to the total inclusive Z/\gamma^ cross section in p pbar collisions at \sqrt = 1.96 TeV

• Phys. Lett. B658, 112-119 (2008) - doi:10.1016/j.physletb.2007.10.046

86. Measurement of the muon charge asymmetry from W boson decays

• Phys. Rev. D77, 011106 (2008) - DOI: 10.1103/PhysRevD.77.011106

87. Search for the lightest scalar top quark in events with two leptons in ppbar collisions at \sqrt{s} = 1.96 TeV

• Phys. Lett. B659, 500–508 (2008) - doi:10.1016/j.physletb.2007.11.086

88. Search for W’ Bosons Decaying to an Electron and a Neutrino with the D0 Detector

• Phys. Rev. Lett. 100, 031804 (2008) - DOI: 10.1103/PhysRevLett.100.031804

89. Search for supersymmetry in di-photon final states at \sqrt{s} = 1.96 TeV

• Phys. Lett. B659, 856–863 (2008) - doi:10.1016/j.physletb.2007.12.006

90. Model-Independent Measurement of the W-Boson Helicity in Top-Quark Decays at D0

• Phys. Rev. Lett. 100, 062004 (2008) - DOI: 10.1103/PhysRevLett.100.062004

91. Observation and Properties of the Orbitally Excited Bs2* Meson

• Phys. Rev. Lett. 100, 082002 (2008) - DOI: 10.1103/PhysRevLett.100.082002

Page 52: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

52

92. Search for squarks and gluinos in events with jets and missing transverse energy using 2.1 fb−1 of ppbar collision data at sqrt[s] =1.96 TeV

• Phys. Lett. B660, 449-457 (2008) - doi:10.1016/j.physletb.2008.01.042

93. Search for Randall-Sundrum Gravitons with 1 fb-1 of Data from ppbar Collisions at sqrt(s)=1.96 TeV

• Phys. Rev. Lett. 100, 091802 (2008) - DOI: 10.1103/PhysRevLett.100.091802

94. Search for Flavor-Changing-Neutral-Current D Meson Decays

• Phys. Rev. Lett. 100, 101801 (2008) - DOI: 10.1103/PhysRevLett.100.101801

95. Measurement of the Shape of the Boson-Transverse Momentum Distribution in pp →Z/γ*→e+e-+X Events Produced at sqrt[s] =1.96 TeV

• Phys. Rev. Lett. 100, 102002 (2008) - DOI: 10.1103/PhysRevLett.100.102002

96. Search for ZZ and Zγ* Production in pp Collisions at sqrt[s] =1.96  TeV and Limits on Anomalous ZZZ and ZZγ* Couplings

• Phys. Rev. Lett. 100, 131801 (2008) - DOI: 10.1103/PhysRevLett.100.131801

97. Measurement of the Forward-Backward Charge Asymmetry in Top-Quark Pair Production

• Phys. Rev. Lett. 100, 142002 (2008) - DOI: 10.1103/PhysRevLett.100.142002

Page 53: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

53

B. Minuta da DZero Note

Page 54: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

DØ Note 1234-CONF

Version: 01 Send comments to [email protected](s): Pedro Mercadante, Sergio M. Lietti and Greg Landsberg by xxx yy, zzzz

Search for Universal Extra Dimension in the Muon Like Sign Channel (Using p17data)

Pedro G. Mercadante, Sergio M. Lietti and Greg Landsberg

(Dated: April 30, 2008)

A search for Universal Extra Dimensions in the two muons like sign channel is performed with1 fb of data collected by the D0 experiment in pp collisions at

√S = 1.96 TeV at the Fermilab

Tevatron Collider. We set 95% confidence level upper limits in the production cross sections whichtranslates into lower limits for the size of the compactification scale 1/R of the order of 230 GeV.

Analysis Note

Page 55: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

2

I. INTRODUCTION

The existence of extra dimensions has been proposed for a long time and has been explored in several theoreticalcontext. Recently, motivated by a possible solution for the hierarchy problem, it has been noted the possibility ofexploring the existence of such dimensions in high energy colliders. Large extra dimensions [1] and the Radall-Sundrun[2] scenarios have been studied at the Fermilab Tevatron Collider by D0 [3] and CDF [4] collaborations. So far, noindication of such phenomena has been found.

In the Large Extra Dimensions scenario all Standard model (SM) fields are restricted to our 4D space, only gravitycan propagate at the extra dimensions. The weakness of gravity is explained by having the radius of the extradimensions, R, large rather than the inverse of the Planck Mass. If one requires the fundamental mass scale forgravity to be of the order of TeV instead of the Planck scale, so that there would be only one fundamental massscale, the value of R−1 ranges from 10−3 eV to MeV leading to an interesting phenomenology at the TeV scale.The Randall-Sundrun scenario also assumes that only gravity propagates on the extra dimension, however, insteadof assuming the extra dimension to be large, the hierarchy problem is solved by requiring that the extra dimensiongeometry is not flat.

More recently the Universal Extra Dimension scenario (UED) is proposed where all matter fields are allowed topropagate through the extra dimensions [5]. In this scenario every SM particle has associated with it a tower of KaluzaKlein states. Conservation of momentum in the extra dimensions lead to the Kaluza Klein number conservation, insuch way KK states can only be pair produced and the lightest KK mode state is stable. In this way the phenomenologyof these models resemble supersymmetry phenomenology. The KK modes have a mass that is given by the inversescale of the extra dimension, M 2

n = M20 + n2/R2

c , n = 0, 1, 2..., where M0 is the SM mass, Rc is the compactificationscale of the extra dimension and n is the number of the excited estates. In this way the spectrum of the excited statesis almost degenerate, however radiative corrections are responsible for splitting the masses.

This scenarios does not have yet a direct limit from colliders experiments. Indirect limits suggest that a massscale of about 300 GeV are compatible with our current knowledge thus rendering the Fermilab Tevatron Collider thepossibility to set the first direct limit, improving on the current one for such scenario. We are going to consider theminimal model where there is only one extra dimension and the mass spectrum of the KK modes are given by thescale of this extra dimensions when 1-loop corrections are applied. In this way we typically have gluons KK modesas the heaviest ones, followed by quarks, leptons, gauge bosons and finally the photon. A typical signal consist in thepair production of KK quarks (Q1) that will cascade decay into leptons plus jets and the lightest KK mode. Becauseof the degeneracy jets are very soft and this signal are killed by QCD background. In the cascade decay we can haveup to four leptons, however, because those leptons are very soft not all of them are reconstructed. A more promisingchannel is the two like-sign channel.

A previous DØ RunII study of the two like-sign muon channel was performed for SUSY signal [6]. In this note westudy this channel in the context of Universal Extra Dimensions.

II. DATA SET AND MONTE CARLO SAMPLES

A. Data

This note is based on data taken in RunIIa, using the CSG CAF MUinclusive PASS3 p17.09.03 skim. Runs markedas bad by calorimeter, SMT, CFT and muons system, as well as events where cal empty crate, cal ring of fire,cal noon noise or cal coherent noise are flagged, are removed from the analysis by using the data quality packagescaf dq version 02-02-01 and dq defs 2007-06-01.

On Table I the estimated luminosity, using correspondent triggers are shown. The total luminosity is 0.849 fb−1.

B. Monte Carlo Samples

The signal was generated using a modified version of pythia that includes the UED scenario. Using PDF functionCTEQ5L, 24500 events of pair produced Kaluza Klein quarks was generated. The efficiency for the signal to havemuons was enhanced forcing the Z1 (first Kaluza Klein excitation of Z boson) and W1 (first Kaluza Klein excitationof W boson) to decay in muons plus the correspondent Kaluza Klein particle. The p17.09.01 of D0RunII software wasused and the generated pythia events passed through the full chain of the DØdetector simulator, using mc runjobv06-05-29 to manage the job.

Page 56: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

3

TABLE I: Integrated Luminosity for the several triggers used

Epoch Trigger Ldelivered Lrecorded Lgood

V8.0 - V9.0 2MU A L2M0 7.23 5.92 5.88V9.0 - V10.0 2MU A L2ETAPHI 47.89 41.76 24.98V10.0 - V11.0 2MU A L2M0 TRK5 21.37 19.30 10.70V11.0 - V12.0 2MU A L2M0 79.27 74.34 65.82V12.0 - V13.0 2MU A L2M0 277.02 254.96 231.63V13.0 - V13.3 DMU1 LM6 82.01 73.53 53.84V13.3 - V14.0 DMU1 LM5 TK5 382.01 344.52 318.54V14.0 - V15.0 DMU1 2TK3TK5TLM3 173.93 162.67 137.38

TABLE II: SM Process and Monte Carlo request ids for the background

Process σ (fb) Nevents Request idW → µν 2.04 x 106 1602750 37641-37645, 35938, 35940, 35942, 38929-38938WZ incl. 2410 305500 33684, 33685, 30488, 30489ZZ incl. 994 100250 33687ZZ → 4µ 1.02 25250 30836

ZZ → 2µ2e 2.04 25000 30838

The gauge boson pair production along with W → µν process are the most important Electroweak background forthe two like-sign muons signal. The backgrounds used on this notes were generated using pythia 6.319 [7] and areshown in Table II.

III. PHYSICS OBJECTS

A. Muons

Muons are identified by combining tracks in the muon spectrometer with central detector tracks. The muon typeand quality criteria are based on p17 definitions [8]. The muons used in this analysis must fulfill the requirementof loose muon and pass cosmic ray rejection requirement. The track reconstructed on the muon system must matcha track reconstructed on the central tracker system with a χ2/ndf < 4. The track must have a distance of closestapproach, dca, to the primary vertex < 0.2 if it does not have a track in the SMT tracker system and of < 0.02 if itis reconstructed in the SMT system. At a first stage no isolation criteria is required.

B. Jets

In this analysis Jets are used to help modeling the QCD background as explained in the following section and tocalculate the Missing Energy. They are standard jets from p17 definitions using the cone jet algorithm with R = 0.5.Jet energy has been corrected using the p17 jet energy scale ApplyJES processor [9].

C. Missing ET

Missing ET is calculated from the calorimeter cells. Coarse Hadronic (CH) cells are only included in the computationif it is part of a good jet. Corrections from good jets energy scale, from electromagnetic energy corrections and frommuon reconstructions are considered [10].

IV. SELECTION AND QCD BACKGROUND

The preselection consists of two like sign muons with pT > 5 GeV. The major background for the like-sign dimuonsignal is from QCD multijet production, mostly bb, which is less isolated than the signal. This background is estimatedfrom data. Two samples of events were considered:

Page 57: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

4

φ∆0 1 2 3

Eve

nts

/GeV

0

500

1000

SAMPLE B

UED

FIG. 1: ∆φ(µ, µ) between the two leading muon for MC signal and for sample B data.

• At least one tight isolated muon and at least one loose isolated muon with the same sign (sample S)

• One tight isolated muon and one muon that fail loose isolation criteria (sample B)

In order to estimate the number of events coming from multijet processes sample B was normalized to sample S.To avoid bias the normalization has been performed in a kinematic region that is removed from the final analysis. OnFig. 1 the distribution of ∆φ(µ, µ) between the like sign muons is shown for the MC signal and for the backgroundsample B. As the background is dominant for ∆φ(µ, µ) > 2.9 this region is chosen for the normalization. The chanceof a muon to be isolated is very dependent on the muon pT , the normalization factor as a function of the muon pT isgiven by

N(pT ) =1

2

S(pT )

B(pnon isolatedT )

∆φ>2.9

, (1)

and its dependence with pT is shown in Fig. 2.Events on Sample B with ∆φ(µ, µ) < 2.9 are multiplied by N(pT ) according to the transverse momentum of the

non isolated muon and form the QCD background. In order to check that this procedure reproduces the data, severalkinematics distributions are shown in Fig. 3. Also shown is the Monte Carlo signal simulation for R−1 = 300 GeVin an arbitrary normalization. We can see that some of the QCD background shapes are not well described by thisprocedure, specially missing ET and muon pT .

This issue was investigated and we found out that events with jets and events without jets has a different probabilityfor the muon to be isolated. It was proposed a new method to estimate the QCD background that take this intoaccount: each sample was divided in events with jets and without jets and a different normalization factor was foundfor each sample. The factors were then applied for events on sample B and form the QCD background. Severalkinematics distributions for this new procedure are shown in Fig. 4. It is clear that the shape of pT and Missing ET

are much better described by this new method, however the overall normalization is a bit off.Another approach considered the sum of scalar energy from calorimeter plus the muons scalar energy (SET ) to use

as a normalizing variable factor. In this way the muon pT as well the amount of calorimeter energy, that seems to bethe relevant variables for isolation, are taken into account. The ratio of sample S over sample B as a function of thisvariable,

N(SET ) =S(SET )

B(SET )

∆φ>2.9

(2)

is shown in Fig. 5.

Page 58: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

5

(GeV)T

p10 20 30

N

0

0.5

1

1.5

2

FIG. 2: pT dependence of the normalization factor (N), for ∆φ(µ, µ) > 2.9.

The result of this normalization can be seen in Fig. 6. Again, the shape of missing ET presents a better agreementwith data but the overall normalization is not perfect.

V. CUTS

In order to separate the signal from the QCD background we have used the signal simulated for R−1 = 300 GeVand optimized the following cuts:

• pT of hardest muon,

• pT of second hardest muon,

• Invariant mass of two muon,

• Missing ET ,

The DZero RGSEARCH program was used to find the set of cuts which optimized S/√

B. In Table III the cut flow

for signal and background is shown, using a set of cuts that maximize S/√

B.

TABLE III: Number of events from data and background for each cut

Cuts QCD 1 QCD 2 QCD 3 W → µν WZ incl. ZZ incl. Data UEDPreselection 20247 15915 15854 44.3 2.68 0.48 20709 10pT > 14 GeV 88.7 39.8 66.5 3.6 2.37 0.44 60 2.9pT > 15 GeV 87.9 38.9 65.6 3.6 2.37 0.44 59 2.9

Mµµ < 65 GeV 22.6 11.8 32.2 3.6 0.75 0.054 29 2.8Mµµ > 20 GeV 19.9 10.5 27.8 2.5 0.72 0.054 27 2.6

VI. SYSTEMATICS UNCERTAINTIES

In this study the dominant background was estimated from data, therefore the main systematics uncertainties arerelated with this method. We considered several ways to model the background, each with its own uncertainty, given

Page 59: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

6

(GeV)µµM0 20 40 60 80 100

Eve

nts

/ G

eV

-110

1

10

210

310

QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)T

Missing E0 20 40 60 80 100

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

FIG. 3: Missing ET , Invariant mass of muons pair, pT of the leading muon and pT of the second hardest muon.

by the quality of the fit. When the parameters of the fit are changed a typical 10% difference is introduced. Thesystematics from the difference of normalization methods needs to be better estimated.

VII. RESULTS AND LIMITS

After our cuts there are 27 signal events left. Considering the approach of modeling the background using the SET

variable we expected 32.1± 3.4 events from background. Using a bayesian approach we can set a 95% CL upper limitfor cross section of 13.3 fb [11]. Taking into account the efficiency for the signal, this translates to a cross section of6.5X103 fb, which corresponds to a scale of 1/R = 230 GeV.

Page 60: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

7

(GeV)µµM0 20 40 60 80 100

Eve

nts

/ G

eV

-110

1

10

210

310

QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)T

Missing E0 20 40 60 80 100

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

FIG. 4: Missing ET , Invariant mass of muons pair, pT of the leading muon and pT of the second hardest muon.

Acknowledgments

We thank the staffs at Fermilab and collaborating institutions, and acknowledge support from the DOE and NSF(USA); CEA and CNRS/IN2P3 (France); FASI, Rosatom and RFBR (Russia); CAPES, CNPq, FAPERJ, FAPESPand FUNDUNESP (Brazil); DAE and DST (India); Colciencias (Colombia); CONACyT (Mexico); KRF and KOSEF(Korea); CONICET and UBACyT (Argentina); FOM (The Netherlands); PPARC (United Kingdom); MSMT (CzechRepublic); CRC Program, CFI, NSERC and WestGrid Project (Canada); BMBF and DFG (Germany); SFI (Ireland);Research Corporation, Alexander von Humboldt Foundation, and the Marie Curie Program.

[1] N. Arkani-Hamed, S. Dimopoulos and G. R. Dvali, Phys. Lett.B429, 263 (1998); N. Arkani-Hamed, S. Dimopoulos andG. R. Dvali, Phys. Rev.D59 086004 (1999).

[2] L. Randall e R. Sundrum, Phys. Rev. Lett. 83 3370 (1999).[3] V.M. Abazov et al., (D0 Collaboration), Phys. Rev. Lett. 95, 161602 (2005); V.M. Abazov et al., (D0 Collaboration),

Phys. Rev. Lett. 90, 251802 (2003); B. Abot et al., (D0 Collaboration), Phys. Rev. Lett. 86, 1156 (2001); V.M. Abazovet al., (D0 Collaboration), Phys. Rev. Lett. 100, 091802 (2008); and V.M. Abazov et al., (D0 Collaboration), Phys. Rev.Lett. 95, 091801 (2005).

Page 61: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

8

(GeV)TSE50 100 150 200

N

0

2

4

6

FIG. 5: pT dependence of the normalization factor (N), for ∆φ(µ, µ) > 2.9.

[4] A. Abulencia et al., (CDF Collaboration), Phys. Rev. Lett. 97, 091801 (2006); D. E. Acosta et al., (CDF Collaboration),Phys. Rev. Lett. 89, 281801(2002);

[5] T. Appelquist, H. -C. Cheng e B. A. Dobrescu, Phys. Rev. D64, 035002 (2001).[6] V. Lesne, “Search for associated production of charginos and neutralinos in the like sign dimuon channel,” DØ Note 5132,

2006.[7] T. Sjostrand et al., Comput. Phys. Commun. 135, 238 (2001).[8] S. Trincaz-Duvoid and P. Verdier,“Missing ET Reconstruction in p17,” DØ Note 4474, 2004.[9] Jet group web page:

http://www-d0.fnal.gov/phys id/jets/jetid.html[10] P. Calfayan et al.,“Muon Identification Certification for p17 data” DØ Note 5157, 2007.[11] I. Bertram et al., “A Recipe for Construction of Confidency Limits,” DØ Note 3476, 1999; The DØ Simple Limit Calculator

web page: http://www-d0.fnal.gov/Run2Physics/limit calc/limit calc.html

Page 62: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

9

(GeV)µµM0 20 40 60 80 100

Eve

nts

/ G

eV

-110

1

10

210

310

QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)T

Missing E0 20 40 60 80 100

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATA

UED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410 QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

(GeV)TP0 20 40 60

Eve

nts

/ G

eV

-210

-110

1

10

210

310

410QCD

W

WZ

ZZ

DATAUED

DØ Run II Preliminary

FIG. 6: Missing ET , Invariant mass of muons pair, pT of the leading muon and pT of the second hardest muon.

Page 63: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

63

C. Minuta da CMS Note

Page 64: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Available on CMS information server CMS IN 2007/XXX

CMS Internal NoteThe content of this note is intended for CMS internal use and distribution only

April 29, 2008

ALPGEN V+jets production in CMS: ValidationStudies

T. TomeiInstituto de Fisica Teorica, Universidade Estadual Paulista, BRAZIL

M. Pierini, M. SpiropuluCERN, European Organization for Nuclear Research, Geneva, SWITZERLAND

Abstract

We discuss the validation studies on theW+jets andZ+jets data samples produced using the fullmatrix elementALPGEN generator interfaced withPYTHIA for the parton shower and underlyingevent modeling and using the “MLM” parton shower matching algorithm. TheALPGEN datasets arefor the most part included in the CSA07 standard model cocktail and partly (the higher bosonpT bins)in the Tier-2 MC production exercise (refered to as “signals” production). The validation we presenthere is focused on studies of jet algorithms already at the parton shower matching stage and at thecharacterization of the boson+jets kinematics and dynamics. We study in detail the jet multiplicityand the bosonpT distributions both at the generator level and reconstruction level. The studies otherthan validating the MC data production are intending in formulating a robust relative metric for thejet definition and are especially aiming at the preparation for the MC tuning (and the identification ofappropriate dials) at the startup of the experiment using the data.

Page 65: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Contents

1 Introduction 2

2 Data Samples 2

3 Jet Definition 3

3.1 Iterative Cone Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.2 Midpoint Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.3 Siscone Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.4 FastkT Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.5 Preliminary Test of Jet Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

4 Characterization of the Samples 6

4.1 The CSA07 ALPGEN soup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

4.2 The samples at GEN level . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

4.3 The Reconstruction Level . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

5 Conclusion 13

1

Page 66: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

1 IntroductionTheW andZ QCD associated production at the LHC is a major component of the Standard Model (SM) back-ground to most physics searches. It is critical that the high jet multiplicity bins as well as the high bosonpT

kinematic ranges can be estimated using the data but with attention and a strategy such that the new physics sig-nals that are expected to emerge in the same kinematic ranges are not normalized away. The current state of artcalculators and generators for these processes include:

• MCFM: calculation on NLOW+jets cross section

• ALPGEN : ME, LO up toW ,Z+N partons (N=6)

• MC@NLO: NLO

• MADGRAPH: ME, LO up toW ,Z+N partons (N=4)

In this note we use the ALPGEN datasets that were produced as described in [1] In terms of the dynamics andkinematics of theW andZ+jets LO predictions there is a dependence on the theoretical input parameters such asthe renormalization and factorization scales as well as the parton distribution functions.

Because of the presence of a number of intermediate scales in the considered processes during the parton showerevolution and the hadronization, the hard process of the first step is not decoupled from the soft branchings thattake place during the hadronization. In order to avoid the double counting of the contributions at the intermediatescales, a parton-shower matching algorithm is applied that is based on the definition of a jet or cluster[cite MLMmatching] 1). For a given set of jet object definitions we investigate at generation level, jet-based observablesthat can be used in the data to tune the Monte Carlo predictions and focus on the jet multiplicity and bosonpT asderived from the jets in the event.

2 Data SamplesThe samples used in this note consists of theALPGEN events introduced in the CMS CSA07 “ data soup”. Thisproduction consists of:

• W+jets events with up to five partons in the hard process (see Ref. [1])

• Z+jets events with up to five partons in the hard process (see Ref. [1])

• tt+jets events with up to four partons in the hard process (see Ref. [2])

I want here the numbers of events that went in the soups per parton multiplicity or the equivalent lumis perparton multiplicity- note these are not just the Gen events requested they are the reco events which are lessor equial to the gen events depending on how many jobs crashed during production etc.

Thiago: where do we get this information?

The samples have been produced using the version 2.12 of theALPGEN [3] leading order (LO) Monte Carlo gener-ator, based on theALPHA algorithm [4]. The parton shower has been performed using version 6.09 ofPYTHIA [5]and theMLM matching algorithm [6] has been applied to avoid double-counting of processes at intermediate statesand to reduce the dependence on the theoretical parameters (the parton shower matching is effectively a partialresummation).

When generating the events corresponding to a given hard-process, we requirepT > 20 GeV/c for each partonand a parton-parton separation of∆R = 0.7. Similarly, the matching parameters of the MLM algorithm have beenfixed toEmin

T = 20 GeV andRmatch = 0.7 × ∆R separation.

ForW+jets andZ+jets samples, a binning in the bosonpT has been applied in order to easily allow to sample thetails and the peaking region of the jetpT distribution, without directly biasing the jet definition. In particular, wedefine six different samples by requiring (for each jet multiplicity):

• pT (V ) ≤ 100 GeV/c

1) Note that the matching is not operating on ISR/FSR or the underlying event.

2

Page 67: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

• 100pT (V ) ≤ 300 GeV/c

• 300pT (V ) ≤ 800 GeV/c

• 800pT (V ) ≤ 1600 GeV/c

• 1600pT (V ) ≤ 3200 GeV/c

• 3200pT (V ) ≤ 5000 GeV/c

In the case ofW+jets (Z+jets) only events in the first two bins (the first bin) have been generated in the CSA07data soup. The rest are being produced as part of the CSA07 “signal” production.

When analysing the generated samples, we collect all the available jet multiplicities and normalize them to areference luminosity (we takeL = 100 pb−1). The scaling factor is given byL × σ/Ngen, whereNgen is thenumber of generated events andσ is the cross section (calculated at the LO byALPGEN) 2).

3 Jet DefinitionSince the quark and gluons produced in a high-energy collision carry a color, they cannot exist as free particles.Propagating in the space, they generate a shower of quarks and gluons, such that the hadrons produced in the finalstate are colorless.

When reconstructing the particles produced in a collision, the limited experimental precision does not allow toreconstruct all the steps of the cascade backward, up to identifying the kinematic properties of the original parton.Instead, it is possible to describe the shower as a single object, ajet. Assuming perfect resolution, the ideal jetalgorithm should be such that its kinematic properties are those of the parton from which the cascade originated.

The jet is defined starting from a list of physics objects (such as quarks, gluons or hadrons at generation level, aswell as tracks or calorimetric deposits at reconstruction level) which are combined according to a given criterion.In analogy to what distinguishes a real photon or electron from a virtual one, when a QED-related observable isdefined, the definition of a jet has to be such that collinear or soft divergences from QCD are avoided. In such away, a measured jet cross section (as for instance the cross section ofW+ ≥ 1 jet in p–p collisions at LHC) isphysically meaningful and calculable.

Several jet algorithms have been proposed in literature. In each case, a metric is defined in the parameter space,which defines the distance among the jet constituents. In the easiest case of cone algorithms, this is obtaineddefining the cone sizeR =

∆φ2 + ∆η2 (where∆η (∆φ) is the maximum rapidity (azimuthal angle) distanceamong each particle in the jet and the center of the cone). This is one of the possible choices adopted for thekT

algorithm.

In addition, apT threshold is generally applied when performing analysis. The algorithm that associates theconstituents into jet candidates (cluster algorithm) is not in general the only needed ingredient. In fact, it ispossible that a given constituent can be associated to more than one jets. In this case, it is important to define acriterion that solves the overlap in favour of one of the overlapping jets (split and merge function). When the listof jets is defined, one needs to establish a criterion to obtain the kinematic properties (pT , η, andφ) of the jets,starting from those of its constituents. In CMS, theEnergy scheme (a.k.a.Scheme A) is used, which consist insumming the four momenta of the constituents to obtain the four momentum of the jet.

In case of reconstructed jets made of calorimetric deposits, each calorimetric tower is treated as a massless particle.Even if this is not requested for generator-level jets, the same approach is usually followed also in this case, forconsistency. In theEnergy scheme the invariant mass of the constituents is not necessarily null, i.e. the jets aremassive objects:

• Eij = Ei + Ej

• pij = pi + pj

2) All the values as registered for the CSA07 production are listed athttps://twiki.cern.ch/twiki/bin/view/CMS/GeneratorProduction2007CSA07,https://twiki.cern.ch/twiki/bin/view/CMS/GeneratorProduction2007CSA07Signal

3

Page 68: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Four jet algorithms are available inCMSSW, namely iterative cone, midpoint cone, siscone, and fastkT algorithm.In each of these algorithms, a parameter defines the size (R for cone algorithms,D for kT ). In addition, all the jetsare required to have apT above a given threshold. We describe below the jet algorithms and the specific settingsused inCMSSW.

3.1 Iterative Cone Algorithm

The iterative cone (IC) algorithm is the simplest cone algorithm used in CMS. The clustering is done sorting theconstituents of the input list from the highestpT to the lowest one. A cone of given size∆R =

∆η2 + ∆φ2 isdrawn around the first element in the list and all the particles inside the cone are used to define the jet direction (byusing theEnergy scheme). The procedure is iterated using the output jet direction as the new center of the cone,until the jet definition becomes stable.

Once a stable jet is found, all its constituents are taken out of the input list and the search of a new jet starts. In thisway, it is impossible by construction that the same constituent belongs to two different jets and no split and mergefunction is needed in this case.

The iterative cone is particularly appealing, thanks to its simplicity and easy interpretation of results. On the otherhand, it introduces some problem from the theoretical point of view. On one hand, if any constituent can act as aseed of the algorithm, then the jet definition is infrared unsafe. This is clear thinking of a cone with two constituentsbeing on the external surface of the cone on opposite sides. If a infinitely soft constituent is added in the cone,the clustering will produce two cones out of this initial cone, i.e. the cone definition is not stable with respect toadding a soft particle.

A workaround for this problem is obtained by applying apT threshold to the jet constituents to be seeds (as adefault, 1 GeV in CMS). It can be shown that in this case the jet is infrared safe, but collinear unsafe. This is whymore complex algorithms have been introduced.

3.2 Midpoint Algorithm

The midpoint algorithm is similar to the IC algorithm, except for the fact that not only the constituents, but alsocombinations of them are used toseed the algorithm. In addition, unlike the case of IC, after a jet is declared stableits constituents can be used to form other jets. When all the jets are formed, jets sharing more than a given fractionof their energy (75% as a default in CMS) are merged. If the overlap is less than what specified, each sharedconstituent is associated to the closest jet (i.e. to the jet having its center closer to the constituent momentum).Otherwise the jets are merged.

While being more stable than IC, the midpoint algorithm does not entirely solve the problem of the infraredunsafety of the cone algorithms. In fact, the problem illustrated in the case of IC disappears for two constituentson the external surface of the cone, but appears back for some configurations of three constituents on the edge ofthe cones.

3.3 Siscone Algorithm

The siscone algorithm is an infrared-safe seed-less algorithm that clusters physics objects into cone-shaped jets.Taking as input a list of objects (generator-level particles, calorimetric towers, ...) the algorithm works as follows:

• Take a particlei from the list.

• Identify all the objectsj in a radius2R in (η, φ) (if no object is found,i forms a jet by itself). This identifiesthe protojet.

• Look for the two circles of radiusR for which i andj are on the boundary.

• Rank the two circles according to the angle between the object and the center. Each circle defines four cones(all combinations ofi andj being in and/or out).

• Check ifi andj are in or out with respect to the cone made with the particles in the circle. If it is the samethen the protojet is defined as stable.

• Consider the next circle and check stability with respect to adding/removing the particles for which this andthe previous circle differ.

4

Page 69: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

The procedure is iterated until no new stable cone is found. The list of stable cones identify the jets, that are thenpassed to the split and merge function, after apT threshold is required and the jets are ranked according to thepT .The split and merge function takes two jetsk andl and works as follows:

• if the overlap is such thatplT < f × pk

T each shared parton is assigned to the closest jet. The momenta arerecalculated and the jets are put back in the list, ranked using the newpT .

• If the overlap is above the thresholdf , the two jets are merged and the jets are put back in the list, rankedusing the newpT .

At the end of each cycle, thepT ranking is done again. The difference with respect to the standard split& mergefunction is that whenever a copy of an already existing jet is produced when splitting or merging two jets, both thecopies of the jets are kept.

3.4 FastkT Algorithm

Unlike the algorithms we illustrated above, thekT algorithm creates jets without forcing them to a cone shape.The algorithm works as follows:

• For each pair of particlesi, j work out thekT distancedij = min(kiT , kj

T )Rij with Rij =√

(ηi − ηj)2 + (φi − φj)2,whereki

T , ηi andφi are the transverse momentum, rapidity and azimuth of particlei. For each partoni alsocalculate the beam distancediB = kTi.

• Find the minimumdmin of all thedij , diB . If dmin is adij merge particlesi andj into a single particle,summing their four-momenta (alternative recombination schemes are possible); if it is adiB then declareparticlei to be a final jet and remove it from the list.

• Repeat from the first step until no particles are left.

The algorithm is infrared and collinear safe, with the disadvantage of loosing the handle on the shape of the jet (nomore constrained to have a regular geometric form).

3.5 Preliminary Test of Jet Algorithms

As a preliminary test, we show the kinematical quantities (pT , η) for the first, second and third jets, ordered byET .The jets were constructed from generator-level stable particles, using both iterative cone and siscone jet algorithms,with CMS standard parameters (cone sizeR = 0.5 for both, seed threshold = 1 GeV for IC, overlap parameter =0.5 for siscone, and no energy orET thresholds on the input objects). On top of those parameters, we also requiredapT threshold of 20 GeV on the jets.

(GeV)T

Jet p20 40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

310

410

510

610

dist. jets - W+jets, ICone, 20 GeV, R=0.5T

p 1st jet2nd jet3nd jet

dist. jets - W+jets, ICone, 20 GeV, R=0.5T

p

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

310

410

510

eta dist. jets - W+jets, ICone, 20 GeV, R=0.5 1st jet2nd jet3nd jet

eta dist. jets - W+jets, ICone, 20 GeV, R=0.5

Figure 0: Transverse momentumpt and pseudo-rapidityη of the three first jets (ordered byEt) in the W+jetssample,0 < pT (W ) < 100 GeV, for the iterative cone algorithm.

5

Page 70: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

(GeV)T

Jet p20 40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

210

310

410

510

dist. jets - Z+jets, SISCone, 20 GeV, R=0.5T

p 1st jet2nd jet3nd jet

dist. jets - Z+jets, SISCone, 20 GeV, R=0.5T

p

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

410

eta dist. jets - Z+jets, SISCone, 20 GeV, R=0.5 1st jet2nd jet3nd jet

eta dist. jets - Z+jets, SISCone, 20 GeV, R=0.5

Figure 1: Transverse momentumpt and pseudo-rapidityη of the three first jets (ordered byEt) in the Z+jetssample,0 < pT (Z) < 100 GeV, for the SISCone algorithm.

4 Characterization of the SamplesIn this section we describe the samples at the generator level (GEN) and after reconstruction (RECO).

On one hand, the comparison of theALPGEN cross sections with the generator-level information allows to quantifythe effect of the soft QCD processes associated to the hard interaction (initial and final state interactions andhadronization) on the jet counting andpT spectrum.

On the other hand, by comparing the generator-level information with the reconstructed events we can evaluatethe impact of the detector effects on the physics observables. As we illustrate in details below, we distinguishthree steps in the reconstruction: i) Detector reconstruction. ii) Baseline QCD selection. iii) EW selection (alsoincluding amimic of the trigger on the leptons).

Before describing theGEN andRECO samples, we recall the main features of theALPGEN production for thedatasoup of CSA07.

4.1 The CSA07 ALPGEN soup

The CSA07 ALPGEN soup, also calledChowder, includes thett samples generated requiringpT > 70 GeV/c forthe partons, and the first two bins of theW+jets andZ+jets samples.

The full description of the samples (as produced byALPGEN) is already documented in CMS notes [1, 2]. Herewe point put three features of the samples that, if preserved at any stage of the reconstruction, guaranties that theQCD is preserved.

i) By plotting the LO cross sections calculated byALPGEN (see Fig. 2) we can calculate thedifferential crosssectiondσ/dnjet ∼ 4.3.

ii) The ratio ofW+jets cross section overZ+jets cross section is∼ 10 (∼ 8) for the first (second)pT bin (seeFig. 3). By requiring the invariant mass of the two leptons to be around theZ peak, the ratio goes up to∼ 10 evenin the second bin.

iii) By requiring the partonpT to be above70 GeV/c, a proper QCD scaling with the number of partons is recovered(see Fig. 4).

4.2 The samples at GEN level

Even if theGEN samples are obtained by filtering theALPGEN samples with the MLM algorithm, the number ofclustered GenJets in the event is different than the number of partons coming from the hard interaction (see Fig. 5).The difference is observed for any jet algorithm used as input, even if it depends qualitatively on the choice.

The effect could be associated to differences in the jet algorithm used to cluster the generated particles. We excludethis possibility by implementing the cluster algorithm used inALPGEN and observing a behavior close to the caseof the IC algorithm3).

3) This is expected, sinceALPGEN uses a simple cone algorithm very close to IC, except for the iterative part.

6

Page 71: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Jet Multiplicity0 1 2 3 4 5

Incl

usi

ve c

ross

sec

tio

n (

pb

)

510

610

710

810

ALPGEN 2.12 Pythia 6.409 MLM matching2(W)<100 GeV/cT

W+jets 0<p

Jet Multiplicity0 1 2 3 4 5

Incl

usi

ve c

ross

sec

tio

n (

pb

)

410

510

610

710

ALPGEN 2.12 Pythia 6.409 MLM matching2(Z)<100 GeV/cT

Z+jets 0<p

Figure 2: Dependence of LOALPGEN W+jets (left) andZ+jets (right) cross section on jet multiplicity.

Jet Multiplicity1 1.5 2 2.5 3 3.5 4 4.5 5

Incl

usi

veN

(Z+j

ets)

N(W

+jet

s)

0

2

4

6

8

10

12

ALPGEN 2.12 Pythia 6.409 MLM matching2(W/Z)<100 GeV/cT

W+jets/Z+jets 0<p

Jet Multiplicity1 1.5 2 2.5 3 3.5 4 4.5 5

Incl

usi

veN

(Z+j

ets)

N(W

+jet

s)

0

2

4

6

8

10

12

ALPGEN 2.12 Pythia 6.409 MLM matching2(W/Z)<300 GeV/cT

W+jets/Z+jets 100<p

Figure 3: Ratio of LOALPGEN W+jets cross section overZ+jets as a function of jet multiplicity, for the vectorbosonpT in the rangepT < 100 GeV/c (left) and100 < pT < 300 GeV/c (right).

jet multiplicity-0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5

+jet

s)[f

b]

t(tσ

incl

usi

ve

310

410

510

610

710

2T=m2Q

20 GeV/c≥T

jet p

40 GeV/c≥T

jet p

70 GeV/c≥T

jet p

2T=m2Q

Figure 4: Dependence of LOALPGEN tt+jets cross section on jet multiplicity for different choices ofpT thresh-olds.

On the other hand, one has to consider that the matching algorithm does not include the soft QCD effects associatedto the hard interaction (initial and final state interaction, hadronization). Since GenJets are clustered after the softQCD effects, a mismatch can be introduced between GenJets and matched partons.

Fig. 6 shows the jet multiplicity forW+jets sample, forming jets at generation level with partons or hadrons.After merging all the partons multiplicities and fitting for the exponential decay, we derivedNevents/dnjets =2.93 ± 0.06 (dNevents/dnjets = 2.94 ± 0.04) for jets made with hadrons (partons). The small difference provesthat the hadronization cannot justify the mismatch between partons and generator-level jets. Another importantinformation is obtained from Fig. 6: in the two plots, the superimposed curves are obtained fitting in the range[1,5] and extrapolating the result beyond this range. The curves and the plots reasonably agree up to thenjets ≥ 7

7

Page 72: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Jet multiplicity0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

Eve

nts

10

210

310

410Iterative Conept > 20 GeVR = 0.7

Jet multiplicity0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

Eve

nts

10

210

310

410Midpoint Conept > 20 GeVR = 0.7

Jet multiplicity0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

Eve

nts

1

10

210

310

410 Kt Conept > 20 GeVD = 0.6

Jet multiplicity0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

Eve

nts

10

210

310

SISConept > 20 GeVR = 0.7

Figure 5: Jet multiplicity forW+2 partons samples obtained using different jet algorithms.

# of jets0 1 2 3 4 5 6 7 8 9

# o

f ev

ents

210

310

410

510

610

Partons: 2.93 +/- 0.06

Hadrons: 2.94 +/- 0.04

Jet multiplicity - partons X hadrons

# of jets0 1 2 3 4 5 6 7 8 9

# o

f ev

ents

310

410

510

610

Partons: 2.03 +/- 0.04

Hadrons: 2.09 +/- 0.02

Jet multiplicity - partons X hadrons

Figure 6: Number of generatedW+jets events as a function of jet multiplicity. Jets are formed taking as inputgenerator-level partons or hadrons, using the IC algorithm with a jetpT threshold of 20 GeV/c and a cone sizeR = 0.5 (left) andR = 0.7 (right). The superimposed curve represent an exponential function obtained fitting inthe range [1,5] and extrapolating to the entire range.

bin. This means thatPYTHIA provides a reasonable estimation of the rates at most for theplus two bin 4)

do we have a plot with high pT cut? does the jet multiplicity spread more or less that at low pT? At high pTwe should have less sensitivity to soft QCD

The mismatch between number of partons and number of hadrons has an implication in the way the samples haveto be combined at the end. Unlike what is done in several published CMS notes, it is not possible to ignore thesamples withn partons, when interested to signatures withm > n jets, because of thefeed-up andfeed-down of

4) Here theplus two is with respect to the number of partons generated byALPGEN.

8

Page 73: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

eachn parton samples to them jet multiplicity.

The determination of the slope ofdNevents/dnpartons is particularly important to predict theW +n jets andZ +njets rates from the measurement of theW + (n − 1) jets andZ + (n − 1) jets cross sections. This is particularlyimportant since it allows to obtain a data-driven estimation of backgrounds to searches. Furthermore, it will bepossible to tune the parameters of the LO Monte Carlo generators (such as factorization and normalization scale)to obtain a more realistic determination of the backgrounds and better design the search analyses. In order todo so, it is crucial to connect the parton-level cross sections with the observed rates. The fact that already atGEN level parton and jet multiplicities do not agree makes this connection even more important. By normalizingthe the distributions of the number of jets in each parton sample, one can summarize thefeed-up andfeed-downprobabilities into a matrix. By inverting the matrix, it is possible to connect the observed rates (and cross sections)at generator level to the parton-level values. The generalization of this approach to the real data will allow to extractthe slope of thedσ/dnpartons from the measured slope ofdσ/dnjet. The result of this procedure when applied togenerator level jet rates is shown in Fig. 7, forW , Z andtt + jets samples. In the case oftt, the generator level jetswere created taking out of the input collection any particles descending from one of thet, in order to have a handleonly on the QCD associated jets. It can be seen that the slope changes from itsdσ/dnjet to itsdσ/dnpartons ∼ 4.3value.

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

510

610

710Slope = 2.92

W + jets multiplicity

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

410

510

610

Slope = 4.39

W + jets multiplicity

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

410

510

610Slope = 2.83

Z + jets multiplicity

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

310

410

510

Slope = 4.10

Z + jets multiplicity

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

310

410

Slope = 2.41

ttbar + jets multiplicity

Jet Multiplicity0 1 2 3 4 5 6

Nu

mb

er o

f ev

ents

210

310

410

Slope = 4.27

ttbar + jets multiplicity

Figure 7:dNevents/dnjet calculated from generator level jets (left) and after correcting for thefeed-up andfeed-down effects, forW , Z andtt + jets samples. Here the IC cone is used, with a jetpT threshold of 20 GeV/c and acone sizeR = 0.5.

The slope of the rate as a function of jet multiplicity also depends on the jet definition. The matrix elements

9

Page 74: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

calculator has two parameters as input (the parton threshold and the parton-parton separation) which mimic thedefinition of the jets (jetpT and cone opening angle). Nevertheless, these requirements do not directly correspondto kinematic thresholds, sincePYTHIA will populate the remaining portion of the phase space. This means thatthere is not a direct correspondence between the two set of parameters. The definition of the jets changes theobserved slope ofdNevents/dnjet, since by using a softer and/or larger cone more jets are going to be reconstructedin average. This is shown in Fig 8, where the value ofdNevents/dnjet is given for W+jets and Z+jets events atgeneration. Here the IC cone is used. It is remarkable to notice that big changes in the jet definition (and thenin the slope) do not affect the W over Z ratio, since the same dependence is observed in the two cases. This isalso proved in Fig. 9: the plot ofdNevents/dnjet for two different settings of the IC cone algorithm are shown inlog scale. The slope of the two lines (obtained fitting the point in the range [1,5]) are consistent between Z+jetsand W+jets. As expected, the ratio of W over Z rates, as a function of the jet multiplicity, is indeed a very robustobservable. This is why the study of the ratios of the W over Z rates represents a privilegedobservatory of QCDat LHC (thinking in particular to the Z+jets sample as acandle for the background studies of BSM searches).

cut (GeV)T

p10 15 20 25 30 35 40 45 50 55 60Cone size X 103

45

67

89

exp

(-sl

op

e)

1

2

3

4

5

6

7

8

jet/dNσVariation of d

cut (GeV)T

p10 15 20 25 30 35 40 45 50 55 60Cone size X 103

45

67

89

exp

(-sl

op

e)1

2

3

4

5

6

7

jet/dNσVariation of d

Figure 8:dNevents/dnjet as a function ofpT threshold and cone size for W+jets (left) and Z+jets (right) samples,as a function of the setting parameters (pT threshold and cone sizeR) of the IC algorithm.

Jet Multiplicity0 1 2 3 4 5 6 7 8 9

Nu

mb

er o

f ev

ents

210

310

410

510

610

710 W Slope = 3.13Z Slope = 3.11

Iterative Cone, 20 GeV, R=0.5

Jet Multiplicity0 1 2 3 4 5 6 7 8 9

Nu

mb

er o

f ev

ents

210

310

410

510

610

710 W Slope = 2.98Z Slope = 3.10

Midpoint Cone, 20 GeV, R=0.5

Jet Multiplicity0 1 2 3 4 5 6 7 8 9

Nu

mb

er o

f ev

ents

10

210

310

410

510

610

710 W Slope = 3.76Z Slope = 3.66

Kt algorithm, 20 GeV, R=0.4

Jet Multiplicity0 1 2 3 4 5 6 7 8 9

Nu

mb

er o

f ev

ents

210

310

410

510

610

710 W Slope = 2.89Z Slope = 2.85

Siscone, 20 GeV, R=0.5

Figure 9: dNevents/dnjet as a function ofpT threshold and cone size for W+jets and Z+jets samples, obtainedusing the Iterative Cone, Midpoint Cone,kT and Siscone algorithms with apT threshold of 20 GeV/c and a conesize (scale parameter) ofR = 0.5 (D = 0.4) for the cone (kT ) algorithms.

10

Page 75: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

The validation of the sample can be performed not only by looking at thedNevents/dnjet slope. A complementaryinformation comes from the distribution of the jetpT . In particular, it is interesting to study the balance betweenthe bosonpT and thepT of the jets system before introducing the detector effects and as a function of the jetalgorithm. In the ideal case of perfect reconstruction, thepT of the invariant system consisting by the jets and thepT of the vector boson should coincide, since the two systems are recoiling one against each other. On the otherhand, for all the jet algorithms we expect some of the shower energy to leak out of the jets, so that a differenceamong the two shapes will be introduced, even at generation level. A comparison of the two shapes allows to judgethe goodness of the performances of a given jet algorithm.

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

310

410

510

W+jets, ICone, 20 GeV, R=0.5 - directT

boson p

- jetsT

boson p

W+jets, ICone, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

310

410

510

W+jets, Midpoint, 20 GeV, R=0.5 - directT

boson p

- jetsT

boson p

W+jets, Midpoint, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

310

410

510

610

- directT

boson p

- jetsT

boson p

W+jets, SISCone, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

310

410

510

W+jets, Kt algorithm, 20 GeV, D=0.4 - directT

boson p

- jetsT

boson p

W+jets, Kt algorithm, 20 GeV, D=0.4

Figure 10:

In Fig. 10 (11) we show the comparison of the two distributions for W+jets (Z+jets) sample withpT (W/Z) < 100GeV/c, obtained using the jet algorithms available by default inCMSSW. Two main features emerge from the plots:i) at low values of the bosonpT the two distribution deviates because of thepT threshold applied to define the jets.In fact, the samples entering in the plots are dominated by the W+1jet and Z+1jet samples5) for which a cut on thepT of the jet directly corresponds to a requirement on thepT of the vector boson. ii) There are events for whichthe vector boson has apT which exceedspT bin defining the sample (0 < pT < 100 GeV/c). In the case of thepT

calculated from the jets, this is related to the fact that, even at generator level, a fraction of the momentum of theinitial parton can flow outside the jet cone during the shower. On the other hand, the observation of a similar effecton the generator-level value of the bosonpT is less intuitive. This feature is related to the fact that the requirementon the bosonpT that defines the sample is applied whenALPGEN generates the hard-interaction kinematic. Whenthe event is passed toPYTHIA the kinematic needs to be modified in order to preserve the balance of thepT inthe event even after adding the underlying event. Because of this modification, the momentum of the vector bosonafter the parton shower is different that what was generated byALPGEN. 6)

5) The presence of a jet is implicitly required when thepT of the vector boson is determined from the recoil against the invariantsystem of one or more jets.

6) It is also important to stress the fact that this effect is not taken into account when the weights of theChowder soup arecalculated. In fact, the information related to theALPGEN generation, stored in theAlpgenInfoProduct, was lost whenthe events have been merged into the soup. Because of this, only thePYTHIA configuration of the event kinematic can usedto calculate the weight. This approach, forced by the limited information available, fails when the events is at the boundariesof the kinematic range.

11

Page 76: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

10

210

310

410

Z+jets, ICone, 20 GeV, R=0.5 - directT

boson p

- jetsT

boson p

Z+jets, ICone, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

10

210

310

410

Z+jets, Midpoint, 20 GeV, R=0.5 - directT

boson p

- jetsT

boson p

Z+jets, Midpoint, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

10

210

310

410

- directT

boson p

- jetsT

boson p

Z+jets, SISCone, 20 GeV, R=0.5

(GeV)T

Boson p20 30 40 50 60 70 80 90 100 110 120

Nu

mb

er o

f ev

ents

10

210

310

410

Z+jets, Kt algorithm, 20 GeV, D=0.4 - directT

boson p

- jetsT

boson p

Z+jets, Kt algorithm, 20 GeV, D=0.4

Figure 11:

4.3 The Reconstruction Level

When studying reconstructed events, we distinguish three different steps of event selection, such that effects relatedto detector resolution, QCD selection, and electroweak selection are factorized. We define:

• A Raw selection, which is applied just after the reconstruction (i.e. all the requirement implied by theCMSSWreconstruction code are implicit). It requires at least oneRECO jet. We focus on muon sample by requiringthatW → µν andZ → µµ at generation level.

• A Baseline selection. It consists in requiring that the leading jet (as ordered inET ) is central (namelyimposing|η| < 1.3). Jets are defined using the IC cone algorithm, withpT ≥ 30 GeV/c.

• A leptonic selection. It consists in requiring that the lading muon (ordered inpT ) haspT > 7 GeV/c andη < 2.1|.

In Tab. 1 we report the number of events (scaled to100 pb−1) selected at each step, for the samples composing theALPGEN soup and differentinclusive jet multiplicities.

The set of numbers shows how thett background is relatively large already at low jet multiplicities and it becomesthe largest contribution already at≥ 3 jets. This is a minor problem forZ + jets selection, since the distributionof theZ invariant mass allows to separate the signal from the background. It is more challenging forW + jets,in which case more detailed studies are needed. It is important to stress the fact that the dominance oftt events isnot related to the selection but it is already present in theRaw sample. Indeed, theBaseline andleptonic selectionactually enrich the sample ofW + jets andZ + jets events.

The kinematic properties of the jets forW + jets (Z + jets) samples are shown in Fig. 12 (Fig. 13). The jets areordered according to the associated transverse energy.

It is remarkable to notice how the distributions ofW+jets andZ+jets agree. This is the confirmation of the factthat the EW part and the QCD part of the decay do factorize, so that all the differences are in the EW featuresand not in the QCD distributions. This is true, despite the fact that the production mechanism forW andZ aredifferent, because of the the different initial states.

In Fig. 14 (Fig. 15) we show the distributions for the bosonpT , calculated from the Monte Carlo truth or from thepT of the invariant system of jets, when we ask for the presence of at least 1 or 2 reconstructed jets in the event.

12

Page 77: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

W ≥ 1j 150484± 390 57716± 240 41584± 200

Z ≥ 1j 17045± 130 6736 ± 82 5628 ± 75

tt ≥ 1j 40744± 200 24924± 160 9093 ± 95

W ≥ 2j 25924± 160 11540± 110 7987 ± 89

Z ≥ 2j 3025 ± 55 1362 ± 37 1093 ± 33

tt ≥ 2j 36571± 190 22273± 150 7707 ± 88

W ≥ 3j 4304 ± 66 2119 ± 46 1456 ± 38

Z ≥ 3j 527 ± 23 260 ± 16 205 ± 14

tt ≥ 3j 26131± 160 15742± 130 4993 ± 71

W ≥ 4j 782 ± 28 413 ± 20 288 ± 17

Z ≥ 4j 96 ± 10 50 ± 7 39 ± 6

tt ≥ 4j 13711± 120 8145 ± 90 2407 ± 49

Table 1: Number of selected events (scaled to100 pb−1) at each step, for the samples composing theALPGEN soup and for differentinclusive jet multiplicities.do we want to put efficiencies instead?

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

410

dist. jets - W+jetsTE 1st jet2nd jet3nd jet

dist. jets - W+jetsTE

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

410

dist. jets - W+jetsTE 1st jet2nd jet3nd jet

dist. jets - W+jetsTE

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

410

dist. jets - W+jetsTE 1st jet2nd jet3nd jet

dist. jets - W+jetsTE

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

410

eta dist. jets - W+jets 1st jet2nd jet3nd jet

eta dist. jets - W+jets

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

410

eta dist. jets - W+jets 1st jet2nd jet3nd jet

eta dist. jets - W+jets

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. jets - W+jets 1st jet2nd jet3nd jet

eta dist. jets - W+jets

Figure 12: Distribution of jetET and η for theRaw (left), Baseline (center), andleptonic (right) selection in thecase ofW+jets events.

Because of the large cross-section of theW/Z + 1 jet sample in comparison to multijets and thepT > 30GeV cuton the jets, the bosonpT distribution derived from the jet recoil is distorted when one asks only for 1 jet. On theother cases, the reconstructed distribution is shifted to lower values ofpT , reflecting a subestimation of the averagejet energy.

In Fig. 16, 17, 18 and 19 we show the kinematics of the reconstructed muons, at the three levels of requirements,requiring 1 or 2 reconstructed jets, forW andZ + jets samples.

In Fig. 20, we show the derived slopes for the three levels of requirements.

5 Conclusion

13

Page 78: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

dist. jets - Z+jetsTE 1st jet2nd jet3nd jet

dist. jets - Z+jetsTE

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

dist. jets - Z+jetsTE 1st jet2nd jet3nd jet

dist. jets - Z+jetsTE

(GeV)TJet E40 60 80 100 120 140 160 180 200

Nu

mb

er o

f E

ven

ts

10

210

310

dist. jets - Z+jetsTE 1st jet2nd jet3nd jet

dist. jets - Z+jetsTE

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. jets - Z+jets 1st jet2nd jet3nd jet

eta dist. jets - Z+jets

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

10

210

310

eta dist. jets - Z+jets 1st jet2nd jet3nd jet

eta dist. jets - Z+jets

Jet eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

10

210

310

eta dist. jets - Z+jets 1st jet2nd jet3nd jet

eta dist. jets - Z+jets

Figure 13: Distribution of jetET and η for theRaw (left), Baseline (center), andleptonic (right) selection in thecase ofZ+jets events.

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

5000

10000

15000

20000

25000

30000

35000

40000

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

2000

4000

6000

8000

10000

12000

14000

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

2000

4000

6000

8000

10000

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

200

400

600

800

1000

1200

1400

1600

1800

2000

- directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

100

200

300

400

500

600

700

800

900

dist. V + >= 2 jetTP - directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

100

200

300

400

500

600

dist. V + >= 2 jetTP - directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

Figure 14: Distribution ofW bosonpT when requiring reconstruction of at least 1 (top) and 2 (bottom) jets, fortheRaw (left), Baseline (center), andleptonic (right) selection events.

References[1] M. Pierini and M. Spiropulu, CMS internal note 2007/031.

[2] M. Pierini and M. Spiropulu, CMS internal note 2007/038.

[3] M. L. Mangano, M. Moretti, F. Piccinini, R. Pittau and A. D. Polosa, JHEP0307(2003) 001 [arXiv:hep-ph/0206293].

[4] F. Caravaglios and M. Moretti, Phys. Lett. B358(1995) 332 [arXiv:hep-ph/9507237].

[5] T. Sjostrand, S. Mrenna and P. Skands, JHEP0605(2006) 026 [arXiv:hep-ph/0603175].

[6] M. L. Mangano, in preparation. See also M. L. Mangano, M. Moretti, F. Piccinini and M. Treccani, JHEP0701(2007) 013 [arXiv:hep-ph/0611129].

14

Page 79: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

500

1000

1500

2000

2500

3000

3500

4000

4500

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

200

400

600

800

1000

1200

1400

1600

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

200

400

600

800

1000

1200

1400

- directT

boson p

- jetsT

boson p

dist. V + >= 1 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

20

40

60

80

100

120

140

160

180

200

220

240

dist. V + >= 2 jetTP - directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

20

40

60

80

100

dist. V + >= 2 jetTP - directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

(GeV)T

Boson p0 50 100 150 200 250 300

Nu

mb

er o

f ev

ents

10

20

30

40

50

60

70

80

dist. V + >= 2 jetTP - directT

boson p

- jetsT

boson p

dist. V + >= 2 jetTP

Figure 15: Distribution ofZ bosonpT when requiring reconstruction of at least 1 (top) and 2 (bottom) jets, for theRaw (left), Baseline (center), andleptonic (right) selection events.

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

410

dist. muons - W+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - W+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - W+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - W+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 2jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - W+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 2jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - W+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - W+jets, >= 2jetT

p

Figure 16: Muon transverse momentum for the two muons with highestpT , requiring 1 (top) and 2 (bottom) jets,for theRaw (left), Baseline (center), andleptonic (right) selection events,W+jets sample.

15

Page 80: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

410

eta dist. muons - W+jets, >= 1jet1st muon

2nd muon

eta dist. muons - W+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. muons - W+jets, >= 1jet1st muon

2nd muon

eta dist. muons - W+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. muons - W+jets, >= 1jet1st muon

2nd muon

eta dist. muons - W+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. muons - W+jets, >= 2jet1st muon

2nd muon

eta dist. muons - W+jets, >= 2jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. muons - W+jets, >= 2jet1st muon

2nd muon

eta dist. muons - W+jets, >= 2jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

310

eta dist. muons - W+jets, >= 2jet1st muon

2nd muon

eta dist. muons - W+jets, >= 2jet

Figure 17: Muon pseudo-rapidity for the two muons with highest pT , requiring 1 (top) and 2 (bottom) jets, for theRaw (left), Baseline (center), andleptonic (right) selection events,W+jets sample.

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

310

dist. muons - Z+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

dist. muons - Z+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

1

10

210

dist. muons - Z+jets, >= 1jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 1jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

10

210

dist. muons - Z+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 2jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

1

10

210

dist. muons - Z+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 2jetT

p

(GeV)T

Muon p0 50 100 150 200 250

Nu

mb

er o

f E

ven

ts

1

10

210

dist. muons - Z+jets, >= 2jetT

p1st muon

2nd muon

dist. muons - Z+jets, >= 2jetT

p

Figure 18: Muon transverse momentum for the two muons with highestpT , requiring 1 (top) and 2 (bottom) jets,for theRaw (left), Baseline (center), andleptonic (right) selection events,Z+jets sample.

16

Page 81: Relatório Científico - sprace.org.br · Projeto Temático Processo 03/04519-9 Abril 2008 Relatório Científico Física Experimental de Anéis de Colisão SPRACE e HEP Grid−Brazil

DR

AFT

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

310

eta dist. muons - Z+jets, >= 1jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

eta dist. muons - Z+jets, >= 1jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

eta dist. muons - Z+jets, >= 1jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 1jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

eta dist. muons - Z+jets, >= 2jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 2jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

eta dist. muons - Z+jets, >= 2jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 2jet

Muon eta-4 -2 0 2 4

Nu

mb

er o

f E

ven

ts

210

eta dist. muons - Z+jets, >= 2jet1st muon

2nd muon

eta dist. muons - Z+jets, >= 2jet

Figure 19: Muon pseudo-rapidity for the two muons with highest pT , requiring 1 (top) and 2 (bottom) jets, for theRaw (left), Baseline (center), andleptonic (right) selection events,Z+jets sample.

Jet Multiplicity1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

Nu

mb

er o

f ev

ents

1

10

210

310

410

510W Slope = 5.85 +/- 0.03

Z Slope = 5.66 +/- 0.09

- Rawjets/dNeventsdN

Jet Multiplicity1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

Nu

mb

er o

f ev

ents

1

10

210

310

410

510W Slope = 5.11 +/- 0.04

Z Slope = 5.02 +/- 0.11

- Baselinejets/dNeventsdN

Jet Multiplicity1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

Nu

mb

er o

f ev

ents

1

10

210

310

410

510W Slope = 5.27 +/- 0.05

Z Slope = 5.19 +/- 0.13

- leptonicjets/dNeventsdN

Figure 20:dNevents/dNjets for W andZ+jets samples, for theRaw (left), Baseline (center), andleptonic (right)selection events.

17