UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ … · Gráfico D2 - Comparação entre os...

74
UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ-REITORIA DE PÓS-GRADUAÇÃO, PESQUISA E EXTENSÃO COORDENADORIA GERAL DOS CURSOS DE PÓS-GRADUAÇÃO I CURSO DE ESPECIALIZAÇÃO EM AUDITORIA CONTÁBIL E FINANCEIRA EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO SISTEMA ELEITORAL BRASILEIRO FRANCISCO ALVES DE OLIVEIRA JÚNIOR JOÃO PESSOA 2009

Transcript of UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ … · Gráfico D2 - Comparação entre os...

UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ-REITORIA DE PÓS-GRADUAÇÃO, PESQUISA E EXTENSÃO COORDENADORIA GERAL DOS CURSOS DE PÓS-GRADUAÇÃO

I CURSO DE ESPECIALIZAÇÃO EM AUDITORIA CONTÁBIL E FINANCEIRA

EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE

NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO SISTEMA ELEITORAL BRASILEIRO

FRANCISCO ALVES DE OLIVEIRA JÚNIOR

JOÃO PESSOA 2009

FRANCISCO ALVES DE OLIVEIRA JÚNIOR

EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO

SISTEMA ELEITORAL BRASILEIRO

Monografia apresentada como exigência para conclusão do I Curso de Especialização em Auditoria Contábil e Financeira oferecido pelo Centro Universitário de João Pessoa – UNIPÊ.

Orientador: Prof. Ms. Mamadou Dieng

JOÃO PESSOA

2009

O48e Oliveira Júnior, Francisco Alves de.

Evidências empíricas acerca da aplicação da Lei de Newcomb-Benford no campo da auditoria do Sistema Eleitoral Brasileiro / Francisco Alves de Oliveira Júnior. - João Pessoa, 2007.

72f. Monografia (Curso de Especialização em Auditoria

Contábil e Financeira) – Centro Universitário de João Pessoa - UNIPÊ

1. Lei de Newcomb-Benford. 2. Auditoria de Eleições.

3. Fraude Eleitoral. 4. Critério FDR. I. Título. UNIPÊ / BC CDU - 657:6

FOLHA DE APROVAÇÃO

FRANCISCO ALVES DE OLIVEIRA JÚNIOR

EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO SISTEMA ELEITORAL BRASILEIRO Esta monografia foi avaliada e aprovada como critério para conclusão do I Curso de Especialização em Auditoria Contábil e Financeira oferecido pelo Centro Universitário de João Pessoa – UNIPÊ, tendo como área de concentração as ciências contábeis.

Nota de avaliação: ________ Aprovada em _____ de _______________ de _______

______________________________________

Prof. Ms. Mamadou Dieng

______________________________________ Francisco Alves de Oliveira Júnior

Dedico este trabalho a Deus, a minha esposa Rúbia e a meus filhos, Giovanna e Leonardo.

AGRADECIMENTOS

Agradeço primeiramente a Deus, pela oportunidade de poder realizar este

trabalho. Agradeço também ao prof. Ms. Mamadou Dieng, pela paciência e pela

brilhante forma com que contribuiu para o desenvolvimento deste estudo. Aos meus colegas do Tribunal Regional Eleitoral da Paraíba, que me incentivaram na realização deste árduo trabalho.

E por fim, porém não menos importante, não poderia deixar de agradecer a minha família: minha esposa, Rúbia; minha filha, Giovanna; e meu filho, Leonardo, que, apesar de exigirem minha atenção a todo instante, sempre me deram forças diante das dificuldades, além de serem a inspiração da minha existência.

"O que prevemos raramente ocorre; o que menos esperamos geralmente acontece." Benjamin Disraeli

RESUMO

Este trabalho pretende verificar a aplicabilidade da Lei de Newcomb-Benford para o Segundo Dígito na auditoria de eleições, através da realização de um estudo empírico analítico e descritivo, tendo como pano de fundo a análise da Eleição Majoritária para o Cargo de Presidente da República Federativa do Brasil no ano de 2006. Em 1881, o astrônomo e matemático Simon Newcomb observou que, em medições experimentais, os dígitos mais significativos (aqueles mais a esquerda) não tinham suas quantidades distribuídas equitativamente entre 1 e 9. Cerca de 30% dos números começavam com o dígito 1, diminuindo gradativamente até chegar ao dígito 9 com apenas 4,6% de ocorrência. Em 1938, tal fenômeno foi verificado, de forma independente, pelo físico Frank Benford. Tais observações chamaram a atenção da comunidade científica, pois contrariavam o senso comum. Surgia assim, a Lei de Newcomb-Benford. Aos poucos, os estudiosos perceberam seu poder na detecção de fraudes em coleções de números. No final do século XX, a referida Lei começou a ser utilizada, com bastante êxito, em auditorias contábeis e financeiras. Recentemente, foi utilizada em auditorias eleitorais nos Estados Unidos, México, Venezuela e Iran. Devido ao seu caráter inédito, ainda não existe bibliografia nacional suficiente nessa área de pesquisa. Assim, foi necessário adaptar metodologias aplicadas em outros países ao cenário brasileiro. Os dados pesquisados foram fornecidos pelo Tribunal Superior Eleitoral – TSE, tendo sido coletados os totais de votos das 3034 zonas eleitorais distribuídas no Brasil e no exterior, para todos os candidatos(as) à presidência da república em 2006. Como a Lei de Newcomb-Benford pode ser subdividida em Lei do Primeiro e do Segundo Dígito, para cada vertente foi realizado um conjunto de testes de hipóteses, utilizando as estatísticas Z-teste, Qui-quadrado e o critério para ocorrência de falsos positivos FDR, com nível de significância α = 0,05. Ou seja, com uma confiança de 95% de que se tome uma decisão acertada. Todavia, como previsto na bibliografia pesquisada, os resultados encontrados foram favoráveis apenas à utilização da Lei de Newcomb-Benford para o Segundo Dígito, pois, do total de 99 testes estatísticos, nenhum deles ultrapassou seu valor crítico geral correspondente. Enquanto que, para o Primeiro Dígito, do total dos 90 testes realizados, 22 ficaram fora do limite geral preestabelecido. Como resultado, ficou evidenciado que a Lei de Newcomb-Benford para o Segundo Dígito pode ser utilizada como indicativo de fraude eleitoral em auditoria de eleições do sistema brasileiro, auxiliando na manutenção da democracia.

Palavras-chave: Lei de Newcomb-Benford. Auditoria de Eleições. Fraude

Eleitoral. Critério FDR.

ABSTRACT

The goal of this paper is to verify the applicability of Newcomb-Benford Law for the Second Digit on elections auditing, through an empirical analytic and descriptive study, having as the background the analysis of the election for President of Brazil in the year 2006. Back in 1881, astronomer and mathematician Simon Newcomb, observed in experimental measurements, that the most significant digits (the ones most to the left), didn’t have their quantities equally distributed between 1 and 9. Around 30% of those numbers started with digit 1, and lowering gradually until gets to digit 9 with only 4,6% of occurrence. In 1938, such a phenomenon was checked independently by physicist Frank Benford. Such observations caught attention of the scientific community, because they contradicted common sense at the time. Therefore, Newcomb-Benford Law was created. Step-by-step, scholars noticed its power to detect frauds in groups of numbers. By the end of the 20th century, Newcomb-Benford Law started to be put in use successfully in financial and accounting audits. Recently it was used in election audits in the United States, Mexico, Venezuela and Iran. Due to its unique characteristics, Brazilian bibliography is almost non-existent on this field of research. This way, it was necessary to make some adaptations on methodologies already used in other countries to the Brazilian case. The data used on this paper was provided by the Tribunal Superior Eleitoral –TSE, Brazilian highest electoral court of law. It consisted on the total of votes of all of the 3034 electoral zones scattered throughout the country and overseas to the candidates for Brazilian presidency in 2006. Since Newcomb-Benford law can be divided into two parts, Law of the First Digit and Law of the Second Digit, for each of these situations, it was taken a different hypothesis test, using Z-test statistics, Qui-square, and FDR criterion for false positives, with significance level α = 0,05. This way, there’s the probability of 95% to make the right decision. Nevertheless, as predicted on the researched bibliography, the results found were only favorable to the Law of the Second Digit, because all of the 99 test statistics that were made none had exceeded their correspondent general critical value. On the other side, when the Law of First Digit was concerned, among all 90 tests made, 22 kept out of the pre-established parameters. It was concluded that the Law of Newcomb-Benford for the Second Digit can be used to search for frauds while auditing Brazilian electoral system, therefore, assisting in the maintenance of democracy. Keywords: Newcomb-Benford Law. Election Audits. Election Fraud. FDR

Criterion.

LISTA DE GRÁFICOS

Gráfico 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito........................................................................................20

Gráfico 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito.......................................................................................21

Gráfico 3 - Análise da Lei de Newcomb-Benford do Primeiro Dígito para a candidata Ana Maria Teixeira Rangel ....................................................38

Gráfico 4 – Análise da Lei de Newcomb-Benford do Segundo Dígito para a candidata Ana Maria Teixeira Rangel ....................................................42

Gráfico C1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito......................................................................................................56

Gráfico C2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito......................................................................................................57

Gráfico D1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno...................................................................58

Gráfico D2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno..................................................................59

Gráfico D3 - Comparação entre os valores de P e FDR para o Teste Z no Primeiro Turno........................................................................................60

Gráfico D4 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Primeiro Turno ..................................................61

Gráfico D5 - Comparação entre os valores de P e FDR para o Teste Z no Segundo Turno.......................................................................................62

Gráfico D6 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Segundo Turno .................................................62

Gráfico F1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito......................................................................................................66

Gráfico F2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito......................................................................................................67

Gráfico G1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno...................................................................68

Gráfico G2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno..................................................................69

LISTA DE TABELAS

Tabela 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito........................................................................................19

Tabela 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito.......................................................................................20

Tabela 3 - Fraude no Arizona....................................................................................22 Tabela 4 - Candidatos a Presidente no Primeiro Turno das Eleições Brasileiras

de 2006 ..................................................................................................30 Tabela 5 - Candidatos a Presidente no Segundo Turno das Eleições Brasileiras

de 2006 ..................................................................................................30 Tabela 6 - Exemplo da Coleta de Votos para Luís Inácio Lula da Silva no 2°

Turno......................................................................................................30 Tabela 7 - Valores Críticos para o Z-teste e o Teste Qui-quadrado ..........................35

Tabela 8 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno .......38 Tabela 9 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro

Dígito no Primeiro Turno das Eleições Presidenciais de 2006...............39

Tabela 10 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006..............39

Tabela 11 - Critério FDR para o Primeiro Dígito........................................................40

Tabela 12 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................40

Tabela 13 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................40

Tabela 14 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno.....42

Tabela 15 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006...............43

Tabela 16 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006..............43

Tabela 17 - Critério FDR para o Primeiro Dígito........................................................44

Tabela 18 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................44

Tabela 19 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................44

Tabela B1 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno .....53 Tabela B2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no

Primeiro Turno........................................................................................53

Tabela B3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno........................................................................................53

Tabela B4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno........................................................................................54

Tabela B5 - Análise dos Votos de José Maria Eymael no Primeiro Turno ................54

Tabela B6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno.............54 Tabela B7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno........55

Tabela B8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno.......................................................................................55

Tabela B9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno.......55 Tabela D1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno .................58

Tabela D2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno ................59 Tabela D3 - Critério FDR para o Teste Z no Primeiro Turno .....................................60

Tabela D4 - Critério FDR para o Teste Z no Segundo Turno....................................61 Tabela E1 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno ....63

Tabela E2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno........................................................................................63

Tabela E3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno........................................................................................63

Tabela E4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno........................................................................................64

Tabela E5 - Análise dos Votos de José Maria Eymael no Primeiro Turno ................64 Tabela E6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno.............64

Tabela E7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno........65 Tabela E8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no

Segundo Turno.......................................................................................65 Tabela E9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno.......65

Tabela G1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno .................68 Tabela G2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno ................69

Tabela G3 - Critério FDR para o Teste Z no Primeiro Turno.....................................70 Tabela G4 - Critério FDR para o Teste Z no Segundo Turno....................................71

LISTA DE SIGLAS E SÍMBOLOS

FDR Do inglês (False Discovery Rate), representa a proporção esperada de

falsos positivos dentre todas as hipóteses nulas

TRE Tribunal Regional Eleitoral

TSE Tribunal Superior Eleitoral

i Número da sequência no critério FDR

m Quantidade de testes de hipóteses no critério FDR

n Número de observações

q* Nível de significância conjunto dos testes de hipótese

po Probabilidade observada

pe Probabilidade esperada

Pi Indexação do p-valor

PFDR P-valor referente ao critério FDR

PE Proporção esperada da população

PO Proporção observada da população

Z Resultado do Z-teste

Zc Valor crítico individual para o Z-teste

ZFDR Valor crítico para o conjunto dos Z-testes, considerando o critério FDR

Hi Indexação do teste de hipótese

H0 Hipótese nula

H1 Hipótese alternativa

α Nível de significância

α* Nível de significância conjunto dos testes de hipótese

χ2 Resultado do teste Qui-quadrado

χ2c Valor crítico individual para o teste Qui-quadrado

χ2FDR Valor crítico para o conjunto dos testes Qui-quadrado, considerando o

critério FDR

SUMÁRIO

1 INTRODUÇÃO .......................................................................................................14

1.1 Apresentação do Tema .................................................................................15 1.2 Caracterização do Problema.........................................................................15

1.3 Objetivos ........................................................................................................15

1.3.1 Objetivo Geral.......................................................................................15 1.3.2 Objetivos Específicos ..........................................................................16

1.4 Relevância da Pesquisa ................................................................................16

1.5 Disponibilização do Conteúdo......................................................................16 2 PLATAFORMA TEÓRICA .....................................................................................18

2.1 Antecedentes Históricos...............................................................................18 2.2 Distribuição de Probabilidades para a Lei de Newcomb-Benford.............19

2.3 Estudos Anteriores sobre a Lei de Newcomb-Benford ..............................21

2.3.1 Auditoria Contábil e Financeira ..........................................................21 2.3.2 Auditoria Eleitoral – Referendo Revocatório na Venezuela..............23

3 PROCEDIMENTOS METODOLÓGICOS...............................................................25

3.1 Natureza do Estudo .......................................................................................25 3.2 Definição das Variáveis de Pesquisa...........................................................25

3.2.1 Limitações na Aplicação da Lei de Newcomb-Benford ....................27 3.2.2 Forma de Totalização Escolhida.........................................................29

3.3 Coleta e Tratamento dos Dados ...................................................................29 3.4 Definição das Estatísticas a Serem Utilizadas ............................................31

3.4.1 Utilizando o Z-Teste .............................................................................31 3.4.2 Utilizando o Teste Qui-quadrado ........................................................32 3.4.3 Utilizando o Critério FDR.....................................................................33

3.5 Teste de Hipóteses para a Análise do Primeiro Dígito ...............................33

3.5.1 Definição das Hipóteses......................................................................33 3.5.2 Cálculo da Estatística do Teste...........................................................34

3.6 Teste de Hipóteses para o Segundo Dígito .................................................34

3.6.1 Definição das Hipóteses......................................................................35 3.6.2 Cálculo da Estatística do Teste...........................................................35

4 ANÁLISE E DISCUSSÃO DOS RESULTADOS....................................................37

4.1 Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na Eleição Presidencial Brasileira de 2006 ......................................................37

4.1.1 Análise dos Testes de Hipótese Utilizando o Critério FDR ..............39 4.2 Aplicação da Lei de Newcomb-Benford para o Segundo Dígito na

Eleição Presidencial Brasileira de 2006 ......................................................41

4.2.1 Análise dos Testes de Hipótese Utilizando o Critério FDR ..............44 4.3 Comparação dos Resultados........................................................................45

5 CONSIDERAÇÕES FINAIS ...................................................................................46

5.1 Recomendações para Futuras Pesquisas ...................................................47 REFERÊNCIAS BIBLIOGRÁFICAS.........................................................................48

APÊNDICE A - EXEMPLO DE PLANILHA ELETRÔNICA PARA O CÁLCULO DOS TESTES ESTATÍSTICOS ............................................................................50

APÊNDICE B – TABELAS DA ANÁLISE PARA O 1° DÍGITO................................53 APÊNDICE C – GRÁFICOS DA ANÁLISE PARA O 1° DÍGITO..............................56

APÊNDICE D – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O PRIMEIRO DÍGITO ...................................58

D.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno.....................58 D.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno....................59

D.3 Critério FDR para o Z-Teste no Primeiro Turno..........................................60 D.4 Critério FDR para o Z-Teste no Segundo Turno.........................................61

APÊNDICE E – TABELAS DA ANÁLISE PARA O 2° DÍGITO ................................63 APÊNDICE F – GRÁFICOS DA ANÁLISE PARA O 2° DÍGITO ..............................66

APÊNDICE G – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O SEGUNDO DÍGITO...................................68

G.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno.....................68 G.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno....................69

G.3 Critério FDR para o Z-Teste no Primeiro Turno..........................................70 G.4 Critério FDR para o Z-Teste no Segundo Turno.........................................71

14

1 INTRODUÇÃO

Fraude eleitoral é uma das opções para a legitimação de políticos corruptos

ao redor do mundo. É o desrespeito à vontade da maioria. Facilmente executada

quando não se tem formas eficientes de controle sobre os mecanismos das eleições.

Geralmente arquitetada pelos regimes autoritários como forma de permanência no

poder, mas também encontrada em grandes potências mundiais, ditas democráticas.

Como muitos interesses estão em jogo, por mais transparente que possa

ocorrer o desenrolar de uma eleição, candidatos e partidos perdedores costumam

duvidar da legitimidade do pleito. E, infelizmente, muitas vezes com razão. É o que

vem mostrando a história, através dos acontecimentos ocorridos na Flórida, durante

as Eleições Presidenciais Norte Americanas de 2004, nas Eleições Presidenciais do

México em 2006, no Referendo Venezuelano de 2004 e, recentemente, na

controversa reeleição do presidente Mahmoud Ahmadinejad do Iran, neste ano de

2009. Nesses países, pesquisadores, tais como Pericchi e Torres (2004) e Mebane

(2006a, 2006b) comprovaram irregularidades, utilizando técnicas de análise

similares as que serão propostas neste trabalho. Baseado nas experimentações dos

mesmos, é proposto um método de auditoria eleitoral de fácil aplicação, podendo ser

utilizado por cidadãos sem conhecimentos aprofundados em estatística, bastando

para isso, a manipulação de planilhas eletrônicas de porte simples. Tal metodologia

é conhecida como a Lei de Newcomb-Benford para o Segundo Dígito.

A Lei de Newcomb-Benford vem sendo utilizada em auditorias contábeis e

financeiras ao redor do mundo. Sua adaptação para auditoria de resultados

eleitorais é bastante recente, sendo este um dos primeiros estudos brasileiros nessa

área, comprovado pela escassez de referências bibliográficas.

Atualmente, procura-se a melhor forma de aplicação da referida Lei em

sistemas eleitorais. Em Mebane (2006b, p. 3), tem-se:

Embora um método ideal possa não existir, neste trabalho gostaria de

ilustrar o uso de um possível candidato. Um método que possa satisfazer

nosso ideal conjunto de requisitos é o de testar se os segundos dígitos dos

votos ocorrem com as frequências especificadas pela Lei de Benford. [...]

Eu estudei a Lei de Benford para o segundo dígito (2BL) para o teste de

contagem de votos. Eu identifiquei um par de mecanismos flexíveis que

15

podem geralmente caracterizar contagens de votos e que satisfazem a

distribuição 2BL em uma ampla gama de circunstâncias. Eu mostrei que o

teste 2BL é sensível a muitos padrões de manipulação de votos, incluindo

padrões que ocorrem em alguns tipos de fraudes eleitorais.

(Tradução nossa)

A Lei de Newcomb-Benford é relativamente nova e está à espera de

pesquisadores que possam descobrir mais formas de tirar proveito da mesma,

aplicando-a nas diferentes áreas do conhecimento.

1.1 Apresentação do Tema

Este trabalho tem como tema o estudo da Lei de Newcomb-Benford para o

Primeiro e Segundo Dígitos aplicada como ferramenta de auditoria ao conjunto de

votos correspondente a todas as zonas eleitorais distribuídas pelo Brasil e Exterior

na Eleição Majoritária para Presidente da República Federativa do Brasil no ano de

2006. Serão analisados os votos recebidos pelos candidatos no Primeiro e Segundo

Turnos.

1.2 Caracterização do Problema

As Leis de Newcomb-Benford para o Primeiro e Segundo Dígitos podem ser

utilizadas como ferramentas de auditoria eleitoral no estudo da Eleição Majoritária

para Presidente da República Federativa do Brasil no ano de 2006?

1.3 Objetivos

A seguir encontram-se listados os objetivos gerais e específicos deste

trabalho.

1.3.1 Objetivo Geral

O objetivo geral deste estudo é:

Verificar a possibilidade de utilização das Leis de Newcomb-Benford como

ferramenta de análise de dados no campo da auditoria do Sistema

Eleitoral Brasileiro.

16

1.3.2 Objetivos Específicos

A seguir encontram-se os objetivos específicos deste trabalho:

Verificar se a Lei de Newcomb-Benford para o Primeiro Dígito pode ser

utilizada na detecção de fraude eleitoral na Eleição Majoritária para

Presidente do Brasil no ano de 2006;

Verificar se a Lei de Newcomb-Benford para o Segundo Dígito pode ser

utilizada na detecção de fraude eleitoral na Eleição Majoritária para

Presidente do Brasil no ano de 2006;

Verificar se a coleta de dados em nível de zona eleitoral pode ser utilizada

na análise das Leis de Newcomb-Benford.

1.4 Relevância da Pesquisa

Esta pesquisa tem implicações importantes. Do ponto de vista social, o

presente trabalho visa estudar a aplicabilidade de uma ferramenta matemática, a Lei

de Newcomb-Benford, na auditoria de resultados eleitorais no Brasil. Tal técnica

pode auxiliar na manutenção da democracia, pois, devido à simplicidade do método,

o cidadão comum poderá ajudar na fiscalização do processo eleitoral, garantindo a

legitimidade do pleito e dirimindo quaisquer dúvidas que possam surgir.

Com relação a sua contribuição acadêmica e científica, este trabalho possui

caráter de ineditismo no Brasil, adaptando as técnicas utilizadas em outros países

para o caso brasileiro. Tal metodologia de auditoria pode ser aproveitada, com suas

devidas adequações, em diversas áreas do conhecimento, contribuindo para o

desenvolvimento científico.

1.5 Disponibilização do Conteúdo

Descreve-se, a seguir, como está distribuído este trabalho.

Inicialmente, no capítulo 2, referente à plataforma teórica, será mostrado um

breve histórico sobre a descoberta da Lei de Newcomb-Benford, sua distribuição de

probabilidades e exemplos de sua utilização nos ramos da auditoria contábil e da

auditoria de eleições.

No capítulo 3, serão apresentados os procedimentos metodológicos, os tipos

de análises existentes (primeiro e segundo dígitos), suas limitações e possibilidades

17

de aplicação. Neste capítulo, as experiências de outros países serão adaptadas ao

caso brasileiro, pois suas estruturas de votação são diferenciadas. Serão estudados

os tipos de estatísticas que poderão ser utilizadas na execução dos testes de

hipótese.

No capítulo 4, serão realizados dois conjuntos de testes para posterior

comparação. Na primeira parte do desenvolvimento deste trabalho, será testada a

aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na auditoria dos

resultados eleitorais nos dois turnos das Eleições Majoritárias para Presidente do

Brasil, em 2006.

Na segunda parte, seguindo os mesmos procedimentos, será testada a Lei de

Newcomb-Benford para o Segundo Dígito.

Tabelas e gráficos acompanharam o desenrolar da metodologia que se

segue, pois são fundamentais para a melhor compreensão do texto.

No capítulo 5, serão apresentadas as considerações finais, comparando-se os

resultados encontrados nas duas análises anteriores. Além disso, será verificado se

os dados encontrados estão de acordo com o previsto na bibliografia pesquisada.

Concluindo, serão indicadas recomendações para futuros trabalhos na área.

No Apêndice A, encontra-se um breve tutorial que explicará, de forma prática,

como manipular os dados em planilhas eletrônicas utilizando a Lei de Newcomb-

Benford. As informações nele contidas serão úteis para aqueles interessados em

testar a metodologia aplicada neste estudo.

O texto visa à compreensão da aplicação da Lei de Newcomb-Benford à

auditoria eleitoral. Com o objetivo de evitar uma leitura cansativa, os detalhamentos

dos cálculos estão descritos nos apêndices restantes, podendo ser consultados por

aqueles que desejem se aprofundar nesse estudo.

18

2 PLATAFORMA TEÓRICA

Este capítulo descreve as informações teóricas necessárias à realização da

pesquisa e exemplos sobre a utilização da Lei de Newcomb-Benford.

A seguir, apresentam-se os antecedentes históricos.

2.1 Antecedentes Históricos

A Lei do Primeiro Dígito, como é conhecida, está sendo amplamente

estudada e testada em diversos tipos de auditoria que têm como base uma coleção

de dados numéricos que se possam por em prova.

Sua descoberta não data de muito tempo. Segundo Santos, Diniz e Corrar

(2007), a Lei de Newcomb-Benford foi descoberta pelo astrônomo e matemático

Simon Newcomb no ano de 1881, ao perceber que as tábuas de logaritmos,

utilizadas para realização de cálculos, apresentavam uma maior evidência de uso

nas primeiras páginas, nas quais estavam números iniciados com o algarismo 1. E,

progressivamente, o uso diminuía à medida que se aproximava do numeral 9.

Assim, ele observou que, na natureza, aproximadamente 30% dos números

utilizados em algum tipo de medição tinham como dígito mais significativo (o primeiro

algarismo à esquerda) o numeral 1. O que contrariava o senso comum no qual a

distribuição de probabilidades para essa ocorrência seria igual para todos os dígitos.

Isto é, probabilidade igual a 1/9, pois os dígitos mais significativos deveriam estar

distribuídos igualmente entre os números de 1 a 9.

Em 1938, 57 anos após as proposições de Newcomb, o físico Frank Benford,

de forma independente, chegou ao mesmo resultado analisando os dados de 20.229

observações, tais como áreas de rios, distâncias entre cidades, números de casas,

entre outros. Benford, diferentemente de Newcomb, divulgou amplamente seu

trabalho.

19

11

11logd

dP

9

1 212

1

11logd dd

dP

2.2 Distribuição de Probabilidades para a Lei de Newcomb-Benford

Através de Nigrini (2000), pode-se encontrar a distribuição de probabilidades

da ocorrência da Lei de Newcomb-Benford para o primeiro e segundo dígitos mais

significativos através das seguintes fórmulas empíricas:

Para o primeiro dígito mais significativo, tem-se:

(1)

Onde, d1 є {1, 2, ... , 9} e P(d1) é a sua probabilidade correspondente.

Calculando as probabilidades, encontram-se os valores na seguinte tabela: Tabela 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito

Algarismo (d1)

Probabilidade P(d1)

Percentualmente (%)

1 0,30103 30,103

2 0,17609 17,609

3 0,12494 12,494

4 0,09691 9,691

5 0,07918 7,918

6 0,06695 6,695

7 0,05799 5,799

8 0,05115 5,115

9 0,04576 4,576

Da mesma forma, para o segundo dígito:

(2)

Onde, d2 є {0, 1, ... , 9} e P(d2) é a probabilidade correspondente.

Os valores calculados são:

20

1º Dígito

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

1 2 3 4 5 6 7 8 9

1º Dígito

Tabela 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito Algarismo

(d2) Probabilidade

P(d2)

Percentualmente (%)

0 0,1197 11,97

1 0,1139 11,39

2 0,1088 10,88

3 0,1043 10,43

4 0,1003 10,03

5 0,0967 9,67

6 0,0934 9,34

7 0,0904 9,04

8 0,0876 8,76

9 0,085 8,5

Pode-se comparar a distribuição de probabilidade inerente ao primeiro e ao

segundo dígito, nos gráficos a seguir:

Gráfico 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito

É possível observar como a curva de distribuição de probabilidades diminui

em, aproximadamente, 6 vezes no intervalo entre os dígitos 1 e 9.

21

2º Dígito

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 1 2 3 4 5 6 7 8 9

2º Dígito

Gráfico 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito

Já na distribuição de probabilidades para o segundo dígito, a diferença se

torna mais suave. Se fossem desenhados os gráficos referentes às distribuições de

probabilidade para o terceiro, quarto ou quinto dígito, poder-se-ia perceber que, com

o incremento do dígito, as probabilidades vão se tornando igualmente distribuídas.

2.3 Estudos Anteriores sobre a Lei de Newcomb-Benford

A Lei de Newcomb-Benford tem sido, originalmente, utilizada em auditorias

contábeis e, gradativamente, vem sendo adaptada em outras áreas de pesquisa

forense.

2.3.1 Auditoria Contábil e Financeira

Existe um exemplo clássico estudado por Nigrini (1999) que demonstra a

aplicabilidade da Lei de Newcomb-Benford em auditoria contábil e financeira.

Segundo Nigrini (1999), em 1993, Wayne James Nelson foi acusado de tentar

fraudar o estado do Arizona (EUA) em aproximadamente 2 milhões de dólares.

Nelson, um gerente do escritório da Tesouraria do Estado do Arizona, argumentou

que teria desviado fundos para demonstrar a ausência de proteção do novo sistema

computadorizado.

O montante de 23 cheques preenchidos por Nelson são mostrados na figura

seguinte:

22

Tabela 3 - Fraude no Arizona Data do cheque Quantidade $

9 de outubro de 1992 1.927,48 27.902,31

14 de outubro de 1992 86 241.90 72 117.46 81 321.75 97 473.96

19 de outubro de 1992 93 249.11 89 658.17 87 776.89 92 105.83 79 949.16 87 602.93 96 879.27 91 806.47 84 991.67 90 831.83 93766.67 88 338.72 94 639,49 83 709.28 96 412.21 88 432.86 71 552.16

Total 1 878 687.58

Fonte: Nigrini (1999)

Como as escolhas humanas não são aleatórias, a simples “criação” de

números não obedece à Lei de Benford. Eis algumas observações importantes:

Frequentemente, em fraudes, os desvios começam por valores

pequenos que aos poucos vão aumentando.

A maioria das quantidades desviadas era abaixo de 100.000 dólares,

pois acima desse limite, necessitava-se de verificação e da assinatura

de um responsável. O gerente tentou manter a fraude em valores

menores, fora desse controle.

As frequências para os primeiros dígitos são praticamente contrárias à

Lei de Benford. Aproximadamente, 90% dos valores dos cheques

começavam com os dígitos 7, 8 ou 9. Esse comportamento sinalizava

uma irregularidade.

Os números pareciam ter sido escolhidos para dar a aparência de

aleatoriedade. Porém, a Lei de Benford é bastante contra-intuitiva; as

pessoas não assumem naturalmente que alguns dígitos ocorrem com

maior freqüência. Nenhum dos cheques foi duplicado, não havia

23

números redondos, e todos os valores incluíam centavos. No entanto,

subconscientemente, o gerente repetiu alguns dígitos e combinações

de dígitos. Com relação aos dois primeiros algarismos, entre os valores

criados, 87, 88, 93 e 96 foram utilizados duas vezes. Com relação aos

últimos dois dígitos, 16, 67 e 83, esses foram duplicados. No entanto

houve uma tendência em direção à criação de dígitos maiores. Os

dígitos de 7 a 9 foram os mais frequentemente utilizados, em contraste

com a lei de Benford. Um total de 160 dígitos foram usados nos 23

valores. As contagens dos dez dígitos de 0 a 9 foram: 7, 19, 16, 14, 12,

5, 17, 22, 22 e 26, respectivamente. Um controle computacional

familiarizado com a lei de Benford poderia facilmente ter detectado que

esses números poderiam ter sido inventados por alguém que

desconhece a lei de Benford.

O próximo exemplo se refere à área da auditoria eleitoral.

2.3.2 Auditoria Eleitoral – Referendo Revocatório na Venezuela

O contexto no qual se realizou o Referendo Revocatório de 2004 na

Venezuela pode ser compreendido através das informações seguintes, obtidas

segundo Dawood (2004):

Conforme anunciado pelo Conselho Nacional Eleitoral (CNE), em junho de 2004, realizou-se um referendo revogatório do mandato do presidente Hugo Chávez a 15 de agosto do ano corrente. A “Constituição da República Bolivariana da Venezuela” prevê a possibilidade de destituição de funcionários públicos eleitos por meio da convocação de referendos populares. Após inúmeras tentativas frustradas, a oposição angariou o número de assinaturas necessárias à validação da petição revogatória por parte do CNE. [...] Assistiu-se, entretanto, a uma expressiva vitória do atual presidente que obteve cerca de 58% de aprovação. [...] A oposição acusa o governo de haver ameaçado funcionários públicos que haviam assinado a petição revogatória com a perda de garantias concedidas no curso da atual administração. Além disso, denuncia que inúmeros assinantes da petição tiveram seu local de votação transferido nas últimas horas que antecederam o referendo. Em contrapartida, os partidários do atual presidente venezuelano acusam os EUA de questionarem o caráter democrático de seu governo como forma de retirarem do poder um governante cujas políticas se opõem aos interesses econômicos estadunidenses.

24

Em Pericchi e Torres (2004), encontra-se a análise do Referendo

Venezuelano de 2004 através da Lei de Newcomb-Benford para o Segundo Dígito.

No Referendo podia-se votar no SIM ou no NÃO. Houve votação manual e

automática.

Segundo Pericchi e Torres (2004), as conclusões são bastante claras. Os

votos NÃO, nas mesas automatizadas violam a Lei de Newcomb-Benford com

probabilidade virtualmente 1, tornando-se relevante investigar os mecanismos de

intervenção que tenham alterado os votos NÃO automatizados.

Por outro lado, os votos NÃO examinados pelos auditores não violaram a lei.

Algo bastante interessante, já que os votos auditados também são corrigidos de

forma automatizada, sugerindo que as mesas auditadas possuem outra estrutura e

por não serem representativas do total de votos automatizados, colocam em dúvida

que eles façam parte de uma amostra aleatória.

Os votos NÃO manuais não violaram a lei. Mas, neste caso, uma análise mais

aprofundada faz-se necessário.

Esse referendo foi polêmico. E, ainda hoje, faz parte de discussão entre os

interessados.

Os dois exemplos apresentados neste capítulo demonstram o poder da Lei de

Newcomb-Benford para o Primeiro e Segundo Dígitos, respectivamente.

A seguir, vêm os procedimentos metodológicos do trabalho.

25

3 PROCEDIMENTOS METODOLÓGICOS

Neste capítulo, serão expostos os procedimentos metodológicos necessários

à realização deste trabalho.

3.1 Natureza do Estudo

Este é um estudo empírico analítico e descritivo, pois pretende, através da

experiência de outros pesquisadores, inferir e tirar conclusões baseadas na

aplicação de testes de hipóteses, através de estatística inferencial.

As técnicas têm como base os trabalhos de Mebane (2006a, 2006b); Pericchi

e Torres (2004); Santos, Diniz e Corrar (2007). Cada um deles com suas respectivas

especificidades e contribuições.

Por exemplo, Santos, Diniz e Corrar (2007) dedicam-se à auditoria contábil no

setor público, porém muitas de suas técnicas podem ser utilizadas no caso de

auditoria de eleições.

Mebane (2006a, 2006b) realiza auditoria em resultados eleitorais norte-

americanos. Pericchi e Torres (2004) analisam o referendo revocatório venezuelano

de agosto de 2004, como foi exemplificado no capítulo anterior. Apesar de o caso

brasileiro ter suas diferenças, pode-se fazer adaptações que tragam contribuições

significativas.

3.2 Definição das Variáveis de Pesquisa

Como este estudo se refere à auditoria de resultados eleitorais no Brasil, com

ênfase na eleição presidencial de 2006, deve-se verificar quais tipos de variáveis

preenchem os requisitos necessários para a aplicação da Lei de Newcomb-Benford.

Para tanto, faz-se necessário entender alguns termos referentes ao sistema

eleitoral brasileiro. Em pesquisa ao Glossário Eleitoral Brasileiro, no site do Tribunal

Superior Eleitoral - TSE, encontram-se os seguintes termos que serão importantes

para o entendimento deste trabalho: [...] Cartório eleitoral Cartório eleitoral é a sede do juízo eleitoral. No cartório funciona, além da parte administrativa da zona eleitoral, a escrivania eleitoral que é a seção judicial.

26

É no cartório que o cidadão tem seu primeiro contato com a Justiça Eleitoral pois é ali que ele se apresenta, é qualificado e é inscrito eleitor. [...] Seção eleitoral É o local onde serão recepcionados os eleitores que exercerão o direito de voto. Nela funcionará a mesa receptora, composta de seis mesários nomeados pelo juiz eleitoral. Na seção eleitoral ficará instalada a urna eletrônica, equipamento no qual serão registrados os votos. [...] Sistema eleitoral majoritário É aquele no qual considera-se eleito o candidato que receber, na respectiva circunscrição – país, estado, município –, a maioria absoluta ou relativa, conforme o caso, dos votos válidos (descontados os nulos e os em branco). No Brasil, exige-se a maioria absoluta dos votos para a eleição do presidente da República , [sic] dos governadores dos estados e do Distrito Federal e dos prefeitos dos municípios com mais de 200.000 eleitores. Caso nenhum candidato alcance a maioria absoluta dos votos na primeira votação, realiza-se um segundo turno entre os dois mais votados no primeiro. Para a eleição dos senadores da República e dos prefeitos dos municípios com menos de 200.000 eleitores exige-se apenas a maioria relativa dos votos, não havendo possibilidade de segundo turno. [...] Urna eletrônica Equipamento de processamento de dados que, junto com o seu software (programas), permite a coleta de votos em uma eleição, de forma ergonômica, rápida e segura. O presidente da Mesa terá, de uma forma descomplicada, controle total do andamento da eleição. O equipamento foi previsto para operar nas mais diversas condições climáticas e de infra-estrutura. [...] Voto do eleitor residente no exterior O eleitor brasileiro residente no exterior tem a faculdade de votar somente nas eleições para presidente e vice-presidente da República, e desde que especificamente cadastrado para esse fim. Organizam-se seções eleitorais sempre que, na jurisdição da missão diplomática (embaixada) ou do consulado geral, haja o mínimo de trinta eleitores cadastrados. [...] Zona eleitoral Região geograficamente delimitada dentro de um Estado, gerenciada pelo cartório eleitoral, que centraliza e coordena os eleitores ali domiciliados. Pode ser composta por mais de um município, ou por parte dele. Normalmente segue a divisão de comarcas da Justiça Estadual. (Grifos do autor).

Como foi exposto, uma zona eleitoral não compreende exatamente uma

cidade. Uma cidade, dependendo da quantidade de eleitores, pode conter diversas

zonas eleitorais, assim como uma única zona eleitoral pode compreender diversas

cidades circunvizinhas no mesmo estado, dependendo do tamanho do eleitorado.

Para complementar, uma zona eleitoral é subdividida em diversas seções

eleitorais. Cada seção eleitoral corresponde a uma urna eletrônica (ou de lona –

caso o voto ocorra por meio de cédula).

27

Importante salientar que existem zonas eleitorais alocadas em outros países

para receberem os votos de brasileiros residentes no exterior.

Segundo Pericchi e Torres (2004), a lei de Newcomb-Benford se cumpre para

os dados eleitorais, desde que esses resultem de uma mistura imparcial de

distribuições.

No caso das eleições presidenciais brasileiras, as quantidades de votos para

cada candidato podem ser encontradas somando-se os totais de votos por estado,

por município, por zona eleitoral ou por seção eleitoral (urna eletrônica).

Independentemente da forma escolhida, o resultado sempre será o mesmo.

Porém, para a aplicação da Lei de Newcomb-Benford, deve-se optar pela forma de

totalização mais adequada a cada situação.

3.2.1 Limitações na Aplicação da Lei de Newcomb-Benford

Para se escolher a forma mais adequada de totalização, faz-se necessário

compreender as limitações na aplicação da Lei de Newcomb-Benford.

Apesar da lei de Newcomb-Benford já ter sido inúmeras vezes verificada, nem

todas as coleções de números obedecem a ela. Existem alguns fatores importantes

que devem ser verificados antes de sua utilização.

Existem as seguintes limitações na utilização da lei de Newcomb-Benford,

segundo Santos, Diniz e Corrar (2007, p. 513): 1. O tamanho de caractere do dígito deve ser grande o bastante para a

validação da lei. 2. Não se opera para números que são verdadeiramente fortuitos (por

exemplo, loteria de números). 3. Não se trabalha com números obtidos de forma imposta (por exemplo,

quando os valores são obtidos de maneira predefinida, estabelecendo limite máximo ou mínimo, os mesmos números devem surgir regularmente por alguma razão).

4. Não se trabalha com número que não corresponde a fenômenos naturais (como, por exemplo, números de telefone).

Se a opção escolhida for a coleta dos dados de todas as seções eleitorais,

isto é, de todas as urnas eletrônicas no Brasil e exterior, tem-se uma maior

quantidade de dados. No entanto, ao se escolherem os dados em nível de urna

eletrônica, vai-se de encontro às limitações 1 e 3 expostas anteriormente. Em

resumo, seriam somados números relativamente pequenos, pois a quantidade de

eleitores por urna não excede os 3 dígitos. Além de possuir um limite máximo. Não

existe um valor predefinido sobre o número de eleitores que se deve alocar em uma

28

urna eletrônica. Cada Tribunal Regional Eleitoral - TRE define o número médio de

eleitores que serão alocados em suas urnas. Tal escolha depende da complexidade

da eleição (quantidade de opções de escolha), quantidade de telas a serem

geradas, se as urnas serão utilizadas em meio urbano ou rural, entre outras. Apesar

de a urna eletrônica ter a capacidade de armazenar os votos de mais de 10.000

eleitores, tal quantidade seria inviável, causando enormes filas nas seções eleitorais.

As quantidades mais comuns de eleitores por urna variam entre 300 e 600 eleitores,

dependendo da localidade.

Pericchi e Torres (2004) afirmam que é preferível aplicar a Lei de Newcomb-

Benford ao segundo dígito, já que o primeiro estará afetado devido ao número pré-

estabelecido de eleitores por máquina.

Para melhor explicar esse fato, podemos fazer uma comparação entre a

auditoria de eleições norte americanas e a brasileira.

Nos Estados Unidos da América, o termo em inglês precinct, por motivo de

analogia, pode ser o equivalente à nossa seção eleitoral, com poucas diferenças. A

quantidade de eleitores na seção eleitoral brasileira corresponde à quantidade de

eleitores que se pode alocar em uma urna eletrônica. Algo em torno de 400

eleitores. Por outro lado, o precinct pode conter mais de uma urna e, segundo a

fonte de pesquisas eletrônicas Wikipedia, nas eleições americanas de 2004, a média

de eleitores cadastrados por precinct era de aproximadamente 1100. Kansas tendo

a menor média de eleitores por precinct com 437, enquanto que o Distrito de

Colúmbia possuía a maior média, 2704 eleitores cadastrados por precinct.

Segundo Mebane (2006a), há boas razões para duvidar que o primeiro dígito

satisfaça a Lei de Benford em nível de precinct. Pois este é designado a possuir

sempre o mesmo número aproximado de eleitores. Se um candidato possui, em

média, o mesmo percentual de votos em cada precinct, isto implica que ele tenderá

a ter o mesmo primeiro dígito significativo em todos os precincts. Como exemplo,

supondo que um candidato possua, aproximadamente, 50% das intenções de voto

igualmente distribuídas para cada precinct e que os precincts contenham, em média,

1000 eleitores. Então, a maioria dos totais de votos por precinct para esse candidato

terá o número 4 ou 5 como primeiro dígito significativo.

29

3.2.2 Forma de Totalização Escolhida

Uma alternativa para se tentar driblar tal dificuldade seria a utilização da Lei

de Benford para o Segundo Dígito.

Mebane (2006a, 2006b), em seus estudos, costuma analisar os resultados de

eleições em nível de precinct. Como foi explicado, a média de eleitores presentes

em um precinct é superior à média de eleitores cadastrados nas seções brasileiras.

Para tentar evitar possíveis problemas, não serão totalizadas as informações das

seções eleitorais. Serão Trabalhados os dados em nível de zona eleitoral, pois, a

zona eleitoral contém diversas seções. Nas eleições presidenciais de 2006, existia

um total de 3034 zonas eleitorais espalhadas pelo Brasil e exterior. E a média de

votos válidos, no primeiro turno, por zona eleitoral foi de 32.069. A 48ª Zona Eleitoral

do Estado do Amazonas obteve a quantidade mínima de votos válidos 1.482. E a

351ª Zona Eleitoral do Estado de São Paulo obteve a quantidade máxima de votos

válidos, 211.014. (Valores calculados a partir dos dados fornecidos no site do TSE –

Consulta de Resultados Eleitorais).

3.3 Coleta e Tratamento dos Dados

Para a utilização da estatística inferencial, através da realização de testes de

hipóteses, foram coletados os votos recebidos por cada um dos candidatos a

presidente do Brasil no ano de 2006 distribuídos, por todas as 3034 zonas eleitorais

existentes no Brasil e no Exterior para o Primeiro e Segundo Turnos das Eleições,

diretamente do site do TSE – Consulta de Resultados Eleitorais.

Nas tabelas seguintes tem-se a relação dos candidatos(as) concorrentes no

Primeiro e Segundo Turnos distribuídos em ordem alfabética:

30

Tabela 4 - Candidatos a Presidente no Primeiro Turno das Eleições Brasileiras de 2006 Candidatos(as) no 1º Turno

Ana Maria Teixeira Rangel

Cristovam Ricardo Cavalcanti Buarque

Geraldo José Rodrigues Alckmin Filho

Heloísa Helena Lima de Moraes Carvalho

José Maria Eymael

Luciano Caldas Bivar

Luís Inácio Lula da Silva

Fonte: TSE

Tabela 5 - Candidatos a Presidente no Segundo Turno das Eleições Brasileiras de 2006

Candidatos no 2º Turno

Geraldo José Rodrigues Alckmin Filho

Luís Inácio Lula da Silva

Fonte: TSE

Após coletados, os dados passarão por um tratamento, via planilha eletrônica,

para se recuperarem os primeiros e segundos dígitos mais significativos do conjunto

de dados. Um exemplo de utilização de planilha eletrônica pode ser encontrado no

Apêndice A.

Como exemplo, pode-se ter a seguinte tabela:

Tabela 6 - Exemplo da Coleta de Votos para Luís Inácio Lula da Silva no 2° Turno

Estado Zona Eleitoral

Votos para Lula

1º Dígito

2° Dígito

AC 1 28.080 2 8 AC 2 3.371 3 3 AC 3 7.850 7 8 AC 4 18.819 1 8 AC 5 6.852 6 8 AC 6 10.532 1 0 AC 7 6.353 6 3 AC 8 12.051 1 2 AC 9 31.328 3 1 AC 10 26.348 2 6 AL 1 30.708 3 0 AL 2 50.031 5 0 AL 3 52.314 5 2

...

...

...

...

...

Fonte: TSE

31

Na tabela anterior, os dados foram classificados por estado da federação,

começando pelo Acre (AC), em seguida pelo número da zona eleitoral, contendo a

sua respectiva quantidade de votos para o candidato Luís Inácio Lula da Silva no 2°

Turno das Eleições Presidenciais de 2006.

Faz-se importante notar que este trabalho não foi realizado com amostras, e

sim com todo o universo de dados correspondentes às 3034 zonas eleitorais

distribuídas pelo Brasil e exterior, para cada candidato e por turno da eleição

presidencial de 2006.

Nos próximos capítulos, serão contabilizados os conteúdos das colunas

correspondentes ao primeiro e segundo dígitos.

3.4 Definição das Estatísticas a Serem Utilizadas

Nesta parte do trabalho, é realizada uma complementação entre as técnicas

utilizadas por Mebane (2006a, 2006b) com as estatísticas fornecidas por Santos,

Diniz e Corrar (2007).

Mebane (2006a, 2006b) dedica-se à questão de auditoria de resultados

eleitorais, tendo especial atenção à forma de totalização dos votos, à aplicação da

Lei de Newcomb-Benford para o Segundo Dígito e a adoção do Teste Qui-quadrado.

Tem-se, também, especial atenção à utilização do critério FDR que será explicado

durante o desenvolvimento deste estudo.

Por outro lado, em Santos, Diniz e Corrar (2007), aplica-se a Lei de

Newcomb-Benford para o Primeiro Dígito à auditoria de contas públicas, utilizando o

Z-teste e o Teste Qui-quadrado.

Para aprofundar a análise, todas as técnicas citadas anteriormente serão

realizadas.

Serão aplicados o Z-Teste e o Teste Qui-quadrado como exposto a seguir.

3.4.1 Utilizando o Z-Teste

De acordo com Santos, Diniz e Corrar (2007), para estudar o nível de

significância entre as diferenças (Poi – Pei), podemos utilizar o Z-Teste.

32

n

ppn

ppZ

ee

eo

121

9

1

22

d PEPEPO

9

0

22

d PEPEPO

(3)

Onde:

a) po é a probabilidade observada;

b) pe é a probabilidade esperada (que pode ser a do primeiro ou segundo

dígito, dependendo do tipo de teste);

c) n é o número de observações;

d) 1/2n é o termo de correção de continuidade e só é usado quando ele

for menor que | po – pe |.

3.4.2 Utilizando o Teste Qui-quadrado

Ainda, segundo Santos, Diniz e Corrar (2007), para verificar se as duas

distribuições de probabilidade estão em conformidade, uma com a outra, ou se a

distribuição de probabilidade observada (po) é “igual” à distribuição esperada (pe),

segundo a Lei de Newcomb-Benford, utiliza-se o Teste Qui-quadrado da seguinte

maneira:

(4)

Onde PO e PE são as proporções observadas e esperadas, respectivamente,

definidas por:

a) PO = (po) x (nº da população);

b) PE = (pe) x (nº da população);

c) d є {1, 2, ..., 9} pois se trata da lei de Newcomb-Benford para o

Primeiro Dígito.

Na Lei de Newcomb-Benford para o Segundo Dígito, será realizado o

somatório, considerando-se as dez possibilidades de d є {0, 1, ..., 9}:

(5)

33

*)( qmiP i

3.4.3 Utilizando o Critério FDR

O critério FDR (do inglês False Discovery Rate) foi proposto por Benjamini e

Hochberg (1995), utilizado por Mebane (2006a, 2006b) e representa a proporção

esperada de falsos positivos dentre todas as hipóteses nulas rejeitadas.

Considere vários testes de hipóteses H1, H2, ..., Hm baseados em seus

correspondentes p-valores P1, P2, ..., Pm. Ordene os p-valores P(1), P(2), ..., P(m) tal

que a hipótese nula H(i) corresponda a seu p-valor P(i). A seguir é definido o

procedimento para a realização de múltiplos testes do tipo Bonferroni:

Seja k o maior i tal que:

(6)

Então, são rejeitadas todas as hipóteses H(i) com i = 1, 2, ..., k.

Para testes estatísticos independentes e para qualquer configuração de falsas

hipóteses nulas, o procedimento acima controla o FDR em q*.

Analogamente a Mebane (2006a), assumindo independência entre as zonas

eleitorais, que corresponde à independência entre os testes, podemos calcular, de

forma rápida, o novo valor crítico, utilizando o critério FDR, definindo q* = α* como

sendo o nível de significância conjunto. Para os testes Qui-quadrados e para os Z-

testes, faremos α* = 0,05 para o Primeiro e Segundo Turnos das Eleições.

3.5 Teste de Hipóteses para a Análise do Primeiro Dígito

Tem-se como ponto de partida o estudo da distribuição de probabilidades da

Lei de Newcomb-Benford para o Primeiro Dígito. Assim, deve-se observar as

frequências relativas dos 9 números possíveis, de 1 a 9, já que, em números inteiros

o 0 (zero) não aparece como dígito mais significativo.

3.5.1 Definição das Hipóteses

A análise das diferenças entre as distribuições de probabilidades observadas

(po) e esperadas (pe) segundo a Lei de Newcomb-Benford para o Primeiro Dígito,

será estudada a partir de testes de hipótese. O Z-teste servirá para avaliar a

diferença entre as probabilidades esperadas pe e as probabilidades observadas po

34

para cada um dos 9 dígitos (1 a 9). O teste Qui-quadrado fornecerá um valor

numérico que indicará o quanto a distribuição de probabilidade observada se

aproxima da distribuição de probabilidades de Newcomb-Benford para o Primeiro

Dígito.

Definem-se, então, as seguintes hipóteses:

Hipótese Nula H0 – Não existe diferença estatisticamente significativa entre

as distribuições de probabilidades observadas (po) e esperadas (pe);

Hipótese Alternativa H1 – Existe diferença estatisticamente significativa entre

as distribuições de probabilidades observadas (po) e esperadas (pe);

Na simbologia usual, temos:

H0: po = pe

H1: po ≠ pe

Observação importante: Estas hipóteses são definidas para cada um dos

dígitos de 1 a 9 no Z-teste e para toda a distribuição de probabilidade no teste Qui-

quadrado. Tem-se então 9 + 1 = 10 testes de hipóteses, para cada candidato no

Primeiro e Segundo Turnos.

3.5.2 Cálculo da Estatística do Teste

Para o Z-teste utiliza-se o nível de significância α = 0,05 que fornece um valor

crítico Zc = 1,96.

Para o teste Qui-quadrado, também se utiliza o nível de significância α = 0,05

com grau de liberdade igual a 8 que fornece um χ2c = 15,507. O grau de liberdade foi

calculado tomando-se a quantidade de pontos observados (9) provenientes dos 9

dígitos possíveis na distribuição: (1, 2, 3, 4, 5, 6, 7, 8 e 9). Desse valor, subtrai-se 1

para se determinar o grau de liberdade necessário para esse teste.

3.6 Teste de Hipóteses para o Segundo Dígito

Diferentemente da Lei de Newcomb-Benford para o Primeiro Dígito, onde são

analisadas as frequências relativas dos 9 dígitos possíveis compreendidos de 1 a 9,

deve-se observar as frequências relativas dos 10 dígitos possíveis, isto é, de 0 a 9.

O dígito 0 (zero) deverá ser incluído, pois agora ele poderá ocorrer.

35

3.6.1 Definição das Hipóteses

De forma análoga, são definidas as seguintes hipóteses:

Hipótese Nula H0 – Não existe diferença estatisticamente significativa entre

as distribuições de probabilidades observadas (po) e esperadas (pe);

Hipótese Alternativa H1 – Existe diferença estatisticamente significativa entre

as distribuições de probabilidades observadas (po) e esperadas (pe);

Na simbologia usual, tem-se:

H0: po = pe

H1: po ≠ pe

Da mesma forma, essas hipóteses são definidas para cada um dos dígitos de

0 a 9 no Z-teste e para toda a distribuição de probabilidade no teste Qui-quadrado.

Tem-se então 10 + 1 = 11 testes de hipóteses, para cada candidato no Primeiro e

Segundo Turnos.

3.6.2 Cálculo da Estatística do Teste

Para o Z-Teste do segundo dígito também se utiliza o nível de significância α

= 0,05 que fornece um valor crítico Zc = 1,96.

O teste Qui-quadrado, com nível de significância α = 0,05 para 9 graus de

liberdade fornece um χ2c = 16,9. O grau de liberdade foi calculado tomando-se a

quantidade de pontos observados (10) provenientes dos 10 dígitos possíveis na

distribuição: (0, 1, 2, 3, 4, 5, 6, 7, 8 e 9). Dessa quantidade, subtrai-se 1 para se

encontrar o grau de liberdade necessário para esse teste.

A seguinte tabela sintetiza os critérios utilizados para os Teste de Hipótese

para o primeiro e segundo dígitos.

Tabela 7 - Valores Críticos para o Z-teste e o Teste Qui-quadrado

Nível de significância α = 0,05

Z-teste Qui-quadrado Dígito Opções Quantidade de Dígitos

Zc χ2c Graus de Liberdade

1° 1 a 9 9 1,96 15,507 8

2° 0 a 9 10 1,96 16,9 9

A tabela anterior disponibiliza os valores críticos para cada teste de hipótese

individual.

36

A seguir, serão analisados e discutidos os resultados para a aplicação da Lei

de Newcomb-Benford para o Primeiro e Segundo Dígitos.

37

4 ANÁLISE E DISCUSSÃO DOS RESULTADOS

Neste capítulo, será utilizada a metodologia explanada no capítulo anterior

para a aplicação da Lei de Newcomb-Benford para o Primeiro e Segundo Dígitos

aos dados provenientes de todas as zonas eleitorais distribuídas pelo Brasil e

exterior.

Ao final do capítulo será realizada comparação entre as funcionalidades das

duas leis para o caso eleitoral.

4.1 Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na Eleição Presidencial Brasileira de 2006

Nas tabelas seguintes, listam-se os resultados encontrados através da

aplicação do Z-teste e do teste Qui-quadrado.

Lembrando que:

H0: po = pe

H1: po ≠ pe

Com:

a) Nível de significância α = 0,05;

b) Valor crítico Zc = 1,96 para o Z-Teste;

c) Valor crítico χ2c = 15,507 para o teste Qui-quadrado com 8 graus de

liberdade, pois temos 9 dígitos possíveis (1 a 9).

É importante salientar que alguns candidatos não receberam votos em todas

as zonas eleitorais. Assim, em algumas tabelas são encontrados totais inferiores a

3.034.

Os valores em amarelo ultrapassaram os limites individuais no respectivo

teste.

Para a candidata Ana Maria Teixeira Rangel, tem-se:

38

Tabela 8 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 809 0,266821 0,30103 -0,03421 912,7229 4,086745 11,78720196

2 544 0,17942 0,176091 0,003328 533,9087 0,457304 0,190733711

3 401 0,132256 0,124939 0,007317 378,8142 1,191083 1,299337421

4 338 0,111478 0,09691 0,014568 293,8312 2,680756 6,639481259

5 251 0,082784 0,079181 0,003602 240,0775 0,700983 0,496923522

6 210 0,069261 0,066947 0,002314 202,9827 0,473573 0,242596943

7 197 0,064974 0,057992 0,006982 175,8316 1,605948 2,54847201

8 151 0,049802 0,051153 -0,00135 155,0944 0,296303 0,108092231

9 131 0,043206 0,045757 -0,00255 138,7367 0,62895 0,431440982

3032 1 3032 23,74428003

Pode-se comparar a distribuição de probabilidades descrita pela Lei de

Newcomb-Benford com os valores calculados na tabela anterior. Veja o gráfico a

seguir:

Gráfico 3 - Análise da Lei de Newcomb-Benford do Primeiro Dígito para a

candidata Ana Maria Teixeira Rangel

Visualmente, as curvas são semelhantes. Porém, estatisticamente,

encontram-se grandes diferenças, pois χ2 = 23,74 está muito acima do valor crítico

individual χ2c = 15,507.

Como a quantidade de informações a serem analisadas é numerosa, as

tabelas e gráficos de todos os candidatos no Primeiro e Segundo Turnos estão à

disposição nos Apêndices B e C, respectivamente.

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

39

Desta forma, seguindo a mesma metodologia aplicada aos votos de Ana

Maria Teixeira Rangel, pode-se construir uma tabela resumida com todos os

resultados calculados para os candidatos. A ordem dos candidatos na tabela

equivale à sua colocação na apuração dos resultados eleitorais, sendo Luís Inácio

Lula da Silva o mais votado no Primeiro e Segundo Turnos.

Tabela 9 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006

1º Turno Z-teste, com Zc = 1,96

Candidatos 1 2 3 4 5 6 7 8 9 χ2

c = 15,507

Lula 1,00 0,99 0,91 0,34 0,86 0,03 0,03 0,52 1,10 4,74

Alckmin 0,63 3,52 0,19 1,26 0,49 2,21 0,20 2,41 3,10 32,31

Heloísa 8,11 1,85 2,00 2,79 4,93 1,77 2,99 2,09 0,12 98,51

Cristovam 4,16 2,59 0,96 1,81 0,86 2,08 2,52 0,88 2,20 38,45

Ana Maria 4,09 0,46 1,16 2,68 0,70 0,47 1,61 0,30 0,63 23,74

Eymael 2,76 2,25 0,87 1,62 4,15 4,38 0,56 0,35 3,06 56,81

Bivar 0,52 1,23 0,11 0,31 1,77 0,38 1,59 1,98 0,29 0,11

Tabela 10 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006

2º Turno Z-teste, com Zc = 1,96

Candidatos 1 2 3 4 5 6 7 8 9 χ2

c = 15,507

Lula 0,55 2,20 2,45 0,46 0,22 0,32 0,35 0,85 1,68 13,79

Alckmin 2,64 1,66 0,00 0,09 1,30 1,34 0,90 3,07 1,36 22,60

Observando-se as tabelas anteriores percebe-se que, dentre os 90 testes de

hipótese realizados, 33 tiveram valores acima dos limites críticos individuais. Apesar

disso, segundo Mebane (2006a, 2006b), deve-se considerar a aplicação do critério

da taxa de falsos positivos FDR.

4.1.1 Análise dos Testes de Hipótese Utilizando o Critério FDR

Como foi explicado anteriormente, utiliza-se o critério FDR para encontrar os

valores críticos, ZFDR e χ2FDR, para o conjunto dos testes de hipótese com nível de

significância α = 0,05.

Aplicando o critério FDR, cujos cálculos estão disponíveis no Apêndice D,

pode-se montar a seguinte tabela:

40

Tabela 11 - Critério FDR para o Primeiro Dígito Turno ZFDR χ2

FDR

Primeiro 2,52 21,00

Segundo 2,99 17,53

Novamente, reúnem-se em duas tabelas os valores encontrados para a Lei de

Newcomb-Benford para o Primeiro Dígito em ambos os turnos.

Tabela 12 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR

1º Turno Z-teste, com Zc = 1,96 e ZFDR = 2,52

Candidatos 1 2 3 4 5 6 7 8 9

χ2c = 15,507

χ2FDR=21,00

Lula 1,00 0,99 0,91 0,34 0,86 0,03 0,03 0,52 1,10 4,74

Alckmin 0,63 3,52 0,19 1,26 0,49 2,21 0,20 2,41 3,10 32,31

Heloísa 8,11 1,85 2,00 2,79 4,93 1,77 2,99 2,09 0,12 98,51

Cristovam 4,16 2,59 0,96 1,81 0,86 2,08 2,52 0,88 2,20 38,45

Ana Maria 4,09 0,46 1,16 2,68 0,70 0,47 1,61 0,30 0,63 23,74

Eymael 2,76 2,25 0,87 1,62 4,15 4,38 0,56 0,35 3,06 56,81

Bivar 0,52 1,23 0,11 0,31 1,77 0,38 1,59 1,98 0,29 0,11

Tabela 13 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR

2º Turno Z-teste, com Zc = 1,96 e ZFDR = 2,99

Candidatos 1 2 3 4 5 6 7 8 9

χ2c = 15,507

χ2FDR=17,53

Lula 0,55 2,20 2,45 0,46 0,22 0,32 0,35 0,85 1,68 13,79

Alckmin 2,64 1,66 0,00 0,09 1,30 1,34 0,90 3,07 1,36 22,60

Marcados em amarelo, encontram-se os valores de Z acima do Zc ou χ2c e em

vermelho, os valores que superam os limites impostos pelo critério FDR, ZFDR e χ2FDR

para o Primeiro e Segundo Turnos.

Na tabela para o Primeiro Turno, encontram-se 23 valores de Z acima de Zc =

1,96. Dentre os quais, 15 superam o valor crítico ZFDR = 2,52. O maior valor de Z

encontrado foi 8,11 referente ao dígito 1 da candidata Heloísa Helena Lima de

Moraes Carvalho. No teste Qui-quadrado, 5 valores ultrapassaram o maior limite

crítico χ2FDR = 21,00. O maior valor do teste Qui-quadrado foi de 98,51, também para

a candidata Heloísa Helena Lima de Moraes Carvalho.

41

Na tabela do Segundo Turno, 4 valores ultrapassaram Zc = 1,96. Dentre

esses, 1 superou o limite do critério FDR, ZFDR = 2,99. Com relação ao teste Qui-

quadrado, 1 valor também superou o valor crítico χ2FDR = 17,53 com χ2 = 22,60 para

Geraldo José Rodrigues Alckmin Filho.

Visivelmente, percebe-se que a hipótese H0 não é verdadeira para a Lei de

Newcomb-Benford para o Primeiro Dígito, similarmente ao que foi observado por

Mebane (2006a, 2006b) e Pericchi e Torres (2004) nos estudos realizados nos

sistemas eleitorais de seus países de origem.

A seguir, os mesmos dados de entrada serão aplicados à análise da Lei de

Newcomb-Benford para o Segundo Dígito.

4.2 Aplicação da Lei de Newcomb-Benford para o Segundo Dígito na Eleição Presidencial Brasileira de 2006

Como realizado anteriormente, utiliza-se a mesma quantidade de votos

recebida por cada um dos candidatos a presidente do Brasil no ano de 2006,

distribuídos por todas as zonas eleitorais existentes, no Brasil e no Exterior, para o

Primeiro e Segundo Turnos das Eleições.

Em diversas zonas eleitorais, alguns candidatos obtiveram a soma de seus

votos inferior a dez (Isto é, quantidades com apenas 1 dígito, não sendo possível

realizar a análise para a Lei de Newcomb-Benford para o Segundo Dígito). Nesse

caso, tal zona será desconsidera do total das 3.034.

Os números que estiverem fora do valor crítico esperado, serão marcados em

amarelo.

Nas tabelas seguintes, serão listados os resultados encontrados através da

aplicação do Z-teste e do teste Qui-quadrado:

Novamente, para a candidata Ana Maria Teixeira Rangel, tem-se os seguintes

resultados:

42

Tabela 14 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 321 0,116 0,1197 -0,0037 331,272 0,572242 0,318524784

1 331 0,1196 0,1139 0,00569 315,248 0,912562 0,787100191

2 301 0,1087 0,1088 -8E-05 301,218 0,0133 0,000157641

3 268 0,0968 0,1043 -0,0075 288,784 1,261239 1,495870896

4 252 0,091 0,1003 -0,0093 277,653 1,591452 2,370158047

5 275 0,0993 0,0967 0,00267 267,603 0,443629 0,204488657

6 287 0,1037 0,0934 0,01031 258,461 1,831668 3,151184669

7 254 0,0918 0,0904 0,00141 250,094 0,225796 0,060994764

8 230 0,0831 0,0876 -0,0045 242,394 0,799768 0,633716269

9 249 0,09 0,085 0,00496 235,273 0,90152 0,800941201

2768 1 2768 9,823137

Percebe-se que, desta vez, nenhum dos valores calculados ultrapassou os

níveis críticos individuais para Z e χ2.

Gráfico 4 – Análise da Lei de Newcomb-Benford do Segundo Dígito para

a candidata Ana Maria Teixeira Rangel

Apesar de, visualmente, as diferenças parecerem maiores do que aquelas

encontradas na análise para o Primeiro Dígito, as quantidades observadas estão

distribuídas de forma mais uniforme. Na análise da Lei para o Primeiro Dígito

referente à mesma candidata, o gráfico estava limitado superiormente por 809 votos,

isto é, mais que o dobro do limite atual de 331.

Como foi realizado para o primeiro dígito, será mostrado adiante um resumo

com os resultados de todos os candidatos para o Primeiro e Segundo Turnos das

0

50

100

150

200

250

300

350

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

43

eleições. Maiores detalhes sobre os cálculos e gráficos, podem ser encontrados nos

Apêndices E e F, respectivamente.

Tabela 15 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006

1º Turno Z-teste, com Zc = 1,96

Candidatos 0 1 2 3 4 5 6 7 8 9 χ2

c = 16,9

Lula 0,75 0,05 0,39 0,71 0,53 1,67 0,82 0,86 2,00 0,42 9,436

Alckmin 1,10 0,51 0,84 0,12 1,50 0,93 0,17 0,34 0,69 0,35 5,787

Heloísa 0,58 0,23 0,27 0,06 0,41 0,44 0,11 1,12 0,76 0,30 2,742

Cristovam 1,99 0,45 0,10 0,30 0,41 0,02 1,70 0,17 0,01 1,21 8,249

Ana Maria 0,57 0,91 0,01 1,26 1,59 0,44 1,83 0,23 0,80 0,90 9,823

Eymael 1,86 0,03 0,39 0,55 0,48 0,00 1,50 1,03 1,67 1,33 11,539

Bivar 0,96 0,08 1,81 0,56 0,18 2,24 1,10 0,83 1,25 2,47 18,208

Tabela 16 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006

2º Turno Z-teste, com Zc = 1,96

Candidatos 0 1 2 3 4 5 6 7 8 9 χ2

c = 16,9

Lula 2,09 1,37 0,51 0,60 1,26 0,07 0,11 0,47 2,39 0,56 13,709

Alckmin 0,13 0,23 0,95 0,00 0,59 1,18 1,17 0,15 0,59 0,11 4,329

Diferentemente do observado na análise para o primeiro dígito, dos 99 testes

de hipóteses realizados, apenas 7 deles ultrapassaram seus valores críticos

individuais.

De forma geral, a grande maioria dos resultados encontra-se abaixo do valor

crítico para os testes individuais. Aqueles que excederam (em amarelo) estão bem

próximos dos limites críticos para o grau de significância α = 0,05. Ou seja, com uma

confiança de 95%.

Mesmo assim, ainda não se pode tirar conclusões a partir da análise realizada

até este ponto, pois pode ter havido a ocorrência de falsos positivos. Por isso, é

importante avaliar o critério FDR já discutido, da mesma forma que foi realizado para

a Lei do Primeiro Dígito.

44

4.2.1 Análise dos Testes de Hipótese Utilizando o Critério FDR

Utilizando o critério FDR para um nível de significância α = 0,05, encontram-

se os seguinte valores críticos para o conjunto.

Tabela 17 - Critério FDR para o Primeiro Dígito

Turno ZFDR χ2FDR

Primeiro 3,38 22,61

Segundo 3,02 19,02

Maiores detalhes sobre a aplicação do critério FDR para a análise do

Segundo Dígito podem ser encontrados no Apêndice G.

A seguinte tabela resume os dados encontrados após a aplicação do critério

FDR.

Tabela 18 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR

1º Turno Z-teste, com Zc = 1,96 e ZFDR = 3,38

Candidatos 0 1 2 3 4 5 6 7 8 9

χ2c = 16,9

χ2FDR=22,61

Lula 0,75 0,05 0,39 0,71 0,53 1,67 0,82 0,86 2,00 0,42 9,436

Alckmin 1,10 0,51 0,84 0,12 1,50 0,93 0,17 0,34 0,69 0,35 5,787

Heloísa 0,58 0,23 0,27 0,06 0,41 0,44 0,11 1,12 0,76 0,30 2,742

Cristovam 1,99 0,45 0,10 0,30 0,41 0,02 1,70 0,17 0,01 1,21 8,249

Ana Maria 0,57 0,91 0,01 1,26 1,59 0,44 1,83 0,23 0,80 0,90 9,823

Eymael 1,86 0,03 0,39 0,55 0,48 0,00 1,50 1,03 1,67 1,33 11,539

Bivar 0,96 0,08 1,81 0,56 0,18 2,24 1,10 0,83 1,25 2,47 18,208

Tabela 19 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR

2º Turno Z-teste, com Zc = 1,96 e ZFDR = 3,02

Candidatos 0 1 2 3 4 5 6 7 8 9

χ2c = 16,9

χ2FDR=19,02

Lula 2,09 1,37 0,51 0,60 1,26 0,07 0,11 0,47 2,39 0,56 13,709

Alckmin 0,13 0,23 0,95 0,00 0,59 1,18 1,17 0,15 0,59 0,11 4,329

Como já foi explicado, os valores em amarelo ultrapassaram os limites

individuais para os testes Zc ou χ2c. Porém, nenhum dos valores excedeu os limites

críticos estabelecidos pelo critério FDR, ZFDR e χ2FDR. Percebe-se que não ocorreram

valores em vermelho.

45

4.3 Comparação dos Resultados

Na realização dos testes estatísticos para a Lei de Newcomb-Benford para o

Primeiro Dígito, ocorreram inúmeras distorções. Diversos valores se encontram

acima dos limites críticos. Do total de 90 testes de hipóteses, 22 ultrapassaram o

limite crítico para o conjunto. Enquanto que, dentre os 99 testes de hipóteses

realizados na análise da Lei para o Segundo Dígito, nenhum deles ultrapassou os

limites críticos para o conjunto.

Comparando as tabelas referentes à aplicação da Lei de Newcomb-Benford

para o Primeiro e para o Segundo Dígitos, percebe-se nitidamente que as

distribuições de probabilidades derivadas dos resultados eleitorais aderem à

distribuição de probabilidades referente à aplicação da referida lei para o Segundo

Dígito.

Assim, é válida a hipótese H0 na qual não se pode negar a utilização da Lei de

Newcomb-Benford apenas para o Segundo Dígito na indicação de possíveis fraudes

no sistema de votação eleitoral como foi demonstrado.

46

5 CONSIDERAÇÕES FINAIS

Com relação aos objetivos elencados no início deste trabalho, pode-se

concluir que não é aconselhável a utilização da Lei de Newcomb-Benford para o

Primeiro Dígito como indicativo de fraude eleitoral, pois, analogamente ao verificado

por Mebane (2006a), os primeiros dígitos ficam comprometidos com a quantidade de

votos apurados em cada zona eleitoral. Por outro lado, pode-se utilizar a Lei de

Newcomb-Benford para o Segundo Dígito como possível indicativo de fraude na

auditoria de resultados eleitorais.

No que diz respeito à coleta de dados em nível de zona eleitoral, a mesma

apresentou-se satisfatória, pois foi capaz de produzir dados que obedeciam à Lei de

Newcomb-Benford para o Segundo Dígito. Porém, é importante salientar que a

mesma não serve para a análise da Lei para o Primeiro Dígito.

Para o tema deste estudo, o objetivo geral foi alcançado, pois foi mostrado

que a Lei de Newcomb-Benford pode ser utilizada como indicativo de fraude em

sistemas eleitorais brasileiros, particularmente no que se refere à Eleição Majoritária

para Presidente da República com coleta de dados em nível de zona eleitoral.

Mesmo assim, é importante salientar que resultados negativos (em vermelho) para a

análise do Segundo Dígito que possam vir a ocorrer em outras eleições

presidenciais não comprovam a existência de fraude eleitoral. É apenas uma

sinalização de que poderá haver algo errado. Caso ocorram, os dígitos cujo Z-teste

tenha ultrapassado seu limite crítico ZFDR servirão para indicar as zonas com

possíveis problemas. Uma investigação mais aprofundada deverá ser realizada

nesses casos.

Novas pesquisas devem ser realizadas para confirmar a possibilidade de

utilização da Lei de Newcomb-Benford na detecção de fraudes eleitorais. A seguir

são listadas algumas recomendações para futuros estudos nesta área.

47

5.1 Recomendações para Futuras Pesquisas

Com relação às Eleições Presidenciais Brasileiras, para maior segurança na

aplicação da metodologia, faz-se necessário analisar os pleitos dos anos anteriores.

Com a proximidade da Eleição Majoritária para Presidente do Brasil de 2010, haverá

outra oportunidade para se testar a Lei de Newcomb-Benford para o Segundo Dígito.

No que se refere às eleições para governador, prefeito, senador, deputado

federal, deputado estadual e vereador, novos estudos deverão ser realizados.

Nesses casos, deverá haver a escolha mais adequada da forma de totalização e dos

testes estatísticos a serem utilizados.

Para futuros trabalhos é recomendado pesquisar formas de simulação de

resultados eleitorais para, a partir delas, simular fraudes e verificar se tais

manipulações podem ser detectadas pela análise da Lei de Newcomb-Benford, de

forma similar à realizada por Mebane (2006a).

Outra recomendação é o estudo da Lei de Newcomb-Benford para outras

bases numéricas, tais como a base octal, quaternária, etc., com a finalidade de se

verificar a sua aplicação diretamente aos dados das seções eleitorais (urnas).

48

REFERÊNCIAS BIBLIOGRÁFICAS

BENJAMINI, Yoav.; HOCHBERG, Yosef. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistics Society, London, v. 57, n.1, p. 289-300, 1995. Disponível em: <http://www.biostat. jhsph.edu/~yonchen/Controlling%20the%20false%20discovery%20rate.pdf >. Acesso em: 26 mai. 2009. BRASIL. Fundação Instituto Brasileiro de Geografia e Estatística. Normas de apresentação tabular. Centro de Documentação e Disseminação de Informações. 3. ed. Rio de Janeiro: IBGE, 1993. Disponível em: <http://biblioteca.ibge.gov.br/ visualizacao/monografias/visualiza_colecao_digital.php?titulo=Normas%20de%20apresenta%C3%A7%C3%A3o%20tabula&link=Normas_de_Apresentacao_Tabulares#>. Acesso em: 04 jul. 2009. ______. Tribunal Superior Eleitoral. Glossário eleitoral brasileiro. Disponível em: <http://www.tse.gov.br/internet/institucional/glossario-eleitoral/index.html>. Acesso em: 22 jun. 2009. ______. Tribunal Superior Eleitoral. Consulta de resultados eleitorais. Disponível em: <http://www.tse.gov.br/internet/eleicoes/2006/result_zona_blank.htm>. Acesso em: 20 mai. 2009. DAWOOD, Layla. Referendo revocatório. Vitória democrática na Venezuela?. PUC Minas. Ago 2004. Disponível em: <http://www.pucminas.br/imagedb/conjuntura/CNO_ARQ_NOTIC20060525103045.pdf?PHPSESSID=54619d94dd0426f3fb4c5cbbcb7fb6e1 >. Acesso em: 04 ago 2009. WIKIPEDIA. Disponível em: <http://en.wikipedia.org/wiki/Precinct>. Acesso em: 22 jun. 2009. MEBANE, Walter R., Jr. Election Forensics: Vote Counts and Benford's Law. Cornell University. Jul. 2006a. Disponível em: <http://www-personal.umich.edu/ ~wmebane/pm06.pdf>. Acesso em: 30 mai. 2009. ______. Election Forensics: The Second-digit Benford’s Law Test and recent American Presidential Elections. Cornell University. Nov. 2006b. Disponível em: <http://www-personal.umich.edu/~wmebane/fraud06.pdf>. Acesso em: 04 ago. 2009. NIGRINI, Mark J. I’ve got your number. How a mathematical phenomenon can help CPAs uncover fraud and other irregularities. Journal of Accountancy. Mai, 1999. Disponível em: <http://www.journalofaccountancy.com/Issues/1999/May/nigrini.htm>. Acesso em: 04 ago. 2009. ______. Continuous auditing. Allen, 2000. Disponível em: <http://aaahq.org/audit/midyear/01midyear/papers/nigrini_continuous_audit.pdf>. Acesso em: 22 jun. 2009.

49

PERICCHI, Luis Raúl; TORRES, David. La Ley de Newcomb-Benford y sus aplicaciones al Referendum Revocatorio en Venezuela. Universidad de Puerto Rico, Universidad Simón Bolívar. Reporte técnico não definitivo, v. 2, out. 2004. Disponível em: <http://esdata.info/pdf/pericchi-torres.pdf>. Acesso em: 22 jun. 2009. SANTOS, Josenildo dos; DINIZ, Josedilton Alves; CORRAR, Luiz J. A lei de Newcomb-Benford. In: CORRAR, Luiz J.; PAULO, Edilson; DIAS FILHO, José Maria. (Coord.). Análise multivariada: para os cursos de administração, ciências contábeis e economia. São Paulo: Atlas, 2007. p. 506 - 541. SPIEGEL, Murray R. Estatística. 3. ed. Tradução e revisão técnica Pedro Constantino. São Paulo: Pearson Makron Books, 1993.

50

APÊNDICE A - EXEMPLO DE PLANILHA ELETRÔNICA PARA O CÁLCULO DOS TESTES ESTATÍSTICOS

Como exemplo, será mostrado como se calculam as principais células para a

análise da Lei de Newcomb-Benford para o Segundo Dígito utilizando funções que

servem para o Microsoft® Office Excel e para o BrOffice Calc.

Será mostrada a planilha de análise para o candidato Luís Inácio Lula da Silva

no Primeiro Turno:

Figura A1 – Planilha exemplificando a aplicação da Lei de Newcomb-Benford para o

Segundo Dígito nos votos de Luís Inácio Lula da Silva no Primeiro Turno

Na coluna A, abaixo do nome Dados, tem-se os votos de cada uma das 3034

zonas eleitorais distribuídas pelo Brasil e exterior, coletadas através do site do TSE.

51

Na coluna B, selecionam-se os dois dígitos mais significativos, formando uma

dezena. A fórmula da célula B4 é dada por:

=ESQUERDA(ABS(A4);2)

Na coluna C, selecionam-se a unidade das células da coluna B. Para a célula

C4, temos:

=SE(A4>=10;DIREITA(B4;1);"")

A condição SE é necessária, pois, se o candidato obtiver uma votação abaixo

de 10 votos, não existirá um segundo dígito significativo.

Na coluna D, distribuem-se as 10 possibilidades de dígitos;

Na coluna E, escreve-se uma função que retorna as quantidades para cada

dígito. Na célula E4, tem-se:

=CONT.SE($C$4:$C$3339;D4)

E14 representa a soma de todas as quantidades de dígitos encontradas:

=SOMA(E4:E13)

Na coluna po, há as proporções observadas para cada dígito:

=E4/$E$14

Na coluna pe, estão as probabilidades para cada dígito, segundo a Lei de

Newcomb-Benford para o Segundo Dígito;

Na coluna H tem-se a diferença entre as colunas po e pe:

=F4-G4

52

n

ppn

ppZ

ee

eo

121

9

1

22

d PEPEPO

Na coluna I, calcula-se o número de casos esperados em relação ao total:

=G4*$E$14

Na coluna J, tem-se o valor do Z-teste. Veja o conteúdo da célula J4:

=SE((1/(2*$F$14))<(ABS(I4));((ABS(I4))-(1/(2*$F$14)))/(RAIZ((H4*(1-H4))/$F$14));((ABS(I4)))/(RAIZ((H4*(1-H4))/$F$14)))

Os passos mostrados até aqui, demonstram o cálculo do Z-teste. Para se

calcular o Z-teste para todos os dígitos, repita as funções até a coluna J para cada

dígito.

Para o cálculo do teste Qui-quadrado, soma-se a contribuição de cada dígito

como se segue.

Na célula M4, temos:

=POTÊNCIA((E4-I4);2)/I4

Na célula M14, tem-se a soma geral para o qui-quadrado:

=SOMA(M5:M13)

Conclui-se, assim, este breve tutorial que poderá ajudar aqueles interessados

que possuam conhecimentos básicos em planilhas eletrônicas.

53

APÊNDICE B – TABELAS DA ANÁLISE PARA O 1° DÍGITO

Tabela B1 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado (χ2

c = 15,507)

1 809 0,266821 0,30103 -0,03421 912,7229 4,086745 11,78720196 2 544 0,17942 0,176091 0,003328 533,9087 0,457304 0,190733711 3 401 0,132256 0,124939 0,007317 378,8142 1,191083 1,299337421 4 338 0,111478 0,09691 0,014568 293,8312 2,680756 6,639481259 5 251 0,082784 0,079181 0,003602 240,0775 0,700983 0,496923522 6 210 0,069261 0,066947 0,002314 202,9827 0,473573 0,242596943 7 197 0,064974 0,057992 0,006982 175,8316 1,605948 2,54847201 8 151 0,049802 0,051153 -0,00135 155,0944 0,296303 0,108092231 9 131 0,043206 0,045757 -0,00255 138,7367 0,62895 0,431440982 3032 1 3032 23,74428003

Tabela B2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado (χ2

c = 15,507)

1 1019 0,33586 0,30103 0,03483 913,325 4,162656 12,22697736 2 589 0,194133 0,176091 0,018042 534,2609 2,585213 5,608442193 3 361 0,118985 0,124939 -0,00595 379,0641 0,964386 0,860837669 4 264 0,087014 0,09691 -0,0099 294,025 1,811891 3,066063957 5 227 0,074819 0,079181 -0,00436 240,2359 0,856295 0,729237645 6 174 0,05735 0,066947 -0,0096 203,1166 2,078699 4,173830298 7 143 0,047132 0,057992 -0,01086 175,9476 2,520364 6,169691332 8 144 0,047462 0,051153 -0,00369 155,1968 0,88148 0,807795766 9 113 0,037245 0,045757 -0,00851 138,8282 2,200577 4,805199162 3034 1 3034 38,44807538

Tabela B3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 897 0,295649 0,30103 -0,00538 913,325 0,626328 0,291797385 2 460 0,151615 0,176091 -0,02448 534,2609 3,515684 10,32207017 3 383 0,126236 0,124939 0,001297 379,0641 0,188652 0,040866693 4 273 0,08998 0,09691 -0,00693 294,025 1,259578 1,503442879 5 248 0,08174 0,079181 0,002559 240,2359 0,4884 0,250925198 6 234 0,077126 0,066947 0,010179 203,1166 2,207044 4,695761308 7 179 0,058998 0,057992 0,001006 175,9476 0,19826 0,052955244 8 185 0,060976 0,051153 0,009823 155,1968 2,414773 5,723273894 9 175 0,05768 0,045757 0,011922 138,8282 3,099249 9,424576273 3034 1 3034 32,30566905

54

Tabela B4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 708 0,233355 0,30103 -0,06767 913,325 8,106643 46,15920742 2 495 0,163151 0,176091 -0,01294 534,2609 1,84747 2,885138617 3 416 0,137113 0,124939 0,012174 379,0641 2,000569 3,599018285 4 340 0,112063 0,09691 0,015153 294,025 2,790714 7,188853535 5 314 0,103494 0,079181 0,024312 240,2359 4,925895 22,64916427 6 228 0,075148 0,066947 0,008202 203,1166 1,771206 3,048425003 7 215 0,070864 0,057992 0,012872 175,9476 2,994559 8,667880653 8 181 0,059657 0,051153 0,008505 155,1968 2,085147 4,290086854 9 137 0,045155 0,045757 -0,0006 138,8282 0,115399 0,024075879 3034 1 3034 98,51185052

Tabela B5 - Análise dos Votos de José Maria Eymael no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 806 0,277357 0,30103 -0,02367 874,7932 2,76182 5,409850073 2 465 0,160014 0,176091 -0,01608 511,7212 2,251049 4,265741626 3 379 0,13042 0,124939 0,005481 363,072 0,865556 0,698765553 4 308 0,105988 0,09691 0,009078 281,6205 1,622775 2,470978291 5 291 0,100138 0,079181 0,020956 230,1007 4,149405 16,11783276 6 254 0,087405 0,066947 0,020459 194,5474 4,375597 18,16840352 7 161 0,055403 0,057992 -0,00259 168,5246 0,557523 0,335972164 8 144 0,049553 0,051153 -0,0016 148,6492 0,349372 0,14541173 9 98 0,033723 0,045757 -0,01203 132,9713 3,060194 9,197397135 2906 1 2906 56,81035286

Tabela B6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 889 0,296531 0,30103 -0,0045 902,4879 0,517118 0,20158073 2 554 0,18479 0,176091 0,008699 527,9216 1,226448 1,288227708 3 377 0,125751 0,124939 0,000812 374,5663 0,106807 0,015812255 4 296 0,098732 0,09691 0,001822 290,5362 0,306441 0,102751054 5 264 0,088059 0,079181 0,008877 237,3854 1,766321 2,983916879 6 195 0,065043 0,066947 -0,0019 200,7065 0,380461 0,162246188 7 153 0,051034 0,057992 -0,00696 173,8599 1,590918 2,502783812 8 129 0,043029 0,051153 -0,00812 153,3553 1,977592 3,868004219 9 141 0,047031 0,045757 0,001274 137,181 0,290093 0,10632009 2998 1 2998 11,23164293

55

Tabela B7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 939 0,309492 0,30103 0,008462 913,325 0,996386 0,721764179 2 513 0,169084 0,176091 -0,00701 534,2609 0,989531 0,846075455 3 362 0,119314 0,124939 -0,00562 379,0641 0,90948 0,768166664 4 300 0,098879 0,09691 0,001969 294,025 0,335991 0,121421215 5 227 0,074819 0,079181 -0,00436 240,2359 0,856295 0,729237645 6 204 0,067238 0,066947 0,000291 203,1166 0,027853 0,003842457 7 175 0,05768 0,057992 -0,00031 175,9476 0,034765 0,005103131 8 162 0,053395 0,051153 0,002242 155,1968 0,519427 0,298228973 9 152 0,050099 0,045757 0,004341 138,8282 1,100954 1,249714308 3034 1 3034 4,743554027

Tabela B8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 846 0,27884 0,30103 -0,02219 913,325 2,644826 4,962807886 2 499 0,164469 0,176091 -0,01162 534,2609 1,656817 2,327195764 3 379 0,124918 0,124939 -2,1E-05 379,0641 0,003521 1,08484E-05 4 292 0,096243 0,09691 -0,00067 294,025 0,093585 0,013946236 5 260 0,085695 0,079181 0,006514 240,2359 1,295217 1,625983576 6 222 0,073171 0,066947 0,006224 203,1166 1,335368 1,755564965 7 188 0,061964 0,057992 0,003972 175,9476 0,897335 0,825593331 8 193 0,063612 0,051153 0,01246 155,1968 3,074023 9,208217615 9 155 0,051088 0,045757 0,00533 138,8282 1,361601 1,883811884 3034 1 3034 22,60313211

Tabela B9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno

Dígitos Obsev. po pe (po - pe) Esperad. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 15,507)

1 899 0,296309 0,30103 -0,00472 913,325 0,547171 0,224679955 2 581 0,191496 0,176091 0,015405 534,2609 2,203907 4,088911284 3 334 0,110086 0,124939 -0,01485 379,0641 2,446864 5,357340319 4 302 0,099539 0,09691 0,002629 294,025 0,458727 0,216311392 5 244 0,080422 0,079181 0,001241 240,2359 0,219461 0,058977218 6 208 0,068556 0,066947 0,00161 203,1166 0,318412 0,117410362 7 181 0,059657 0,057992 0,001665 175,9476 0,35361 0,145083438 8 166 0,054713 0,051153 0,003561 155,1968 0,849053 0,75201408 9 119 0,039222 0,045757 -0,00654 138,8282 1,679282 2,83197856 3034 1 3034 13,79270661

56

APÊNDICE C – GRÁFICOS DA ANÁLISE PARA O 1° DÍGITO

Ana Maria Teixeira Rangel Cristovam Ricardo Cavalcanti Buarque

Geraldo José Rodrigues Alckmin Filho Heloísa Helena Lima de Moraes Carvalho

José Maria Eymael Luciano Caldas Bivar

Luís Inácio Lula da Silva

Gráfico C1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

200

400

600

800

1000

1200

1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

Observadoesperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

Observadoesperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

57

Geraldo José Rodrigues Alckmin Filho Luís Inácio Lula da Silva Gráfico C2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da

Análise da Lei de Newcomb-Benford para o Primeiro Dígito

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7 8 9

ObservadoEsperado

58

0

0,2

0,4

0,6

0,8

1

1,2

1 2 3 4 5 6 7

P-valorFDR

APÊNDICE D – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O PRIMEIRO DÍGITO

D.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno

No Primeiro Turno existem 7 candidatos. Assim, foram realizados 7 testes de

hipóteses para a estatística Qui-quadrado. Desta forma, m = 7 para a distribuição χ2

com 8 graus de liberdade, cujo valor crítico individual é de χ2c = 16,9.

Utilizando o critério FDR, tem-se:

Tabela D1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno

χ2i Pi m i q* FDR Compara

0,11 3,91965E-08 7 1 0,05 0,00714 -0,00714 4,74 0,143641341 7 2 0,05 0,01429 0,12936

23,74 0,995268145 7 3 0,05 0,02143 0,97384 32,31 0,99982401 7 4 0,05 0,02857 0,97125 38,45 0,999985529 7 5 0,05 0,03571 0,96427 56,81 0,999999995 7 6 0,05 0,04286 0,95714 98,51 1 7 7 0,05 0,05000 0,95000

A partir dos dados da tabela anterior, pode-se montar o seguinte gráfico:

Gráfico D1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno

59

0025,02

05,01

FDRP

0

0,2

0,4

0,6

0,8

1

1,2

1 2

P-valorFDR

Diretamente da tabela, para i = 1, encontra-se o valor de 0,00714 para PFDR.

Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 21,00.

D.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno

Utilizando o mesmo critério para o Segundo Turno, com apenas 2 candidatos,

tem-se m = 2.

Tabela D2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno

χ2i Pi m i q* FDR Compara

13,79 0,870006 2 1 0,05 0,02500 0,84501 22,6 0,99284 2 2 0,05 0,05000 0,94284

Gráfico D2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno

Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,

utiliza-se o critério de Bonferroni para i = 1.

(7)

Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 17,53.

60

D.3 Critério FDR para o Z-Teste no Primeiro Turno

Para o Z-teste, existem 7 (candidatos ao Primeiro Turno) x 9 (possíveis

dígitos) = 63. Assim, m = 63. Tem-se a tabela e o gráfico correspondente:

Tabela D3 - Critério FDR para o Teste Z no Primeiro Turno

Zi Pi m i q* FDR Compara

8,11 4,44089E-16 63 1 0,05 0,00079 -0,00079 4,93 8,22296E-07 63 2 0,05 0,00159 -0,00159 4,38 1,18679E-05 63 3 0,05 0,00238 -0,00237 4,16 3,18248E-05 63 4 0,05 0,00317 -0,00314 4,15 3,32475E-05 63 5 0,05 0,00397 -0,00394 4,09 4,31373E-05 63 6 0,05 0,00476 -0,00472 3,52 0,000431547 63 7 0,05 0,00556 -0,00512 3,1 0,001935206 63 8 0,05 0,00635 -0,00441 3,06 0,00221337 63 9 0,05 0,00714 -0,00493 2,99 0,002789774 63 10 0,05 0,00794 -0,00515 2,79 0,005270804 63 11 0,05 0,00873 -0,00346 2,76 0,005780136 63 12 0,05 0,00952 -0,00374 2,68 0,007362216 63 13 0,05 0,01032 -0,00296 2,59 0,009597593 63 14 0,05 0,01111 -0,00151 2,52 0,011735483 63 15 0,05 0,01190 -0,00017 2,41 0,015952521 63 16 0,05 0,01270 0,00325 2,25 0,024448945 63 17 0,05 0,01349 0,01096

...

...

...

...

...

...

...

0,03 0,976067053 63 63 0,05 0,05000 0,92607

Gráfico D3 - Comparação entre os valores de P e FDR para o Teste Z no

Primeiro Turno

0

0,2

0,4

0,6

0,8

1

1,2

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61

P-valorFDR

61

Ampliando o gráfico anterior, pode-se visualizar o ponto de intersecção.

Gráfico D4 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Primeiro Turno

Diretamente da tabela, tem-se para i = 15 o valor de 0,0119 para PFDR.

Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 2,52.

D.4 Critério FDR para o Z-Teste no Segundo Turno

Para o Segundo Turno, m = 18, pois existem 2 (candidatos) x 9 (possíveis

dígitos).

Tabela D4 - Critério FDR para o Teste Z no Segundo Turno

Zi Pi m i q* FDR Compara

3,07 0,002141 18 1 0,05 0,00278 -0,00064 2,64 0,008291 18 2 0,05 0,00556 0,00274 2,45 0,014286 18 3 0,05 0,00833 0,00595

...

...

...

...

...

...

...

0,09 0,928287 18 17 0,05 0,04722 0,88106 0 1 18 18 0,05 0,05000 0,95000

Novamente, podem-se ver esses valores em um gráfico:

0

0,002

0,004

0,006

0,008

0,01

0,012

0,014

0,016

0,018

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

P-valorFDR

62

0

0,2

0,4

0,6

0,8

1

1,2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

P-valorFDR

Gráfico D5 - Comparação entre os valores de P e FDR para o Teste Z no

Segundo Turno

Ampliando o trecho de 1 a 4, tem-se:

0

0,005

0,01

0,015

0,02

0,025

0,03

1 2 3 4

P-valorFDR

Gráfico D6 - Detalhamento da intersecção entre as curvas dos valores de

P e FDR para o Teste Z no Segundo Turno

Diretamente da tabela, tem-se para i = 15 o valor de 0,00278 para PFDR.

Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 2,99.

63

APÊNDICE E – TABELAS DA ANÁLISE PARA O 2° DÍGITO

Tabela E1 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 321 0,116 0,1197 -0,0037 331,272 0,572242 0,318524784 1 331 0,1196 0,1139 0,00569 315,248 0,912562 0,787100191 2 301 0,1087 0,1088 -8E-05 301,218 0,0133 0,000157641 3 268 0,0968 0,1043 -0,0075 288,784 1,261239 1,495870896 4 252 0,091 0,1003 -0,0093 277,653 1,591452 2,370158047 5 275 0,0993 0,0967 0,00267 267,603 0,443629 0,204488657 6 287 0,1037 0,0934 0,01031 258,461 1,831668 3,151184669 7 254 0,0918 0,0904 0,00141 250,094 0,225796 0,060994764 8 230 0,0831 0,0876 -0,0045 242,394 0,799768 0,633716269 9 249 0,09 0,085 0,00496 235,273 0,90152 0,800941201 2768 1 2768 9,823137

Tabela E2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 327 0,1078 0,1197 -0,0119 363,107 1,991574 3,590425549 1 354 0,1167 0,1139 0,00279 345,543 0,454756 0,20700216 2 328 0,1081 0,1088 -0,0007 330,164 0,097033 0,014189138 3 311 0,1025 0,1043 -0,0018 316,536 0,299082 0,096816924 4 297 0,0979 0,1003 -0,0024 304,335 0,413068 0,17679027 5 293 0,0966 0,0967 -0,0001 293,319 0,019581 0,00034635 6 311 0,1025 0,0934 0,00913 283,299 1,697264 2,708616697 7 271 0,0893 0,0904 -0,001 274,128 0,166418 0,035691292 8 265 0,0873 0,0876 -0,0002 265,688 0,012045 0,001779213 9 277 0,0913 0,085 0,0063 257,882 1,212027 1,417312052 3034 1 3034 8,24897

Tabela E3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 343 0,1131 0,1197 -0,0066 363,107 1,096658 1,11341168 1 355 0,117 0,1139 0,00312 345,543 0,511904 0,258847732 2 345 0,1137 0,1088 0,00489 330,164 0,835733 0,666619958 3 314 0,1035 0,1043 -0,0008 316,536 0,120912 0,020315916 4 279 0,092 0,1003 -0,0084 304,335 1,500869 2,109078436 5 309 0,1018 0,0967 0,00517 293,319 0,932646 0,838344413 6 280 0,0923 0,0934 -0,0011 283,299 0,174646 0,038415463 7 280 0,0923 0,0904 0,00194 274,128 0,340195 0,125784853 8 277 0,0913 0,0876 0,00373 265,688 0,694447 0,481662377 9 252 0,0831 0,085 -0,0019 257,882 0,350364 0,134160315 3034 1 3034 5,786641

64

Tabela E4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 374 0,1233 0,1197 0,00359 363,107 0,581309 0,326789734 1 341 0,1124 0,1139 -0,0015 345,543 0,231027 0,059717609 2 325 0,1071 0,1088 -0,0017 330,164 0,271926 0,08078192 3 318 0,1048 0,1043 0,00048 316,536 0,057259 0,006772157 4 297 0,0979 0,1003 -0,0024 304,335 0,413068 0,17679027 5 301 0,0992 0,0967 0,00253 293,319 0,441174 0,201152703 6 281 0,0926 0,0934 -0,0008 283,299 0,112249 0,018655783 7 256 0,0844 0,0904 -0,006 274,128 1,116318 1,198790787 8 278 0,0916 0,0876 0,00406 265,688 0,758673 0,570582297 9 263 0,0867 0,085 0,00169 257,882 0,300632 0,10157465 3034 1 3034 2,741608

Tabela E5 - Análise dos Votos de José Maria Eymael no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 204 0,1355 0,1197 0,01587 180,117 1,85693411 3,166733002 1 171 0,1136 0,1139 -0,0003 171,405 0,03283045 0,000955084 2 169 0,1123 0,1088 0,00347 163,776 0,3909932 0,166608033 3 150 0,0997 0,1043 -0,0047 157,016 0,54945765 0,313497309 4 157 0,1043 0,1003 0,00401 150,964 0,47503426 0,241350334 5 146 0,097 0,0967 0,00033 145,499 0,00006630 0,00172345 6 158 0,105 0,0934 0,01161 140,529 1,50352676 2,172054747 7 124 0,0824 0,0904 -0,008 135,98 1,03218704 1,055409127 8 113 0,0751 0,0876 -0,0125 131,793 1,66815908 2,679766207 9 113 0,0751 0,085 -0,0099 127,921 1,33294951 1,74042306 1505 1 1505 11,53852

Tabela E6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 232 0,1273 0,1197 0,00758 218,175 0,96146607 0,876002647 1 206 0,113 0,1139 -0,0009 207,622 0,08269524 0,012666195 2 223 0,1223 0,1088 0,0135 198,382 1,81390939 3,055051481 3 198 0,1086 0,1043 0,00428 190,193 0,55986143 0,320477738 4 180 0,0987 0,1003 -0,0016 182,862 0,1841384 0,044789008 5 205 0,1125 0,0967 0,01577 176,243 2,23952163 4,692327512 6 156 0,0856 0,0934 -0,0078 170,222 1,10458722 1,188267032 7 154 0,0845 0,0904 -0,0059 164,712 0,83425374 0,696611282 8 144 0,079 0,0876 -0,0086 159,64 1,25447186 1,532296278 9 125 0,0686 0,085 -0,0164 154,95 2,47332188 5,789040661 1823 1 1823 18,20753

65

Tabela E7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 377 0,1243 0,1197 0,00458 363,107 0,74910615 0,531574039 1 347 0,1144 0,1139 0,00048 345,543 0,05471555 0,006147119 2 323 0,1065 0,1088 -0,0024 330,164 0,3885218 0,155465047 3 329 0,1084 0,1043 0,00411 316,536 0,71055051 0,490794729 4 295 0,0972 0,1003 -0,0031 304,335 0,53393436 0,286341696 5 321 0,1058 0,0967 0,00912 293,319 1,66985327 2,612354521 6 297 0,0979 0,0934 0,00452 283,299 0,82370583 0,662617412 7 260 0,0857 0,0904 -0,0047 274,128 0,8630118 0,728121924 8 234 0,0771 0,0876 -0,0104 265,688 2,00306847 3,779252665 9 251 0,0827 0,085 -0,0023 257,882 0,41546346 0,183655564 3034 1 3034 9,436325

Tabela E8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 366 0,1206 0,1197 0,00095 363,107 0,13385141 0,023051124 1 341 0,1124 0,1139 -0,0015 345,543 0,23102734 0,059717609 2 347 0,1144 0,1088 0,00555 330,164 0,95232866 0,858470693 3 316 0,1042 0,1043 -0,0002 316,536 0,00213126 0,000907238 4 294 0,0969 0,1003 -0,0034 304,335 0,59436778 0,350974965 5 313 0,1032 0,0967 0,00649 293,319 1,17838147 1,320584777 6 264 0,087 0,0934 -0,0064 283,299 1,17299771 1,314686871 7 277 0,0913 0,0904 0,00095 274,128 0,15021495 0,030090895 8 256 0,0844 0,0876 -0,0032 265,688 0,59008422 0,353228759 9 260 0,0857 0,085 0,0007 257,882 0,10533336 0,017395817 3034 1 3034 4,329109

Tabela E9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno

Dígitos Observ. po pe (po - pe) Esper. Z-teste

(Zc = 1,96) Qui-quadrado

(χ2c = 16,9)

0 401 0,1322 0,1197 0,01249 363,107 2,09148014 3,954446897 1 370 0,122 0,1139 0,00806 345,543 1,36913283 1,731091173 2 321 0,1058 0,1088 -0,003 330,164 0,50511749 0,254378525 3 306 0,1009 0,1043 -0,0035 316,536 0,59603273 0,350686584 4 283 0,0933 0,1003 -0,007 304,335 1,2591353 1,495673363 5 295 0,0972 0,0967 0,00055 293,319 0,0725699 0,009636811 6 281 0,0926 0,0934 -0,0008 283,299 0,11224896 0,018655783 7 282 0,0929 0,0904 0,00259 274,128 0,46684831 0,226060143 8 228 0,0751 0,0876 -0,0124 265,688 2,38842781 5,345944527 9 267 0,088 0,085 0,00301 257,882 0,56103058 0,322389901 3034 1 3034 13,70896

66

APÊNDICE F – GRÁFICOS DA ANÁLISE PARA O 2° DÍGITO

Ana Maria Teixeira Rangel Cristovam Ricardo Cavalcanti Buarque

Geraldo José Rodrigues Alckmin Filho Heloísa Helena Lima de Moraes Carvalho

José Maria Eymael Luciano Caldas Bivar

Luís Inácio Lula da Silva

Gráfico F1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito

0

50

100

150

200

250

300

350

400

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

0 1 2 3 4 5 6 7 8 9

Observadoesperado

0

50

100

150

200

250

300

350

400

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

300

350

400

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

300

350

400

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

300

350

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

67

Geraldo José Rodrigues Alckmin Filho Luís Inácio Lula da Silva Gráfico F2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da

Análise da Lei de Newcomb-Benford para o Segundo Dígito

0

50

100

150

200

250

300

350

400

450

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

0

50

100

150

200

250

300

350

400

0 1 2 3 4 5 6 7 8 9

ObservadoEsperado

68

0

0,2

0,4

0,6

0,8

1

1,2

1 2 3 4 5 6 7

P-valorFDR

APÊNDICE G – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O SEGUNDO DÍGITO

G.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno

No Primeiro Turno existem 7 candidatos, correspondendo a 7 testes de

hipóteses baseados na estatística Qui-quadrado. Assim m = 7 para a distribuição χ2

com 9 graus de liberdade, cujo valor crítico individual é de 16,9.

Utilizando o critério para o cálculo do FDR, tem-se.

Tabela G1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno

χ2i Pi m i Q* FDR Compara

2,742 0,02634799 7 1 0,05 0,00714 0,01921 5,787 0,238967527 7 2 0,05 0,01429 0,22468 8,249 0,490738966 7 3 0,05 0,02143 0,46931 9,436 0,601961426 7 4 0,05 0,02857 0,57339 9,823 0,634996376 7 5 0,05 0,03571 0,59928 11,539 0,759437278 7 6 0,05 0,04286 0,71658 18,208 0,967164364 7 7 0,05 0,05000 0,91716

Da tabela, tem-se:

Gráfico G1 - Comparação entre os valores de P e FDR para o Teste Qui-

quadrado no Primeiro Turno

Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,

deverá ser utilizado o critério de Bonferroni para i = 1.

69

007143,07

05,01

FDRP

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

1 2

P-valorFDR

Assim:

(8)

Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 22,61.

No primeiro turno, apenas os votos de Luciano Caldas Bivar, obteve valor de

χ2 superior a 16,9. Porém, nenhum ultrapassou o valor crítico do conjunto 22,61.

G.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno

Para o segundo turno tem-se:

Tabela G2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno

χ2i Pi m i Q* FDR Compara

4,33 0,111618 2 1 0,05 0,02500 0,08662 13,71 0,866979 2 2 0,05 0,05000 0,81698

Segue o gráfico correspondente:

Gráfico G2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno

Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,

utiliza-se, novamente, o critério de Bonferroni para i = 1.

70

0025,02

05,01

FDRP

000714,070

05,01

FDRP

(9)

Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 19,02.

Para o segundo turno, nenhum valor de χ2 ultrapassou o valor crítico individual

de 16,9 nem o valor geral de 19,02. O valor de χ2 mais alto encontrado foi de 13,709

referente à soma dos votos de Luís Inácio Lula da Silva.

G.3 Critério FDR para o Z-Teste no Primeiro Turno

Da mesma forma, encontraremos o valor PFDR e o novo valor limite para o Z-

teste.

Nesse caso, a quantidade de testes realizados é maior, m = 70, isto é, dez

testes para cada um dos sete candidatos.

Tem-se então:

Tabela G3 - Critério FDR para o Teste Z no Primeiro Turno

Zi Pi m i Q* FDR Compara

2,47 0,013511305 70 1 0,05 0,00071 0,01280 2,24 0,025090923 70 2 0,05 0,00143 0,02366

2 0,045500264 70 3 0,05 0,00214 0,04336

...

...

...

...

...

...

...

0,01 0,992021287 70 69 0,05 0,04929 0,94274 0 1 70 70 0,05 0,05000 0,95000

Não houve intersecção. Assim, não se faz visualizar a tabela através de um

gráfico.

Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,

utiliza-se o critério de Bonferroni para i = 1.

(10)

71

Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 3,38.

Para o primeiro turno, 4 valores do teste Z, entre os 70 calculados,

ultrapassaram o valor crítico individual Zc = 1,96. Porém, entre esses, nenhum

ultrapassou o valor limite geral de 3,38. O maior Z encontrado foi de 2,47 para o

dígito 9 do candidato Luciano Caldas Bivar.

G.4 Critério FDR para o Z-Teste no Segundo Turno

Utilizando o mesmo critério para o segundo turno, tem-se:

Tabela G4 - Critério FDR para o Teste Z no Segundo Turno

Zi Pi m i q* FDR Compara

2,39 0,016848 20 1 0,05 0,00250 0,01435 2,09 0,036618 20 2 0,05 0,00500 0,03162 1,37 0,170687 20 3 0,05 0,00750 0,16319 1,26 0,207669 20 4 0,05 0,01000 0,19767 1,18 0,238 20 5 0,05 0,01250 0,22550 1,17 0,242001 20 6 0,05 0,01500 0,22700 0,95 0,342112 20 7 0,05 0,01750 0,32461 0,6 0,548506 20 8 0,05 0,02000 0,52851

0,59 0,555191 20 9 0,05 0,02250 0,53269 0,59 0,555191 20 10 0,05 0,02500 0,53019 0,56 0,575479 20 11 0,05 0,02750 0,54798 0,51 0,610051 20 12 0,05 0,03000 0,58005 0,47 0,638355 20 13 0,05 0,03250 0,60586 0,23 0,818092 20 14 0,05 0,03500 0,78309 0,15 0,880765 20 15 0,05 0,03750 0,84326 0,13 0,896566 20 16 0,05 0,04000 0,85657 0,11 0,912409 20 17 0,05 0,04250 0,86991 0,11 0,912409 20 18 0,05 0,04500 0,86741 0,07 0,944194 20 19 0,05 0,04750 0,89669

0 1 20 20 0,05 0,05000 0,95000

Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,

utiliza-se, novamente, o critério de Bonferroni para i = 1.

72

025,020

05,01

FDRP

(11)

Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 3,02.