UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ … · Gráfico D2 - Comparação entre os...
-
Upload
nguyenlien -
Category
Documents
-
view
234 -
download
1
Transcript of UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ … · Gráfico D2 - Comparação entre os...
UNIPÊ - CENTRO UNIVERSITÁRIO DE JOÃO PESSOA PRÓ-REITORIA DE PÓS-GRADUAÇÃO, PESQUISA E EXTENSÃO COORDENADORIA GERAL DOS CURSOS DE PÓS-GRADUAÇÃO
I CURSO DE ESPECIALIZAÇÃO EM AUDITORIA CONTÁBIL E FINANCEIRA
EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE
NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO SISTEMA ELEITORAL BRASILEIRO
FRANCISCO ALVES DE OLIVEIRA JÚNIOR
JOÃO PESSOA 2009
FRANCISCO ALVES DE OLIVEIRA JÚNIOR
EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO
SISTEMA ELEITORAL BRASILEIRO
Monografia apresentada como exigência para conclusão do I Curso de Especialização em Auditoria Contábil e Financeira oferecido pelo Centro Universitário de João Pessoa – UNIPÊ.
Orientador: Prof. Ms. Mamadou Dieng
JOÃO PESSOA
2009
O48e Oliveira Júnior, Francisco Alves de.
Evidências empíricas acerca da aplicação da Lei de Newcomb-Benford no campo da auditoria do Sistema Eleitoral Brasileiro / Francisco Alves de Oliveira Júnior. - João Pessoa, 2007.
72f. Monografia (Curso de Especialização em Auditoria
Contábil e Financeira) – Centro Universitário de João Pessoa - UNIPÊ
1. Lei de Newcomb-Benford. 2. Auditoria de Eleições.
3. Fraude Eleitoral. 4. Critério FDR. I. Título. UNIPÊ / BC CDU - 657:6
FOLHA DE APROVAÇÃO
FRANCISCO ALVES DE OLIVEIRA JÚNIOR
EVIDÊNCIAS EMPÍRICAS ACERCA DA APLICAÇÃO DA LEI DE NEWCOMB-BENFORD NO CAMPO DA AUDITORIA DO SISTEMA ELEITORAL BRASILEIRO Esta monografia foi avaliada e aprovada como critério para conclusão do I Curso de Especialização em Auditoria Contábil e Financeira oferecido pelo Centro Universitário de João Pessoa – UNIPÊ, tendo como área de concentração as ciências contábeis.
Nota de avaliação: ________ Aprovada em _____ de _______________ de _______
______________________________________
Prof. Ms. Mamadou Dieng
______________________________________ Francisco Alves de Oliveira Júnior
AGRADECIMENTOS
Agradeço primeiramente a Deus, pela oportunidade de poder realizar este
trabalho. Agradeço também ao prof. Ms. Mamadou Dieng, pela paciência e pela
brilhante forma com que contribuiu para o desenvolvimento deste estudo. Aos meus colegas do Tribunal Regional Eleitoral da Paraíba, que me incentivaram na realização deste árduo trabalho.
E por fim, porém não menos importante, não poderia deixar de agradecer a minha família: minha esposa, Rúbia; minha filha, Giovanna; e meu filho, Leonardo, que, apesar de exigirem minha atenção a todo instante, sempre me deram forças diante das dificuldades, além de serem a inspiração da minha existência.
RESUMO
Este trabalho pretende verificar a aplicabilidade da Lei de Newcomb-Benford para o Segundo Dígito na auditoria de eleições, através da realização de um estudo empírico analítico e descritivo, tendo como pano de fundo a análise da Eleição Majoritária para o Cargo de Presidente da República Federativa do Brasil no ano de 2006. Em 1881, o astrônomo e matemático Simon Newcomb observou que, em medições experimentais, os dígitos mais significativos (aqueles mais a esquerda) não tinham suas quantidades distribuídas equitativamente entre 1 e 9. Cerca de 30% dos números começavam com o dígito 1, diminuindo gradativamente até chegar ao dígito 9 com apenas 4,6% de ocorrência. Em 1938, tal fenômeno foi verificado, de forma independente, pelo físico Frank Benford. Tais observações chamaram a atenção da comunidade científica, pois contrariavam o senso comum. Surgia assim, a Lei de Newcomb-Benford. Aos poucos, os estudiosos perceberam seu poder na detecção de fraudes em coleções de números. No final do século XX, a referida Lei começou a ser utilizada, com bastante êxito, em auditorias contábeis e financeiras. Recentemente, foi utilizada em auditorias eleitorais nos Estados Unidos, México, Venezuela e Iran. Devido ao seu caráter inédito, ainda não existe bibliografia nacional suficiente nessa área de pesquisa. Assim, foi necessário adaptar metodologias aplicadas em outros países ao cenário brasileiro. Os dados pesquisados foram fornecidos pelo Tribunal Superior Eleitoral – TSE, tendo sido coletados os totais de votos das 3034 zonas eleitorais distribuídas no Brasil e no exterior, para todos os candidatos(as) à presidência da república em 2006. Como a Lei de Newcomb-Benford pode ser subdividida em Lei do Primeiro e do Segundo Dígito, para cada vertente foi realizado um conjunto de testes de hipóteses, utilizando as estatísticas Z-teste, Qui-quadrado e o critério para ocorrência de falsos positivos FDR, com nível de significância α = 0,05. Ou seja, com uma confiança de 95% de que se tome uma decisão acertada. Todavia, como previsto na bibliografia pesquisada, os resultados encontrados foram favoráveis apenas à utilização da Lei de Newcomb-Benford para o Segundo Dígito, pois, do total de 99 testes estatísticos, nenhum deles ultrapassou seu valor crítico geral correspondente. Enquanto que, para o Primeiro Dígito, do total dos 90 testes realizados, 22 ficaram fora do limite geral preestabelecido. Como resultado, ficou evidenciado que a Lei de Newcomb-Benford para o Segundo Dígito pode ser utilizada como indicativo de fraude eleitoral em auditoria de eleições do sistema brasileiro, auxiliando na manutenção da democracia.
Palavras-chave: Lei de Newcomb-Benford. Auditoria de Eleições. Fraude
Eleitoral. Critério FDR.
ABSTRACT
The goal of this paper is to verify the applicability of Newcomb-Benford Law for the Second Digit on elections auditing, through an empirical analytic and descriptive study, having as the background the analysis of the election for President of Brazil in the year 2006. Back in 1881, astronomer and mathematician Simon Newcomb, observed in experimental measurements, that the most significant digits (the ones most to the left), didn’t have their quantities equally distributed between 1 and 9. Around 30% of those numbers started with digit 1, and lowering gradually until gets to digit 9 with only 4,6% of occurrence. In 1938, such a phenomenon was checked independently by physicist Frank Benford. Such observations caught attention of the scientific community, because they contradicted common sense at the time. Therefore, Newcomb-Benford Law was created. Step-by-step, scholars noticed its power to detect frauds in groups of numbers. By the end of the 20th century, Newcomb-Benford Law started to be put in use successfully in financial and accounting audits. Recently it was used in election audits in the United States, Mexico, Venezuela and Iran. Due to its unique characteristics, Brazilian bibliography is almost non-existent on this field of research. This way, it was necessary to make some adaptations on methodologies already used in other countries to the Brazilian case. The data used on this paper was provided by the Tribunal Superior Eleitoral –TSE, Brazilian highest electoral court of law. It consisted on the total of votes of all of the 3034 electoral zones scattered throughout the country and overseas to the candidates for Brazilian presidency in 2006. Since Newcomb-Benford law can be divided into two parts, Law of the First Digit and Law of the Second Digit, for each of these situations, it was taken a different hypothesis test, using Z-test statistics, Qui-square, and FDR criterion for false positives, with significance level α = 0,05. This way, there’s the probability of 95% to make the right decision. Nevertheless, as predicted on the researched bibliography, the results found were only favorable to the Law of the Second Digit, because all of the 99 test statistics that were made none had exceeded their correspondent general critical value. On the other side, when the Law of First Digit was concerned, among all 90 tests made, 22 kept out of the pre-established parameters. It was concluded that the Law of Newcomb-Benford for the Second Digit can be used to search for frauds while auditing Brazilian electoral system, therefore, assisting in the maintenance of democracy. Keywords: Newcomb-Benford Law. Election Audits. Election Fraud. FDR
Criterion.
LISTA DE GRÁFICOS
Gráfico 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito........................................................................................20
Gráfico 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito.......................................................................................21
Gráfico 3 - Análise da Lei de Newcomb-Benford do Primeiro Dígito para a candidata Ana Maria Teixeira Rangel ....................................................38
Gráfico 4 – Análise da Lei de Newcomb-Benford do Segundo Dígito para a candidata Ana Maria Teixeira Rangel ....................................................42
Gráfico C1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito......................................................................................................56
Gráfico C2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito......................................................................................................57
Gráfico D1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno...................................................................58
Gráfico D2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno..................................................................59
Gráfico D3 - Comparação entre os valores de P e FDR para o Teste Z no Primeiro Turno........................................................................................60
Gráfico D4 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Primeiro Turno ..................................................61
Gráfico D5 - Comparação entre os valores de P e FDR para o Teste Z no Segundo Turno.......................................................................................62
Gráfico D6 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Segundo Turno .................................................62
Gráfico F1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito......................................................................................................66
Gráfico F2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito......................................................................................................67
Gráfico G1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno...................................................................68
Gráfico G2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno..................................................................69
LISTA DE TABELAS
Tabela 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito........................................................................................19
Tabela 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito.......................................................................................20
Tabela 3 - Fraude no Arizona....................................................................................22 Tabela 4 - Candidatos a Presidente no Primeiro Turno das Eleições Brasileiras
de 2006 ..................................................................................................30 Tabela 5 - Candidatos a Presidente no Segundo Turno das Eleições Brasileiras
de 2006 ..................................................................................................30 Tabela 6 - Exemplo da Coleta de Votos para Luís Inácio Lula da Silva no 2°
Turno......................................................................................................30 Tabela 7 - Valores Críticos para o Z-teste e o Teste Qui-quadrado ..........................35
Tabela 8 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno .......38 Tabela 9 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro
Dígito no Primeiro Turno das Eleições Presidenciais de 2006...............39
Tabela 10 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006..............39
Tabela 11 - Critério FDR para o Primeiro Dígito........................................................40
Tabela 12 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................40
Tabela 13 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................40
Tabela 14 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno.....42
Tabela 15 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006...............43
Tabela 16 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006..............43
Tabela 17 - Critério FDR para o Primeiro Dígito........................................................44
Tabela 18 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................44
Tabela 19 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR........................................................................44
Tabela B1 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno .....53 Tabela B2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no
Primeiro Turno........................................................................................53
Tabela B3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno........................................................................................53
Tabela B4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno........................................................................................54
Tabela B5 - Análise dos Votos de José Maria Eymael no Primeiro Turno ................54
Tabela B6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno.............54 Tabela B7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno........55
Tabela B8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno.......................................................................................55
Tabela B9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno.......55 Tabela D1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno .................58
Tabela D2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno ................59 Tabela D3 - Critério FDR para o Teste Z no Primeiro Turno .....................................60
Tabela D4 - Critério FDR para o Teste Z no Segundo Turno....................................61 Tabela E1 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno ....63
Tabela E2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno........................................................................................63
Tabela E3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno........................................................................................63
Tabela E4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno........................................................................................64
Tabela E5 - Análise dos Votos de José Maria Eymael no Primeiro Turno ................64 Tabela E6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno.............64
Tabela E7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno........65 Tabela E8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no
Segundo Turno.......................................................................................65 Tabela E9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno.......65
Tabela G1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno .................68 Tabela G2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno ................69
Tabela G3 - Critério FDR para o Teste Z no Primeiro Turno.....................................70 Tabela G4 - Critério FDR para o Teste Z no Segundo Turno....................................71
LISTA DE SIGLAS E SÍMBOLOS
FDR Do inglês (False Discovery Rate), representa a proporção esperada de
falsos positivos dentre todas as hipóteses nulas
TRE Tribunal Regional Eleitoral
TSE Tribunal Superior Eleitoral
i Número da sequência no critério FDR
m Quantidade de testes de hipóteses no critério FDR
n Número de observações
q* Nível de significância conjunto dos testes de hipótese
po Probabilidade observada
pe Probabilidade esperada
Pi Indexação do p-valor
PFDR P-valor referente ao critério FDR
PE Proporção esperada da população
PO Proporção observada da população
Z Resultado do Z-teste
Zc Valor crítico individual para o Z-teste
ZFDR Valor crítico para o conjunto dos Z-testes, considerando o critério FDR
Hi Indexação do teste de hipótese
H0 Hipótese nula
H1 Hipótese alternativa
α Nível de significância
α* Nível de significância conjunto dos testes de hipótese
χ2 Resultado do teste Qui-quadrado
χ2c Valor crítico individual para o teste Qui-quadrado
χ2FDR Valor crítico para o conjunto dos testes Qui-quadrado, considerando o
critério FDR
SUMÁRIO
1 INTRODUÇÃO .......................................................................................................14
1.1 Apresentação do Tema .................................................................................15 1.2 Caracterização do Problema.........................................................................15
1.3 Objetivos ........................................................................................................15
1.3.1 Objetivo Geral.......................................................................................15 1.3.2 Objetivos Específicos ..........................................................................16
1.4 Relevância da Pesquisa ................................................................................16
1.5 Disponibilização do Conteúdo......................................................................16 2 PLATAFORMA TEÓRICA .....................................................................................18
2.1 Antecedentes Históricos...............................................................................18 2.2 Distribuição de Probabilidades para a Lei de Newcomb-Benford.............19
2.3 Estudos Anteriores sobre a Lei de Newcomb-Benford ..............................21
2.3.1 Auditoria Contábil e Financeira ..........................................................21 2.3.2 Auditoria Eleitoral – Referendo Revocatório na Venezuela..............23
3 PROCEDIMENTOS METODOLÓGICOS...............................................................25
3.1 Natureza do Estudo .......................................................................................25 3.2 Definição das Variáveis de Pesquisa...........................................................25
3.2.1 Limitações na Aplicação da Lei de Newcomb-Benford ....................27 3.2.2 Forma de Totalização Escolhida.........................................................29
3.3 Coleta e Tratamento dos Dados ...................................................................29 3.4 Definição das Estatísticas a Serem Utilizadas ............................................31
3.4.1 Utilizando o Z-Teste .............................................................................31 3.4.2 Utilizando o Teste Qui-quadrado ........................................................32 3.4.3 Utilizando o Critério FDR.....................................................................33
3.5 Teste de Hipóteses para a Análise do Primeiro Dígito ...............................33
3.5.1 Definição das Hipóteses......................................................................33 3.5.2 Cálculo da Estatística do Teste...........................................................34
3.6 Teste de Hipóteses para o Segundo Dígito .................................................34
3.6.1 Definição das Hipóteses......................................................................35 3.6.2 Cálculo da Estatística do Teste...........................................................35
4 ANÁLISE E DISCUSSÃO DOS RESULTADOS....................................................37
4.1 Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na Eleição Presidencial Brasileira de 2006 ......................................................37
4.1.1 Análise dos Testes de Hipótese Utilizando o Critério FDR ..............39 4.2 Aplicação da Lei de Newcomb-Benford para o Segundo Dígito na
Eleição Presidencial Brasileira de 2006 ......................................................41
4.2.1 Análise dos Testes de Hipótese Utilizando o Critério FDR ..............44 4.3 Comparação dos Resultados........................................................................45
5 CONSIDERAÇÕES FINAIS ...................................................................................46
5.1 Recomendações para Futuras Pesquisas ...................................................47 REFERÊNCIAS BIBLIOGRÁFICAS.........................................................................48
APÊNDICE A - EXEMPLO DE PLANILHA ELETRÔNICA PARA O CÁLCULO DOS TESTES ESTATÍSTICOS ............................................................................50
APÊNDICE B – TABELAS DA ANÁLISE PARA O 1° DÍGITO................................53 APÊNDICE C – GRÁFICOS DA ANÁLISE PARA O 1° DÍGITO..............................56
APÊNDICE D – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O PRIMEIRO DÍGITO ...................................58
D.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno.....................58 D.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno....................59
D.3 Critério FDR para o Z-Teste no Primeiro Turno..........................................60 D.4 Critério FDR para o Z-Teste no Segundo Turno.........................................61
APÊNDICE E – TABELAS DA ANÁLISE PARA O 2° DÍGITO ................................63 APÊNDICE F – GRÁFICOS DA ANÁLISE PARA O 2° DÍGITO ..............................66
APÊNDICE G – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O SEGUNDO DÍGITO...................................68
G.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno.....................68 G.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno....................69
G.3 Critério FDR para o Z-Teste no Primeiro Turno..........................................70 G.4 Critério FDR para o Z-Teste no Segundo Turno.........................................71
14
1 INTRODUÇÃO
Fraude eleitoral é uma das opções para a legitimação de políticos corruptos
ao redor do mundo. É o desrespeito à vontade da maioria. Facilmente executada
quando não se tem formas eficientes de controle sobre os mecanismos das eleições.
Geralmente arquitetada pelos regimes autoritários como forma de permanência no
poder, mas também encontrada em grandes potências mundiais, ditas democráticas.
Como muitos interesses estão em jogo, por mais transparente que possa
ocorrer o desenrolar de uma eleição, candidatos e partidos perdedores costumam
duvidar da legitimidade do pleito. E, infelizmente, muitas vezes com razão. É o que
vem mostrando a história, através dos acontecimentos ocorridos na Flórida, durante
as Eleições Presidenciais Norte Americanas de 2004, nas Eleições Presidenciais do
México em 2006, no Referendo Venezuelano de 2004 e, recentemente, na
controversa reeleição do presidente Mahmoud Ahmadinejad do Iran, neste ano de
2009. Nesses países, pesquisadores, tais como Pericchi e Torres (2004) e Mebane
(2006a, 2006b) comprovaram irregularidades, utilizando técnicas de análise
similares as que serão propostas neste trabalho. Baseado nas experimentações dos
mesmos, é proposto um método de auditoria eleitoral de fácil aplicação, podendo ser
utilizado por cidadãos sem conhecimentos aprofundados em estatística, bastando
para isso, a manipulação de planilhas eletrônicas de porte simples. Tal metodologia
é conhecida como a Lei de Newcomb-Benford para o Segundo Dígito.
A Lei de Newcomb-Benford vem sendo utilizada em auditorias contábeis e
financeiras ao redor do mundo. Sua adaptação para auditoria de resultados
eleitorais é bastante recente, sendo este um dos primeiros estudos brasileiros nessa
área, comprovado pela escassez de referências bibliográficas.
Atualmente, procura-se a melhor forma de aplicação da referida Lei em
sistemas eleitorais. Em Mebane (2006b, p. 3), tem-se:
Embora um método ideal possa não existir, neste trabalho gostaria de
ilustrar o uso de um possível candidato. Um método que possa satisfazer
nosso ideal conjunto de requisitos é o de testar se os segundos dígitos dos
votos ocorrem com as frequências especificadas pela Lei de Benford. [...]
Eu estudei a Lei de Benford para o segundo dígito (2BL) para o teste de
contagem de votos. Eu identifiquei um par de mecanismos flexíveis que
15
podem geralmente caracterizar contagens de votos e que satisfazem a
distribuição 2BL em uma ampla gama de circunstâncias. Eu mostrei que o
teste 2BL é sensível a muitos padrões de manipulação de votos, incluindo
padrões que ocorrem em alguns tipos de fraudes eleitorais.
(Tradução nossa)
A Lei de Newcomb-Benford é relativamente nova e está à espera de
pesquisadores que possam descobrir mais formas de tirar proveito da mesma,
aplicando-a nas diferentes áreas do conhecimento.
1.1 Apresentação do Tema
Este trabalho tem como tema o estudo da Lei de Newcomb-Benford para o
Primeiro e Segundo Dígitos aplicada como ferramenta de auditoria ao conjunto de
votos correspondente a todas as zonas eleitorais distribuídas pelo Brasil e Exterior
na Eleição Majoritária para Presidente da República Federativa do Brasil no ano de
2006. Serão analisados os votos recebidos pelos candidatos no Primeiro e Segundo
Turnos.
1.2 Caracterização do Problema
As Leis de Newcomb-Benford para o Primeiro e Segundo Dígitos podem ser
utilizadas como ferramentas de auditoria eleitoral no estudo da Eleição Majoritária
para Presidente da República Federativa do Brasil no ano de 2006?
1.3 Objetivos
A seguir encontram-se listados os objetivos gerais e específicos deste
trabalho.
1.3.1 Objetivo Geral
O objetivo geral deste estudo é:
Verificar a possibilidade de utilização das Leis de Newcomb-Benford como
ferramenta de análise de dados no campo da auditoria do Sistema
Eleitoral Brasileiro.
16
1.3.2 Objetivos Específicos
A seguir encontram-se os objetivos específicos deste trabalho:
Verificar se a Lei de Newcomb-Benford para o Primeiro Dígito pode ser
utilizada na detecção de fraude eleitoral na Eleição Majoritária para
Presidente do Brasil no ano de 2006;
Verificar se a Lei de Newcomb-Benford para o Segundo Dígito pode ser
utilizada na detecção de fraude eleitoral na Eleição Majoritária para
Presidente do Brasil no ano de 2006;
Verificar se a coleta de dados em nível de zona eleitoral pode ser utilizada
na análise das Leis de Newcomb-Benford.
1.4 Relevância da Pesquisa
Esta pesquisa tem implicações importantes. Do ponto de vista social, o
presente trabalho visa estudar a aplicabilidade de uma ferramenta matemática, a Lei
de Newcomb-Benford, na auditoria de resultados eleitorais no Brasil. Tal técnica
pode auxiliar na manutenção da democracia, pois, devido à simplicidade do método,
o cidadão comum poderá ajudar na fiscalização do processo eleitoral, garantindo a
legitimidade do pleito e dirimindo quaisquer dúvidas que possam surgir.
Com relação a sua contribuição acadêmica e científica, este trabalho possui
caráter de ineditismo no Brasil, adaptando as técnicas utilizadas em outros países
para o caso brasileiro. Tal metodologia de auditoria pode ser aproveitada, com suas
devidas adequações, em diversas áreas do conhecimento, contribuindo para o
desenvolvimento científico.
1.5 Disponibilização do Conteúdo
Descreve-se, a seguir, como está distribuído este trabalho.
Inicialmente, no capítulo 2, referente à plataforma teórica, será mostrado um
breve histórico sobre a descoberta da Lei de Newcomb-Benford, sua distribuição de
probabilidades e exemplos de sua utilização nos ramos da auditoria contábil e da
auditoria de eleições.
No capítulo 3, serão apresentados os procedimentos metodológicos, os tipos
de análises existentes (primeiro e segundo dígitos), suas limitações e possibilidades
17
de aplicação. Neste capítulo, as experiências de outros países serão adaptadas ao
caso brasileiro, pois suas estruturas de votação são diferenciadas. Serão estudados
os tipos de estatísticas que poderão ser utilizadas na execução dos testes de
hipótese.
No capítulo 4, serão realizados dois conjuntos de testes para posterior
comparação. Na primeira parte do desenvolvimento deste trabalho, será testada a
aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na auditoria dos
resultados eleitorais nos dois turnos das Eleições Majoritárias para Presidente do
Brasil, em 2006.
Na segunda parte, seguindo os mesmos procedimentos, será testada a Lei de
Newcomb-Benford para o Segundo Dígito.
Tabelas e gráficos acompanharam o desenrolar da metodologia que se
segue, pois são fundamentais para a melhor compreensão do texto.
No capítulo 5, serão apresentadas as considerações finais, comparando-se os
resultados encontrados nas duas análises anteriores. Além disso, será verificado se
os dados encontrados estão de acordo com o previsto na bibliografia pesquisada.
Concluindo, serão indicadas recomendações para futuros trabalhos na área.
No Apêndice A, encontra-se um breve tutorial que explicará, de forma prática,
como manipular os dados em planilhas eletrônicas utilizando a Lei de Newcomb-
Benford. As informações nele contidas serão úteis para aqueles interessados em
testar a metodologia aplicada neste estudo.
O texto visa à compreensão da aplicação da Lei de Newcomb-Benford à
auditoria eleitoral. Com o objetivo de evitar uma leitura cansativa, os detalhamentos
dos cálculos estão descritos nos apêndices restantes, podendo ser consultados por
aqueles que desejem se aprofundar nesse estudo.
18
2 PLATAFORMA TEÓRICA
Este capítulo descreve as informações teóricas necessárias à realização da
pesquisa e exemplos sobre a utilização da Lei de Newcomb-Benford.
A seguir, apresentam-se os antecedentes históricos.
2.1 Antecedentes Históricos
A Lei do Primeiro Dígito, como é conhecida, está sendo amplamente
estudada e testada em diversos tipos de auditoria que têm como base uma coleção
de dados numéricos que se possam por em prova.
Sua descoberta não data de muito tempo. Segundo Santos, Diniz e Corrar
(2007), a Lei de Newcomb-Benford foi descoberta pelo astrônomo e matemático
Simon Newcomb no ano de 1881, ao perceber que as tábuas de logaritmos,
utilizadas para realização de cálculos, apresentavam uma maior evidência de uso
nas primeiras páginas, nas quais estavam números iniciados com o algarismo 1. E,
progressivamente, o uso diminuía à medida que se aproximava do numeral 9.
Assim, ele observou que, na natureza, aproximadamente 30% dos números
utilizados em algum tipo de medição tinham como dígito mais significativo (o primeiro
algarismo à esquerda) o numeral 1. O que contrariava o senso comum no qual a
distribuição de probabilidades para essa ocorrência seria igual para todos os dígitos.
Isto é, probabilidade igual a 1/9, pois os dígitos mais significativos deveriam estar
distribuídos igualmente entre os números de 1 a 9.
Em 1938, 57 anos após as proposições de Newcomb, o físico Frank Benford,
de forma independente, chegou ao mesmo resultado analisando os dados de 20.229
observações, tais como áreas de rios, distâncias entre cidades, números de casas,
entre outros. Benford, diferentemente de Newcomb, divulgou amplamente seu
trabalho.
19
11
11logd
dP
9
1 212
1
11logd dd
dP
2.2 Distribuição de Probabilidades para a Lei de Newcomb-Benford
Através de Nigrini (2000), pode-se encontrar a distribuição de probabilidades
da ocorrência da Lei de Newcomb-Benford para o primeiro e segundo dígitos mais
significativos através das seguintes fórmulas empíricas:
Para o primeiro dígito mais significativo, tem-se:
(1)
Onde, d1 є {1, 2, ... , 9} e P(d1) é a sua probabilidade correspondente.
Calculando as probabilidades, encontram-se os valores na seguinte tabela: Tabela 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito
Algarismo (d1)
Probabilidade P(d1)
Percentualmente (%)
1 0,30103 30,103
2 0,17609 17,609
3 0,12494 12,494
4 0,09691 9,691
5 0,07918 7,918
6 0,06695 6,695
7 0,05799 5,799
8 0,05115 5,115
9 0,04576 4,576
Da mesma forma, para o segundo dígito:
(2)
Onde, d2 є {0, 1, ... , 9} e P(d2) é a probabilidade correspondente.
Os valores calculados são:
20
1º Dígito
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1 2 3 4 5 6 7 8 9
1º Dígito
Tabela 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito Algarismo
(d2) Probabilidade
P(d2)
Percentualmente (%)
0 0,1197 11,97
1 0,1139 11,39
2 0,1088 10,88
3 0,1043 10,43
4 0,1003 10,03
5 0,0967 9,67
6 0,0934 9,34
7 0,0904 9,04
8 0,0876 8,76
9 0,085 8,5
Pode-se comparar a distribuição de probabilidade inerente ao primeiro e ao
segundo dígito, nos gráficos a seguir:
Gráfico 1 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Primeiro Dígito
É possível observar como a curva de distribuição de probabilidades diminui
em, aproximadamente, 6 vezes no intervalo entre os dígitos 1 e 9.
21
2º Dígito
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0 1 2 3 4 5 6 7 8 9
2º Dígito
Gráfico 2 - Distribuição de probabilidades da Lei de Newcomb-Benford para o Segundo Dígito
Já na distribuição de probabilidades para o segundo dígito, a diferença se
torna mais suave. Se fossem desenhados os gráficos referentes às distribuições de
probabilidade para o terceiro, quarto ou quinto dígito, poder-se-ia perceber que, com
o incremento do dígito, as probabilidades vão se tornando igualmente distribuídas.
2.3 Estudos Anteriores sobre a Lei de Newcomb-Benford
A Lei de Newcomb-Benford tem sido, originalmente, utilizada em auditorias
contábeis e, gradativamente, vem sendo adaptada em outras áreas de pesquisa
forense.
2.3.1 Auditoria Contábil e Financeira
Existe um exemplo clássico estudado por Nigrini (1999) que demonstra a
aplicabilidade da Lei de Newcomb-Benford em auditoria contábil e financeira.
Segundo Nigrini (1999), em 1993, Wayne James Nelson foi acusado de tentar
fraudar o estado do Arizona (EUA) em aproximadamente 2 milhões de dólares.
Nelson, um gerente do escritório da Tesouraria do Estado do Arizona, argumentou
que teria desviado fundos para demonstrar a ausência de proteção do novo sistema
computadorizado.
O montante de 23 cheques preenchidos por Nelson são mostrados na figura
seguinte:
22
Tabela 3 - Fraude no Arizona Data do cheque Quantidade $
9 de outubro de 1992 1.927,48 27.902,31
14 de outubro de 1992 86 241.90 72 117.46 81 321.75 97 473.96
19 de outubro de 1992 93 249.11 89 658.17 87 776.89 92 105.83 79 949.16 87 602.93 96 879.27 91 806.47 84 991.67 90 831.83 93766.67 88 338.72 94 639,49 83 709.28 96 412.21 88 432.86 71 552.16
Total 1 878 687.58
Fonte: Nigrini (1999)
Como as escolhas humanas não são aleatórias, a simples “criação” de
números não obedece à Lei de Benford. Eis algumas observações importantes:
Frequentemente, em fraudes, os desvios começam por valores
pequenos que aos poucos vão aumentando.
A maioria das quantidades desviadas era abaixo de 100.000 dólares,
pois acima desse limite, necessitava-se de verificação e da assinatura
de um responsável. O gerente tentou manter a fraude em valores
menores, fora desse controle.
As frequências para os primeiros dígitos são praticamente contrárias à
Lei de Benford. Aproximadamente, 90% dos valores dos cheques
começavam com os dígitos 7, 8 ou 9. Esse comportamento sinalizava
uma irregularidade.
Os números pareciam ter sido escolhidos para dar a aparência de
aleatoriedade. Porém, a Lei de Benford é bastante contra-intuitiva; as
pessoas não assumem naturalmente que alguns dígitos ocorrem com
maior freqüência. Nenhum dos cheques foi duplicado, não havia
23
números redondos, e todos os valores incluíam centavos. No entanto,
subconscientemente, o gerente repetiu alguns dígitos e combinações
de dígitos. Com relação aos dois primeiros algarismos, entre os valores
criados, 87, 88, 93 e 96 foram utilizados duas vezes. Com relação aos
últimos dois dígitos, 16, 67 e 83, esses foram duplicados. No entanto
houve uma tendência em direção à criação de dígitos maiores. Os
dígitos de 7 a 9 foram os mais frequentemente utilizados, em contraste
com a lei de Benford. Um total de 160 dígitos foram usados nos 23
valores. As contagens dos dez dígitos de 0 a 9 foram: 7, 19, 16, 14, 12,
5, 17, 22, 22 e 26, respectivamente. Um controle computacional
familiarizado com a lei de Benford poderia facilmente ter detectado que
esses números poderiam ter sido inventados por alguém que
desconhece a lei de Benford.
O próximo exemplo se refere à área da auditoria eleitoral.
2.3.2 Auditoria Eleitoral – Referendo Revocatório na Venezuela
O contexto no qual se realizou o Referendo Revocatório de 2004 na
Venezuela pode ser compreendido através das informações seguintes, obtidas
segundo Dawood (2004):
Conforme anunciado pelo Conselho Nacional Eleitoral (CNE), em junho de 2004, realizou-se um referendo revogatório do mandato do presidente Hugo Chávez a 15 de agosto do ano corrente. A “Constituição da República Bolivariana da Venezuela” prevê a possibilidade de destituição de funcionários públicos eleitos por meio da convocação de referendos populares. Após inúmeras tentativas frustradas, a oposição angariou o número de assinaturas necessárias à validação da petição revogatória por parte do CNE. [...] Assistiu-se, entretanto, a uma expressiva vitória do atual presidente que obteve cerca de 58% de aprovação. [...] A oposição acusa o governo de haver ameaçado funcionários públicos que haviam assinado a petição revogatória com a perda de garantias concedidas no curso da atual administração. Além disso, denuncia que inúmeros assinantes da petição tiveram seu local de votação transferido nas últimas horas que antecederam o referendo. Em contrapartida, os partidários do atual presidente venezuelano acusam os EUA de questionarem o caráter democrático de seu governo como forma de retirarem do poder um governante cujas políticas se opõem aos interesses econômicos estadunidenses.
24
Em Pericchi e Torres (2004), encontra-se a análise do Referendo
Venezuelano de 2004 através da Lei de Newcomb-Benford para o Segundo Dígito.
No Referendo podia-se votar no SIM ou no NÃO. Houve votação manual e
automática.
Segundo Pericchi e Torres (2004), as conclusões são bastante claras. Os
votos NÃO, nas mesas automatizadas violam a Lei de Newcomb-Benford com
probabilidade virtualmente 1, tornando-se relevante investigar os mecanismos de
intervenção que tenham alterado os votos NÃO automatizados.
Por outro lado, os votos NÃO examinados pelos auditores não violaram a lei.
Algo bastante interessante, já que os votos auditados também são corrigidos de
forma automatizada, sugerindo que as mesas auditadas possuem outra estrutura e
por não serem representativas do total de votos automatizados, colocam em dúvida
que eles façam parte de uma amostra aleatória.
Os votos NÃO manuais não violaram a lei. Mas, neste caso, uma análise mais
aprofundada faz-se necessário.
Esse referendo foi polêmico. E, ainda hoje, faz parte de discussão entre os
interessados.
Os dois exemplos apresentados neste capítulo demonstram o poder da Lei de
Newcomb-Benford para o Primeiro e Segundo Dígitos, respectivamente.
A seguir, vêm os procedimentos metodológicos do trabalho.
25
3 PROCEDIMENTOS METODOLÓGICOS
Neste capítulo, serão expostos os procedimentos metodológicos necessários
à realização deste trabalho.
3.1 Natureza do Estudo
Este é um estudo empírico analítico e descritivo, pois pretende, através da
experiência de outros pesquisadores, inferir e tirar conclusões baseadas na
aplicação de testes de hipóteses, através de estatística inferencial.
As técnicas têm como base os trabalhos de Mebane (2006a, 2006b); Pericchi
e Torres (2004); Santos, Diniz e Corrar (2007). Cada um deles com suas respectivas
especificidades e contribuições.
Por exemplo, Santos, Diniz e Corrar (2007) dedicam-se à auditoria contábil no
setor público, porém muitas de suas técnicas podem ser utilizadas no caso de
auditoria de eleições.
Mebane (2006a, 2006b) realiza auditoria em resultados eleitorais norte-
americanos. Pericchi e Torres (2004) analisam o referendo revocatório venezuelano
de agosto de 2004, como foi exemplificado no capítulo anterior. Apesar de o caso
brasileiro ter suas diferenças, pode-se fazer adaptações que tragam contribuições
significativas.
3.2 Definição das Variáveis de Pesquisa
Como este estudo se refere à auditoria de resultados eleitorais no Brasil, com
ênfase na eleição presidencial de 2006, deve-se verificar quais tipos de variáveis
preenchem os requisitos necessários para a aplicação da Lei de Newcomb-Benford.
Para tanto, faz-se necessário entender alguns termos referentes ao sistema
eleitoral brasileiro. Em pesquisa ao Glossário Eleitoral Brasileiro, no site do Tribunal
Superior Eleitoral - TSE, encontram-se os seguintes termos que serão importantes
para o entendimento deste trabalho: [...] Cartório eleitoral Cartório eleitoral é a sede do juízo eleitoral. No cartório funciona, além da parte administrativa da zona eleitoral, a escrivania eleitoral que é a seção judicial.
26
É no cartório que o cidadão tem seu primeiro contato com a Justiça Eleitoral pois é ali que ele se apresenta, é qualificado e é inscrito eleitor. [...] Seção eleitoral É o local onde serão recepcionados os eleitores que exercerão o direito de voto. Nela funcionará a mesa receptora, composta de seis mesários nomeados pelo juiz eleitoral. Na seção eleitoral ficará instalada a urna eletrônica, equipamento no qual serão registrados os votos. [...] Sistema eleitoral majoritário É aquele no qual considera-se eleito o candidato que receber, na respectiva circunscrição – país, estado, município –, a maioria absoluta ou relativa, conforme o caso, dos votos válidos (descontados os nulos e os em branco). No Brasil, exige-se a maioria absoluta dos votos para a eleição do presidente da República , [sic] dos governadores dos estados e do Distrito Federal e dos prefeitos dos municípios com mais de 200.000 eleitores. Caso nenhum candidato alcance a maioria absoluta dos votos na primeira votação, realiza-se um segundo turno entre os dois mais votados no primeiro. Para a eleição dos senadores da República e dos prefeitos dos municípios com menos de 200.000 eleitores exige-se apenas a maioria relativa dos votos, não havendo possibilidade de segundo turno. [...] Urna eletrônica Equipamento de processamento de dados que, junto com o seu software (programas), permite a coleta de votos em uma eleição, de forma ergonômica, rápida e segura. O presidente da Mesa terá, de uma forma descomplicada, controle total do andamento da eleição. O equipamento foi previsto para operar nas mais diversas condições climáticas e de infra-estrutura. [...] Voto do eleitor residente no exterior O eleitor brasileiro residente no exterior tem a faculdade de votar somente nas eleições para presidente e vice-presidente da República, e desde que especificamente cadastrado para esse fim. Organizam-se seções eleitorais sempre que, na jurisdição da missão diplomática (embaixada) ou do consulado geral, haja o mínimo de trinta eleitores cadastrados. [...] Zona eleitoral Região geograficamente delimitada dentro de um Estado, gerenciada pelo cartório eleitoral, que centraliza e coordena os eleitores ali domiciliados. Pode ser composta por mais de um município, ou por parte dele. Normalmente segue a divisão de comarcas da Justiça Estadual. (Grifos do autor).
Como foi exposto, uma zona eleitoral não compreende exatamente uma
cidade. Uma cidade, dependendo da quantidade de eleitores, pode conter diversas
zonas eleitorais, assim como uma única zona eleitoral pode compreender diversas
cidades circunvizinhas no mesmo estado, dependendo do tamanho do eleitorado.
Para complementar, uma zona eleitoral é subdividida em diversas seções
eleitorais. Cada seção eleitoral corresponde a uma urna eletrônica (ou de lona –
caso o voto ocorra por meio de cédula).
27
Importante salientar que existem zonas eleitorais alocadas em outros países
para receberem os votos de brasileiros residentes no exterior.
Segundo Pericchi e Torres (2004), a lei de Newcomb-Benford se cumpre para
os dados eleitorais, desde que esses resultem de uma mistura imparcial de
distribuições.
No caso das eleições presidenciais brasileiras, as quantidades de votos para
cada candidato podem ser encontradas somando-se os totais de votos por estado,
por município, por zona eleitoral ou por seção eleitoral (urna eletrônica).
Independentemente da forma escolhida, o resultado sempre será o mesmo.
Porém, para a aplicação da Lei de Newcomb-Benford, deve-se optar pela forma de
totalização mais adequada a cada situação.
3.2.1 Limitações na Aplicação da Lei de Newcomb-Benford
Para se escolher a forma mais adequada de totalização, faz-se necessário
compreender as limitações na aplicação da Lei de Newcomb-Benford.
Apesar da lei de Newcomb-Benford já ter sido inúmeras vezes verificada, nem
todas as coleções de números obedecem a ela. Existem alguns fatores importantes
que devem ser verificados antes de sua utilização.
Existem as seguintes limitações na utilização da lei de Newcomb-Benford,
segundo Santos, Diniz e Corrar (2007, p. 513): 1. O tamanho de caractere do dígito deve ser grande o bastante para a
validação da lei. 2. Não se opera para números que são verdadeiramente fortuitos (por
exemplo, loteria de números). 3. Não se trabalha com números obtidos de forma imposta (por exemplo,
quando os valores são obtidos de maneira predefinida, estabelecendo limite máximo ou mínimo, os mesmos números devem surgir regularmente por alguma razão).
4. Não se trabalha com número que não corresponde a fenômenos naturais (como, por exemplo, números de telefone).
Se a opção escolhida for a coleta dos dados de todas as seções eleitorais,
isto é, de todas as urnas eletrônicas no Brasil e exterior, tem-se uma maior
quantidade de dados. No entanto, ao se escolherem os dados em nível de urna
eletrônica, vai-se de encontro às limitações 1 e 3 expostas anteriormente. Em
resumo, seriam somados números relativamente pequenos, pois a quantidade de
eleitores por urna não excede os 3 dígitos. Além de possuir um limite máximo. Não
existe um valor predefinido sobre o número de eleitores que se deve alocar em uma
28
urna eletrônica. Cada Tribunal Regional Eleitoral - TRE define o número médio de
eleitores que serão alocados em suas urnas. Tal escolha depende da complexidade
da eleição (quantidade de opções de escolha), quantidade de telas a serem
geradas, se as urnas serão utilizadas em meio urbano ou rural, entre outras. Apesar
de a urna eletrônica ter a capacidade de armazenar os votos de mais de 10.000
eleitores, tal quantidade seria inviável, causando enormes filas nas seções eleitorais.
As quantidades mais comuns de eleitores por urna variam entre 300 e 600 eleitores,
dependendo da localidade.
Pericchi e Torres (2004) afirmam que é preferível aplicar a Lei de Newcomb-
Benford ao segundo dígito, já que o primeiro estará afetado devido ao número pré-
estabelecido de eleitores por máquina.
Para melhor explicar esse fato, podemos fazer uma comparação entre a
auditoria de eleições norte americanas e a brasileira.
Nos Estados Unidos da América, o termo em inglês precinct, por motivo de
analogia, pode ser o equivalente à nossa seção eleitoral, com poucas diferenças. A
quantidade de eleitores na seção eleitoral brasileira corresponde à quantidade de
eleitores que se pode alocar em uma urna eletrônica. Algo em torno de 400
eleitores. Por outro lado, o precinct pode conter mais de uma urna e, segundo a
fonte de pesquisas eletrônicas Wikipedia, nas eleições americanas de 2004, a média
de eleitores cadastrados por precinct era de aproximadamente 1100. Kansas tendo
a menor média de eleitores por precinct com 437, enquanto que o Distrito de
Colúmbia possuía a maior média, 2704 eleitores cadastrados por precinct.
Segundo Mebane (2006a), há boas razões para duvidar que o primeiro dígito
satisfaça a Lei de Benford em nível de precinct. Pois este é designado a possuir
sempre o mesmo número aproximado de eleitores. Se um candidato possui, em
média, o mesmo percentual de votos em cada precinct, isto implica que ele tenderá
a ter o mesmo primeiro dígito significativo em todos os precincts. Como exemplo,
supondo que um candidato possua, aproximadamente, 50% das intenções de voto
igualmente distribuídas para cada precinct e que os precincts contenham, em média,
1000 eleitores. Então, a maioria dos totais de votos por precinct para esse candidato
terá o número 4 ou 5 como primeiro dígito significativo.
29
3.2.2 Forma de Totalização Escolhida
Uma alternativa para se tentar driblar tal dificuldade seria a utilização da Lei
de Benford para o Segundo Dígito.
Mebane (2006a, 2006b), em seus estudos, costuma analisar os resultados de
eleições em nível de precinct. Como foi explicado, a média de eleitores presentes
em um precinct é superior à média de eleitores cadastrados nas seções brasileiras.
Para tentar evitar possíveis problemas, não serão totalizadas as informações das
seções eleitorais. Serão Trabalhados os dados em nível de zona eleitoral, pois, a
zona eleitoral contém diversas seções. Nas eleições presidenciais de 2006, existia
um total de 3034 zonas eleitorais espalhadas pelo Brasil e exterior. E a média de
votos válidos, no primeiro turno, por zona eleitoral foi de 32.069. A 48ª Zona Eleitoral
do Estado do Amazonas obteve a quantidade mínima de votos válidos 1.482. E a
351ª Zona Eleitoral do Estado de São Paulo obteve a quantidade máxima de votos
válidos, 211.014. (Valores calculados a partir dos dados fornecidos no site do TSE –
Consulta de Resultados Eleitorais).
3.3 Coleta e Tratamento dos Dados
Para a utilização da estatística inferencial, através da realização de testes de
hipóteses, foram coletados os votos recebidos por cada um dos candidatos a
presidente do Brasil no ano de 2006 distribuídos, por todas as 3034 zonas eleitorais
existentes no Brasil e no Exterior para o Primeiro e Segundo Turnos das Eleições,
diretamente do site do TSE – Consulta de Resultados Eleitorais.
Nas tabelas seguintes tem-se a relação dos candidatos(as) concorrentes no
Primeiro e Segundo Turnos distribuídos em ordem alfabética:
30
Tabela 4 - Candidatos a Presidente no Primeiro Turno das Eleições Brasileiras de 2006 Candidatos(as) no 1º Turno
Ana Maria Teixeira Rangel
Cristovam Ricardo Cavalcanti Buarque
Geraldo José Rodrigues Alckmin Filho
Heloísa Helena Lima de Moraes Carvalho
José Maria Eymael
Luciano Caldas Bivar
Luís Inácio Lula da Silva
Fonte: TSE
Tabela 5 - Candidatos a Presidente no Segundo Turno das Eleições Brasileiras de 2006
Candidatos no 2º Turno
Geraldo José Rodrigues Alckmin Filho
Luís Inácio Lula da Silva
Fonte: TSE
Após coletados, os dados passarão por um tratamento, via planilha eletrônica,
para se recuperarem os primeiros e segundos dígitos mais significativos do conjunto
de dados. Um exemplo de utilização de planilha eletrônica pode ser encontrado no
Apêndice A.
Como exemplo, pode-se ter a seguinte tabela:
Tabela 6 - Exemplo da Coleta de Votos para Luís Inácio Lula da Silva no 2° Turno
Estado Zona Eleitoral
Votos para Lula
1º Dígito
2° Dígito
AC 1 28.080 2 8 AC 2 3.371 3 3 AC 3 7.850 7 8 AC 4 18.819 1 8 AC 5 6.852 6 8 AC 6 10.532 1 0 AC 7 6.353 6 3 AC 8 12.051 1 2 AC 9 31.328 3 1 AC 10 26.348 2 6 AL 1 30.708 3 0 AL 2 50.031 5 0 AL 3 52.314 5 2
...
...
...
...
...
Fonte: TSE
31
Na tabela anterior, os dados foram classificados por estado da federação,
começando pelo Acre (AC), em seguida pelo número da zona eleitoral, contendo a
sua respectiva quantidade de votos para o candidato Luís Inácio Lula da Silva no 2°
Turno das Eleições Presidenciais de 2006.
Faz-se importante notar que este trabalho não foi realizado com amostras, e
sim com todo o universo de dados correspondentes às 3034 zonas eleitorais
distribuídas pelo Brasil e exterior, para cada candidato e por turno da eleição
presidencial de 2006.
Nos próximos capítulos, serão contabilizados os conteúdos das colunas
correspondentes ao primeiro e segundo dígitos.
3.4 Definição das Estatísticas a Serem Utilizadas
Nesta parte do trabalho, é realizada uma complementação entre as técnicas
utilizadas por Mebane (2006a, 2006b) com as estatísticas fornecidas por Santos,
Diniz e Corrar (2007).
Mebane (2006a, 2006b) dedica-se à questão de auditoria de resultados
eleitorais, tendo especial atenção à forma de totalização dos votos, à aplicação da
Lei de Newcomb-Benford para o Segundo Dígito e a adoção do Teste Qui-quadrado.
Tem-se, também, especial atenção à utilização do critério FDR que será explicado
durante o desenvolvimento deste estudo.
Por outro lado, em Santos, Diniz e Corrar (2007), aplica-se a Lei de
Newcomb-Benford para o Primeiro Dígito à auditoria de contas públicas, utilizando o
Z-teste e o Teste Qui-quadrado.
Para aprofundar a análise, todas as técnicas citadas anteriormente serão
realizadas.
Serão aplicados o Z-Teste e o Teste Qui-quadrado como exposto a seguir.
3.4.1 Utilizando o Z-Teste
De acordo com Santos, Diniz e Corrar (2007), para estudar o nível de
significância entre as diferenças (Poi – Pei), podemos utilizar o Z-Teste.
32
n
ppn
ppZ
ee
eo
121
9
1
22
d PEPEPO
9
0
22
d PEPEPO
(3)
Onde:
a) po é a probabilidade observada;
b) pe é a probabilidade esperada (que pode ser a do primeiro ou segundo
dígito, dependendo do tipo de teste);
c) n é o número de observações;
d) 1/2n é o termo de correção de continuidade e só é usado quando ele
for menor que | po – pe |.
3.4.2 Utilizando o Teste Qui-quadrado
Ainda, segundo Santos, Diniz e Corrar (2007), para verificar se as duas
distribuições de probabilidade estão em conformidade, uma com a outra, ou se a
distribuição de probabilidade observada (po) é “igual” à distribuição esperada (pe),
segundo a Lei de Newcomb-Benford, utiliza-se o Teste Qui-quadrado da seguinte
maneira:
(4)
Onde PO e PE são as proporções observadas e esperadas, respectivamente,
definidas por:
a) PO = (po) x (nº da população);
b) PE = (pe) x (nº da população);
c) d є {1, 2, ..., 9} pois se trata da lei de Newcomb-Benford para o
Primeiro Dígito.
Na Lei de Newcomb-Benford para o Segundo Dígito, será realizado o
somatório, considerando-se as dez possibilidades de d є {0, 1, ..., 9}:
(5)
33
*)( qmiP i
3.4.3 Utilizando o Critério FDR
O critério FDR (do inglês False Discovery Rate) foi proposto por Benjamini e
Hochberg (1995), utilizado por Mebane (2006a, 2006b) e representa a proporção
esperada de falsos positivos dentre todas as hipóteses nulas rejeitadas.
Considere vários testes de hipóteses H1, H2, ..., Hm baseados em seus
correspondentes p-valores P1, P2, ..., Pm. Ordene os p-valores P(1), P(2), ..., P(m) tal
que a hipótese nula H(i) corresponda a seu p-valor P(i). A seguir é definido o
procedimento para a realização de múltiplos testes do tipo Bonferroni:
Seja k o maior i tal que:
(6)
Então, são rejeitadas todas as hipóteses H(i) com i = 1, 2, ..., k.
Para testes estatísticos independentes e para qualquer configuração de falsas
hipóteses nulas, o procedimento acima controla o FDR em q*.
Analogamente a Mebane (2006a), assumindo independência entre as zonas
eleitorais, que corresponde à independência entre os testes, podemos calcular, de
forma rápida, o novo valor crítico, utilizando o critério FDR, definindo q* = α* como
sendo o nível de significância conjunto. Para os testes Qui-quadrados e para os Z-
testes, faremos α* = 0,05 para o Primeiro e Segundo Turnos das Eleições.
3.5 Teste de Hipóteses para a Análise do Primeiro Dígito
Tem-se como ponto de partida o estudo da distribuição de probabilidades da
Lei de Newcomb-Benford para o Primeiro Dígito. Assim, deve-se observar as
frequências relativas dos 9 números possíveis, de 1 a 9, já que, em números inteiros
o 0 (zero) não aparece como dígito mais significativo.
3.5.1 Definição das Hipóteses
A análise das diferenças entre as distribuições de probabilidades observadas
(po) e esperadas (pe) segundo a Lei de Newcomb-Benford para o Primeiro Dígito,
será estudada a partir de testes de hipótese. O Z-teste servirá para avaliar a
diferença entre as probabilidades esperadas pe e as probabilidades observadas po
34
para cada um dos 9 dígitos (1 a 9). O teste Qui-quadrado fornecerá um valor
numérico que indicará o quanto a distribuição de probabilidade observada se
aproxima da distribuição de probabilidades de Newcomb-Benford para o Primeiro
Dígito.
Definem-se, então, as seguintes hipóteses:
Hipótese Nula H0 – Não existe diferença estatisticamente significativa entre
as distribuições de probabilidades observadas (po) e esperadas (pe);
Hipótese Alternativa H1 – Existe diferença estatisticamente significativa entre
as distribuições de probabilidades observadas (po) e esperadas (pe);
Na simbologia usual, temos:
H0: po = pe
H1: po ≠ pe
Observação importante: Estas hipóteses são definidas para cada um dos
dígitos de 1 a 9 no Z-teste e para toda a distribuição de probabilidade no teste Qui-
quadrado. Tem-se então 9 + 1 = 10 testes de hipóteses, para cada candidato no
Primeiro e Segundo Turnos.
3.5.2 Cálculo da Estatística do Teste
Para o Z-teste utiliza-se o nível de significância α = 0,05 que fornece um valor
crítico Zc = 1,96.
Para o teste Qui-quadrado, também se utiliza o nível de significância α = 0,05
com grau de liberdade igual a 8 que fornece um χ2c = 15,507. O grau de liberdade foi
calculado tomando-se a quantidade de pontos observados (9) provenientes dos 9
dígitos possíveis na distribuição: (1, 2, 3, 4, 5, 6, 7, 8 e 9). Desse valor, subtrai-se 1
para se determinar o grau de liberdade necessário para esse teste.
3.6 Teste de Hipóteses para o Segundo Dígito
Diferentemente da Lei de Newcomb-Benford para o Primeiro Dígito, onde são
analisadas as frequências relativas dos 9 dígitos possíveis compreendidos de 1 a 9,
deve-se observar as frequências relativas dos 10 dígitos possíveis, isto é, de 0 a 9.
O dígito 0 (zero) deverá ser incluído, pois agora ele poderá ocorrer.
35
3.6.1 Definição das Hipóteses
De forma análoga, são definidas as seguintes hipóteses:
Hipótese Nula H0 – Não existe diferença estatisticamente significativa entre
as distribuições de probabilidades observadas (po) e esperadas (pe);
Hipótese Alternativa H1 – Existe diferença estatisticamente significativa entre
as distribuições de probabilidades observadas (po) e esperadas (pe);
Na simbologia usual, tem-se:
H0: po = pe
H1: po ≠ pe
Da mesma forma, essas hipóteses são definidas para cada um dos dígitos de
0 a 9 no Z-teste e para toda a distribuição de probabilidade no teste Qui-quadrado.
Tem-se então 10 + 1 = 11 testes de hipóteses, para cada candidato no Primeiro e
Segundo Turnos.
3.6.2 Cálculo da Estatística do Teste
Para o Z-Teste do segundo dígito também se utiliza o nível de significância α
= 0,05 que fornece um valor crítico Zc = 1,96.
O teste Qui-quadrado, com nível de significância α = 0,05 para 9 graus de
liberdade fornece um χ2c = 16,9. O grau de liberdade foi calculado tomando-se a
quantidade de pontos observados (10) provenientes dos 10 dígitos possíveis na
distribuição: (0, 1, 2, 3, 4, 5, 6, 7, 8 e 9). Dessa quantidade, subtrai-se 1 para se
encontrar o grau de liberdade necessário para esse teste.
A seguinte tabela sintetiza os critérios utilizados para os Teste de Hipótese
para o primeiro e segundo dígitos.
Tabela 7 - Valores Críticos para o Z-teste e o Teste Qui-quadrado
Nível de significância α = 0,05
Z-teste Qui-quadrado Dígito Opções Quantidade de Dígitos
Zc χ2c Graus de Liberdade
1° 1 a 9 9 1,96 15,507 8
2° 0 a 9 10 1,96 16,9 9
A tabela anterior disponibiliza os valores críticos para cada teste de hipótese
individual.
36
A seguir, serão analisados e discutidos os resultados para a aplicação da Lei
de Newcomb-Benford para o Primeiro e Segundo Dígitos.
37
4 ANÁLISE E DISCUSSÃO DOS RESULTADOS
Neste capítulo, será utilizada a metodologia explanada no capítulo anterior
para a aplicação da Lei de Newcomb-Benford para o Primeiro e Segundo Dígitos
aos dados provenientes de todas as zonas eleitorais distribuídas pelo Brasil e
exterior.
Ao final do capítulo será realizada comparação entre as funcionalidades das
duas leis para o caso eleitoral.
4.1 Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito na Eleição Presidencial Brasileira de 2006
Nas tabelas seguintes, listam-se os resultados encontrados através da
aplicação do Z-teste e do teste Qui-quadrado.
Lembrando que:
H0: po = pe
H1: po ≠ pe
Com:
a) Nível de significância α = 0,05;
b) Valor crítico Zc = 1,96 para o Z-Teste;
c) Valor crítico χ2c = 15,507 para o teste Qui-quadrado com 8 graus de
liberdade, pois temos 9 dígitos possíveis (1 a 9).
É importante salientar que alguns candidatos não receberam votos em todas
as zonas eleitorais. Assim, em algumas tabelas são encontrados totais inferiores a
3.034.
Os valores em amarelo ultrapassaram os limites individuais no respectivo
teste.
Para a candidata Ana Maria Teixeira Rangel, tem-se:
38
Tabela 8 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 809 0,266821 0,30103 -0,03421 912,7229 4,086745 11,78720196
2 544 0,17942 0,176091 0,003328 533,9087 0,457304 0,190733711
3 401 0,132256 0,124939 0,007317 378,8142 1,191083 1,299337421
4 338 0,111478 0,09691 0,014568 293,8312 2,680756 6,639481259
5 251 0,082784 0,079181 0,003602 240,0775 0,700983 0,496923522
6 210 0,069261 0,066947 0,002314 202,9827 0,473573 0,242596943
7 197 0,064974 0,057992 0,006982 175,8316 1,605948 2,54847201
8 151 0,049802 0,051153 -0,00135 155,0944 0,296303 0,108092231
9 131 0,043206 0,045757 -0,00255 138,7367 0,62895 0,431440982
3032 1 3032 23,74428003
Pode-se comparar a distribuição de probabilidades descrita pela Lei de
Newcomb-Benford com os valores calculados na tabela anterior. Veja o gráfico a
seguir:
Gráfico 3 - Análise da Lei de Newcomb-Benford do Primeiro Dígito para a
candidata Ana Maria Teixeira Rangel
Visualmente, as curvas são semelhantes. Porém, estatisticamente,
encontram-se grandes diferenças, pois χ2 = 23,74 está muito acima do valor crítico
individual χ2c = 15,507.
Como a quantidade de informações a serem analisadas é numerosa, as
tabelas e gráficos de todos os candidatos no Primeiro e Segundo Turnos estão à
disposição nos Apêndices B e C, respectivamente.
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
39
Desta forma, seguindo a mesma metodologia aplicada aos votos de Ana
Maria Teixeira Rangel, pode-se construir uma tabela resumida com todos os
resultados calculados para os candidatos. A ordem dos candidatos na tabela
equivale à sua colocação na apuração dos resultados eleitorais, sendo Luís Inácio
Lula da Silva o mais votado no Primeiro e Segundo Turnos.
Tabela 9 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006
1º Turno Z-teste, com Zc = 1,96
Candidatos 1 2 3 4 5 6 7 8 9 χ2
c = 15,507
Lula 1,00 0,99 0,91 0,34 0,86 0,03 0,03 0,52 1,10 4,74
Alckmin 0,63 3,52 0,19 1,26 0,49 2,21 0,20 2,41 3,10 32,31
Heloísa 8,11 1,85 2,00 2,79 4,93 1,77 2,99 2,09 0,12 98,51
Cristovam 4,16 2,59 0,96 1,81 0,86 2,08 2,52 0,88 2,20 38,45
Ana Maria 4,09 0,46 1,16 2,68 0,70 0,47 1,61 0,30 0,63 23,74
Eymael 2,76 2,25 0,87 1,62 4,15 4,38 0,56 0,35 3,06 56,81
Bivar 0,52 1,23 0,11 0,31 1,77 0,38 1,59 1,98 0,29 0,11
Tabela 10 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006
2º Turno Z-teste, com Zc = 1,96
Candidatos 1 2 3 4 5 6 7 8 9 χ2
c = 15,507
Lula 0,55 2,20 2,45 0,46 0,22 0,32 0,35 0,85 1,68 13,79
Alckmin 2,64 1,66 0,00 0,09 1,30 1,34 0,90 3,07 1,36 22,60
Observando-se as tabelas anteriores percebe-se que, dentre os 90 testes de
hipótese realizados, 33 tiveram valores acima dos limites críticos individuais. Apesar
disso, segundo Mebane (2006a, 2006b), deve-se considerar a aplicação do critério
da taxa de falsos positivos FDR.
4.1.1 Análise dos Testes de Hipótese Utilizando o Critério FDR
Como foi explicado anteriormente, utiliza-se o critério FDR para encontrar os
valores críticos, ZFDR e χ2FDR, para o conjunto dos testes de hipótese com nível de
significância α = 0,05.
Aplicando o critério FDR, cujos cálculos estão disponíveis no Apêndice D,
pode-se montar a seguinte tabela:
40
Tabela 11 - Critério FDR para o Primeiro Dígito Turno ZFDR χ2
FDR
Primeiro 2,52 21,00
Segundo 2,99 17,53
Novamente, reúnem-se em duas tabelas os valores encontrados para a Lei de
Newcomb-Benford para o Primeiro Dígito em ambos os turnos.
Tabela 12 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR
1º Turno Z-teste, com Zc = 1,96 e ZFDR = 2,52
Candidatos 1 2 3 4 5 6 7 8 9
χ2c = 15,507
χ2FDR=21,00
Lula 1,00 0,99 0,91 0,34 0,86 0,03 0,03 0,52 1,10 4,74
Alckmin 0,63 3,52 0,19 1,26 0,49 2,21 0,20 2,41 3,10 32,31
Heloísa 8,11 1,85 2,00 2,79 4,93 1,77 2,99 2,09 0,12 98,51
Cristovam 4,16 2,59 0,96 1,81 0,86 2,08 2,52 0,88 2,20 38,45
Ana Maria 4,09 0,46 1,16 2,68 0,70 0,47 1,61 0,30 0,63 23,74
Eymael 2,76 2,25 0,87 1,62 4,15 4,38 0,56 0,35 3,06 56,81
Bivar 0,52 1,23 0,11 0,31 1,77 0,38 1,59 1,98 0,29 0,11
Tabela 13 - Resumo da Aplicação da Lei de Newcomb-Benford para o Primeiro Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR
2º Turno Z-teste, com Zc = 1,96 e ZFDR = 2,99
Candidatos 1 2 3 4 5 6 7 8 9
χ2c = 15,507
χ2FDR=17,53
Lula 0,55 2,20 2,45 0,46 0,22 0,32 0,35 0,85 1,68 13,79
Alckmin 2,64 1,66 0,00 0,09 1,30 1,34 0,90 3,07 1,36 22,60
Marcados em amarelo, encontram-se os valores de Z acima do Zc ou χ2c e em
vermelho, os valores que superam os limites impostos pelo critério FDR, ZFDR e χ2FDR
para o Primeiro e Segundo Turnos.
Na tabela para o Primeiro Turno, encontram-se 23 valores de Z acima de Zc =
1,96. Dentre os quais, 15 superam o valor crítico ZFDR = 2,52. O maior valor de Z
encontrado foi 8,11 referente ao dígito 1 da candidata Heloísa Helena Lima de
Moraes Carvalho. No teste Qui-quadrado, 5 valores ultrapassaram o maior limite
crítico χ2FDR = 21,00. O maior valor do teste Qui-quadrado foi de 98,51, também para
a candidata Heloísa Helena Lima de Moraes Carvalho.
41
Na tabela do Segundo Turno, 4 valores ultrapassaram Zc = 1,96. Dentre
esses, 1 superou o limite do critério FDR, ZFDR = 2,99. Com relação ao teste Qui-
quadrado, 1 valor também superou o valor crítico χ2FDR = 17,53 com χ2 = 22,60 para
Geraldo José Rodrigues Alckmin Filho.
Visivelmente, percebe-se que a hipótese H0 não é verdadeira para a Lei de
Newcomb-Benford para o Primeiro Dígito, similarmente ao que foi observado por
Mebane (2006a, 2006b) e Pericchi e Torres (2004) nos estudos realizados nos
sistemas eleitorais de seus países de origem.
A seguir, os mesmos dados de entrada serão aplicados à análise da Lei de
Newcomb-Benford para o Segundo Dígito.
4.2 Aplicação da Lei de Newcomb-Benford para o Segundo Dígito na Eleição Presidencial Brasileira de 2006
Como realizado anteriormente, utiliza-se a mesma quantidade de votos
recebida por cada um dos candidatos a presidente do Brasil no ano de 2006,
distribuídos por todas as zonas eleitorais existentes, no Brasil e no Exterior, para o
Primeiro e Segundo Turnos das Eleições.
Em diversas zonas eleitorais, alguns candidatos obtiveram a soma de seus
votos inferior a dez (Isto é, quantidades com apenas 1 dígito, não sendo possível
realizar a análise para a Lei de Newcomb-Benford para o Segundo Dígito). Nesse
caso, tal zona será desconsidera do total das 3.034.
Os números que estiverem fora do valor crítico esperado, serão marcados em
amarelo.
Nas tabelas seguintes, serão listados os resultados encontrados através da
aplicação do Z-teste e do teste Qui-quadrado:
Novamente, para a candidata Ana Maria Teixeira Rangel, tem-se os seguintes
resultados:
42
Tabela 14 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 321 0,116 0,1197 -0,0037 331,272 0,572242 0,318524784
1 331 0,1196 0,1139 0,00569 315,248 0,912562 0,787100191
2 301 0,1087 0,1088 -8E-05 301,218 0,0133 0,000157641
3 268 0,0968 0,1043 -0,0075 288,784 1,261239 1,495870896
4 252 0,091 0,1003 -0,0093 277,653 1,591452 2,370158047
5 275 0,0993 0,0967 0,00267 267,603 0,443629 0,204488657
6 287 0,1037 0,0934 0,01031 258,461 1,831668 3,151184669
7 254 0,0918 0,0904 0,00141 250,094 0,225796 0,060994764
8 230 0,0831 0,0876 -0,0045 242,394 0,799768 0,633716269
9 249 0,09 0,085 0,00496 235,273 0,90152 0,800941201
2768 1 2768 9,823137
Percebe-se que, desta vez, nenhum dos valores calculados ultrapassou os
níveis críticos individuais para Z e χ2.
Gráfico 4 – Análise da Lei de Newcomb-Benford do Segundo Dígito para
a candidata Ana Maria Teixeira Rangel
Apesar de, visualmente, as diferenças parecerem maiores do que aquelas
encontradas na análise para o Primeiro Dígito, as quantidades observadas estão
distribuídas de forma mais uniforme. Na análise da Lei para o Primeiro Dígito
referente à mesma candidata, o gráfico estava limitado superiormente por 809 votos,
isto é, mais que o dobro do limite atual de 331.
Como foi realizado para o primeiro dígito, será mostrado adiante um resumo
com os resultados de todos os candidatos para o Primeiro e Segundo Turnos das
0
50
100
150
200
250
300
350
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
43
eleições. Maiores detalhes sobre os cálculos e gráficos, podem ser encontrados nos
Apêndices E e F, respectivamente.
Tabela 15 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006
1º Turno Z-teste, com Zc = 1,96
Candidatos 0 1 2 3 4 5 6 7 8 9 χ2
c = 16,9
Lula 0,75 0,05 0,39 0,71 0,53 1,67 0,82 0,86 2,00 0,42 9,436
Alckmin 1,10 0,51 0,84 0,12 1,50 0,93 0,17 0,34 0,69 0,35 5,787
Heloísa 0,58 0,23 0,27 0,06 0,41 0,44 0,11 1,12 0,76 0,30 2,742
Cristovam 1,99 0,45 0,10 0,30 0,41 0,02 1,70 0,17 0,01 1,21 8,249
Ana Maria 0,57 0,91 0,01 1,26 1,59 0,44 1,83 0,23 0,80 0,90 9,823
Eymael 1,86 0,03 0,39 0,55 0,48 0,00 1,50 1,03 1,67 1,33 11,539
Bivar 0,96 0,08 1,81 0,56 0,18 2,24 1,10 0,83 1,25 2,47 18,208
Tabela 16 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006
2º Turno Z-teste, com Zc = 1,96
Candidatos 0 1 2 3 4 5 6 7 8 9 χ2
c = 16,9
Lula 2,09 1,37 0,51 0,60 1,26 0,07 0,11 0,47 2,39 0,56 13,709
Alckmin 0,13 0,23 0,95 0,00 0,59 1,18 1,17 0,15 0,59 0,11 4,329
Diferentemente do observado na análise para o primeiro dígito, dos 99 testes
de hipóteses realizados, apenas 7 deles ultrapassaram seus valores críticos
individuais.
De forma geral, a grande maioria dos resultados encontra-se abaixo do valor
crítico para os testes individuais. Aqueles que excederam (em amarelo) estão bem
próximos dos limites críticos para o grau de significância α = 0,05. Ou seja, com uma
confiança de 95%.
Mesmo assim, ainda não se pode tirar conclusões a partir da análise realizada
até este ponto, pois pode ter havido a ocorrência de falsos positivos. Por isso, é
importante avaliar o critério FDR já discutido, da mesma forma que foi realizado para
a Lei do Primeiro Dígito.
44
4.2.1 Análise dos Testes de Hipótese Utilizando o Critério FDR
Utilizando o critério FDR para um nível de significância α = 0,05, encontram-
se os seguinte valores críticos para o conjunto.
Tabela 17 - Critério FDR para o Primeiro Dígito
Turno ZFDR χ2FDR
Primeiro 3,38 22,61
Segundo 3,02 19,02
Maiores detalhes sobre a aplicação do critério FDR para a análise do
Segundo Dígito podem ser encontrados no Apêndice G.
A seguinte tabela resume os dados encontrados após a aplicação do critério
FDR.
Tabela 18 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Primeiro Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR
1º Turno Z-teste, com Zc = 1,96 e ZFDR = 3,38
Candidatos 0 1 2 3 4 5 6 7 8 9
χ2c = 16,9
χ2FDR=22,61
Lula 0,75 0,05 0,39 0,71 0,53 1,67 0,82 0,86 2,00 0,42 9,436
Alckmin 1,10 0,51 0,84 0,12 1,50 0,93 0,17 0,34 0,69 0,35 5,787
Heloísa 0,58 0,23 0,27 0,06 0,41 0,44 0,11 1,12 0,76 0,30 2,742
Cristovam 1,99 0,45 0,10 0,30 0,41 0,02 1,70 0,17 0,01 1,21 8,249
Ana Maria 0,57 0,91 0,01 1,26 1,59 0,44 1,83 0,23 0,80 0,90 9,823
Eymael 1,86 0,03 0,39 0,55 0,48 0,00 1,50 1,03 1,67 1,33 11,539
Bivar 0,96 0,08 1,81 0,56 0,18 2,24 1,10 0,83 1,25 2,47 18,208
Tabela 19 - Resumo da Aplicação da Lei de Newcomb-Benford para o Segundo Dígito no Segundo Turno das Eleições Presidenciais de 2006, Utilizando o Critério FDR
2º Turno Z-teste, com Zc = 1,96 e ZFDR = 3,02
Candidatos 0 1 2 3 4 5 6 7 8 9
χ2c = 16,9
χ2FDR=19,02
Lula 2,09 1,37 0,51 0,60 1,26 0,07 0,11 0,47 2,39 0,56 13,709
Alckmin 0,13 0,23 0,95 0,00 0,59 1,18 1,17 0,15 0,59 0,11 4,329
Como já foi explicado, os valores em amarelo ultrapassaram os limites
individuais para os testes Zc ou χ2c. Porém, nenhum dos valores excedeu os limites
críticos estabelecidos pelo critério FDR, ZFDR e χ2FDR. Percebe-se que não ocorreram
valores em vermelho.
45
4.3 Comparação dos Resultados
Na realização dos testes estatísticos para a Lei de Newcomb-Benford para o
Primeiro Dígito, ocorreram inúmeras distorções. Diversos valores se encontram
acima dos limites críticos. Do total de 90 testes de hipóteses, 22 ultrapassaram o
limite crítico para o conjunto. Enquanto que, dentre os 99 testes de hipóteses
realizados na análise da Lei para o Segundo Dígito, nenhum deles ultrapassou os
limites críticos para o conjunto.
Comparando as tabelas referentes à aplicação da Lei de Newcomb-Benford
para o Primeiro e para o Segundo Dígitos, percebe-se nitidamente que as
distribuições de probabilidades derivadas dos resultados eleitorais aderem à
distribuição de probabilidades referente à aplicação da referida lei para o Segundo
Dígito.
Assim, é válida a hipótese H0 na qual não se pode negar a utilização da Lei de
Newcomb-Benford apenas para o Segundo Dígito na indicação de possíveis fraudes
no sistema de votação eleitoral como foi demonstrado.
46
5 CONSIDERAÇÕES FINAIS
Com relação aos objetivos elencados no início deste trabalho, pode-se
concluir que não é aconselhável a utilização da Lei de Newcomb-Benford para o
Primeiro Dígito como indicativo de fraude eleitoral, pois, analogamente ao verificado
por Mebane (2006a), os primeiros dígitos ficam comprometidos com a quantidade de
votos apurados em cada zona eleitoral. Por outro lado, pode-se utilizar a Lei de
Newcomb-Benford para o Segundo Dígito como possível indicativo de fraude na
auditoria de resultados eleitorais.
No que diz respeito à coleta de dados em nível de zona eleitoral, a mesma
apresentou-se satisfatória, pois foi capaz de produzir dados que obedeciam à Lei de
Newcomb-Benford para o Segundo Dígito. Porém, é importante salientar que a
mesma não serve para a análise da Lei para o Primeiro Dígito.
Para o tema deste estudo, o objetivo geral foi alcançado, pois foi mostrado
que a Lei de Newcomb-Benford pode ser utilizada como indicativo de fraude em
sistemas eleitorais brasileiros, particularmente no que se refere à Eleição Majoritária
para Presidente da República com coleta de dados em nível de zona eleitoral.
Mesmo assim, é importante salientar que resultados negativos (em vermelho) para a
análise do Segundo Dígito que possam vir a ocorrer em outras eleições
presidenciais não comprovam a existência de fraude eleitoral. É apenas uma
sinalização de que poderá haver algo errado. Caso ocorram, os dígitos cujo Z-teste
tenha ultrapassado seu limite crítico ZFDR servirão para indicar as zonas com
possíveis problemas. Uma investigação mais aprofundada deverá ser realizada
nesses casos.
Novas pesquisas devem ser realizadas para confirmar a possibilidade de
utilização da Lei de Newcomb-Benford na detecção de fraudes eleitorais. A seguir
são listadas algumas recomendações para futuros estudos nesta área.
47
5.1 Recomendações para Futuras Pesquisas
Com relação às Eleições Presidenciais Brasileiras, para maior segurança na
aplicação da metodologia, faz-se necessário analisar os pleitos dos anos anteriores.
Com a proximidade da Eleição Majoritária para Presidente do Brasil de 2010, haverá
outra oportunidade para se testar a Lei de Newcomb-Benford para o Segundo Dígito.
No que se refere às eleições para governador, prefeito, senador, deputado
federal, deputado estadual e vereador, novos estudos deverão ser realizados.
Nesses casos, deverá haver a escolha mais adequada da forma de totalização e dos
testes estatísticos a serem utilizados.
Para futuros trabalhos é recomendado pesquisar formas de simulação de
resultados eleitorais para, a partir delas, simular fraudes e verificar se tais
manipulações podem ser detectadas pela análise da Lei de Newcomb-Benford, de
forma similar à realizada por Mebane (2006a).
Outra recomendação é o estudo da Lei de Newcomb-Benford para outras
bases numéricas, tais como a base octal, quaternária, etc., com a finalidade de se
verificar a sua aplicação diretamente aos dados das seções eleitorais (urnas).
48
REFERÊNCIAS BIBLIOGRÁFICAS
BENJAMINI, Yoav.; HOCHBERG, Yosef. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistics Society, London, v. 57, n.1, p. 289-300, 1995. Disponível em: <http://www.biostat. jhsph.edu/~yonchen/Controlling%20the%20false%20discovery%20rate.pdf >. Acesso em: 26 mai. 2009. BRASIL. Fundação Instituto Brasileiro de Geografia e Estatística. Normas de apresentação tabular. Centro de Documentação e Disseminação de Informações. 3. ed. Rio de Janeiro: IBGE, 1993. Disponível em: <http://biblioteca.ibge.gov.br/ visualizacao/monografias/visualiza_colecao_digital.php?titulo=Normas%20de%20apresenta%C3%A7%C3%A3o%20tabula&link=Normas_de_Apresentacao_Tabulares#>. Acesso em: 04 jul. 2009. ______. Tribunal Superior Eleitoral. Glossário eleitoral brasileiro. Disponível em: <http://www.tse.gov.br/internet/institucional/glossario-eleitoral/index.html>. Acesso em: 22 jun. 2009. ______. Tribunal Superior Eleitoral. Consulta de resultados eleitorais. Disponível em: <http://www.tse.gov.br/internet/eleicoes/2006/result_zona_blank.htm>. Acesso em: 20 mai. 2009. DAWOOD, Layla. Referendo revocatório. Vitória democrática na Venezuela?. PUC Minas. Ago 2004. Disponível em: <http://www.pucminas.br/imagedb/conjuntura/CNO_ARQ_NOTIC20060525103045.pdf?PHPSESSID=54619d94dd0426f3fb4c5cbbcb7fb6e1 >. Acesso em: 04 ago 2009. WIKIPEDIA. Disponível em: <http://en.wikipedia.org/wiki/Precinct>. Acesso em: 22 jun. 2009. MEBANE, Walter R., Jr. Election Forensics: Vote Counts and Benford's Law. Cornell University. Jul. 2006a. Disponível em: <http://www-personal.umich.edu/ ~wmebane/pm06.pdf>. Acesso em: 30 mai. 2009. ______. Election Forensics: The Second-digit Benford’s Law Test and recent American Presidential Elections. Cornell University. Nov. 2006b. Disponível em: <http://www-personal.umich.edu/~wmebane/fraud06.pdf>. Acesso em: 04 ago. 2009. NIGRINI, Mark J. I’ve got your number. How a mathematical phenomenon can help CPAs uncover fraud and other irregularities. Journal of Accountancy. Mai, 1999. Disponível em: <http://www.journalofaccountancy.com/Issues/1999/May/nigrini.htm>. Acesso em: 04 ago. 2009. ______. Continuous auditing. Allen, 2000. Disponível em: <http://aaahq.org/audit/midyear/01midyear/papers/nigrini_continuous_audit.pdf>. Acesso em: 22 jun. 2009.
49
PERICCHI, Luis Raúl; TORRES, David. La Ley de Newcomb-Benford y sus aplicaciones al Referendum Revocatorio en Venezuela. Universidad de Puerto Rico, Universidad Simón Bolívar. Reporte técnico não definitivo, v. 2, out. 2004. Disponível em: <http://esdata.info/pdf/pericchi-torres.pdf>. Acesso em: 22 jun. 2009. SANTOS, Josenildo dos; DINIZ, Josedilton Alves; CORRAR, Luiz J. A lei de Newcomb-Benford. In: CORRAR, Luiz J.; PAULO, Edilson; DIAS FILHO, José Maria. (Coord.). Análise multivariada: para os cursos de administração, ciências contábeis e economia. São Paulo: Atlas, 2007. p. 506 - 541. SPIEGEL, Murray R. Estatística. 3. ed. Tradução e revisão técnica Pedro Constantino. São Paulo: Pearson Makron Books, 1993.
50
APÊNDICE A - EXEMPLO DE PLANILHA ELETRÔNICA PARA O CÁLCULO DOS TESTES ESTATÍSTICOS
Como exemplo, será mostrado como se calculam as principais células para a
análise da Lei de Newcomb-Benford para o Segundo Dígito utilizando funções que
servem para o Microsoft® Office Excel e para o BrOffice Calc.
Será mostrada a planilha de análise para o candidato Luís Inácio Lula da Silva
no Primeiro Turno:
Figura A1 – Planilha exemplificando a aplicação da Lei de Newcomb-Benford para o
Segundo Dígito nos votos de Luís Inácio Lula da Silva no Primeiro Turno
Na coluna A, abaixo do nome Dados, tem-se os votos de cada uma das 3034
zonas eleitorais distribuídas pelo Brasil e exterior, coletadas através do site do TSE.
51
Na coluna B, selecionam-se os dois dígitos mais significativos, formando uma
dezena. A fórmula da célula B4 é dada por:
=ESQUERDA(ABS(A4);2)
Na coluna C, selecionam-se a unidade das células da coluna B. Para a célula
C4, temos:
=SE(A4>=10;DIREITA(B4;1);"")
A condição SE é necessária, pois, se o candidato obtiver uma votação abaixo
de 10 votos, não existirá um segundo dígito significativo.
Na coluna D, distribuem-se as 10 possibilidades de dígitos;
Na coluna E, escreve-se uma função que retorna as quantidades para cada
dígito. Na célula E4, tem-se:
=CONT.SE($C$4:$C$3339;D4)
E14 representa a soma de todas as quantidades de dígitos encontradas:
=SOMA(E4:E13)
Na coluna po, há as proporções observadas para cada dígito:
=E4/$E$14
Na coluna pe, estão as probabilidades para cada dígito, segundo a Lei de
Newcomb-Benford para o Segundo Dígito;
Na coluna H tem-se a diferença entre as colunas po e pe:
=F4-G4
52
n
ppn
ppZ
ee
eo
121
9
1
22
d PEPEPO
Na coluna I, calcula-se o número de casos esperados em relação ao total:
=G4*$E$14
Na coluna J, tem-se o valor do Z-teste. Veja o conteúdo da célula J4:
=SE((1/(2*$F$14))<(ABS(I4));((ABS(I4))-(1/(2*$F$14)))/(RAIZ((H4*(1-H4))/$F$14));((ABS(I4)))/(RAIZ((H4*(1-H4))/$F$14)))
Os passos mostrados até aqui, demonstram o cálculo do Z-teste. Para se
calcular o Z-teste para todos os dígitos, repita as funções até a coluna J para cada
dígito.
Para o cálculo do teste Qui-quadrado, soma-se a contribuição de cada dígito
como se segue.
Na célula M4, temos:
=POTÊNCIA((E4-I4);2)/I4
Na célula M14, tem-se a soma geral para o qui-quadrado:
=SOMA(M5:M13)
Conclui-se, assim, este breve tutorial que poderá ajudar aqueles interessados
que possuam conhecimentos básicos em planilhas eletrônicas.
53
APÊNDICE B – TABELAS DA ANÁLISE PARA O 1° DÍGITO
Tabela B1 - Análise dos votos de Ana Maria Teixeira Rangel no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado (χ2
c = 15,507)
1 809 0,266821 0,30103 -0,03421 912,7229 4,086745 11,78720196 2 544 0,17942 0,176091 0,003328 533,9087 0,457304 0,190733711 3 401 0,132256 0,124939 0,007317 378,8142 1,191083 1,299337421 4 338 0,111478 0,09691 0,014568 293,8312 2,680756 6,639481259 5 251 0,082784 0,079181 0,003602 240,0775 0,700983 0,496923522 6 210 0,069261 0,066947 0,002314 202,9827 0,473573 0,242596943 7 197 0,064974 0,057992 0,006982 175,8316 1,605948 2,54847201 8 151 0,049802 0,051153 -0,00135 155,0944 0,296303 0,108092231 9 131 0,043206 0,045757 -0,00255 138,7367 0,62895 0,431440982 3032 1 3032 23,74428003
Tabela B2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado (χ2
c = 15,507)
1 1019 0,33586 0,30103 0,03483 913,325 4,162656 12,22697736 2 589 0,194133 0,176091 0,018042 534,2609 2,585213 5,608442193 3 361 0,118985 0,124939 -0,00595 379,0641 0,964386 0,860837669 4 264 0,087014 0,09691 -0,0099 294,025 1,811891 3,066063957 5 227 0,074819 0,079181 -0,00436 240,2359 0,856295 0,729237645 6 174 0,05735 0,066947 -0,0096 203,1166 2,078699 4,173830298 7 143 0,047132 0,057992 -0,01086 175,9476 2,520364 6,169691332 8 144 0,047462 0,051153 -0,00369 155,1968 0,88148 0,807795766 9 113 0,037245 0,045757 -0,00851 138,8282 2,200577 4,805199162 3034 1 3034 38,44807538
Tabela B3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 897 0,295649 0,30103 -0,00538 913,325 0,626328 0,291797385 2 460 0,151615 0,176091 -0,02448 534,2609 3,515684 10,32207017 3 383 0,126236 0,124939 0,001297 379,0641 0,188652 0,040866693 4 273 0,08998 0,09691 -0,00693 294,025 1,259578 1,503442879 5 248 0,08174 0,079181 0,002559 240,2359 0,4884 0,250925198 6 234 0,077126 0,066947 0,010179 203,1166 2,207044 4,695761308 7 179 0,058998 0,057992 0,001006 175,9476 0,19826 0,052955244 8 185 0,060976 0,051153 0,009823 155,1968 2,414773 5,723273894 9 175 0,05768 0,045757 0,011922 138,8282 3,099249 9,424576273 3034 1 3034 32,30566905
54
Tabela B4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 708 0,233355 0,30103 -0,06767 913,325 8,106643 46,15920742 2 495 0,163151 0,176091 -0,01294 534,2609 1,84747 2,885138617 3 416 0,137113 0,124939 0,012174 379,0641 2,000569 3,599018285 4 340 0,112063 0,09691 0,015153 294,025 2,790714 7,188853535 5 314 0,103494 0,079181 0,024312 240,2359 4,925895 22,64916427 6 228 0,075148 0,066947 0,008202 203,1166 1,771206 3,048425003 7 215 0,070864 0,057992 0,012872 175,9476 2,994559 8,667880653 8 181 0,059657 0,051153 0,008505 155,1968 2,085147 4,290086854 9 137 0,045155 0,045757 -0,0006 138,8282 0,115399 0,024075879 3034 1 3034 98,51185052
Tabela B5 - Análise dos Votos de José Maria Eymael no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 806 0,277357 0,30103 -0,02367 874,7932 2,76182 5,409850073 2 465 0,160014 0,176091 -0,01608 511,7212 2,251049 4,265741626 3 379 0,13042 0,124939 0,005481 363,072 0,865556 0,698765553 4 308 0,105988 0,09691 0,009078 281,6205 1,622775 2,470978291 5 291 0,100138 0,079181 0,020956 230,1007 4,149405 16,11783276 6 254 0,087405 0,066947 0,020459 194,5474 4,375597 18,16840352 7 161 0,055403 0,057992 -0,00259 168,5246 0,557523 0,335972164 8 144 0,049553 0,051153 -0,0016 148,6492 0,349372 0,14541173 9 98 0,033723 0,045757 -0,01203 132,9713 3,060194 9,197397135 2906 1 2906 56,81035286
Tabela B6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 889 0,296531 0,30103 -0,0045 902,4879 0,517118 0,20158073 2 554 0,18479 0,176091 0,008699 527,9216 1,226448 1,288227708 3 377 0,125751 0,124939 0,000812 374,5663 0,106807 0,015812255 4 296 0,098732 0,09691 0,001822 290,5362 0,306441 0,102751054 5 264 0,088059 0,079181 0,008877 237,3854 1,766321 2,983916879 6 195 0,065043 0,066947 -0,0019 200,7065 0,380461 0,162246188 7 153 0,051034 0,057992 -0,00696 173,8599 1,590918 2,502783812 8 129 0,043029 0,051153 -0,00812 153,3553 1,977592 3,868004219 9 141 0,047031 0,045757 0,001274 137,181 0,290093 0,10632009 2998 1 2998 11,23164293
55
Tabela B7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 939 0,309492 0,30103 0,008462 913,325 0,996386 0,721764179 2 513 0,169084 0,176091 -0,00701 534,2609 0,989531 0,846075455 3 362 0,119314 0,124939 -0,00562 379,0641 0,90948 0,768166664 4 300 0,098879 0,09691 0,001969 294,025 0,335991 0,121421215 5 227 0,074819 0,079181 -0,00436 240,2359 0,856295 0,729237645 6 204 0,067238 0,066947 0,000291 203,1166 0,027853 0,003842457 7 175 0,05768 0,057992 -0,00031 175,9476 0,034765 0,005103131 8 162 0,053395 0,051153 0,002242 155,1968 0,519427 0,298228973 9 152 0,050099 0,045757 0,004341 138,8282 1,100954 1,249714308 3034 1 3034 4,743554027
Tabela B8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 846 0,27884 0,30103 -0,02219 913,325 2,644826 4,962807886 2 499 0,164469 0,176091 -0,01162 534,2609 1,656817 2,327195764 3 379 0,124918 0,124939 -2,1E-05 379,0641 0,003521 1,08484E-05 4 292 0,096243 0,09691 -0,00067 294,025 0,093585 0,013946236 5 260 0,085695 0,079181 0,006514 240,2359 1,295217 1,625983576 6 222 0,073171 0,066947 0,006224 203,1166 1,335368 1,755564965 7 188 0,061964 0,057992 0,003972 175,9476 0,897335 0,825593331 8 193 0,063612 0,051153 0,01246 155,1968 3,074023 9,208217615 9 155 0,051088 0,045757 0,00533 138,8282 1,361601 1,883811884 3034 1 3034 22,60313211
Tabela B9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno
Dígitos Obsev. po pe (po - pe) Esperad. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 15,507)
1 899 0,296309 0,30103 -0,00472 913,325 0,547171 0,224679955 2 581 0,191496 0,176091 0,015405 534,2609 2,203907 4,088911284 3 334 0,110086 0,124939 -0,01485 379,0641 2,446864 5,357340319 4 302 0,099539 0,09691 0,002629 294,025 0,458727 0,216311392 5 244 0,080422 0,079181 0,001241 240,2359 0,219461 0,058977218 6 208 0,068556 0,066947 0,00161 203,1166 0,318412 0,117410362 7 181 0,059657 0,057992 0,001665 175,9476 0,35361 0,145083438 8 166 0,054713 0,051153 0,003561 155,1968 0,849053 0,75201408 9 119 0,039222 0,045757 -0,00654 138,8282 1,679282 2,83197856 3034 1 3034 13,79270661
56
APÊNDICE C – GRÁFICOS DA ANÁLISE PARA O 1° DÍGITO
Ana Maria Teixeira Rangel Cristovam Ricardo Cavalcanti Buarque
Geraldo José Rodrigues Alckmin Filho Heloísa Helena Lima de Moraes Carvalho
José Maria Eymael Luciano Caldas Bivar
Luís Inácio Lula da Silva
Gráfico C1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Primeiro Dígito
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
200
400
600
800
1000
1200
1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
Observadoesperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
Observadoesperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
57
Geraldo José Rodrigues Alckmin Filho Luís Inácio Lula da Silva Gráfico C2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da
Análise da Lei de Newcomb-Benford para o Primeiro Dígito
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
100
200
300
400
500
600
700
800
900
1000
1 2 3 4 5 6 7 8 9
ObservadoEsperado
58
0
0,2
0,4
0,6
0,8
1
1,2
1 2 3 4 5 6 7
P-valorFDR
APÊNDICE D – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O PRIMEIRO DÍGITO
D.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno
No Primeiro Turno existem 7 candidatos. Assim, foram realizados 7 testes de
hipóteses para a estatística Qui-quadrado. Desta forma, m = 7 para a distribuição χ2
com 8 graus de liberdade, cujo valor crítico individual é de χ2c = 16,9.
Utilizando o critério FDR, tem-se:
Tabela D1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno
χ2i Pi m i q* FDR Compara
0,11 3,91965E-08 7 1 0,05 0,00714 -0,00714 4,74 0,143641341 7 2 0,05 0,01429 0,12936
23,74 0,995268145 7 3 0,05 0,02143 0,97384 32,31 0,99982401 7 4 0,05 0,02857 0,97125 38,45 0,999985529 7 5 0,05 0,03571 0,96427 56,81 0,999999995 7 6 0,05 0,04286 0,95714 98,51 1 7 7 0,05 0,05000 0,95000
A partir dos dados da tabela anterior, pode-se montar o seguinte gráfico:
Gráfico D1 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Primeiro Turno
59
0025,02
05,01
FDRP
0
0,2
0,4
0,6
0,8
1
1,2
1 2
P-valorFDR
Diretamente da tabela, para i = 1, encontra-se o valor de 0,00714 para PFDR.
Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 21,00.
D.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno
Utilizando o mesmo critério para o Segundo Turno, com apenas 2 candidatos,
tem-se m = 2.
Tabela D2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno
χ2i Pi m i q* FDR Compara
13,79 0,870006 2 1 0,05 0,02500 0,84501 22,6 0,99284 2 2 0,05 0,05000 0,94284
Gráfico D2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno
Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,
utiliza-se o critério de Bonferroni para i = 1.
(7)
Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 17,53.
60
D.3 Critério FDR para o Z-Teste no Primeiro Turno
Para o Z-teste, existem 7 (candidatos ao Primeiro Turno) x 9 (possíveis
dígitos) = 63. Assim, m = 63. Tem-se a tabela e o gráfico correspondente:
Tabela D3 - Critério FDR para o Teste Z no Primeiro Turno
Zi Pi m i q* FDR Compara
8,11 4,44089E-16 63 1 0,05 0,00079 -0,00079 4,93 8,22296E-07 63 2 0,05 0,00159 -0,00159 4,38 1,18679E-05 63 3 0,05 0,00238 -0,00237 4,16 3,18248E-05 63 4 0,05 0,00317 -0,00314 4,15 3,32475E-05 63 5 0,05 0,00397 -0,00394 4,09 4,31373E-05 63 6 0,05 0,00476 -0,00472 3,52 0,000431547 63 7 0,05 0,00556 -0,00512 3,1 0,001935206 63 8 0,05 0,00635 -0,00441 3,06 0,00221337 63 9 0,05 0,00714 -0,00493 2,99 0,002789774 63 10 0,05 0,00794 -0,00515 2,79 0,005270804 63 11 0,05 0,00873 -0,00346 2,76 0,005780136 63 12 0,05 0,00952 -0,00374 2,68 0,007362216 63 13 0,05 0,01032 -0,00296 2,59 0,009597593 63 14 0,05 0,01111 -0,00151 2,52 0,011735483 63 15 0,05 0,01190 -0,00017 2,41 0,015952521 63 16 0,05 0,01270 0,00325 2,25 0,024448945 63 17 0,05 0,01349 0,01096
...
...
...
...
...
...
...
0,03 0,976067053 63 63 0,05 0,05000 0,92607
Gráfico D3 - Comparação entre os valores de P e FDR para o Teste Z no
Primeiro Turno
0
0,2
0,4
0,6
0,8
1
1,2
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61
P-valorFDR
61
Ampliando o gráfico anterior, pode-se visualizar o ponto de intersecção.
Gráfico D4 - Detalhamento da intersecção entre as curvas dos valores de P e FDR para o Teste Z no Primeiro Turno
Diretamente da tabela, tem-se para i = 15 o valor de 0,0119 para PFDR.
Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 2,52.
D.4 Critério FDR para o Z-Teste no Segundo Turno
Para o Segundo Turno, m = 18, pois existem 2 (candidatos) x 9 (possíveis
dígitos).
Tabela D4 - Critério FDR para o Teste Z no Segundo Turno
Zi Pi m i q* FDR Compara
3,07 0,002141 18 1 0,05 0,00278 -0,00064 2,64 0,008291 18 2 0,05 0,00556 0,00274 2,45 0,014286 18 3 0,05 0,00833 0,00595
...
...
...
...
...
...
...
0,09 0,928287 18 17 0,05 0,04722 0,88106 0 1 18 18 0,05 0,05000 0,95000
Novamente, podem-se ver esses valores em um gráfico:
0
0,002
0,004
0,006
0,008
0,01
0,012
0,014
0,016
0,018
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
P-valorFDR
62
0
0,2
0,4
0,6
0,8
1
1,2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
P-valorFDR
Gráfico D5 - Comparação entre os valores de P e FDR para o Teste Z no
Segundo Turno
Ampliando o trecho de 1 a 4, tem-se:
0
0,005
0,01
0,015
0,02
0,025
0,03
1 2 3 4
P-valorFDR
Gráfico D6 - Detalhamento da intersecção entre as curvas dos valores de
P e FDR para o Teste Z no Segundo Turno
Diretamente da tabela, tem-se para i = 15 o valor de 0,00278 para PFDR.
Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 2,99.
63
APÊNDICE E – TABELAS DA ANÁLISE PARA O 2° DÍGITO
Tabela E1 - Análise dos Votos de Ana Maria Teixeira Rangel no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 321 0,116 0,1197 -0,0037 331,272 0,572242 0,318524784 1 331 0,1196 0,1139 0,00569 315,248 0,912562 0,787100191 2 301 0,1087 0,1088 -8E-05 301,218 0,0133 0,000157641 3 268 0,0968 0,1043 -0,0075 288,784 1,261239 1,495870896 4 252 0,091 0,1003 -0,0093 277,653 1,591452 2,370158047 5 275 0,0993 0,0967 0,00267 267,603 0,443629 0,204488657 6 287 0,1037 0,0934 0,01031 258,461 1,831668 3,151184669 7 254 0,0918 0,0904 0,00141 250,094 0,225796 0,060994764 8 230 0,0831 0,0876 -0,0045 242,394 0,799768 0,633716269 9 249 0,09 0,085 0,00496 235,273 0,90152 0,800941201 2768 1 2768 9,823137
Tabela E2 - Análise dos Votos de Cristovam Ricardo Cavalcanti Buarque no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 327 0,1078 0,1197 -0,0119 363,107 1,991574 3,590425549 1 354 0,1167 0,1139 0,00279 345,543 0,454756 0,20700216 2 328 0,1081 0,1088 -0,0007 330,164 0,097033 0,014189138 3 311 0,1025 0,1043 -0,0018 316,536 0,299082 0,096816924 4 297 0,0979 0,1003 -0,0024 304,335 0,413068 0,17679027 5 293 0,0966 0,0967 -0,0001 293,319 0,019581 0,00034635 6 311 0,1025 0,0934 0,00913 283,299 1,697264 2,708616697 7 271 0,0893 0,0904 -0,001 274,128 0,166418 0,035691292 8 265 0,0873 0,0876 -0,0002 265,688 0,012045 0,001779213 9 277 0,0913 0,085 0,0063 257,882 1,212027 1,417312052 3034 1 3034 8,24897
Tabela E3 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 343 0,1131 0,1197 -0,0066 363,107 1,096658 1,11341168 1 355 0,117 0,1139 0,00312 345,543 0,511904 0,258847732 2 345 0,1137 0,1088 0,00489 330,164 0,835733 0,666619958 3 314 0,1035 0,1043 -0,0008 316,536 0,120912 0,020315916 4 279 0,092 0,1003 -0,0084 304,335 1,500869 2,109078436 5 309 0,1018 0,0967 0,00517 293,319 0,932646 0,838344413 6 280 0,0923 0,0934 -0,0011 283,299 0,174646 0,038415463 7 280 0,0923 0,0904 0,00194 274,128 0,340195 0,125784853 8 277 0,0913 0,0876 0,00373 265,688 0,694447 0,481662377 9 252 0,0831 0,085 -0,0019 257,882 0,350364 0,134160315 3034 1 3034 5,786641
64
Tabela E4 - Análise dos Votos de Heloísa Helena Lima de Moraes Carvalho no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 374 0,1233 0,1197 0,00359 363,107 0,581309 0,326789734 1 341 0,1124 0,1139 -0,0015 345,543 0,231027 0,059717609 2 325 0,1071 0,1088 -0,0017 330,164 0,271926 0,08078192 3 318 0,1048 0,1043 0,00048 316,536 0,057259 0,006772157 4 297 0,0979 0,1003 -0,0024 304,335 0,413068 0,17679027 5 301 0,0992 0,0967 0,00253 293,319 0,441174 0,201152703 6 281 0,0926 0,0934 -0,0008 283,299 0,112249 0,018655783 7 256 0,0844 0,0904 -0,006 274,128 1,116318 1,198790787 8 278 0,0916 0,0876 0,00406 265,688 0,758673 0,570582297 9 263 0,0867 0,085 0,00169 257,882 0,300632 0,10157465 3034 1 3034 2,741608
Tabela E5 - Análise dos Votos de José Maria Eymael no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 204 0,1355 0,1197 0,01587 180,117 1,85693411 3,166733002 1 171 0,1136 0,1139 -0,0003 171,405 0,03283045 0,000955084 2 169 0,1123 0,1088 0,00347 163,776 0,3909932 0,166608033 3 150 0,0997 0,1043 -0,0047 157,016 0,54945765 0,313497309 4 157 0,1043 0,1003 0,00401 150,964 0,47503426 0,241350334 5 146 0,097 0,0967 0,00033 145,499 0,00006630 0,00172345 6 158 0,105 0,0934 0,01161 140,529 1,50352676 2,172054747 7 124 0,0824 0,0904 -0,008 135,98 1,03218704 1,055409127 8 113 0,0751 0,0876 -0,0125 131,793 1,66815908 2,679766207 9 113 0,0751 0,085 -0,0099 127,921 1,33294951 1,74042306 1505 1 1505 11,53852
Tabela E6 - Análise dos Votos de Luciano Caldas Bivar no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 232 0,1273 0,1197 0,00758 218,175 0,96146607 0,876002647 1 206 0,113 0,1139 -0,0009 207,622 0,08269524 0,012666195 2 223 0,1223 0,1088 0,0135 198,382 1,81390939 3,055051481 3 198 0,1086 0,1043 0,00428 190,193 0,55986143 0,320477738 4 180 0,0987 0,1003 -0,0016 182,862 0,1841384 0,044789008 5 205 0,1125 0,0967 0,01577 176,243 2,23952163 4,692327512 6 156 0,0856 0,0934 -0,0078 170,222 1,10458722 1,188267032 7 154 0,0845 0,0904 -0,0059 164,712 0,83425374 0,696611282 8 144 0,079 0,0876 -0,0086 159,64 1,25447186 1,532296278 9 125 0,0686 0,085 -0,0164 154,95 2,47332188 5,789040661 1823 1 1823 18,20753
65
Tabela E7 - Análise dos Votos de Luís Inácio Lula da Silva no Primeiro Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 377 0,1243 0,1197 0,00458 363,107 0,74910615 0,531574039 1 347 0,1144 0,1139 0,00048 345,543 0,05471555 0,006147119 2 323 0,1065 0,1088 -0,0024 330,164 0,3885218 0,155465047 3 329 0,1084 0,1043 0,00411 316,536 0,71055051 0,490794729 4 295 0,0972 0,1003 -0,0031 304,335 0,53393436 0,286341696 5 321 0,1058 0,0967 0,00912 293,319 1,66985327 2,612354521 6 297 0,0979 0,0934 0,00452 283,299 0,82370583 0,662617412 7 260 0,0857 0,0904 -0,0047 274,128 0,8630118 0,728121924 8 234 0,0771 0,0876 -0,0104 265,688 2,00306847 3,779252665 9 251 0,0827 0,085 -0,0023 257,882 0,41546346 0,183655564 3034 1 3034 9,436325
Tabela E8 - Análise dos Votos de Geraldo José Rodrigues Alckmin Filho no Segundo Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 366 0,1206 0,1197 0,00095 363,107 0,13385141 0,023051124 1 341 0,1124 0,1139 -0,0015 345,543 0,23102734 0,059717609 2 347 0,1144 0,1088 0,00555 330,164 0,95232866 0,858470693 3 316 0,1042 0,1043 -0,0002 316,536 0,00213126 0,000907238 4 294 0,0969 0,1003 -0,0034 304,335 0,59436778 0,350974965 5 313 0,1032 0,0967 0,00649 293,319 1,17838147 1,320584777 6 264 0,087 0,0934 -0,0064 283,299 1,17299771 1,314686871 7 277 0,0913 0,0904 0,00095 274,128 0,15021495 0,030090895 8 256 0,0844 0,0876 -0,0032 265,688 0,59008422 0,353228759 9 260 0,0857 0,085 0,0007 257,882 0,10533336 0,017395817 3034 1 3034 4,329109
Tabela E9 - Análise dos Votos de Luís Inácio Lula da Silva no Segundo Turno
Dígitos Observ. po pe (po - pe) Esper. Z-teste
(Zc = 1,96) Qui-quadrado
(χ2c = 16,9)
0 401 0,1322 0,1197 0,01249 363,107 2,09148014 3,954446897 1 370 0,122 0,1139 0,00806 345,543 1,36913283 1,731091173 2 321 0,1058 0,1088 -0,003 330,164 0,50511749 0,254378525 3 306 0,1009 0,1043 -0,0035 316,536 0,59603273 0,350686584 4 283 0,0933 0,1003 -0,007 304,335 1,2591353 1,495673363 5 295 0,0972 0,0967 0,00055 293,319 0,0725699 0,009636811 6 281 0,0926 0,0934 -0,0008 283,299 0,11224896 0,018655783 7 282 0,0929 0,0904 0,00259 274,128 0,46684831 0,226060143 8 228 0,0751 0,0876 -0,0124 265,688 2,38842781 5,345944527 9 267 0,088 0,085 0,00301 257,882 0,56103058 0,322389901 3034 1 3034 13,70896
66
APÊNDICE F – GRÁFICOS DA ANÁLISE PARA O 2° DÍGITO
Ana Maria Teixeira Rangel Cristovam Ricardo Cavalcanti Buarque
Geraldo José Rodrigues Alckmin Filho Heloísa Helena Lima de Moraes Carvalho
José Maria Eymael Luciano Caldas Bivar
Luís Inácio Lula da Silva
Gráfico F1 - Distribuição de Probabilidades dos Candidatos no Primeiro Turno através da Análise da Lei de Newcomb-Benford para o Segundo Dígito
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
0 1 2 3 4 5 6 7 8 9
Observadoesperado
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
300
350
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
67
Geraldo José Rodrigues Alckmin Filho Luís Inácio Lula da Silva Gráfico F2 - Distribuição de Probabilidades dos Candidatos no Segundo Turno através da
Análise da Lei de Newcomb-Benford para o Segundo Dígito
0
50
100
150
200
250
300
350
400
450
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
0
50
100
150
200
250
300
350
400
0 1 2 3 4 5 6 7 8 9
ObservadoEsperado
68
0
0,2
0,4
0,6
0,8
1
1,2
1 2 3 4 5 6 7
P-valorFDR
APÊNDICE G – APLICAÇÃO DO CRITÉRIO FDR PARA A ANÁLISE DA LEI DE NEWCOMB-BENFORD PARA O SEGUNDO DÍGITO
G.1 Critério FDR para o Teste Qui-quadrado no Primeiro Turno
No Primeiro Turno existem 7 candidatos, correspondendo a 7 testes de
hipóteses baseados na estatística Qui-quadrado. Assim m = 7 para a distribuição χ2
com 9 graus de liberdade, cujo valor crítico individual é de 16,9.
Utilizando o critério para o cálculo do FDR, tem-se.
Tabela G1 - Critério FDR para o Teste Qui-quadrado no Primeiro Turno
χ2i Pi m i Q* FDR Compara
2,742 0,02634799 7 1 0,05 0,00714 0,01921 5,787 0,238967527 7 2 0,05 0,01429 0,22468 8,249 0,490738966 7 3 0,05 0,02143 0,46931 9,436 0,601961426 7 4 0,05 0,02857 0,57339 9,823 0,634996376 7 5 0,05 0,03571 0,59928 11,539 0,759437278 7 6 0,05 0,04286 0,71658 18,208 0,967164364 7 7 0,05 0,05000 0,91716
Da tabela, tem-se:
Gráfico G1 - Comparação entre os valores de P e FDR para o Teste Qui-
quadrado no Primeiro Turno
Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,
deverá ser utilizado o critério de Bonferroni para i = 1.
69
007143,07
05,01
FDRP
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1 2
P-valorFDR
Assim:
(8)
Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 22,61.
No primeiro turno, apenas os votos de Luciano Caldas Bivar, obteve valor de
χ2 superior a 16,9. Porém, nenhum ultrapassou o valor crítico do conjunto 22,61.
G.2 Critério FDR para o Teste Qui-quadrado no Segundo Turno
Para o segundo turno tem-se:
Tabela G2 - Critério FDR para o Teste Qui-quadrado no Segundo Turno
χ2i Pi m i Q* FDR Compara
4,33 0,111618 2 1 0,05 0,02500 0,08662 13,71 0,866979 2 2 0,05 0,05000 0,81698
Segue o gráfico correspondente:
Gráfico G2 - Comparação entre os valores de P e FDR para o Teste Qui-quadrado no Segundo Turno
Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,
utiliza-se, novamente, o critério de Bonferroni para i = 1.
70
0025,02
05,01
FDRP
000714,070
05,01
FDRP
(9)
Fazendo a conversão, encontra-se o novo valor crítico geral χ2FDR = 19,02.
Para o segundo turno, nenhum valor de χ2 ultrapassou o valor crítico individual
de 16,9 nem o valor geral de 19,02. O valor de χ2 mais alto encontrado foi de 13,709
referente à soma dos votos de Luís Inácio Lula da Silva.
G.3 Critério FDR para o Z-Teste no Primeiro Turno
Da mesma forma, encontraremos o valor PFDR e o novo valor limite para o Z-
teste.
Nesse caso, a quantidade de testes realizados é maior, m = 70, isto é, dez
testes para cada um dos sete candidatos.
Tem-se então:
Tabela G3 - Critério FDR para o Teste Z no Primeiro Turno
Zi Pi m i Q* FDR Compara
2,47 0,013511305 70 1 0,05 0,00071 0,01280 2,24 0,025090923 70 2 0,05 0,00143 0,02366
2 0,045500264 70 3 0,05 0,00214 0,04336
...
...
...
...
...
...
...
0,01 0,992021287 70 69 0,05 0,04929 0,94274 0 1 70 70 0,05 0,05000 0,95000
Não houve intersecção. Assim, não se faz visualizar a tabela através de um
gráfico.
Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,
utiliza-se o critério de Bonferroni para i = 1.
(10)
71
Fazendo a conversão, encontra-se o novo valor crítico geral ZFDR = 3,38.
Para o primeiro turno, 4 valores do teste Z, entre os 70 calculados,
ultrapassaram o valor crítico individual Zc = 1,96. Porém, entre esses, nenhum
ultrapassou o valor limite geral de 3,38. O maior Z encontrado foi de 2,47 para o
dígito 9 do candidato Luciano Caldas Bivar.
G.4 Critério FDR para o Z-Teste no Segundo Turno
Utilizando o mesmo critério para o segundo turno, tem-se:
Tabela G4 - Critério FDR para o Teste Z no Segundo Turno
Zi Pi m i q* FDR Compara
2,39 0,016848 20 1 0,05 0,00250 0,01435 2,09 0,036618 20 2 0,05 0,00500 0,03162 1,37 0,170687 20 3 0,05 0,00750 0,16319 1,26 0,207669 20 4 0,05 0,01000 0,19767 1,18 0,238 20 5 0,05 0,01250 0,22550 1,17 0,242001 20 6 0,05 0,01500 0,22700 0,95 0,342112 20 7 0,05 0,01750 0,32461 0,6 0,548506 20 8 0,05 0,02000 0,52851
0,59 0,555191 20 9 0,05 0,02250 0,53269 0,59 0,555191 20 10 0,05 0,02500 0,53019 0,56 0,575479 20 11 0,05 0,02750 0,54798 0,51 0,610051 20 12 0,05 0,03000 0,58005 0,47 0,638355 20 13 0,05 0,03250 0,60586 0,23 0,818092 20 14 0,05 0,03500 0,78309 0,15 0,880765 20 15 0,05 0,03750 0,84326 0,13 0,896566 20 16 0,05 0,04000 0,85657 0,11 0,912409 20 17 0,05 0,04250 0,86991 0,11 0,912409 20 18 0,05 0,04500 0,86741 0,07 0,944194 20 19 0,05 0,04750 0,89669
0 1 20 20 0,05 0,05000 0,95000
Como nenhum Pi ficou abaixo dos valores calculados na curva do FDR,
utiliza-se, novamente, o critério de Bonferroni para i = 1.