Da aplicação da Lei de Newcomb Benford em processos eleitorais eletrônicos

Cenário Inicial

Considerando a necessidade de aprimorar o debate democrático sobre as eleições eletrônicas no Brasil, é importante consignar algumas reflexões. Antes, porém, é de se registrar a necessidade do esclarecimento do assunto por todos os meios possíveis. Todas as formas de estudo do tema, que possam trazer algum tipo de contribuição, sempre serão (ou deveriam ser) bem recebidas. Esse é o meu pensamento.

Decidimos fazer um estudo com a utilização da Lei (Matemática) de Newcomb Benford, por algumas razões:

>> Ela é relativamente fácil de ser aplicada;

>> Apresenta resultados conclusivos muito rapidamente;

>> Ela dá poder às minorias e ao pequeno cidadão, frente às grandes organizações, aos grandes conglomerados e grandes tribos políticas;

>> Ela é aceita pela justiça de outros países, como meio de prova de fraudes contábeis.

Nesse sentido, essa Lei está em sintonia com alguns dos mais intensos princípios da sociedade da informação, que são a desmaterialização e a desintermediação das organizações, pois uma única pessoa, com alguns poucos insumos, pode colocá-la em funcionamento, sem a necessidade de grandes equipes ou grandes estruturas e respectivos custos. E essa Lei coloca o cidadão frente a frente com a informação primária, sem intermediários.

A Lei de Newcomb Benford

Sob o aspecto técnico, a Lei de Newcomb Benford (LNB), necessário esclarecer, se aplica a qualquer série histórica de números. Veja o lúcido comentário que o usuário Prometheus registrou em nosso hangout:

Prometheus Compartilhado no Google+ · 1 semana atrás

O ano foi 1938 e seu nome era Frank Benford. Benford era físico e ficou intrigado com uma observação que ele tinha constatado em seus conjuntos de dados. Ele observou que apesar de seus dados serem aparentemente aleatórios, os primeiros dígitos tinham uma distribuição muito estranha. Por exemplo, se pensarmos na sucessão de potências de 2, o que será que pode-se tirar de comum? 2 4 8 16 32 64 128 256 512 1024… Considere agora apenas o primeiro dígito de cada número: 2 4 8 1 3 6 1 2 5 1…Observe agora quantas vezes apareceu o número 1? E o número 2? E os demais? Pois foi o que Frank Benford fez em seus dados. Ele observou que mesmo em tabelas de números aleatórios, o número 1 sempre aparecia mais que o número 2, o número 2 mais que o número 3 e assim até o dígito 9. Pode-se pensar que é um absurdo, pois na conhecida distribuição de probabilidade uniforme, todo número têm a mesma chance de ser escolhido com a probabilidade 1/(tamanho do intervalo). Mas incrivelmente, mesmo nessa distribuição, retirando-se apenas o primeiro digítio a “Lei Benford” é obedecida.

Então, Você, leitor ou leitora, é quem decide: Acredita nos seus próprios olhos, ou aceita as imposições de terceiros.

“Mas a LNB é absoluta?” Claro que não. A leitura do sumário executivo que produzimos (referência em anexo) mostra isso claramente, existem situações nas quais ela não se aplica. Por exemplo, em ítens com concentrações muito próximas de um ponto médio (altura dos seres humanos). Outro exemplo – no caso dos dados eleitorais – está nas seções eleitorais, pois elas têm um número máximo absoluto: 400 (Resolução do TSE nº 14.250/88). Então não é necessário ser sequer um jumento, nem mesmo uma ameba, para saber que esse tipo de universo – seções eleitorais – não pode ser examinado de pronto, pois o primeiro dígito nunca vai ser maior do que 4. É surpreendente, estupefante, que supostos “especialistas” desconheçam um aspecto tão básico e tão primário desse tipo de análise, para, afoitamente, dizer que “não se aplica”, sem antes estudar o assunto. E, por essa razão, o estudo do sumário executivo (work in progress, diga-se de passagem), não aplicou a LNB diretamente no universo das seções eleitorais.

A escolha foi por identificar outros universos nos quais esses números (seções eleitorais) desaguam, formando outras séries numéricas que se recompõe. O gráfico (A2) mostra a curva derivada dos informes totalizatórios:

Isso não é só uma coincidência. A ciência forense mostra que quanto mais o olhar é dirigido para o cenário montado pelo suposto fraudador, menores são as chances de encontrar erros. Por isso foram escolhidos dois universos de dados secundários e derivados: os informes totalizatórios e os resultados consolidados dos municípios. Provavelmente isso explique o tom nervoso de certas críticas “chapa-branca”: Geralmente é nesse momento (quando percebem a mudança de foco) que os fraudadores entram em polvorosa.

Monopólio da crítica

Nós te perguntamos se Você, que está lendo este texto, identifica, por sua própria conta, algum tipo de característica especial, algum tipo de “foro privilegiado”, de natureza matemática, que nos diga que os números eleitorais são diferentes, ou especiais, em relação às constantes da físicas, à tabela de expansão de gases, às estatísticas esportivas, às tabelas de números aleatórios, e até mesmo à distribuição de probabilidade uniforme e, por alguma razão excepcional, ficariam os dados eleitorais proibidos de serem examinados pela LNB? Historicamente, as “carteiradas” que confrontam a lógica podem até ganhar a discussão – pela força hegemônica ou pela violência simbólica – mas, com o passar da tempo, acabam caindo no ridículo. Assim foi com a ciência do nazismo. Assim foi com os julgadores de Galileu e Copérnico.

Precisamos, portanto, redobrar a atenção para a tentativa de se criar no Brasil mais um tipo de monopólio exclusivista: O Monopólio da Crítica Eleitoral.

Diversidade de opiniões

Sem esquecer o ponto mais importante deste texto: Ciência não combina com verdades absolutas. Você pode não concordar com certas teorias, e isso é benéfico, mas convém respeitar a diversidade de opiniões. No final das contas, com tranquilidade e serenidade, com o passar do tempo, essas coisas se esclarecem. Ninguém ganha uma discussão dessas da noite para o dia, na base da imposição. O fato é que existem muitas, e boas, referências sobre a aplicabilidade da LNB em processos eleitorais, dentre as quais citamos as seguintes:

>> Carlos Orsi, no Estado de S.Paulo: http://blogs.estadao.com.br/carlos-orsi/2010/02/12/eleicao-corrupcao-matematica/

>> Salomon Mizrahi, no site Academia.edu: http://www.academia.edu/3596147/As_%C3%BAltimas_elei%C3%A7%C3%B5es_e_a_lei_de_Benford_ou_Lei_do_Primeiro_D%C3%ADgito_

>> Francisco Alves Júnior, em sua monografia de especialização:
https://franciscoalvesjunior.wordpress.com/2010/08/24/evidencias-empiricas-acerca-da-aplicacao-da-lei-de/

Todos esses trabalhos foram escritos antes desse processo eleitoral (2014), o que reforça o seu aspecto de independência e isenção. No cenário internacional, existem várias outras referências, a favor e contra a aplicação da LNB, e escolhemos a referência do Prof. Walter Mebane, da Universidade de Michigan, seguramente o pesquisador internacional que mais estudou esse assunto nos últimos anos, e realizou testes em várias eleições, incluindo Rússia e Irã. Dentre os seus trabalhos, destacam-se os seguintes:

>> Mebane, Walter R., Jr. 2007. Election Forensics: Statistical Interventions in Election Controversies (pdf); (postscript). Prepared for presentation at the 2007 Annual Meeting of the American Political Science Association, Chicago, Aug 30-Sep 2.

>> Mebane, Walter R., Jr. 2007. Statistics for Digits (pdf); (postscript). Prepared for presentation at the 2007 Summer Meeting of the Political Methodology Society, Pennsylvania State University, July 18–21.

>> Mebane, Walter R., Jr. 2007. Election Forensics: Statistics, Recounts and Fraud (pdf); (postscript). Prepared for presentation at the 2007 Annual Meeting of the Midwest Political Science Association, Chicago, IL, April 12–16.

>> Mebane, Walter R., Jr. 2007. Evaluating Voting Systems To Improve and Verify Accuracy (pdf); (postscript). Prepared for presentation at the 2007 Annual Meeting of the American Association for the Advancement of Science, San Francisco, CA, February 16, 2007, and at the Bay Area Methods Meeting, Berkeley, CA, March 1, 2007.

>> Mebane, Walter R., Jr., and David L. Dill. 2007. Factors Associated with the Excessive CD-13 Undervote in the 2006 General Election in Sarasota County, Florida (pdf). Draft of January 18, 2007.

>> Mebane, Walter R., Jr. 2006. Election Forensics: The Second-digit Benford’s Law Test and Recent American Presidential Elections (pdf); (postscript). Prepared for delivery at the Election Fraud Conference, Salt Lake City, Utah, September 29–30, 2006.

>> Mebane, Walter R., Jr. 2006. Election Forensics: Vote Counts and Benford’s Law (pdf); (postscript). Prepared for delivery at the 2006 Summer Meeting of the Political Methodology Society, UC-Davis, July 20-22.

Repare bem, Você não é obrigado a concordar com essas referências. Mas não pode exterminá-las, ou apagá-las da história, visando a atender conveniências momentâneas e interesses transitórios. Aqueles que não acreditam, que delas não façam uso. Existem pessoas que não acreditam no teste de DNA, outras que não acreditam que a humanidade pisou na Lua. Mas o respeito à diversidade de opiniões é questão básica no ambiente de pesquisa. Como comer com talheres, é uma questão de educação.

A respeito do artigo “The Irrelevance of Benford’s Law for Detecting Fraud in Elections“, vale notar que, apesar de sua divulgação ser feita por um projeto da Caltech (juntamente com o MIT), existem autores de outras instituições. O referido paper está classificado na base de dados do Voting Technology Project como “RPEAVT paper”, ou seja, uma publicação que não é de responsabilidade do projeto e nem dos membros do mesmo (“Research papers in this archive represent the research of their authors, and not the Caltech/MIT Voting Technology Project”). O argumento de apelo à autoridade pelo suposto fato do artigo ser de pesquisadores da Caltech não é consistente, mas não implica que a referida pesquisa não tenha valor científico. Na realidade, na época em que os dados das eleições de 2014 estavam sendo avaliados, tal artigo já havia sido analisado, em conjunto com outros insumos. Registre-se a conclusão de número “I” no nosso relatório:

“I) Não há razão plausível para refutar, ab initio, a aplicação da LNB no processo eleitoral brasileiro de 2014. A Terra não é o centro do universo, como ensinou Copernico, e o sistema eleitoral brasileiro não é infalível ou inquestionável. Nenhum sistema eleitoral está acima de falhas ou questionamentos;”

Da aplicabilidade da Lei de Newcomb Benford

A análise das condições objetivas do cenário indicavam (e indicam) a necessidade do exame, em especial considerando o envolvimento de empresas as quais já receberam questionamentos veementes em outros países. Por outro lado, especificamente em relação à empresa Smartmatic, que teve contrato com o TSE para atuação no processo eleitoral, está havendo, nesse momento, uma leva de Ações Populares (judiciais), exatamente em função desses questionamentos e dos detalhes de sua contratação, até agora desconhecidos do grande público.

Mas uma coisa que chama a atenção, em momentos como este, é o surgimento de “hordas”, com discursos irascíveis, sempre com o mesmo estilo, bradando com veemência sobre punições, acusações, desqualificaçãoes, no mais raivoso espírito “Stasi” e “Gestapo”. Logo após a divulgação do nosso estudo, por exemplo, fomos agraciados com dossiês anônimos e reportagens agressivas, contendo ataques pessoais. Em uma delas, conhecido portal jurídico, o jornalista sequer nos ouviu.

Mesmo considerando todos esses aspectos, ainda assim é de se destacar a conclusão final do nosso relatório, cautelosa, mas muito clara:

“A aplicação da LNB no processo eleitoral brasileiro demonstra, em análise preliminar, elevados níveis de inconistência (A1, A2 e A3). As diferenças nas curvas superam os limites frequenciais em quantidade e variedade, o que sugere aplicações mais profundas e auditagens em escala mais ampla. No aspecto técnico, sob o ponto de vista da análise das séries históricas, o resultado eleitoral encontra-se sob a ótica da dúvida.

A exasperação em negar a mera possibilidade de aplicação da LNB sobre os dados eleitorais só faz aumentar mais e mais a nossa curiosidade:

>> Quem quer impedir o exame desses números, e por qual razão?

>> A quem isso interessa?

>> O que há de errado nesses números?

>> Por que eles tem que ser examinados somente por metodologias exclusivistas e “abençoadas” pelo oficialismo?

>> Por qual razão teríamos que aceitar somente um único tipo de questionamento?

***

Veja aqui o sumário executivo:

http://www.scribd.com/doc/256249069/Eleic-o-es-eletro-nicas-2014-no-Brasil#scribd

E aqui os hangouts explicativos sobre o trabalho:

https://www.youtube.com/watch?v=2lqb1w1qA0g&feature=youtu.be

https://www.youtube.com/watch?v=oxntU557Dvk

Referências sobre a criação de sistemas de inteligência

>> Knowledge-Based System Applied on the Previous Consent of Brazilian National Defense Council.

http://www.researchgate.net/researcher/26884323_Hugo_Cesar_Hoeschl/publications/2

http://dl.acm.org/citation.cfm?id=1047811

>> O Estado de S.Paulo: “Brasileiros são destaque em conferência de inteligência artificial”

http://ciencia.estadao.com.br/noticias/geral,brasileiros-sao-destaque-em-conferencia-de-inteligencia-artificial,20030624p73235

>> Revista ComCiência: “Sistema aplica inteligência artificial ao controle de fronteiras”

http://www.comciencia.br/noticias/2003/18jul03/inteligencia_artificial.htm

>> The RR Project – A Framework for Relationship Network Viewing and Management.

http://link.springer.com/chapter/10.1007%2F978-0-387-34749-3_13

>> “Tecnologia permite o monitoramento inteligente de conversas”

http://sedici.unlp.edu.ar/bitstream/handle/10915/24193/Documento_completo.pdf?sequence=1

>> O Estado de S.Paulo: “Pesquisas brasileiras são destaque internacional”

http://ciencia.estadao.com.br/noticias/geral,pesquisas-brasileiras-sao-destaque-internacional,20021111p59746

>> Knowledge Engineering Suite: A Tool to Create Ontologies for an Automatic Knowledge Representation in Intelligent Systems.

http://www.researchgate.net/publication/221643296_Knowledge_Engineering_Suite_A_Tool_to_Create_Ontologies_for_an_Automatic_Knowledge_Representation_in_Intelligent_Systems?ev=auth_pub

>> Professional practice in artificial intelligence – 19th World Computer Congress – Toulouse (Google Books):

https://books.google.com.br/books?id=TyAWAQOhgPcC&pg=PP10&lpg=PP10&dq=rr+hoeschl&source=bl&ots=Ex-SOOdTUl&sig=Z3oYE_-IbJE95qq7v6aDatbZswI&hl=pt-BR&sa=X&ei=8BTVVJ-7Fsq4ggSSsIKYBA&ved=0CCcQ6AEwAjgK#v=onepage&q=rr%20hoeschl&f=false

>> O Estado de S.Paulo: “Sistema brasileiro de inteligência artificial será apresentado na França”

http://ciencia.estadao.com.br/noticias/geral,sistema-brasileiro-de-inteligencia-artificial-sera-apresentado-na-franca,20030107p72621

***

Hugo Cesar Hoeschl é ex-Presidente da Associação Brasileira de Empresas de Processamento de Dados (ABEP). Ex-Presidente do Centro de Informática e Automação de Santa Catarina. Procurador da Fazenda Nacional. Ex-Promotor de Justiça. Mestre em Filosofia e TGD. Especialista em Informática Jurídica. Doutor em Inteligência Aplicada. Pós-doutor em Governo Eletrônico. Criador da metodologia nacional de combate à lavagem de dinheiro dos LAB-LD/CNPq. Obs: Embora exerça função pública, a presente manifestação do autor se dá em caráter pessoal.

Tags: eleições tecnologia e democracia voto eletrônico

Hugo Cesar Hoeschl

Ver outras publicações do autor

Aos leitores

Os artigos publicados nesta página não refletem necessariamente a opinião do Observatório da Imprensa, já que somos um fórum de opiniões. Procuramos publicar os textos recebidos como parte de nosso compromisso com a diversificação das fontes de informação. Como ninguém é dono da verdade, a melhor forma de buscar a objetividade é através do contato com perspectivas e opiniões diferenciadas, o que nos permite neutralizar o discurso do ódio e da intolerância.