Domingo, 19 de Novembro de 2017
ISSN 1519-7670 - Ano 19 - nº966

JORNAL DE DEBATES > ESTATÍSTICA & PREVISÕES

A ciência bêbada

Por Flávio de Carvalho Serpa em 13/07/2010 na edição 598

Quando não estão se saindo bem nas prévias eleitorais, os candidatos costumam desdenhá-las lembrando a famosa frase atribuída ao escritor americano Mark Twain (1835-1910): ‘Existem três tipos de mentiras: as mentiras, as malditas mentiras e as estatísticas.’ Para cada exemplo de sucesso nas previsões, existem dezenas de outras convenientemente varridas sob o tapete. Nem mesmo a ressalva moderna das margens de erro, usualmente em 3% dos valores nas prévias eleitorais, desfaz a suspeita quase natural de que alguma trapaça está em andamento.

Atualmente, as pessoas encaram as probabilidades na pior das hipóteses como tentativa de trapaça. Mas no século 17, quando pela primeira vez a coleta de dados estatísticos de natalidade, mortes, crimes, doenças e outros eventos sociais produziu tabelas consistentes, uma acesa polêmica foi aberta com filósofos, sociólogos e religiosos. Ter tabelas detalhadas de eventos sociais é uma coisa, mas usá-las para fazer adivinhações sobre o futuro com a probabilidade, é outra coisa. Astrólogos podiam, até com apoio dos reis, arriscar previsões regidas pelos astros, mas quando cientistas mastigavam estatísticas para prever o futuro, muita gente achou que isso era uma heresia que violava o livre arbítrio concedido por Deus à humanidade. Que tipo de Deus era esse que prometia a salvação para os homens de bem, mas ao mesmo tempo ceifava vidas com metódica regularidade a cada ano?

Quando essa regularidade nos números anuais para mortes, suicídios e crimes em geral ficou clara, a sociologia entrou em novo patamar de debates. O primeiro grande estatístico, Adolphe Quetelet (1796-1874) sugeriu que a criminalidade não era um desvio pessoal da moral religiosa, mas sim, um fardo social que cobrava a cada ano cotas de delinquência inexoravelmente. Ou seja, pela primeira vez surgiu a ideia de que a sociedade gerava taxas quase fixas de vários tipos de delinquência, sorteada mais ou menos ao acaso entre os cidadãos. Claro que os pobres eram vítimas de dados viciados com mais frequência para preencher as cotas de crimes e desgraças fixadas pela natureza.

O ‘andar do bêbado’

No século 17, portanto, emergiu a ideia de que a sociedade tinha também leis ocultas, na esteira do sucesso da física newtoniana, cujas regras matemáticas rigorosas podiam prever até as órbitas dos planetas. Esse tipo de determinismo acabou naufragando completamente. Os cientistas jogaram então todas suas fichas na estatística e na probabilidade, conformados em adivinhações com margem de erros. Reabilitaram o conhecimento empírico dos grandes apostadores e jogadores: as leis que regiam as jogatinas eram as mesmas do funcionamento social.

Ao contrário do que se imagina, seres humanos são muito ruins ao tomar decisões pressionados pelo desconhecido. ‘A mente humana foi construída para identificar uma causa definida para cada acontecimento, podendo ter bastante dificuldade em aceitar a influência de fatores aleatórios’, escreve Leonard Mdodinow, autor do ótimo livro O Andar do Bêbado – Como, o acaso determina nossas vidas, (261 páginas, editora Zahar). Mdodinow, um físico estatístico que já escreveu um livro junto com o físico Stephen Hawking, além de episódios de Jornadas nas Estrela e da série MacGyver, é dono de um estilo claro, divertido e produziu uma obra didática fundamental para o cidadão comum entender o papel do acaso na vida – que não é pequeno, mas sim, determinante.

Não por acaso, a obra faz parte de uma ótima safra de livros sobre probabilidades, uma vez que a complexidade do mundo moderno parece estar acirrando o aparecimento de eventos que antes poderiam ser considerados incomuns. Outra publicação é Uma Senhora Toma Chá, de David Salsburg (286 páginas, Editora Zahar), que promete explicar ‘como a estatística revolucionou a ciência do século 20’. É uma leitura maçante e complicada, recomendável apenas para aficionados. Finalmente, o polêmico A Lógica do Cisne Negro, ou o impacto do altamente improvável (459 páginas, Editora BestSeller) de Nassim Nichola Taleb, que ganhou o status de obra visionária por expor antes o mecanismo do colapso financeiro mundial em 2008. Nunca é demais lembrar Lance de Dados (332 páginas, Editora Record), do paleontólogo Stephen Jay Gould, essencial para entender o papel do acaso na evolução e na interpretação das probabilidades que afetam a vida.

O traço comum das obras é a metáfora do ‘andar do bêbado’. A estatística e probabilidade desse trivial evento, no qual o cidadão borracho caminha na saída do bar numa rota entre as trombadas nas paredes e tombos no meio-fio, acaba tendo uma formulação matemática que vale para quase tudo, desde quebra de recordes esportivos até os sobes e desces da Bolsa de Valores.

Jogar quatro moedas e obter três caras ao acaso

A parede na qual o bêbado ricocheteia é uma perfeita metáfora para os obstáculos naturais que os seres vivos encontram. No caso das tentativas de quebra de recordes, representa as limitações físicas do corpo humano. Oposto à parede há um espaço livre, metaforicamente, para a natureza realizar experiências de aumento da complexidade – que nunca devem ser confundidas com progresso, como adverte Jay Gould.

Desde 1930 já se sabia por testes psicológicos que humanos erram muito nas decisões quando nem todos os fatores são conhecidos. Sabe-se que os dois hemisférios do cérebro brigam ao tomar uma decisão. O lado direito tenta uma decisão apostando nas situações mais comuns da experiência e o esquerdo, uma mais analítica. Quando as informações são precárias, vence o lado emocional, os preconceitos e o peso de experiências anteriores. O cérebro humano não sabe lidar com o acaso – acha que tudo tem uma causa.

Até mesmo quando se ensaia uma análise probabilística, os erros crassos são muito comuns. Definitivamente, a análise de probabilidades não é coisa para amadores. Por exemplo, um médico sem noção da realidade testa por conta própria em pacientes uma substância supostamente curativa. Aplica a poção em quatro pacientes e constata que três melhoraram e uma das cobaias não mudou . Uma taxa de sucesso de 75%. Ótimo? Não, péssimo.

Uma amostragem de apenas quatro casos não é suficiente para abolir o acaso. É o mesmo que jogar quatro moedas e obter três caras ao acaso. Não é nada incomum. Por isso, os órgãos governamentais exigem amostragens imensas de testes antes de aprovar uma medicação nova, suficiente para deixar claro que o resultado não se deve ao acaso. Além disso, os testes exigem que igual número de pacientes recebam doses de placebo, para controlar o acaso. Se o grupo placebo der os mesmos resultados, a substância testada não é efetiva.

Curva normal é simétrica

Pesquisas feitas nos EUA e na Alemanha mostram que os médicos são ruins para avaliar probabilidades dos prognósticos. Médicos nesses países foram entrevistados: qual a probabilidade de uma mulher com um mamograma positivo para câncer de seios ter realmente a doença, mesmo que estivesse num grupo de risco baixo (40 a 50 anos, sem sintomas nem histórico familiar)? O resultado é que a maioria dos médicos achou que a probabilidade de confirmação da doença seria alta. Entre os médicos americanos, a estimativa média foi de 75% de chance do exame positivo ser confirmado. O cálculo certo é de apenas 9%!

No caso das pesquisas eleitorais, além do tamanho da amostragem, ela deve também ter as características de semelhança com o universo total da população. Deve representar o padrão de distribuição de renda, religião, cor, regionalidade, educação e outros dados que caracterizem o total dos eleitores.

A principal equação matemática do cálculo de probabilidades tem a forma gráfica de um sino e é chamada também de curva normal ou gaussiana. Trata-se de uma espécie de gabarito matemático para fazer previsões baseadas numa espécie de média sofisticada dos dados conhecidos. Não é a média mais comum, aquela na qual simplesmente se divide a soma dos valores pelo número de eventos. É um tipo de média baseada na observação empírica de que os erros de medidas e dados em geral tendem a se acumular ao redor de um valor mais frequente. Colocado na forma gráfica, assemelha-se a um sino.

Para algumas aplicações mais bem comportadas, os resultados são espetaculares. Por exemplo, a estatura média do brasileiro é de 1,69 metros. Quanto mais altos ou menores, mais raros vão ficando na contagem. O interessante da curva normal é que ela é simétrica: a quantidade de pessoas que medem acima de 1,9 metros é igual à quantidade de pessoas com menos de 1,5 metros.

O exemplo de O.J. Simpson

O feito histórico de Quetelet foi comparar a tabela nacional de altura dos franceses, segundo o censo, com a tabela dos convocados para o serviço militar obrigatório. Ele descobriu uma discrepância: a amostragem do exército tinha na média mais gente abaixo da altura de dispensa, sinal de que muita gente mentia ou fraudava o exame de admissão ao serviço militar obrigatório. É o mesmo teste que se usa hoje para delatar fraudes: se um agente do INSS aprova uma taxa muito maior do que a média de benefícios, é sinal de que merece investigação.

Os livros de Mlodinow, Salsburg e Jay Gould exploram todo o universo das coisas enquadradas nas leis baseadas nas gaussianas, e quase tudo, na maior parte do tempo da nossa vida cotidiana, obedece às gaussianas. Mas nossos cérebros são avessos às regras das probabilidades, como mostram esses livros.

Na vã tentativa de tentar achar causas para tudo, sem levar em conta a possibilidade do acaso, criamos associações fantasmas. O exemplo mais crasso, por exemplo, é do atleta que usa as mesmas meias ou roupas do dia de alguma performance recordista. Até mesmo pessoas mais cultas seguem instintivamente (e inconscientemente) associações que têm correlação, mas não relação de causa e efeito.

E são tantos os dados que podem ser colhidos que eventualmente o uso deles, mesmo feitos com todo rigor, pode levar a erros grosseiros. O exemplo mais dramático destacado por Mlodinow é o das estatísticas usadas pelo advogado do astro do futebol americano O.J. Simpson, que ajudaram no veredicto de inocência na acusação de assassinato da mulher. O advogado alegou que quatro milhões de mulheres são espancadas pelos maridos – e ficou provado que o astro fazia isso com regularidade – mas apenas 2,5 mil acabam assassinadas. Significa que a probabilidade de Simpson matar a mulher é de apenas uma em 2,5 mil, ou 0,0004%, o que impressionou o júri, que acabou inocentando o jogador. Mas, observa Mlodinow, uma vez que a mulher estava morta, outra estatística deveria ser usada: de todas as mulheres frequentemente espancadas e que foram mortas, 90% dos casos é o marido ou companheiro o autor do crime. A promotoria, despreparada, nunca soube dessa estatística, que poderia ter mudado o resultado do julgamento. Mlodinow foi o primeiro a revelar o raciocínio no seu livro.

O ponto de virada

O ponto de vista de A Lógica do Cisne Negro, o impacto do altamente improvável vai na contramão dos livros anteriores. Enquanto nas obras precedentes a distribuição gaussiana reina como lei suprema, Nassim Taleb dedica todo seu fôlego e 42 páginas finais só de bibliografia (quase 700 citações de outros autores), à demolição da gaussiana e da ideia de normalidade em estatística e probabilidade. ‘É uma grande fraude intelectual’, dispara ele. Libanês naturalizado americano, Taleb ficou famoso porque seu livro já antecipava, em 2007, o colapso financeiro que viria um ano depois. Outra credencial importante é que Taleb ficou rico quando operava em Wall Street, explorando justamente a possibilidade de eventos inesperados. Muito rico, a ponto de agora se dedicar apenas a filosofar e dar aulas na Universidade de Massachusetts. Conferencista e consultor provocador, ele faz enorme sucesso entre os militares com suas visões apocalípticas de eventos impensáveis, como o atentado às torres gêmeas de Nova York.

Taleb divide o universo em dois mundos. O primeiro, que ele chama de Mediocristão, é regido pela gaussiana e os eventos são bem comportados; já o segundo, o Extremistão, é regido por estatísticas e probabilidades radicalmente diferentes. Na maior parte do tempo, vivemos no mundo morno do Mediocristão, mas de tempos em tempos as leis do Extremistão assolam a existência com eventos desastrosos ou de mudanças radicais. Ele aponta como exemplos de coisas do Extremistão o ataque às torres gêmeas de Nova York, o surgimento da internet, do Google e toda sorte de coisas inimagináveis até elas ocorrerem.

A tese é de que a história é monótona com avanços incrementais irrisórios nos períodos de normalidade gaussiana e exibe toda a mudança revolucionária quando o Extremistão toma as rédeas dos eventos. ‘A história não se arrasta, ela dá saltos’, pontifica ele. O título do livro vem do fato de todos os cisnes serem brancos para a lógica clássica ocidental, até que um dia a civilização foi surpreendida com a existência de cisnes negros na então remota Austrália, descoberta somente em 1697.

Esse tipo de abordagem é também o foco de Ponto de Virada (Editora Sextante, 288 páginas), de Malcon Gladwell, com a vantagem do texto ser de ótima leitura. O ponto de virada é quando algum tipo de fenômeno surge como um raio no céu azul, mas depois de acontecido é possível traçar sua origem, que quase sempre fica obscurecida pelas tendências convencionais.

A receita tradicional de investimento

Para alguns tipos de dados, concorda Taleb, as previsões gaussianas funcionam perfeitamente. No caso de peso das pessoas, por exemplo, adicionar mais um gordo numa amostragem de mil pessoas não vai alterar a média. Mas quando se trata de variáveis do tipo financeira, por exemplo, tudo pode dar errado. Tomando uma amostragem de mil pessoas comuns e adicionando a riqueza de Bill Gates, tudo vai ficar desequilibrado. A média da riqueza vai subir tremendamente, mas ela vai ser falsa, pois quase toda grana vai estar concentrada apenas nos bolsos e na conta bancária de Gates.

Estatísticas empíricas mostram que as finanças são mais atingidas pelo acaso do que o previsto. Na maior parte do tempo, as probabilidades gaussianas funcionam, mas eventos no que se chama a cauda longa da curva às vezes dão uma boa lambada e acabam impactando mais do que todo o período de marasmo normal.

O matemático Benoit Maldelbrot, inventor da famosa teoria das fractais e o inspirador de Taleb, calculou que se o índice Dow Jones do mercado financeiro seguisse uma distribuição gaussiana, deveria ter se movido mais do que 3,4% em apenas 58 dias entre 1919 e 2003. Na verdade, se moveu 1.001 vezes. Deveria ter se movido mais de 7% somente uma vez em 300 mil anos se fosse regido pela curva normal ou gaussiana. Na verdade, isso aconteceu 48 vezes no século 20.

Infelizmente, Taleb não tem muitos conselhos para a vida prática das pessoas que vivem no Mediocristão e mesmo sobre o mercado financeiro. Ele recomenda a receita tradicional de investir muito em coisas conservadoras e reservar uma pequena parcela para as coisas arriscadas que podem dar um altíssimo retorno.

******

Jornalista

Todos os comentários

  1. Comentou em 13/07/2010 Flávio de Carvalho Serpa

    Ops, é Benoit Mandelbrot e não Maldelbort como aprce no fim do texto.

x

Indique a um amigo

Este é um espaço para você indicar conteúdo do site aos seus amigos.

O Campos com * são obrigatórios.

Seus dados

Dados do amigo (1)

Dados do amigo (2)

Mensagem