O cérebro humano tem uma propensão fortíssima a acreditar que correlações demonstram a existência de relações causais. Vira e mexe lemos notícias do seguinte tipo: pessoas que comem muito aspargos têm menos câncer. Nossa mente imediatamente imagina que comer aspargos evita o câncer e decidimos comer aspargos aos montes.
Mas, o que existe nesse caso é uma correlação entre consumo de aspargos e câncer. E isso não implica em uma relação causal, ou seja, o alto consumo de aspargos não é a causa da diminuição nos casos de câncer. Pode ser que o consumo de aspargos seja um hábito cultural do país e os poucos casos de câncer se devam à genética da população estudada, ou seja, a correlação é pura coincidência.
Sabemos que muitas correlações de fato refletem relações causais (fumar causa câncer de pulmão), mas, para demonstrar que relações causais estão por trás de uma correlação, é necessário alterar um dos fatores e demonstrar que o outro também se altera. No exemplo acima precisaríamos aumentar ou diminuir o consumo de aspargos e observar se os casos de câncer aumentam ou diminuem da maneira esperada.
Muitos cientistas cultivam o hábito de procurar correlações onde seguramente não existem relações causais. E usam esses exemplos para ensinar aos alunos a diferença entre esses dois conceitos.
Meu exemplo preferido é o caso das cegonhas e dos bebês. No ano 2000, um cientista inglês resolveu testar a veracidade da lenda de que são as cegonhas que trazem as crianças ao mundo.
Segundo essa teoria, as cegonhas trazem os nenês pendurados nos seus bicos, já embrulhados em uma fralda, e as deixam nas casas. Essa teoria isenta os pais da tarefa de explicar para os irmãos mais velhos como ocorre um parto.
Robert Mathews raciocinou que caso os bebês fossem realmente trazidos pelas cegonhas era de se esperar que o número de nascimentos tivesse uma correlação direta com a presença de cegonhas (mais cegonhas, mais bebês, menos cegonhas, menos bebês).
Leia também
Como se sabe, na sua rota migratória, as cegonhas migram para a Europa todos os anos e fazem ninhos nas torres mais altas das cidades, chocam os ovos e voltam para o sul (seria durante a migração que elas trariam os bebês). Esses ninhos são contados cuidadosamente pelos ambientalistas.
Robert coletou os dados do número de ninhos de cegonhas em cada um de 17 países europeus e fez uma tabela com o nome do país, o número de ninhos presentes, e o número de crianças nascidas. De posse desses dados ele fez um gráfico onde, em um eixo, colocou o número de ninhos no país e no outro o número de nascimentos. E, observando o gráfico, descobriu que o número de nascimentos em um país tem correlação direta com o número de ninhos de cegonhas no país.
À medida que o número de ninhos cresce, também cresce o número de nascimentos. Usando métodos estatísticos foi possível demonstrar que a probabilidade dessa correlação ter ocorrido ao acaso é muito baixa (p< 0,008). Isto significa que existe uma probabilidade de 99,2% que a presença de ninhos está correlacionada ao nascimento de crianças. E, portanto, nosso cérebro tende a acreditar que são as cegonhas que trazem os bebês.
Essa probabilidade é muito maior que as probabilidades de grande parte das correlações entre tipos de alimentos e as mais diferentes doenças. Mas, uma correlação muito forte como essa não demonstra obrigatoriamente uma relação causal.
O interessante nesse exemplo é que ninguém acredita que as cegonhas trazem nenês (o que seria de fato uma relação causal), apesar de a correlação ser muito forte. Portanto, é necessário testar se essa correlação é de fato uma relação causal. Infelizmente os testes ainda não foram executados pois envolveriam bloquear ou estimular a chegada das cegonhas nos países e observar o que aconteceria com os nascimentos dos bebês. Esse é um experimento que foi rejeitado pelos ambientalistas e nunca foi feito.
O que sobrou para os cientistas foi criar modelos para explicar essa correlação bizarra. Posso adiantar que existe uma extensa literatura nessa área tentando explicar essa alta correlação. Assim como esse exemplo, existem outras correlações bizarras que foram detectadas nas últimas décadas. Uma delas mostra que o consumo de margarina está relacionado com a taxa de nascimento nos Estados americanos.
Isto demonstra que correlações não implicam obrigatoriamente em relações causais. Em muitos casos elas sugerem que relações causais de fato existem, e devem ser investigadas, mas não são provas científicas de relações causais.
Eu resolvi escrever esse artigo exatamente porque, após a tragédia da inundação de Porto Alegre, surgiram inúmeras correlações entre fenômenos de diversas origens e a inundação. E essas correlações foram apresentadas como se fossem a causa da inundação.
São correlações com os gastos do governo em prevenção, desrespeito a normas ambientais, desmatamento da Amazônia, desmatamento da Mata Atlântica, plantio de soja no Cerrado ou no Rio Grande do Sul e assim por diante. Talvez parte dessas correlações de fato reflitam relações causais, mas precisamos ser cautelosos ao distribuir a culpa. Afinal, sabemos que não são as cegonhas as culpadas pela chegada dos bebês.
Mais informações: Storks Deliver Babies (p< 0.008). Teaching Statistics. Vol. 22 2000
Os comentários são exclusivos para assinantes do Estadão.