sexta-feira, 30 de janeiro de 2026

O Salto no Escuro

O Perigo de Confundir Estatística com Causalidade


Outro texto que será baseado em uma frase minha em redes sociais:

“A única TRETA é transpor relação estatística para nexo causal.”

I. A Sedução dos Números e a Ilusão da Adjacência

O cérebro humano é uma máquina de buscar padrões. Quando vemos dois eventos acontecendo em sincronia, nossa intuição imediatamente tenta estabelecer um sentido. No entanto, a estatística é, por definição, descritiva; ela aponta que duas variáveis, X e Y, se movem juntas, mas a matemática da correlação não possui ferramentas intrínsecas para determinar a direção do fluxo de influência. A covariância é um fenômeno de observação, enquanto a causalidade é um fenômeno de mecanismo.

II. O Problema das Variáveis Ocultas (Confounding Variables)

O principal obstáculo para estabelecer o nexo causal é a existência de uma terceira variável, Z, que influencia tanto X quanto Y. É o que chamamos de correlação espúria.

  • Exemplo: Se o aumento nas vendas de sorvete coincide com o aumento de ataques de tubarão, o erro seria proibir o sorvete para salvar banhistas. Aqui, Z é o verão — a variável oculta que impulsiona ambos os dados, criando uma ilusão de conexão direta onde existe apenas uma coincidência de contexto.

Imagem de Correlation vs Causation diagram

III. A Falácia da Direcionalidade e a Cronologia

A estatística é "cega" para a cronologia e a intenção. A transposição errônea muitas vezes ignora o vetor real da relação (X → Y, Y → X ou Z → (X, Y)).

  • Post Hoc Ergo Propter Hoc: A falácia de acreditar que "porque veio depois, foi causado por". Observar que pessoas de alta renda usam roupas de marca e concluir que comprar roupas caras causa o aumento de renda é inverter o nexo lógico. Sem o isolamento experimental, como testes A/B ou ensaios clínicos, a variação observada pode ser apenas um ruído de fundo.

IV. A Transposição Legítima: O Critério de Hill

Para que a "treta" seja resolvida e a transposição seja legítima, a ciência exige o preenchimento de critérios que vão além dos números: a plausibilidade (um mecanismo físico/lógico), a consistência e a temporalidade. Sem um modelo que explique como a relação ocorre, a estatística permanece apenas como uma sugestão, nunca como uma prova. O maior desafio da análise de dados não reside na coleta, mas na interpretação ética e lógica desse vínculo.



O Arsenal Científico contra a Ilusão Estatística


Para transpor o abismo entre o "acontece junto" e o "causa isto", a ciência não se baseia em acumular mais dados, mas em refinar o controle sobre eles.

1. O Padrão-Ouro: O Ensaio Controlado Aleatorizado (RCT)

A ferramenta mais poderosa contra a correlação espúria é a aleatorização.

  • O Problema: Se testarmos um remédio apenas em quem escolhe tomá-lo, a "causa" da cura pode ser o estilo de vida daquelas pessoas, não o composto químico.

  • A Solução: Ao dividir um grupo aleatoriamente, neutralizamos as variáveis de confusão (idade, genética, hábitos). Se o grupo A (medicamento) performa melhor que o grupo B (placebo), o nexo causal é estabelecido porque a única diferença entre eles foi a intervenção.

Imagem de randomized controlled trial diagram
Shutterstock


2. O Controle de Variáveis e a Causalidade de Granger

Em sistemas onde não podemos fazer experimentos (como na astronomia ou macroeconomia), usamos o controle estatístico e a Causalidade de Granger.

  • A lógica aqui é a precedência temporal: se o evento X ajuda a prever o evento Y melhor do que o histórico de Y sozinho, e X ocorre antes de Y, temos um indício de nexo.

  • Contudo, o método exige cautela: a sucessão temporal é condição necessária, mas não suficiente.

3. A Navalha de Occam e a Plausibilidade do Mecanismo

A ciência impõe uma barreira lógica extra: o mecanismo de transmissão.

Mesmo que os números batam perfeitamente (como a correlação entre o consumo de queijo e pessoas que morrem presas em seus lençóis), o método científico exige a pergunta: Como isso acontece fisicamente? Sem um modelo teórico que explique o caminho entre a causa e o efeito, a relação é descartada como ruído estatístico.

Um nexo causal robusto exige um Caminho de Mediação. A ciência não aceita que "apertar um botão" causa "uma luz acender" sem explicar o fluxo de elétrons no fio.

  • Plausibilidade: Se a estatística diz que "comer laranjas aumenta o desempenho em matemática", o método científico exige o mecanismo. Há uma substância na laranja que altera a sinapse? Sem esse "como", a relação permanece na gaveta das correlações suspeitas, aguardando prova de mecanismo.

4. O Contrafactual: O "E se não?"

O nexo causal sólido exige a prova do contrafactual. No rigor lógico, A causa B se, e somente se, na ausência de A (mantendo todo o resto constante), B não ocorreria. É a busca por essa "ausência controlada" que separa a ciência de alta performance das observações anedóticas.

Conclusão

Ao final, transpor relação estatística para nexo causal sem o devido rigor não é apenas um erro técnico; é um salto de fé travestido de ciência. A "treta" se resolve quando aceitamos que a estatística é o mapa, mas o método científico é a bússola que nos diz se o caminho realmente existe ou se é apenas uma miragem no papel.

O rigor lógico é, portanto, o único antídoto contra a tendência humana de ver conexões onde existe apenas o caos organizado dos números.

Nenhum comentário: