
Como já mostramos em um post anterior a correlação é útil para avaliar a relação entre duas variáveis.
Mas a existência de correlação entre duas variáveis não indica necessariamente uma relação de causa e efeito entre as mesmas. Em alguns casos, a correlação observada pode ser espúria, em outros, uma alta correlação pode ocorrer devido a um terceiro fator, chamado de fator de confundimento.
Um exemplo clássico é apresentado pelo estatístico Gustav Fischer, que mostrou uma correlação positiva entre o número de recém nascidos e o número de cegonhas na cidade de Oldenburg da Dinamarca. Mas ao contrário das histórias infantis, não era o aumento do número de cegonhas que causava o aumento do número de bebês, mas sim o crescimento da cidade, que era causa de ambos os fenômenos, uma vez que as cegonhas faziam seus ninhos perto de casas com chaminés.
Logo, o fator urbanização que implica tanto no aumento populacional de humanos quanto de cegonhas torna-se um fator de confundimento, que implica na alta correlação observada.
Assim, é importante ressaltar que a correlação ou associação quantifica a força com que duas variáveis estão correlacionadas, mas não aponta se uma interfere de fato no resultado da outra.
Mas uma relação de causa e efeito entre as variáveis pode existir sim, a chamada causalidade, mas isso é assunto para um próximo post, então fique atento.