Causes, efectes i correlacions

Causes, efectes i correlacions

Què implica aquesta correlació? Doncs simplement això que els grups de dades tenen una relació matemàtica entre elles.


El nostre cervell està preparat per veure seqüències correlatives de causa i efecte. Deixem caure un got, arriba a terra, es trenca, els bocins s’escampen. Això és una seqüència de causes i efectes que el nostre cervell té totalment assumides, de fet sempre busca aquest tipus d’estructures per tal de descriure el món que ens envolta. Veuríem molt estranya la seqüència anterior si la passéssim a l’inrevés.

Tal com vam dir en un altre article ( estadística, mostres i biaixos ) l’estadística és la ciència que ens permet analitzar un conjunt de dades no complet i extrapolar-lo a un grup més gran. Un d’aquests anàlisis que podem fer amb l’estadística són les correlacions.

Les correlacions són un mètode matemàtic que usa l’estadística per saber quin grau de relació hi ha entre dos, o més, grups de dades. Així podem tenir dades fortament correlacionades i per tant amb una forta dependència i dades no correlacionades o independents. O no?

Recordem que estem parlant d’un mètode matemàtic i per tant és una manera de portar les dades a un nivell d’abstracció que ens permeti treballar amb elles. Però les matemàtiques no tenen en compte el món real, només les seves pròpies normes.

Així una correlació forta entre dos grups de dades, només implica que les dades estan relacionades matemàticament. És a dir els números en que hem convertit aquestes dades tenen una relació matemàtica entre ells.

Per exemple si tenim 2 grups de dades:

1    2    3    4    5    6    7    8    9    10

2    4    6    8    10    12    14    16    18    20

Podem veure fàcilment que estan correlacionats, hi ha una relació molt forta, de fet exacta entre els dos grups de xifres que respon a y=2·x. Existeixen diversos coeficients per calcular el grau de correlació entre dos grups de dades.

Què implica aquesta correlació? Doncs simplement això que els grups de dades tenen una relació matemàtica entre elles. Estem en el nivell d’abstracció matemàtic, són només números.

Només si jo dic que el primer grup de dades és la nota que ha tret a l’examen un estudiant i el segon grup de dades correspon a la quantitat d’hores que ha estudiat l’assignatura, aquesta correlació esdevé una relació causa efecte.

Podria donar-se el cas que existeixi una correlació matemàtica però que no hi hagi una causa efecte directe. Per exemple si les dades anteriors representessin les hores que ha dormit un grup de persones i els centímetres de neu que han acumulat les pistes d’esquí, la correlació entre els grups de dades seguiria existint, però veiem clarament que no existeix una relació causa efecte entre els dos grups de dades. Tornem al cas que les matemàtiques són abstraccions de la realitat i per tant cal tornar-les a posar dins d’un context per poder-les interpretar. Aquest cas és el que es mostra a la imatge que acompanya el post, o si més no, crec que hauria de ser aquests cas. La correlació entre l’ús del navegador Internet Explorer i el nombre d’assassinats a Estats Units és gairebé perfecte, però és força clar que les dues variables realment, tot i el que diguin les matemàtiques, no estan relacionades.

Pot donar-se el cas també que el desenvolupament matemàtic ens doni que existeix una correlació i no tinguem clar si això representa una relació causa-efecte. Per exemple si les dades anteriors fossin hores que ha nevat i centímetres de neu acumulada, podria pensar-se que sí que hi ha una relació causal entre els dos grups de dades, però també podria donar-se el cas que no tinguessin res a veure i ha estat només una casualitat que els grups de dades estiguin correlacionats. Estem segurs que la quantitat de neu acumulada depèn de les hores que ha nevat? En cas que estiguin relacionades es realment creïble que existeix una relació tant forta com per a ser exacta? No seria més normal que la correlació no fos tant forta de manera que demostres que existeixen altres paràmetres que afectes a la quantitat de neu acumulada?

El nostre cervell en la seva recerca continua de les relacions causa-efecte, pot fer que apareguin més problemes en aquests tipus d’anàlisi. Imaginem que tenim una correlació perfecte entre dos grups de dades i les dades realment estan relacionades. Com podem determinar quina és la causa i quina és la conseqüència o l’efecte?.

Suposem els grups de dades anteriors un altre cop. El primer grup és l’augment de la temperatura en un gas tancat en un recipient i el segon grup de dades és l’augment de la pressió que fa aquest gas a les parets del recipient. Si recordem una mica les classes de física i química, sabem que la calor dilata per tant sembla correcte que aquetes dades estiguin correlacionades, doncs existeix una relació, que a més a més, es coneguda per les lleis de la física. Però aquesta correlació ens diu quina és la causa i quin l’efecte? Podem amb la informació que tenim saber si estem escalfant el gas del recipient per tant augmentant la temperatura o estem reduint el volum del recipient i per tant augmentant la pressió. Qualsevol de les dues opcions pot ser correcte, la correlació no ens diu en cap cas quina és la causa i quin l’efecte simplement ens diu que estan relacionades matemàticament. És el nostre cervell el que li dona el significat de causa-efecte a les dades perquè és una necessitat que té ell per poder interpretar el món.

Per tant podem veure que tot i que matemàticament ens apareguin relacions entre dos conjunts de dades, cal interpretar bé aquests resultats per tal que aquestes relacions siguin útils. Hem vist que els mateixos números poden portar-nos a condicions totalment diferents en base a què representen aquestes dades. Tornem a dir, les matemàtiques i en aquest cas l’estadística, és una eina i no representen cap mena de veritat absoluta. Ha de ser la interpretació que es fa dels resultats i de les dades la que ens dona un reflex del món. Per altre banda tampoc no podem obtenir relacions causa-efecte en base a aquests anàlisi doncs les matemàtiques en aquest cas no ens ofereixen aquesta interpretació.

Links d’interès.

 

Links a d’altres articles mencionats:




Comentaris