conogasi logo

Análisis de correlación

Conocimientos previos

 

Descripción

En la rama de la estadística, la correlación se refiere a que existe un vínculo entre varios eventos. Una de las herramientas que nos permite inferir si existe dicho vínculo es justamente el análisis de correlación. Este procedimiento tiene por objetivo indicarnos si existe relación entre dos eventos – es decir, variables–, un poco sobre la naturaleza de dicha relación, y su fuerza.Para poder realizar un análisis de correlación confiable, lo primero que se necesita es realizar muchas observaciones de dos variables. Un ejemplo sería visitar muchos supermercados y revisar tanto el precio de cierta fruta como el precio de un litro de jugo. La colección de datos que se obtenga para aquellas observaciones puede expresarse en forma de una matriz (o tabla), que puede someterse a análisis utilizando software de estadística, como R, SAS, SPSS, etc.

El análisis de correlación general da como resultado un número entre  -1 y 1, llamado coeficiente de correlación. Este resultado nos sirve para entender tres cosas:

  1. Si existe  o no correlación entre las variables. Un coeficiente que valga cero indica que nuestras variables son independientes; un ejemplo de esto sería que no hay relación entre qué tan dulce es una fruta y cuál es el precio de un litro de jugo.
  2. Qué tan fuerte es la correlación (si es que existe). A más se ‘aleje del cero’ el coeficiente, más fuerte será la correlación entre las dos variables. Siendo así, las correlaciones cuyo coeficiente esté más cerca de  -1  o 1 serán más poderosas.
  3. Detalles sobre la naturaleza de la correlación. Existen correlaciones llamadas directas (donde ambas variables  aumentan o disminuyen simultáneamente) e inversas (donde cuando una variable aumenta, la otra disminuye). Un coeficiente positivo significa que la correlación es del primer tipo, mientras que uno negativo indica que es del segundo. Un ejemplo de correlación positiva es que, si el precio de una fruta aumenta, el precio de un litro de jugo de dicha fruta también aumentará; una correlación negativa sería que a más gente consuma una fruta, menor cantidad de fruta estará disponible.

El coeficiente de correlación es el resultado de dividir la covarianza entre las variables X y Y entre la raíz cuadrada del producto de la varianza de X y la de Y.