conogasi logo

Análisis de correlación

Conocimientos previos

 

Descripción

El análisis de correlación es un procedimiento estadístico que nos permite determinar si dos variable [1]s están relacionadas o no. El resultado del análisis es un coeficiente que puede tomar valores entre -1 y +1.  El signo indica el  tipo de correlación entre las variables. Un signo positivo indica que existe una relación positiva, es decir, si una variable incrementa, la otra también.  Un signo negativo  indica que existe una relación negativa: Mientras una incrementa, la segunda disminuye. Si dos variables son independientes, el coeficiente de correlación es cero. La fuerza de la relación incrementa a medida que el coeficiente de correlación se aproxima a -1 o a +1.

 

Entrada/Muestra

Es necesario usar software estadístico, por ejemplo: R, SAS, SPSS, Stata, etc.

 

Recursos/Material

Matriz con dimensiones n X 2;  n filas (observaciones) y 2 columnas (variables).

 

Requisitos previos

Matriz que posea el mismo número observaciones en variable X y en variable Y.

 

Procedimiento

La fórmula general para calcular el coeficiente de correlación entre dos variables es:

Fórmula para calcular el coeficiente de correlación

El coeficiente de correlación es el resultado de dividir la covarianza entre las variables X y Y entre la raíz cuadrada del producto de la varianza de X y la de Y.

1. Primero se calcula la covarianza entre la variable X y la variable Y (es decir, entre las dos columnas de la matriz).

Se calcula la media de todos los valores de X y de Y

Se realiza la sumatoria del producto de las diferencias entre cada observación de cada variable y su media correspondiente
La sumatoria calculada anteriormente se divide entre el número total de observaciones menos 1

2. Calcular las varianzas de la variable X y la varianza de la variable Y y obtener la raíz cuadrada de cada una:

Para cada variable se calcula la desviación estándar y se multiplican

3. Se divide la covarianza entre el producto de las desviaciones estándar

 

Salida/Resultado

Coeficiente de correlación; un valor entre -1 y 1 que representa la naturaleza de la relación entre dos variables (directa, inversa, o sin relación).

 

Fuentes de error más frecuentes

Errores al crear la matriz de datos.

 

Métodos alternativos

 

Aplicaciones

 

Temas relacionados