Análisis de correlación

total de vistas
Visitas
Nivel avanzado
AAumentar texto
ADisminuir texto


Conocimientos previos Media Varianza Covarianza Sumatoria Descripción El análisis de correlación consiste en un procedimiento estadístico para determinar si dos…
Conocimientos previos

 

Descripción

El análisis de correlación consiste en un procedimiento estadístico para determinar si dos variables están relacionadas o no. El resultado del análisis es un coeficiente de correlación  que puede tomar valores entre -1 y +1.  El signo indica el  tipo de correlación entre las dos variables . Un signo positivo indica que existe una relación positiva entre las dos variables; es decir, cuando la magnitud de una incrementa, la otra también.  Un signo negativo  indica que existe una relación negativa entre las dos variables. Mientras los valores de una incrementan, los de la segunda variable disminuyen. Si dos variables son independientes, el coeficiente de correlación es de magnitud cero . La fuerza de la relación lineal incrementa a medida que el coeficiente de correlación se aproxima a -1 o a +1.

 

Entrada/Muestra

Matriz de n X 2, con n filas (observaciones) y 2 columnas (variables).

 

Recursos/Material

Software estadístico: R, SAS, SPSS, Stata.

 

Requisitos previos

Matriz sin valores ausentes (mismo número observaciones en variable X y en variable Y)

 

Procedimiento

La fórmula general para calcular el coeficiente de correlación entre dos variables es:

Fórmula para calcular el coeficiente de correlación

El coeficiente de correlación es el resultado de dividir la covarianza entre las variables X y Y entre la raíz cuadrada del producto de la varianza de X y la de Y.

 

1. Calcular la covarianza entre la variable X y la variable Y (entre las dos columnas de la matriz) de acuerdo a la siguiente fórmula:

Fórmula para calcular la covarianza entre dos variables

Se calcula la media de todos los valores de X y de Y
Se realiza la sumatoria del producto de las diferencias entre cada observación de cada variable y su media correspondiente.
La sumatoria calculada anteriormente se divide entre el número total de observaciones menos 1

 

2. Calcular las varianza de la variable X y la varianza de la variable Y y obtener la raíz cuadrada de cada una:

Producto de desviaciones estándar

Para cada variable se calcula la desviación estándar y se multiplican

 

3. Se divide la covarianza entre el producto de las desviaciones estándar

Ejemplo en R:

1. Crear dos variables dependientes

2. Utilizar la función cor()

O utilizar la fórmula antes propuesta

 

Salida/Resultado

Coeficiente de correlación

 

Métodos alternativos
  • Coeficiente de correlación de Spearman
  • Coeficiente de correlación de Kendall
  • Coediciente de correlación Pearson

 

Aplicaciones
  • Regresiones lineales

 

Temas relacionados
  • Regresión lineal

 

Referencias:

Isotalo, J. Basics of Statistics. Retrieved August 25, 2016, from http://www.mv.helsinki.fi/home/jmisotal/BoS.pdf
Ver más


Cómo citar: Alquicira, J. (2017, 25 de Mayo ) Análisis de correlación. Conogasi, Conocimiento para la vida. Fecha de consulta: Mayo 21, 2018

Esta obra está disponible bajo una licencia de Creative Commons Reconocimiento-No Comercial Compartir Igual 4.0

Deja un comentario

Sé el primero en comentar!

wpDiscuz