Concordancia y Correlación (T.12)
Hoy en día podemos definir la regresión como la predicción de una medida basándonos en el conocimiento de otra. Existen varios modelos de análisis de regresión:
Con la REGRESIÓN LINEAL SIMPLE se estudia la asociación lineal entre dos variables cuantitativas habiendo una sola variable independiente. Para analizar este tipo de regresión utilizaremos el modelo de regresión:
y= a+bx Donde “x” es la variable independiente e “y” la variable dependiente.La pendiente de la recta es “b” y el
punto de intersección con el eje de coordenadas “a”. “b” también es denominado coeficiente de
regresión.
Cosas a tener en cuenta:
· Si x=0, y= a
- Si b>0 habrá una relación directa, de forma en que cuando x aumenta y también.
- Si b<0 habrá una relación indirecta, de forma en que cuando x aumenta, y disminuye
- Modelos lineales deterministas: Para cada valor de la variable independiente hay un valor de la variable dependiente
- Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores dependientes
Criterio de los mínimos cuadrados: Se trata de un criterio utilizado para calcular los valores de “a” y “b” que proporcionan la recta que mejor se ajusta.
Consiste en obtener un punto sobre la grafica que se denomina (Yi), que es el punto observado, y posteriormente coger un punto sobre la recta que hemos dibujado, denominado (Yi*), este punto es el que estima el modelo.
A continuación se calcula la diferencia entre ambos y nos interesa que la diferencia sea lo más pequeña posible, por eso se llama el criterio de los mínimos, y también se denomina cuadrado porque se calcula con un término al cuadrado.
Se trata de la recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube
COEFICIENTES DE CORRELACIÓN:
El análisis de correlación se utiliza para obtener un indicador cuantitativo que permita sintetizar el grado de asociación entre variables, midiendo la fuerza y el sentido la relación lineal entre dos variables, siendo un número adimensional (entre –a y 1) . De esta manera:
- Coeficiente de correlación r de Pearson (r), (Rxy): mide el grado de la relación de dependencia que existe entre las variables, yendo sus valores desde -1 hasta 1. Si r>0 la relación lineal será directa, si r<0 la relación lineal será inversa, y si r=0 las variables serán independientes. Se usa con variables cuantitativas normales
- Coeficiente de correlación por rango o rho de Sperman: mide el grado de asociación que requiere ambas variables en estudio que sean medidas por lo menos en una escala ordinal. Se usa con variables ordinales que requieren transformación o con variables cuantitativas no normales
De manera general podemos definir el coeficiente de correlación mediante la
fórmula:
*Recuerda que para calcular la normalidad de los datos puedes utilizar métodos gráficos como el histograma o la prueba del lápiz grueso, métodos descriptivos como el cálculo de IQR/S, o pruebas como Kolmogorov o Shapiro-Wilk.
COEFICIENTE DE DETERMINACIÓN: número adimensional entre 0 y 1, que da idea de la relación entre variables relacionadas linealmente. Es r2
BONDAD DE AJUSTE DEL MODELO: Esta se va a calcular a partir del coeficiente de determinación, de forma en que cuanto más se acerque a 1, mayor poder explicativo, y mayor bondad del ajuste.
T DE KENDALL: se trata de un test de hipótesis ara modelos de regresión lineal, siendo su fórmula:
t > valor de la tabla, rechazo la hipótesis nula t < valor de la tabla, acepto hipótesis nula
de
Comentarios
Publicar un comentario