Los estadísticos utilizan la técnica de regresión lineal para encontrar la línea recta que mejor se ajusta a una serie de datos X e Y. pares . Lo hacen a través de una serie de cálculos que se derivan de la ecuación de la mejor línea . Esta descripción matemática de la línea será una ecuación lineal y tienen la forma general de y = mx + b , donde x e y son las dos variables en los pares de datos , m es la pendiente de la línea y b es su intersección .
Coeficiente de Correlación
los cálculos que encuentran la mejor línea recta producirá una ecuación lineal para adaptarse a cualquier conjunto de datos , incluso si la realidad no es muy lineal . Con el fin de tener una indicación de qué tan bien los datos se ajustan en realidad una línea recta , los estadísticos también calculan un número conocido como el coeficiente de correlación . Esto se da el símbolo R o R y es una medida de cuán estrechamente alineados los pares de datos son a la mejor línea recta a través de ellos .
Importancia de la I
R puede tener cualquier valor entre -1 y 1 Un valor negativo de R significa simplemente que la línea más idónea a la baja Slants mueve de izquierda a derecha , en lugar de hacia arriba. Cuanto más cerca R es o bien la de los dos extremos , el mejor el ajuste de los puntos de datos a la línea, ya sea con -1 o 1 siendo un ajuste perfecto y un valor R de significado cero que no hay ajuste y los puntos son totalmente al azar . Si los puntos de datos están bien alineados con la línea recta , no se dice que es una cierta correlación entre ellos, por lo tanto, el coeficiente de correlación de nombre R.
R2
Algunas estadísticos prefieren trabajar con el valor de R2 , que es simplemente el coeficiente de correlación al cuadrado, o multiplicado por sí mismo , y se conoce como el coeficiente de determinación . R2 es muy similar a R y también describe la correlación entre las dos variables , sin embargo, también es ligeramente diferente. Se mide el porcentaje de variación de la variable y que puede atribuirse a la variación en la variable x . Un valor de R2 de 0,9 , por ejemplo, significa que el 90 por ciento de la variación en los datos y es debido a la variación en los datos de x . Esto no significa necesariamente que x está afectando realmente a, pero que parece estar haciéndolo.