Full screen

Share

Show pages

Análisis de Datos
Maestría en Sostenibilidad y Planificación de la Conservación
MODELOS LINEALES: REGRESIÓN

Want to create interactive content? It’s easy in Genially!

Get started free

MSPC-9-M7-R1

CEV PUCE

Created on June 19, 2021

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

Análisis de Datos

Maestría en Sostenibilidad y Planificación de la Conservación

MODELOS LINEALES: REGRESIÓN

En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación: Y = a + b X Donde : a es el valor ordenada (EJE Y) donde la línea de regresión se intercepta con el eje y. b es el coeficiente de regresión pblacional (pendiente de la línea recta).

Regresión Lineal Simple

Gran parte del pensamiento científico se preocupa de la relación entre pares de variables con una hipotética relación de cause - efecto. Forma y significancia de las relaciones funcionales entre dos variables Función: Relación matemática que permite predecir que valores de una variable Y (dependeinte) corresponden a un valor dado de la variable X (independiente). Y = f(X) "Ecuación de la regresión".

Regresión Lineal

Tipo de más simple de regresión:

Para un incremento de 20 unidades en X, existirá un incremento de unidad en Y.

  • La variable independiente multiplicada por el coeficiente b.
  • b pendiente: coeficiente de regresión.

Relanción funcional Y = bX

  • La pendiente de la función depende de la mangitud de b... a medida que b se incrementa, lapendiente se hace más pronunciada.
  • Cuando X=0, la variable dependiente es también 0.
  • En biología, esta relación es apropiada solamente para un rango limitado de valores de X.

Ej: Después de 4 ug de droga, la presión sanguinea será: Y = 20 +(15)(4) = 80 mm Hg

Relación funcional Y = a + bX

  • La otras funciones muestran los efectos del cambio de valores en a y b
  • Cuando la variable independiente = 0, la independiente no es igual a 0, pero = a (Y INTERCEPTO)

La dispersión se debe a la variación natural de los individuos (genética o ambiental) y a errores de medida.

En la realidad, las observaciones no se localizan perfectamente a lo largo de la línea de regresión, sino que se encuentran dispersas a ambos lados de la línea.

Modelos de regresión

X puede ser manipulado al igual que se puede manipular el efecto del tratamiento en el ANOVA Modelo 1.

Es usado en situaciones experimentales y basado en cuatro supuestos: 1) La variable independiente es medida sin error, la variable X es fija: Mientras Y varía aleatoriamente, X no varía, está bajo el control del investigador.

Modelo I

2) El valor esperado de la variable Y para cualquier valor dado de X es descrito por la ecuación: Y = a + bX 3) Para cualquier valor X¡ de X, los valores Ys están independiente y normalmente distribuídos. Esta relación puede ser representada por la ecuación: Y = a + bX + ε (ε es el error)

  • La variabilidad inherente del material biológico hace que las respuestas de cada dosis de droga no sea la misma en cada individuo, y por lo tanto se obtiene una distribución de valores Y (presión sanguínea) alrededor del valor esperado.
  • No todos los experimentos tienen más de un valor Y para cada valor X, de hecho el solo tener un valor Y por X es el caso más común.

4) Las muestras a lo largode la línea de regresión tienen homocedasticidad (la misma variancia). Por lo tanto, asumimos que la variancia alrededor de la línea de regresión es constante e independiente de la magnitudo de X y Y.

Modelo II: cuando ambas variables varían aleatoriamente

Frecuentemente tanto X como Y están sujetos a variación natural y/o error de medición. Además X no es una variable fija (bajo el control del investigador).

Modelo II

  • Describir la relación lineal entre Y y X.
  • Determinar cuanto de la variación en Y puede ser explicada por la relación lineal con X, y cuanto de esta variación permanece no explicada.
  • Predecir nuevos valores de Y a partir de nuevos valores de X.

Aplicaciones de la Regresión Lineal

Y¡ = valor esperado (predecido) de la variable dependiente en base a un valor dado de XX = Valor de la variable independiente a = Y intercepto, o valor de Y cuando X es 0 b = pendiente = COEFICIENTE DE REGRESIÓN = cambio en la variable dependiente asociado a un cambio de una unidad en la variable independiente.

Ecuación de la LÍNEA de Regresión (para describir y predecir valores Y en base a X)

Los coeficientes a y be se obtienen mediante las expresiones:

Ecuación de la LÍNEA de Regresión (para predecir valores Y en base a X)

Objetivo de la regresión - minimizar la suma de los errores de las observaciones

Ecuación de la Regresión (para determinar la relación entre X y Y)

La recta de regresión hace mínimos los cuadrados de las distancias verticales desde cada punto de una observación a la recta.

Ecuación de la Regresión (para determinar la relación entre X y Y)

Y = valor de la variable dependiente X = Valor de la variable independiente a = Y intercepto b = pendiente error = variación de Y no explicada por X (llamado también residuo)

Ecuación de la Regresión (para determinar la relación entre X y Y)

Mide el poder explicativo del modelo de regresión, es decir, la parte de la variación de Y explicada por la variación de X. El valor de r2 varía entre 0 y 1, si r2 = 0,70 significa que el 70% de la variación de Y está explicada por las variaciones de X. Es evidente que cuanto mayor sea r2, mayor poder explicativo tendrá nuestro modelo.

Coeficiente de determinación

Next page

genially options