Introducción a la regresión logística

Los investigadores se han interesado en la creación de un modelo para analizar la relación entre algunos factores predictivos (es decir, las variables independientes) y una respuesta (es decir, variable dependiente). La regresión lineal se usa comúnmente cuando la variable respuesta es continua. Una de las hipótesis de los modelos lineales es que los errores residuales siguen una distribución normal. Este supuesto falla cuando la variable respuesta es categórica, por lo que un modelo lineal ordinaria no es apropiado. Este boletín presenta un modelo de regresión de una variable respuesta que es dicotómica que tiene dos categorías. Ejemplos son comunes: si una planta viva o muera, si un encuestado está de acuerdo o no está de acuerdo con una declaración, o si un niño se gradúe en riesgo o se retira de la escuela secundaria

En la regresión lineal ordinaria, la respuesta. variable (Y) es una función lineal de los coeficientes (B0, B1, etc.) que corresponden a las variables predictoras (X1, X2, etc.). Un modelo típico se vería así:

Y = B0 + B1 * X1 + B2 + B3 * X2 * X3 + ... + E

Para una variable de respuesta dicotómica, podríamos configurar un modelo lineal similar para predecir la categoría de miembro de los individuos si se utilizan valores numéricos para representar las dos categorías. Valores arbitrarios de 1 y 0 son elegidos por conveniencia matemática. Usando el primer ejemplo, podríamos asignar Y = 1 si una planta vive y Y = 0 si una planta muere.

Este modelo lineal no funciona bien por varias razones. En primer lugar, los valores de respuesta, 0 y 1, son arbitrarios, por lo que el modelado de los valores reales de Y no es precisamente de su interés. En segundo lugar, en realidad es la probabilidad de que cada individuo de la población responde con 0 o 1 que estamos interesados ​​en el modelado. Por ejemplo, podemos encontrar que las plantas con un alto nivel de una infección por hongos (X1) caen en la categoría de "la planta vive" (Y) con menos frecuencia que aquellas plantas con bajo nivel de infección. Por lo tanto, como el nivel de infección aumenta, la probabilidad de una planta viva disminuye.

Por lo tanto, podríamos considerar el modelado P, la probabilidad, como la variable de respuesta. Una vez más, hay problemas. Aunque la disminución general de la probabilidad se acompaña de un aumento general en el nivel de la infección, sabemos que P, al igual que todas las probabilidades, sólo puede caer dentro de los límites de 0 y 1. En consecuencia, es mejor asumir que la relación entre X1 y P es sigmoidal (forma de S), en lugar de una línea recta.

Es posible, sin embargo, para encontrar una relación lineal entre X1 y una función de P. Aunque un número de funciones de trabajo, uno de los más útil es la función logit. Es el logaritmo natural de las probabilidades de que y es igual a 1, que es simplemente la relación de la probabilidad de que Y es 1 dividido por la probabilidad de que Y es 0. La relación entre el logit de P y P es en sí en forma sigmoidal . La ecuación de regresión que resulta es:

En [P /(1-P)] = B0 + B1 * X1 + B2 * X2 + ...

Aunque el lado izquierdo de esta ecuación parece intimidante, esta forma de expresar los resultados de probabilidad en el lado derecho de la ecuación es lineal y mirando familiar para nosotros. Esto nos ayuda a entender el significado de los coeficientes de regresión. Los coeficientes se pueden transformar fácilmente por lo que su interpretación tiene sentido.

La ecuación de regresión logística se puede extender más allá del caso de una variable de respuesta dicotómica para los casos de categorías ordenadas y categorías polytymous (más de dos categorías).
.

consulta de trabajo

  1. Aprovechar al máximo de su stand de feria
  2. Cómo detección de gas portátiles Minimiza el riesgo de Trabajadores
  3. Entrenador de la bolsa de pañales se puede producir para obtener una cantidad de factores
  4. Consejos para vender su oro
  5. Auto Insurance gratuito Hoja de ruta útil para Seguro de Auto
  6. Necesidades Canadian Business Banking? The Edge en la orilla Líneas de créditos! ¿Quién es mejor…
  7. Planificación Financiera requiere un conocimiento profundo, contratar a un planificador financiero …
  8. Libre computadora llamada a teléfonos fijos
  9. El conocimiento sobre la comunicación
  10. Hay muchos proveedores de VoIP por ahí
  11. De vídeo basado en la web Entrevista: El reclutamiento en línea
  12. La necesidad de abogados
  13. El accesorio más común para las mujeres - El reloj de pulsera
  14. ¿Cómo el cumplimiento de servicios de Internet pueden ser de ayuda para su negocio?
  15. Ilusión # 5 Llámeme cuando usted tiene una venta
  16. ¿Por ANOVA y regresión lineal son los mismos análisis
  17. Consejos para comprar buenos jugadores de DVD
  18. Los datos de Aduanas es importante en los negocios de comercio internacional
  19. Material de oficina indispensable para una empresa de negocio
  20. El desarrollo de su nicho de mercado mediante el desarrollo de una alianza estratégica