Víctor Rodríguez Galiano
2013-Apr-17 12:44 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
Hola a todos, Estoy intentando aplicar regresión logística (glm). Tengo un conjunto de variables explicativas y una variable respuesta (0 o 1). Resulta que al calcular el modelo de regresión obtengo el siguiente mensaje de error: glm.fit: fitted probabilities numerically 0 or 1 occurred Al utilizar el modelo para predecir a partir de nuevos datos, en todos los casos se asigna un valor de 1. Cuando tendrían que ser valores decimales entre 0 y 1. No se si hay alguna forma de evitar esto... He leído un poco al respecto en: http://r.789695.n4.nabble.com/glm-fit-quot-fitted-probabilities-numerically-0-or-1-occurred-quot-td849242.HTML Aquí explican el porque se produce este efecto, pero me pregunto si existe alguna forma de evitarlo, o simplemente el problema está en mis datos y no puedo aplicar regresión logística en este caso. He probado con otro tipo de metodologías como Random Forest, y no tengo problema. Pero necesito comparar los resultados con los de regresión logística. ¿Alguna sugerencia?. Gracias y saludos Víctor [[alternative HTML version deleted]]
Carlos J. Gil Bellosta
2013-Apr-17 12:52 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
¿Será que tienes un problema de separación perfecta? De ser así, échale un vistazo a http://www.datanalytics.com/blog/2010/10/25/una-solucion-al-problema-de-la-separacion-perfecta-con-regresiones-logisticas/ El día 17 de abril de 2013 14:44, Víctor Rodríguez Galiano <luxorvrg en hotmail.com> escribió:> Hola a todos, Estoy intentando aplicar regresión logística (glm). Tengo un conjunto de variables explicativas y una variable respuesta (0 o 1). Resulta que al calcular el modelo de regresión obtengo el siguiente mensaje de error: glm.fit: fitted probabilities numerically 0 or 1 occurred Al utilizar el modelo para predecir a partir de nuevos datos, en todos los casos se asigna un valor de 1. Cuando tendrían que ser valores decimales entre 0 y 1. No se si hay alguna forma de evitar esto... He leído un poco al respecto en: http://r.789695.n4.nabble.com/glm-fit-quot-fitted-probabilities-numerically-0-or-1-occurred-quot-td849242.HTML Aquí explican el porque se produce este efecto, pero me pregunto si existe alguna forma de evitarlo, o simplemente el problema está en mis datos y no puedo aplicar regresión logística en este caso. He probado con otro tipo de metodologías como Random Forest, y no tengo problema. Pero necesito comparar los resultados con los de regresión logística. ¿Alguna sugerencia?. Gracias y saludos Víctor > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >
Jorge I Velez
2013-Apr-17 14:57 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
Hola Victor, Si "y" es tu variable respuesta, cual es el resultado de table(y) ? Saludos, Jorge.- 2013/4/17 Víctor Rodríguez Galiano <luxorvrg@hotmail.com>> Hola a todos, Estoy intentando aplicar regresión logística (glm). Tengo > un conjunto de variables explicativas y una variable respuesta (0 o 1). > Resulta que al calcular el modelo de regresión obtengo el siguiente mensaje > de error: glm.fit: fitted probabilities numerically 0 or 1 occurred Al > utilizar el modelo para predecir a partir de nuevos datos, en todos los > casos se asigna un valor de 1. Cuando tendrían que ser valores decimales > entre 0 y 1. No se si hay alguna forma de evitar esto... He leído un poco > al respecto en: > http://r.789695.n4.nabble.com/glm-fit-quot-fitted-probabilities-numerically-0-or-1-occurred-quot-td849242.HTMLAquí explican el porque se produce este efecto, pero me pregunto si existe > alguna forma de evitarlo, o simplemente el problema está en mis datos y no > puedo aplicar regresión logística en este caso. He probado con otro tipo de > metodologías como Random Forest, y no tengo problema. Pero necesito > comparar los resultados con los de regresión logística. ¿Alguna > sugerencia?. Gracias y saludos Víctor > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Víctor Rodríguez Galiano
2013-Apr-17 15:40 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
Hola a todos,> table(calibrate$occ)0 1 85 90 No creo que sea un problema de separación perfecta. Si es que he entendido bien lo de separación perfecta. Es decir una separación lineal simple de los datos... No es eso, la base de datos es compleja y es posible que tenga outliers. Al aplicar el modelo de regresión logística obtengo valores muy cercanos o iguales a uno para casi el 100% de los datos. Lo esperable, y lo que obtengo con Random Forest, es diferentes valores entre 0 y 1 con una distribución más o menos normal... Gracias Víctor From: jorgeivanvelez@gmail.com Date: Thu, 18 Apr 2013 00:57:39 +1000 Subject: Re: [R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred) To: luxorvrg@hotmail.com CC: r-help-es@r-project.org Hola Victor, Si "y" es tu variable respuesta, cual es el resultado de table(y) ? Saludos, Jorge.- 2013/4/17 Víctor Rodríguez Galiano <luxorvrg@hotmail.com> Hola a todos, Estoy intentando aplicar regresión logística (glm). Tengo un conjunto de variables explicativas y una variable respuesta (0 o 1). Resulta que al calcular el modelo de regresión obtengo el siguiente mensaje de error: glm.fit: fitted probabilities numerically 0 or 1 occurred Al utilizar el modelo para predecir a partir de nuevos datos, en todos los casos se asigna un valor de 1. Cuando tendrían que ser valores decimales entre 0 y 1. No se si hay alguna forma de evitar esto... He leído un poco al respecto en: http://r.789695.n4.nabble.com/glm-fit-quot-fitted-probabilities-numerically-0-or-1-occurred-quot-td849242.HTML Aquí explican el porque se produce este efecto, pero me pregunto si existe alguna forma de evitarlo, o simplemente el problema está en mis datos y no puedo aplicar regresión logística en este caso. He probado con otro tipo de metodologías como Random Forest, y no tengo problema. Pero necesito comparar los resultados con los de regresión logística. ¿Alguna sugerencia?. Gracias y saludos Víctor [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]
José Luis Cañadas Reche
2013-Apr-17 15:51 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20130417/b40b4cd6/attachment-0001.html>
Carlos Ortega
2013-Apr-17 20:28 UTC
[R-es] regresión logística (glm.fit: fitted probabilities numerically 0 or 1 occurred)
Hola, Aquí tienes una explicación alternativa de cuál puede ser el origen de tu error: http://stackoverflow.com/questions/8596160/why-am-i-getting-algorithm-did-not-converge-and-fitted-prob-numerically-0-or Y aquí hay otras propuestas que van en la dirección que ha apuntado Carlos y donde se proponen formas de comprobar si existe o no separación perfecta: http://stats.stackexchange.com/questions/45803/logistic-regression-in-r-resulted-in-hauck-donner-phenomenon-now-what http://stats.stackexchange.com/questions/5354/logistic-regression-model-does-not-converge Saludos, Carlos Ortega www.qualityexcellence.es El 17 de abril de 2013 17:51, José Luis Cañadas Reche < canadasreche@gmail.com> escribió:> Hola. > > Quizá te sirva el paquete glm2 > > http://cran.r-project.org/web/packages/glm2/index.html > > Saludos > El 17/04/13 17:40, Víctor Rodríguez Galiano escribió: > > Hola a todos, > > table(calibrate$occ) > > 0 1 85 90 > > No creo que sea un problema de separaci�n perfecta. Si es que he entendido bien lo de separaci�n perfecta. Es decir una separaci�n lineal simple de los datos... No es eso, la base de datos es compleja y es posible que tenga outliers. Al aplicar el modelo de regresi�n log�stica obtengo valores muy cercanos o iguales a uno para casi el 100% de los datos. Lo esperable, y lo que obtengo con Random Forest, es diferentes valores entre 0 y 1 con una distribuci�n m�s o menos normal... > Gracias > V�ctor > From: jorgeivanvelez@gmail.com > Date: Thu, 18 Apr 2013 00:57:39 +1000 > Subject: Re: [R-es] regresi�n log�stica (glm.fit: fitted probabilities numerically 0 or 1 occurred) > To: luxorvrg@hotmail.com > CC: r-help-es@r-project.org > > Hola Victor, > > > Si "y" es tu variable respuesta, cual es el resultado de > > > table(y) > > > ? > Saludos, > > Jorge.- > > > > > > 2013/4/17 V�ctor Rodr�guez Galiano <luxorvrg@hotmail.com> <luxorvrg@hotmail.com> > > > Hola a todos, Estoy intentando aplicar regresi�n log�stica (glm). Tengo un conjunto de variables explicativas y una variable respuesta (0 o 1). Resulta que al calcular el modelo de regresi�n obtengo el siguiente mensaje de error: glm.fit: fitted probabilities numerically 0 or 1 occurred Al utilizar el modelo para predecir a partir de nuevos datos, en todos los casos se asigna un valor de 1. Cuando tendr�an que ser valores decimales entre 0 y 1. No se si hay alguna forma de evitar esto... He le�do un poco al respecto en: http://r.789695.n4.nabble.com/glm-fit-quot-fitted-probabilities-numerically-0-or-1-occurred-quot-td849242.HTML Aqu� explican el porque se produce este efecto, pero me pregunto si existe alguna forma de evitarlo, o simplemente el problema est� en mis datos y ! > no puedo a > plicar regresi�n log�stica en este caso. He probado con otro tipo de metodolog�as como Random Forest, y no tengo problema. Pero necesito comparar los resultados con los de regresi�n log�stica. �Alguna sugerencia?. Gracias y saludos V�ctor > > > > [[alternative HTML version deleted]] > > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > [[alternative HTML version deleted]] > > > > > _______________________________________________ > R-help-es mailing listR-help-es@r-project.orghttps://stat.ethz.ch/mailman/listinfo/r-help-es > > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]