Buenos días a todxs, Estoy comparando la predicción de los valores (0, 1, 2, 3,.....hasta 13) frente a los observados. Con la idea de comparar el modelo Zero inflated y el Binomial negativo y ver cual presenta mas distancia frente a las predicciones observadas. Para ello introduzco los códigos en la consola: #Modelo ZIM pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) #Valores observados realmente obs<-table(IB$nijt)[1:14] #Tabla comparativa rbind( pred, obs) Y obtengo la siguiente tabla: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 pred 3600 589 349 224 151 105 75 55 42 32 25 20 16 13 obs 3529 743 300 203 135 81 76 44 33 37 30 12 14 13 La duda me surge al intentarlo con el Modelo Binomial negativo.¿Sabeis que comando podría introducir para obtener los 13 valores predichos por el modelo BN? Muchas gracias por vuestra ayuda y buen día. Lorena [[alternative HTML version deleted]]
Hola Lorena, Sin tener muy claro lo que estas haciendo (deberías tratar de proporcionar código reproducible, p.e. como se llega a los distintos modelos a partir de un conj de datos de juguete), entiendo que con la función predict(zeroinfl, type="prob") obtienes estimaciones de las probabilidades de las 14 categorías para cada uno de los individuos? Simplemente ten en cuenta que lo que estas haciendo no sería realmente predecir la categoría (aunque creo que serviría para comparar modelos), se supone que la predicción sería la categoría con mayor probabilidad estimada? la media estimada? (si no me equivoco, lo que estas haciendo se parece más a esto último, aunque no exactamente eso...). Un saludo, Rubén. El 06/11/2014 10:48, Lorena Tudela Marco escribió:> Buenos días a todxs, > > Estoy comparando la predicción de los valores (0, 1, 2, 3,.....hasta 13) > frente a los observados. > Con la idea de comparar el modelo Zero inflated y el Binomial negativo y > ver cual presenta mas distancia frente a las predicciones observadas. > > Para ello introduzco los códigos en la consola: > > #Modelo ZIM > pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) > #Valores observados realmente > obs<-table(IB$nijt)[1:14] > #Tabla comparativa > rbind( pred, obs) > > Y obtengo la siguiente tabla: > > 0 1 2 3 4 5 6 7 8 9 10 11 12 13 > pred 3600 589 349 224 151 105 75 55 42 32 25 20 16 13 > obs 3529 743 300 203 135 81 76 44 33 37 30 12 14 13 > > La duda me surge al intentarlo con el Modelo Binomial negativo.¿Sabeis que > comando podría introducir para obtener los 13 valores predichos por el > modelo BN? > > Muchas gracias por vuestra ayuda y buen día. > > Lorena > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >
Hola Ruben, gracias por la rápida respuesta! ;) Si, mi idea es intentar conseguir la estimación de las probabilidades de las 14 primeras categóricas de la variable dependiente ( eg, Que probabilidad hay de que la variable Y (numero de notificaciones) sea cero? o sea uno? o dos? o sean tres notificaciones?....etc.) Y se me ocurre, que puede ser una manera de comparar los modelos para ver cual se ajusta mas a los datos reales. Que opinas? voy bien encaminada? El objetivo principal de comparar los modelos (ZIM vs NBM) a través de la probabilidad de predicciones es porq ya he calculado el test de Voung y los criterios AIC/BIC y cada uno apuesta por un modelo diferente....así que me gustaria contrastarlos una vez mas... Cualquier sugerencia o aportación es bienvenida! gracias! Buena mañana! Lore El 6 de noviembre de 2014, 11:41, rubenfcasal <rubenfcasal en gmail.com> escribió:> Hola Lorena, > > Sin tener muy claro lo que estas haciendo (deberías tratar de > proporcionar código reproducible, p.e. como se llega a los distintos > modelos a partir de un conj de datos de juguete), entiendo que con la > función predict(zeroinfl, type="prob") obtienes estimaciones de las > probabilidades de las 14 categorías para cada uno de los individuos? > > Simplemente ten en cuenta que lo que estas haciendo no sería realmente > predecir la categoría (aunque creo que serviría para comparar modelos), se > supone que la predicción sería la categoría con mayor probabilidad > estimada? la media estimada? (si no me equivoco, lo que estas haciendo se > parece más a esto último, aunque no exactamente eso...). > > Un saludo, Rubén. > > > El 06/11/2014 10:48, Lorena Tudela Marco escribió: > >> Buenos días a todxs, >> >> Estoy comparando la predicción de los valores (0, 1, 2, 3,.....hasta 13) >> frente a los observados. >> Con la idea de comparar el modelo Zero inflated y el Binomial negativo y >> ver cual presenta mas distancia frente a las predicciones observadas. >> >> Para ello introduzco los códigos en la consola: >> >> #Modelo ZIM >> pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) >> #Valores observados realmente >> obs<-table(IB$nijt)[1:14] >> #Tabla comparativa >> rbind( pred, obs) >> >> Y obtengo la siguiente tabla: >> >> 0 1 2 3 4 5 6 7 8 9 10 11 12 13 >> pred 3600 589 349 224 151 105 75 55 42 32 25 20 16 13 >> obs 3529 743 300 203 135 81 76 44 33 37 30 12 14 13 >> >> La duda me surge al intentarlo con el Modelo Binomial negativo.¿Sabeis que >> comando podría introducir para obtener los 13 valores predichos por el >> modelo BN? >> >> Muchas gracias por vuestra ayuda y buen día. >> >> Lorena >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Estimada Lorena Tudela Voy a escribir algo por como yo lo aprendí (quizás mal redactado para un estad?itico), lo observado es lo que se mide a campo y lo predicho es lo que surge a partir del modelo estadístico. Luego aprendí como realizarlo con R, pero no siempre es posible en forma fácil, porque hay librerías que tienen dentro de sus algoritmos la forma adecuada para la predicción, en cambio otras no, y hay que realizarlo a mano. Por lo cuál es necesario conocer que herramienta dentro de R está utilizando para sus modelos. Porque, puede ser que ella misma tenga la solución o se deba escribir en código R, y no siempre se pueden combinar una librería con la otra. Javier Marcuzzi El 06/11/14 a las 06:48, Lorena Tudela Marco escibió:> Buenos días a todxs, > > Estoy comparando la predicción de los valores (0, 1, 2, 3,.....hasta 13) > frente a los observados. > Con la idea de comparar el modelo Zero inflated y el Binomial negativo y > ver cual presenta mas distancia frente a las predicciones observadas. > > Para ello introduzco los códigos en la consola: > > #Modelo ZIM > pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) > #Valores observados realmente > obs<-table(IB$nijt)[1:14] > #Tabla comparativa > rbind( pred, obs) > > Y obtengo la siguiente tabla: > > 0 1 2 3 4 5 6 7 8 9 10 11 12 13 > pred 3600 589 349 224 151 105 75 55 42 32 25 20 16 13 > obs 3529 743 300 203 135 81 76 44 33 37 30 12 14 13 > > La duda me surge al intentarlo con el Modelo Binomial negativo.¿Sabeis que > comando podría introducir para obtener los 13 valores predichos por el > modelo BN? > > Muchas gracias por vuestra ayuda y buen día. > > Lorena > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Hola Javier, Si, cuando hablo de valor observado me refiero al valor real en campo y el predicho al que estiman los modelos. Disculpa, que no lo detallase así desde el principio. En mi caso trabajo con dos diferentes: Zero inflated y Binomial Negativo y me gustaría comprobar que diferencia (distancia) existe entre cada uno de ellos y la realidad. Estoy trabajando con los siguientes paquetes: library(pscl) library(MASS) library(AER) library(VGAM) library(truncreg) library(censReg) library(sampleSelection) library(ggplot2) library(boot) library(aod) library(lmtest) library(zoo) library(nlme) library(lmtest) library(boot) library(spatcounts) Mi duda es: ¿Que comando podría utilizar para calcular por valores predichos por el Binomial negativo para los 14 primeros valores de la variable dependiente? En el caso del ZIM utilizo: pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) Gracias por vuestra ayuda! ;) Lore El 6 de noviembre de 2014, 12:30, "Marcuzzi, Javier Rubén" < javier.ruben.marcuzzi en gmail.com> escribió:> Estimada Lorena Tudela > > Voy a escribir algo por como yo lo aprendí (quizás mal redactado para un > estad?itico), lo observado es lo que se mide a campo y lo predicho es lo > que surge a partir del modelo estadístico. Luego aprendí como realizarlo > con R, pero no siempre es posible en forma fácil, porque hay librerías que > tienen dentro de sus algoritmos la forma adecuada para la predicción, en > cambio otras no, y hay que realizarlo a mano. > > Por lo cuál es necesario conocer que herramienta dentro de R está > utilizando para sus modelos. Porque, puede ser que ella misma tenga la > solución o se deba escribir en código R, y no siempre se pueden combinar > una librería con la otra. > > Javier Marcuzzi > > El 06/11/14 a las 06:48, Lorena Tudela Marco escibió: > >> Buenos días a todxs, >> >> Estoy comparando la predicción de los valores (0, 1, 2, 3,.....hasta 13) >> frente a los observados. >> Con la idea de comparar el modelo Zero inflated y el Binomial negativo y >> ver cual presenta mas distancia frente a las predicciones observadas. >> >> Para ello introduzco los códigos en la consola: >> >> #Modelo ZIM >> pred<-round(colSums(predict(zeroinfl, type="prob") [,1:14])) >> #Valores observados realmente >> obs<-table(IB$nijt)[1:14] >> #Tabla comparativa >> rbind( pred, obs) >> >> Y obtengo la siguiente tabla: >> >> 0 1 2 3 4 5 6 7 8 9 10 11 12 13 >> pred 3600 589 349 224 151 105 75 55 42 32 25 20 16 13 >> obs 3529 743 300 203 135 81 76 44 33 37 30 12 14 13 >> >> La duda me surge al intentarlo con el Modelo Binomial negativo.¿Sabeis que >> comando podría introducir para obtener los 13 valores predichos por el >> modelo BN? >> >> Muchas gracias por vuestra ayuda y buen día. >> >> Lorena >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]