Antonio José Sáez Castillo
2011-Apr-13 05:05 UTC
[R-es] Modelo para datos de conteos (Manuel Spínola)
Una distribución binomial negativa podría ser adecuada. De hecho, una extensión de la binomial negativa, como la distribución de Waring generalizada, termina convergiendo a una distribución binomial negativa. Puedes ver que la mejora en la bondad del ajuste de la binomial negativa con respecto a la Poisson es sustancial (te muestro también las salidas.). datos<-c(1280, 1262, 1290, 1321, 1318, 1232, 1742, 1351, 1271, 1398, 1295, 1460, 1431, 966, 1474, 1831, 1453, 1274,971, 1286, 1403, 1488, 1666, 1406, 1432, 1503, 1739,1411, 1361, 1223, 1303, 1452, 1293, 1353, 1383, 1390,1402, 1307, 1438, 1398, 1440, 1427, 1414, 1323, 1340,1968, 1825, 1251, 1897, 876, 442, 948, 1548, 1535) datos<-data.frame(y=datos) glm.nb(y~1,data=datos) Call: glm.nb(formula = y ~ 1, data = datos, init.theta = 25.57251534, link = log) Coefficients: (Intercept) 7.23 Degrees of Freedom: 53 Total (i.e. Null); 53 Residual Null Deviance: 54.55 Residual Deviance: 54.55 AIC: 762.7 glm(y~1,family="poisson",data=datos) Call: glm(formula = y ~ 1, family = "poisson", data = datos) Coefficients: (Intercept) 7.23 Degrees of Freedom: 53 Total (i.e. Null); 53 Residual Null Deviance: 2607 Residual Deviance: 2607 AIC: 3097 library(GWRM) GWRM.fit(y~1,data=datos)$aic [1] 764.7715 El 12/04/2011 20:58, r-help-es-request@r-project.org escribió: ---------------------------------------------------------------------- Message: 1 Date: Tue, 12 Apr 2011 07:59:51 -0600 From: Manuel Spínola<mspinola10@gmail.com> To:r-help-es@r-project.org Subject: [R-es] Modelo para datos de conteos Message-ID:<BANLkTin3Xibq7JefqcDVSv5mt3zSmj-x0Q@mail.gmail.com> Content-Type: text/plain Estimados compañeros de la lista, Estoy intentando modelar la riqueza de especies florísticas de una región de América Latina pero la variable respuesta (riqueza) tiene un comportamiento muy particular. Son conteos en el orden de los cientos y miles, valor mínimo 442, máximo 1968. La variable muestra atípicos "hacia arriba y hacia abajo", pero si hago una transformación logarítmica no corrijo los atípicos.> > dput(riq$riqueza)c(1280L, 1262L, 1290L, 1321L, 1318L, 1232L, 1742L, 1351L, 1271L, 1398L, 1295L, 1460L, 1431L, 966L, 1474L, 1831L, 1453L, 1274L, 971L, 1286L, 1403L, 1488L, 1666L, 1406L, 1432L, 1503L, 1739L, 1411L, 1361L, 1223L, 1303L, 1452L, 1293L, 1353L, 1383L, 1390L, 1402L, 1307L, 1438L, 1398L, 1440L, 1427L, 1414L, 1323L, 1340L, 1968L, 1825L, 1251L, 1897L, 876L, 442L, 948L, 1548L, 1535L) Yo estoy pensando en usar un modelo con la función binomial negativa ya que los datos muestran sobredisperisón para realizar un modelo de Poisson. ¿Sería esto correcto? ¿Existen otras alternativas? Muchas gracias, Manuel Spínola -- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000 Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono: (506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río <https://sites.google.com/site/lobitoderio/> Institutional website: ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version deleted]] -- Dr. Antonio José Sáez Castillo Dpto. de Estadística e Investigación Operativa Escuela Politécnica Superior de Linares Universidad de Jaén C/ Alfonso X El Sabio 28, 23700 Linares (Jaén) ESPAÑA Tlf. y FAX +34 953 648578 [[alternative HTML version deleted]]
Muchas gracias Antonio. ¿Cómo se hace para obtener el Theta inicial? ¿la intepretación de los coeficientes en una binomial negativa es similar a la de la regresión de Poisson? ¿Se extrae el antilogaritmo del coeficiente? Saludos, Manuel El 12 de abril de 2011 23:05, Antonio José Sáez Castillo <ajsaez@ujaen.es>escribió:> Una distribución binomial negativa podría ser adecuada. De hecho, una > extensión de la binomial negativa, como la distribución de Waring > generalizada, termina convergiendo a una distribución binomial negativa. > Puedes ver que la mejora en la bondad del ajuste de la binomial negativa > con respecto a la Poisson es sustancial (te muestro también las salidas.). > > datos<-c(1280, 1262, 1290, 1321, 1318, 1232, 1742, 1351, 1271, 1398, > 1295, 1460, 1431, 966, 1474, 1831, 1453, 1274,971, 1286, 1403, 1488, > 1666, 1406, 1432, 1503, 1739,1411, 1361, 1223, 1303, 1452, 1293, 1353, > 1383, 1390,1402, 1307, 1438, 1398, 1440, 1427, 1414, 1323, 1340,1968, > 1825, 1251, 1897, 876, 442, 948, 1548, 1535) > datos<-data.frame(y=datos) > glm.nb(y~1,data=datos) > > Call: glm.nb(formula = y ~ 1, data = datos, init.theta = 25.57251534, > link = log) > > Coefficients: > (Intercept) > 7.23 > > Degrees of Freedom: 53 Total (i.e. Null); 53 Residual > Null Deviance: 54.55 > Residual Deviance: 54.55 AIC: 762.7 > > > > glm(y~1,family="poisson",data=datos) > > Call: glm(formula = y ~ 1, family = "poisson", data = datos) > > Coefficients: > (Intercept) > 7.23 > > Degrees of Freedom: 53 Total (i.e. Null); 53 Residual > Null Deviance: 2607 > Residual Deviance: 2607 AIC: 3097 > > > library(GWRM) > GWRM.fit(y~1,data=datos)$aic > > [1] 764.7715 > > > > El 12/04/2011 20:58, r-help-es-request@r-project.org escribió: > > ---------------------------------------------------------------------- > > Message: 1 > Date: Tue, 12 Apr 2011 07:59:51 -0600 > From: Manuel Spínola<mspinola10@gmail.com> > To:r-help-es@r-project.org > Subject: [R-es] Modelo para datos de conteos > Message-ID:<BANLkTin3Xibq7JefqcDVSv5mt3zSmj-x0Q@mail.gmail.com> > Content-Type: text/plain > > Estimados compañeros de la lista, > > Estoy intentando modelar la riqueza de especies florísticas de una > región de > América Latina pero la variable respuesta (riqueza) tiene un > comportamiento > muy particular. Son conteos en el orden de los cientos y miles, valor > mínimo 442, máximo 1968. La variable muestra atípicos "hacia arriba y > hacia > abajo", pero si hago una transformación logarítmica no corrijo los > atípicos. > > > > > dput(riq$riqueza) > c(1280L, 1262L, 1290L, 1321L, 1318L, 1232L, 1742L, 1351L, 1271L, > 1398L, 1295L, 1460L, 1431L, 966L, 1474L, 1831L, 1453L, 1274L, > 971L, 1286L, 1403L, 1488L, 1666L, 1406L, 1432L, 1503L, 1739L, > 1411L, 1361L, 1223L, 1303L, 1452L, 1293L, 1353L, 1383L, 1390L, > 1402L, 1307L, 1438L, 1398L, 1440L, 1427L, 1414L, 1323L, 1340L, > 1968L, 1825L, 1251L, 1897L, 876L, 442L, 948L, 1548L, 1535L) > > Yo estoy pensando en usar un modelo con la función binomial negativa ya > que > los datos muestran sobredisperisón para realizar un modelo de Poisson. > > ¿Sería esto correcto? > ¿Existen otras alternativas? > > Muchas gracias, > > Manuel Spínola > > > > -- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y > Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000 > Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono: > (506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río > <https://sites.google.com/site/lobitoderio/> Institutional website: > ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version > deleted]] > > > -- > Dr. Antonio José Sáez Castillo > Dpto. de Estadística e Investigación Operativa > Escuela Politécnica Superior de Linares > Universidad de Jaén > C/ Alfonso X El Sabio 28, 23700 Linares (Jaén) ESPAÑA > Tlf. y FAX +34 953 648578 > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000 Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono: (506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río <https://sites.google.com/site/lobitoderio/> Institutional website: ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version deleted]]