Antonio José Sáez Castillo
2011-Apr-13 05:05 UTC
[R-es] Modelo para datos de conteos (Manuel Spínola)
Una distribución binomial negativa podría ser adecuada. De hecho, una
extensión de la binomial negativa, como la distribución de Waring
generalizada, termina convergiendo a una distribución binomial negativa.
Puedes ver que la mejora en la bondad del ajuste de la binomial negativa
con respecto a la Poisson es sustancial (te muestro también las salidas.).
datos<-c(1280, 1262, 1290, 1321, 1318, 1232, 1742, 1351, 1271, 1398,
1295, 1460, 1431, 966, 1474, 1831, 1453, 1274,971, 1286, 1403, 1488,
1666, 1406, 1432, 1503, 1739,1411, 1361, 1223, 1303, 1452, 1293, 1353,
1383, 1390,1402, 1307, 1438, 1398, 1440, 1427, 1414, 1323, 1340,1968,
1825, 1251, 1897, 876, 442, 948, 1548, 1535)
datos<-data.frame(y=datos)
glm.nb(y~1,data=datos)
Call: glm.nb(formula = y ~ 1, data = datos, init.theta = 25.57251534,
link = log)
Coefficients:
(Intercept)
7.23
Degrees of Freedom: 53 Total (i.e. Null); 53 Residual
Null Deviance: 54.55
Residual Deviance: 54.55 AIC: 762.7
glm(y~1,family="poisson",data=datos)
Call: glm(formula = y ~ 1, family = "poisson", data = datos)
Coefficients:
(Intercept)
7.23
Degrees of Freedom: 53 Total (i.e. Null); 53 Residual
Null Deviance: 2607
Residual Deviance: 2607 AIC: 3097
library(GWRM)
GWRM.fit(y~1,data=datos)$aic
[1] 764.7715
El 12/04/2011 20:58, r-help-es-request@r-project.org escribió:
----------------------------------------------------------------------
Message: 1
Date: Tue, 12 Apr 2011 07:59:51 -0600
From: Manuel Spínola<mspinola10@gmail.com>
To:r-help-es@r-project.org
Subject: [R-es] Modelo para datos de conteos
Message-ID:<BANLkTin3Xibq7JefqcDVSv5mt3zSmj-x0Q@mail.gmail.com>
Content-Type: text/plain
Estimados compañeros de la lista,
Estoy intentando modelar la riqueza de especies florísticas de una región de
América Latina pero la variable respuesta (riqueza) tiene un comportamiento
muy particular. Son conteos en el orden de los cientos y miles, valor
mínimo 442, máximo 1968. La variable muestra atípicos "hacia arriba y
hacia
abajo", pero si hago una transformación logarítmica no corrijo los
atípicos.
> > dput(riq$riqueza)
c(1280L, 1262L, 1290L, 1321L, 1318L, 1232L, 1742L, 1351L, 1271L,
1398L, 1295L, 1460L, 1431L, 966L, 1474L, 1831L, 1453L, 1274L,
971L, 1286L, 1403L, 1488L, 1666L, 1406L, 1432L, 1503L, 1739L,
1411L, 1361L, 1223L, 1303L, 1452L, 1293L, 1353L, 1383L, 1390L,
1402L, 1307L, 1438L, 1398L, 1440L, 1427L, 1414L, 1323L, 1340L,
1968L, 1825L, 1251L, 1897L, 876L, 442L, 948L, 1548L, 1535L)
Yo estoy pensando en usar un modelo con la función binomial negativa ya que
los datos muestran sobredisperisón para realizar un modelo de Poisson.
¿Sería esto correcto?
¿Existen otras alternativas?
Muchas gracias,
Manuel Spínola
-- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y
Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000
Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono:
(506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río
<https://sites.google.com/site/lobitoderio/> Institutional website:
ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version
deleted]]
--
Dr. Antonio José Sáez Castillo
Dpto. de Estadística e Investigación Operativa
Escuela Politécnica Superior de Linares
Universidad de Jaén
C/ Alfonso X El Sabio 28, 23700 Linares (Jaén) ESPAÑA
Tlf. y FAX +34 953 648578
[[alternative HTML version deleted]]
Muchas gracias Antonio. ¿Cómo se hace para obtener el Theta inicial? ¿la intepretación de los coeficientes en una binomial negativa es similar a la de la regresión de Poisson? ¿Se extrae el antilogaritmo del coeficiente? Saludos, Manuel El 12 de abril de 2011 23:05, Antonio José Sáez Castillo <ajsaez@ujaen.es>escribió:> Una distribución binomial negativa podría ser adecuada. De hecho, una > extensión de la binomial negativa, como la distribución de Waring > generalizada, termina convergiendo a una distribución binomial negativa. > Puedes ver que la mejora en la bondad del ajuste de la binomial negativa > con respecto a la Poisson es sustancial (te muestro también las salidas.). > > datos<-c(1280, 1262, 1290, 1321, 1318, 1232, 1742, 1351, 1271, 1398, > 1295, 1460, 1431, 966, 1474, 1831, 1453, 1274,971, 1286, 1403, 1488, > 1666, 1406, 1432, 1503, 1739,1411, 1361, 1223, 1303, 1452, 1293, 1353, > 1383, 1390,1402, 1307, 1438, 1398, 1440, 1427, 1414, 1323, 1340,1968, > 1825, 1251, 1897, 876, 442, 948, 1548, 1535) > datos<-data.frame(y=datos) > glm.nb(y~1,data=datos) > > Call: glm.nb(formula = y ~ 1, data = datos, init.theta = 25.57251534, > link = log) > > Coefficients: > (Intercept) > 7.23 > > Degrees of Freedom: 53 Total (i.e. Null); 53 Residual > Null Deviance: 54.55 > Residual Deviance: 54.55 AIC: 762.7 > > > > glm(y~1,family="poisson",data=datos) > > Call: glm(formula = y ~ 1, family = "poisson", data = datos) > > Coefficients: > (Intercept) > 7.23 > > Degrees of Freedom: 53 Total (i.e. Null); 53 Residual > Null Deviance: 2607 > Residual Deviance: 2607 AIC: 3097 > > > library(GWRM) > GWRM.fit(y~1,data=datos)$aic > > [1] 764.7715 > > > > El 12/04/2011 20:58, r-help-es-request@r-project.org escribió: > > ---------------------------------------------------------------------- > > Message: 1 > Date: Tue, 12 Apr 2011 07:59:51 -0600 > From: Manuel Spínola<mspinola10@gmail.com> > To:r-help-es@r-project.org > Subject: [R-es] Modelo para datos de conteos > Message-ID:<BANLkTin3Xibq7JefqcDVSv5mt3zSmj-x0Q@mail.gmail.com> > Content-Type: text/plain > > Estimados compañeros de la lista, > > Estoy intentando modelar la riqueza de especies florísticas de una > región de > América Latina pero la variable respuesta (riqueza) tiene un > comportamiento > muy particular. Son conteos en el orden de los cientos y miles, valor > mínimo 442, máximo 1968. La variable muestra atípicos "hacia arriba y > hacia > abajo", pero si hago una transformación logarítmica no corrijo los > atípicos. > > > > > dput(riq$riqueza) > c(1280L, 1262L, 1290L, 1321L, 1318L, 1232L, 1742L, 1351L, 1271L, > 1398L, 1295L, 1460L, 1431L, 966L, 1474L, 1831L, 1453L, 1274L, > 971L, 1286L, 1403L, 1488L, 1666L, 1406L, 1432L, 1503L, 1739L, > 1411L, 1361L, 1223L, 1303L, 1452L, 1293L, 1353L, 1383L, 1390L, > 1402L, 1307L, 1438L, 1398L, 1440L, 1427L, 1414L, 1323L, 1340L, > 1968L, 1825L, 1251L, 1897L, 876L, 442L, 948L, 1548L, 1535L) > > Yo estoy pensando en usar un modelo con la función binomial negativa ya > que > los datos muestran sobredisperisón para realizar un modelo de Poisson. > > ¿Sería esto correcto? > ¿Existen otras alternativas? > > Muchas gracias, > > Manuel Spínola > > > > -- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y > Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000 > Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono: > (506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río > <https://sites.google.com/site/lobitoderio/> Institutional website: > ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version > deleted]] > > > -- > Dr. Antonio José Sáez Castillo > Dpto. de Estadística e Investigación Operativa > Escuela Politécnica Superior de Linares > Universidad de Jaén > C/ Alfonso X El Sabio 28, 23700 Linares (Jaén) ESPAÑA > Tlf. y FAX +34 953 648578 > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- *Manuel Spínola, Ph.D.* Instituto Internacional en Conservación y Manejo de Vida Silvestre Universidad Nacional Apartado 1350-3000 Heredia COSTA RICA mspinola@una.ac.cr mspinola10@gmail.com Teléfono: (506) 2277-3598 Fax: (506) 2237-7036 Personal website: Lobito de río <https://sites.google.com/site/lobitoderio/> Institutional website: ICOMVIS <http://www.icomvis.una.ac.cr/> [[alternative HTML version deleted]]