Estimados colisteros, estudio la relación entre la frecuencia de aparición de especies vegetales típicas de humedales con los usos del suelo circundantes a los mismos, y para ello uso datos de un estudio temporal de vegetación en humedales, por lo que los éstos no son completamente independientes sino que están agrupados en base a cada humedal. He usado modelos mixtos generalizados, concretamente la función "glmer" del paquete "lme4" con la familia binomial, aunque sólo cuento con dos años de estudio, o sea dos puntos por cada humedal. La relación que presentan cada especie y uso de suelo es consistente entre humedales y los modelos obtenidos son significativos considerando tanto el intercepto de cada humedal, como éste junto con la pendiente como variables aleatorias, pero el intervalo de confianza de las predicciones "de la población" es muy alto porque cada humedal presenta unos rangos y "pendiente" (si se puede llamar así con sólo dos puntos) muy distinta. En ese sentido no sé si estos modelos están bien planteados así, y si serán realmente útiles para mi propósito, que es conocer la relación general entre las variables de uso y de vegetación. ¿Alguien tiene alguna experiencia con datos similares? Gracias! Javier --- Javier Martínez López Departmento de Ecología e Hidrología Facultad de Biología Universidad de Murcia [[alternative HTML version deleted]]
Javier, para ajustar una recta necesitas al menos 3 puntos. Si sólo tienes dos puntos, tu ajuste es artificialmente perfecto, y no puedes evaluar la varianza residual. Lo cual suele generar intervalos de confianza mal definidos en los paquetes estadísticos. Por lo tanto, te aconsejo utilizar un modelo sin pendiente. Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez en iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 15/11/2010, a las 19:30, Javier Martinez escribió:> Estimados colisteros, > > estudio la relación entre la frecuencia de aparición de especies > vegetales > típicas de humedales con los usos del suelo circundantes a los > mismos, y > para ello uso datos de un estudio temporal de vegetación en > humedales, por > lo que los éstos no son completamente independientes sino que están > agrupados en base a cada humedal. He usado modelos mixtos > generalizados, > concretamente la función "glmer" del paquete "lme4" con la familia > binomial, > aunque sólo cuento con dos años de estudio, o sea dos puntos por cada > humedal. La relación que presentan cada especie y uso de suelo es > consistente entre humedales y los modelos obtenidos son significativos > considerando tanto el intercepto de cada humedal, como éste junto > con la > pendiente como variables aleatorias, pero el intervalo de > confianza de las > predicciones "de la población" es muy alto porque cada humedal > presenta unos > rangos y "pendiente" (si se puede llamar así con sólo dos puntos) muy > distinta. En ese sentido no sé si estos modelos están bien > planteados así, y > si serán realmente útiles para mi propósito, que es conocer la > relación > general entre las variables de uso y de vegetación. ¿Alguien tiene > alguna > experiencia con datos similares? > > Gracias! > > Javier > > --- > Javier Martínez López > Departmento de Ecología e Hidrología > Facultad de Biología > Universidad de Murcia > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Hola Olivier, ¿te refieres a poner la variable independiente en el modelo como constante (~1) o a no incluir dicha variable en los términos aleatorios? Gracias y saludos, Javier 2010/11/15 Olivier Nuñez <onunez@iberstat.es>> Javier, > > para ajustar una recta necesitas al menos 3 puntos. > Si sólo tienes dos puntos, tu ajuste es artificialmente perfecto, y no > puedes evaluar la varianza residual. > Lo cual suele generar intervalos de confianza mal definidos en los paquetes > estadísticos. > Por lo tanto, te aconsejo utilizar un modelo sin pendiente. > Un saludo. Olivier > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez@iberstat.es > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 15/11/2010, a las 19:30, Javier Martinez escribió: > > Estimados colisteros, >> >> estudio la relación entre la frecuencia de aparición de especies vegetales >> típicas de humedales con los usos del suelo circundantes a los mismos, y >> para ello uso datos de un estudio temporal de vegetación en humedales, por >> lo que los éstos no son completamente independientes sino que están >> agrupados en base a cada humedal. He usado modelos mixtos generalizados, >> concretamente la función "glmer" del paquete "lme4" con la familia >> binomial, >> aunque sólo cuento con dos años de estudio, o sea dos puntos por cada >> humedal. La relación que presentan cada especie y uso de suelo es >> consistente entre humedales y los modelos obtenidos son significativos >> considerando tanto el intercepto de cada humedal, como éste junto con la >> pendiente como variables aleatorias, pero el intervalo de confianza de >> las >> predicciones "de la población" es muy alto porque cada humedal presenta >> unos >> rangos y "pendiente" (si se puede llamar así con sólo dos puntos) muy >> distinta. En ese sentido no sé si estos modelos están bien planteados así, >> y >> si serán realmente útiles para mi propósito, que es conocer la relación >> general entre las variables de uso y de vegetación. ¿Alguien tiene alguna >> experiencia con datos similares? >> >> Gracias! >> >> Javier >> >> --- >> Javier Martínez López >> Departmento de Ecología e Hidrología >> Facultad de Biología >> Universidad de Murcia >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > >[[alternative HTML version deleted]]
Javier, me refiero a que en el modelo intra-humedal, el termino aleatorio sea sólo la constante. En otras palabra, si la j-esima observación (j=1,2) sobre el i-esimo humedal es Y_ij , tu modelo debería ser E(Y_ij | a_i ) = g( a_i + b*X_ij), donde a_i es un termino que varía de manera aleatoria de un humedal atro, b es la pendiente común a todos los humedales, los X_ij son variables explicativas, y g es la función de vinculo del modelo lineal generalizado. Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez en iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 15/11/2010, a las 20:35, Javier Martinez escribió:> Hola Olivier, ¿te refieres a poner la variable independiente en el > modelo como constante (~1) o a no incluir dicha variable en los > términos aleatorios? > > Gracias y saludos, > > Javier > > 2010/11/15 Olivier Nuñez <onunez en iberstat.es> > Javier, > > para ajustar una recta necesitas al menos 3 puntos. > Si sólo tienes dos puntos, tu ajuste es artificialmente perfecto, y > no puedes evaluar la varianza residual. > Lo cual suele generar intervalos de confianza mal definidos en los > paquetes estadísticos. > Por lo tanto, te aconsejo utilizar un modelo sin pendiente. > Un saludo. Olivier > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez en iberstat.es > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 15/11/2010, a las 19:30, Javier Martinez escribió: > > Estimados colisteros, > > estudio la relación entre la frecuencia de aparición de especies > vegetales > típicas de humedales con los usos del suelo circundantes a los > mismos, y > para ello uso datos de un estudio temporal de vegetación en > humedales, por > lo que los éstos no son completamente independientes sino que están > agrupados en base a cada humedal. He usado modelos mixtos > generalizados, > concretamente la función "glmer" del paquete "lme4" con la familia > binomial, > aunque sólo cuento con dos años de estudio, o sea dos puntos por cada > humedal. La relación que presentan cada especie y uso de suelo es > consistente entre humedales y los modelos obtenidos son significativos > considerando tanto el intercepto de cada humedal, como éste junto > con la > pendiente como variables aleatorias, pero el intervalo de > confianza de las > predicciones "de la población" es muy alto porque cada humedal > presenta unos > rangos y "pendiente" (si se puede llamar así con sólo dos puntos) muy > distinta. En ese sentido no sé si estos modelos están bien > planteados así, y > si serán realmente útiles para mi propósito, que es conocer la > relación > general entre las variables de uso y de vegetación. ¿Alguien tiene > alguna > experiencia con datos similares? > > Gracias! > > Javier > > --- > Javier Martínez López > Departmento de Ecología e Hidrología > Facultad de Biología > Universidad de Murcia > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >
entiendo, supongo que el modelo con el intercepto aleatorio sí lo puedo usar entonces y es válido para mostrar la tendencia media, aunque no para predecir debido a que el IC es muy alto. Gracias y saludos, Javier 2010/11/15 Olivier Nuñez <onunez@iberstat.es>> Javier, > > me refiero a que en el modelo intra-humedal, el termino aleatorio sea sólo > la constante. > En otras palabra, si la j-esima observación (j=1,2) sobre el i-esimo > humedal es Y_ij , tu modelo debería ser > > E(Y_ij | a_i ) = g( a_i + b*X_ij), > > donde a_i es un termino que varía de manera aleatoria de un humedal atro, > b es la pendiente común a todos los humedales, > los X_ij son variables explicativas, > y g es la función de vinculo del modelo lineal generalizado. > > > Un saludo. Olivier > > -- ____________________________________ > > Olivier G. Nuñez > Email: onunez@iberstat.es > Tel : +34 663 03 69 09 > Web: http://www.iberstat.es > > ____________________________________ > > > > > El 15/11/2010, a las 20:35, Javier Martinez escribió: > > > Hola Olivier, ¿te refieres a poner la variable independiente en el modelo >> como constante (~1) o a no incluir dicha variable en los términos >> aleatorios? >> >> Gracias y saludos, >> >> Javier >> >> 2010/11/15 Olivier Nuñez <onunez@iberstat.es> >> Javier, >> >> para ajustar una recta necesitas al menos 3 puntos. >> Si sólo tienes dos puntos, tu ajuste es artificialmente perfecto, y no >> puedes evaluar la varianza residual. >> Lo cual suele generar intervalos de confianza mal definidos en los >> paquetes estadísticos. >> Por lo tanto, te aconsejo utilizar un modelo sin pendiente. >> Un saludo. Olivier >> -- ____________________________________ >> >> Olivier G. Nuñez >> Email: onunez@iberstat.es >> Tel : +34 663 03 69 09 >> Web: http://www.iberstat.es >> >> ____________________________________ >> >> >> >> >> El 15/11/2010, a las 19:30, Javier Martinez escribió: >> >> Estimados colisteros, >> >> estudio la relación entre la frecuencia de aparición de especies vegetales >> típicas de humedales con los usos del suelo circundantes a los mismos, y >> para ello uso datos de un estudio temporal de vegetación en humedales, por >> lo que los éstos no son completamente independientes sino que están >> agrupados en base a cada humedal. He usado modelos mixtos generalizados, >> concretamente la función "glmer" del paquete "lme4" con la familia >> binomial, >> aunque sólo cuento con dos años de estudio, o sea dos puntos por cada >> humedal. La relación que presentan cada especie y uso de suelo es >> consistente entre humedales y los modelos obtenidos son significativos >> considerando tanto el intercepto de cada humedal, como éste junto con la >> pendiente como variables aleatorias, pero el intervalo de confianza de >> las >> predicciones "de la población" es muy alto porque cada humedal presenta >> unos >> rangos y "pendiente" (si se puede llamar así con sólo dos puntos) muy >> distinta. En ese sentido no sé si estos modelos están bien planteados así, >> y >> si serán realmente útiles para mi propósito, que es conocer la relación >> general entre las variables de uso y de vegetación. ¿Alguien tiene alguna >> experiencia con datos similares? >> >> Gracias! >> >> Javier >> >> --- >> Javier Martínez López >> Departmento de Ecología e Hidrología >> Facultad de Biología >> Universidad de Murcia >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> >> >[[alternative HTML version deleted]]