Estimados Escribo para consultar sobre el uso de modelos mixtos anidados. Los datos que estoy analizando provienen de censos de malezas en cuatro tipos de paisajes de la región pampeana, en los que seleccioné al azar igual número de lotes agrícolas cultivados con tres cultivos (maíz, soja y trigo-soja). En cada lote censé el número de especies de malezas en tres posiciones: el alambrado, el borde y el centro del lote. Estas medidas no son independientes. Entonces, las tres posiciones en el lote están anidadas dentro de los cultivos, los que a su vez lo están dentro de los cuatro paisajes. Mi objetivo es determinar en qué medida la variación en el número de especies de malezas es explicada por el tipo de paisaje, el cultivo y la posición en el lote agrícola, o las interacciones entre factores. Usé la library (nlme) con el siguiente modelo: alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position+Landscape:Crop+Landscape:Position+Crop:Position, random=~1|Landscape/Crop/Position, method="REML") Obtengo la siguiente solución en el ANVA:> anova(alpha.lme)numDF denDF F-value p-value (Intercept) 1 216 609.6535 <.0001 Landscape 3 0 0.7533 NaN Crop 2 0 0.7327 NaN Position 2 12 64.1800 <.0001 Landscape:Crop 6 0 0.2956 NaN Landscape:Position 6 12 1.2043 0.3679 Crop:Position 4 12 1.1807 0.3679 Warning messages: 1: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced 2: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced 3: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced Y hasta aquí llegue. Veo que algo está mal con la distribución de los grados de libertad, ¿Qué es lo que tendría que odificar para resolver el problema? ¿Están mal elegidos los efectos aleatorios? ¿Tendría que usar otra formulación del modelo u otro modelo? Muchas gracias a todos Saludos Santiago -- Santiago. L. Poggio Ing. Agr., Dr. CONICET - Cátedra de Producción Vegetal Departamento de Producción Vegetal Facultad de Agronomía Universidad de Buenos Aires Av. San Martín 4453 (C1417DSE) Buenos Aires ARGENTINA
Hola Santiago: Me parece que esta mal especificado la parte aleatoria del modelo. Yo pondría algo como random = ~1|Lote porque me parece que lo que realmente está anidado son las posiciones dentro del lote. Pero el problema puede ser que no tengas suficientes réplicas, cosa que no puedo saber. Quizá obtengas más ayudas si preguntas en R-Sig-ME Espero que te sea de ayuda. Luciano El 24 de septiembre de 2010 13:08, Santiago L. Poggio <spoggio@agro.uba.ar>escribió:> Estimados > Escribo para consultar sobre el uso de modelos mixtos anidados. Los > datos que estoy analizando provienen de censos de malezas en cuatro > tipos de paisajes de la región pampeana, en los que seleccioné al azar > igual número de lotes agrícolas cultivados con tres cultivos (maíz, > soja y trigo-soja). En cada lote censé el número de especies de > malezas en tres posiciones: el alambrado, el borde y el centro del > lote. Estas medidas no son independientes. Entonces, las tres > posiciones en el lote están anidadas dentro de los cultivos, los que a > su vez lo están dentro de los cuatro paisajes. Mi objetivo es > determinar en qué medida la variación en el número de especies de > malezas es explicada por el tipo de paisaje, el cultivo y la posición > en el lote agrícola, o las interacciones entre factores. > > Usé la library (nlme) con el siguiente modelo: > > > alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position+Landscape:Crop+Landscape:Position+Crop:Position, > random=~1|Landscape/Crop/Position, method="REML") > > Obtengo la siguiente solución en el ANVA: > > > anova(alpha.lme) > numDF denDF F-value p-value > (Intercept) 1 216 609.6535 <.0001 > Landscape 3 0 0.7533 NaN > Crop 2 0 0.7327 > NaN > Position 2 12 64.1800 <.0001 > Landscape:Crop 6 0 0.2956 NaN > Landscape:Position 6 12 1.2043 0.3679 > Crop:Position 4 12 1.1807 0.3679 > Warning messages: > 1: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > 2: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > 3: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > > Y hasta aquí llegue. Veo que algo está mal con la distribución de los > grados de libertad, ¿Qué es lo que tendría que odificar para resolver > el problema? ¿Están mal elegidos los efectos aleatorios? ¿Tendría que > usar otra formulación del modelo u otro modelo? > > Muchas gracias a todos > Saludos > Santiago > > > -- > Santiago. L. Poggio > Ing. Agr., Dr. > CONICET - Cátedra de Producción Vegetal > Departamento de Producción Vegetal > Facultad de Agronomía > Universidad de Buenos Aires > Av. San Martín 4453 > (C1417DSE) Buenos Aires > ARGENTINA > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
---------- Forwarded message ---------- From: Gabriela Cendoya <gabrielacendoya.rlist en gmail.com> Date: Fri, 24 Sep 2010 13:48:07 -0300 Subject: [R-es] (sin asunto) To: spoggio en agro.uba.ar, r-help-es en r-project.org Podrías mandar un summary de tu conjunto de datos o un str para ver por que no puede estimar esos efectos, también sería útil el resultado de with(tusdatos, table(Landscape,Crop,Position)) Gabriela _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Santiago, los efectos aleatorios han de corresponder a un factor cuyos niveles son elegidos al azar (o no controlados) en el experimento. Me parece que tanto la posición, el paisaje o el tipo de cultivo son factores fijos en tu experimento. Sin embargo la posición es anidada dentro del lote y puede por lo tanto tener efectos aleatorios (curvas no paralelas). Por lo tanto, te propongo alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position+Landscape:Crop +Landscape:Position+Crop:Position, random=~1|Lote/Position, method="REML") Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez en iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 24/09/2010, a las 18:08, Santiago L. Poggio escribió:> Estimados > Escribo para consultar sobre el uso de modelos mixtos anidados. Los > datos que estoy analizando provienen de censos de malezas en cuatro > tipos de paisajes de la región pampeana, en los que seleccioné al azar > igual número de lotes agrícolas cultivados con tres cultivos (maíz, > soja y trigo-soja). En cada lote censé el número de especies de > malezas en tres posiciones: el alambrado, el borde y el centro del > lote. Estas medidas no son independientes. Entonces, las tres > posiciones en el lote están anidadas dentro de los cultivos, los que a > su vez lo están dentro de los cuatro paisajes. Mi objetivo es > determinar en qué medida la variación en el número de especies de > malezas es explicada por el tipo de paisaje, el cultivo y la posición > en el lote agrícola, o las interacciones entre factores. > > Usé la library (nlme) con el siguiente modelo: > > alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position+Landscape:Crop > +Landscape:Position+Crop:Position, > random=~1|Landscape/Crop/Position, method="REML") > > Obtengo la siguiente solución en el ANVA: > >> anova(alpha.lme) > numDF denDF F-value p- > value > (Intercept) 1 216 609.6535 <. > 0001 > Landscape 3 0 > 0.7533 NaN > Crop 2 0 > 0.7327 NaN > Position 2 12 > 64.1800 <.0001 > Landscape:Crop 6 0 0.2956 NaN > Landscape:Position 6 12 1.2043 0.3679 > Crop:Position 4 12 1.1807 0.3679 > Warning messages: > 1: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > 2: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > 3: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced > > Y hasta aquí llegue. Veo que algo está mal con la distribución de los > grados de libertad, ¿Qué es lo que tendría que odificar para resolver > el problema? ¿Están mal elegidos los efectos aleatorios? ¿Tendría que > usar otra formulación del modelo u otro modelo? > > Muchas gracias a todos > Saludos > Santiago > > > -- > Santiago. L. Poggio > Ing. Agr., Dr. > CONICET - Cátedra de Producción Vegetal > Departamento de Producción Vegetal > Facultad de Agronomía > Universidad de Buenos Aires > Av. San Martín 4453 > (C1417DSE) Buenos Aires > ARGENTINA > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Hola: Mi primer mail te pedía el summary de los datos, por que pensé que quizás no tuviese todos los cultivos en todos los paisajes, pero no, tu tabla de datos es completa, pero el anidamiento de efectos aleatorios no me queda muy claro. si vos anidas dentro de Paisaje los cultivos y dentro de los cultivos las posiciones, no tenes repeticiones reales, y por otro lado se pierde el lote del cual sacaste la informacion. Por lo que entendí de tu muestreo, creo que las observaciones que se realizan dentro de un mismo lote en las tres posiciones son las que están correlacionadas, por lo que tendrías que añadir a tus datos un factor que le indique que lote se está analizando, y en random usar ~1|lote, eso determinará que que esas tres observaciones estén correlacionadas, en principio es razonable pensar que esos lotes son representantes del tipo del cultivo dentro de ese tipo de paisaje, elegidos aleatoriamente entre otros lotes, pero el tipo de cultivo no es aleatorio ni el tipo de paisaje, y tampoco considero que lotes dentro de esos estratos deban pensarse como correlacionados, suponiendo que los datos que mandaste estuviesen ordenados te agregue una columna con la variable lote, (ojo estos lotes pueden estar mal armados tenes que verificar en tus datos). El modelo sería> alpha.lme3<-lme(log(alpha+1)~Landscape*Crop*Position, data=data,+ random=~1|as.factor(Lote), method="REML")> anova(alpha.lme3)numDF denDF F-value p-value (Intercept) 1 144 5343.990 <.0001 Landscape 3 72 7.121 0.0003 Crop 2 72 3.759 0.0280 Position 2 144 98.108 <.0001 Landscape:Crop 6 72 1.463 0.2032 Landscape:Position 6 144 1.841 0.0951 Crop:Position 4 144 1.805 0.1311 Landscape:Crop:Position 12 144 1.148 0.3263>saludos Gabriela -- _________________________ Lic. María Gabriela Cendoya Magíster en Biometría Profesor Adjunto Facultad de Ciencias Agrarias UNMdP - Argentina _________________________ ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: particion total modificada.csv Type: text/csv Size: 6903 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20100924/2e25184e/attachment-0001.bin>
Santiago, no estoy seguro de entenderte bien. Con el fin de asegurarme que entendí algo, me explico con más detalles: En el seno de cada paisaje, hay una serie de cultivos. A si mismo, para cada cultivo encontramos una serie de lotes dedicados a dicho cultivo. Tu elegiste al azar una muestra de lotes para cada paisaje y cada cultivo. Dentro de cada uno de los lotes observas la densidad de maleza en distintas posiciones (comunes a cada lote). Los efectos principales de estos factores y sus mutuas interacciones son FIJOS. Ahora bien, es muy probable que observes variaciones entre lotes de un mismo paisajes y mismo cultivo. Puesto que estos lotes han sido elegidos al azar sus correspondientes efectos serán también aleatorios. Si proponemos el modelo simple "random=~1|Lote", suponemos implícitamente que la variación de la densidad de maleza entre dos lote perteneciendo al mismo paisaje y dedicado al mismo cultivo, será constante en las distintas posiciones. Es decir que no hay interacción entre el lote y la posición (curvas de densidad de maleza paralelas). Si en cambio, se considera el modelo "random=~1|Lote/Position", puede haber efectos de interacción (curvas no necesariamente paralelas) y la interacción es aleatoria porque el factor Lote tiene niveles aleatorios. Dicho eso, es posible, como lo señalo Luciano, que este ultimo modelo no te dejé ningún grados de libertad para la variabilidad residual, y que obtengas una salida de la tabla ANOVA con NA's. Así que si no tienes replicaciones no dudes en optar por un modelo más parsimonioso. Un saludo. Olivier -- ____________________________________ Olivier G. Nuñez Email: onunez en iberstat.es Tel : +34 663 03 69 09 Web: http://www.iberstat.es ____________________________________ El 24/09/2010, a las 19:15, Santiago L. Poggio escribió:> Estimado Olivier, > Muchas gracias por tu respuesta. Sí, es como vos decís. Los efectos > son fijos, pero la posición en el lote no es independiente. Como cada > cultivo corresponde a un lote, ntentaré con el modelo que proponés > incluyendo 'Cop/Position' como variable aleatoria. > Saludos cordiales > Santiago > > El día 24 de septiembre de 2010 14:00, Olivier Nuñez > <onunez en iberstat.es> escribió: >> Santiago, >> >> los efectos aleatorios han de corresponder a un factor cuyos >> niveles son >> elegidos al azar (o no controlados) en el experimento. >> Me parece que tanto la posición, el paisaje o el tipo de cultivo son >> factores fijos en tu experimento. >> Sin embargo la posición es anidada dentro del lote y puede por lo >> tanto >> tener efectos aleatorios (curvas no paralelas). >> Por lo tanto, te propongo >> >> alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position >> +Landscape:Crop+Landscape:Position+Crop:Position, >> random=~1|Lote/Position, method="REML") >> >> Un saludo. Olivier >> -- ____________________________________ >> >> Olivier G. Nuñez >> Email: onunez en iberstat.es >> Tel : +34 663 03 69 09 >> Web: http://www.iberstat.es >> >> ____________________________________ >> >> >> >> >> El 24/09/2010, a las 18:08, Santiago L. Poggio escribió: >> >>> Estimados >>> Escribo para consultar sobre el uso de modelos mixtos anidados. Los >>> datos que estoy analizando provienen de censos de malezas en cuatro >>> tipos de paisajes de la región pampeana, en los que seleccioné al >>> azar >>> igual número de lotes agrícolas cultivados con tres cultivos (maíz, >>> soja y trigo-soja). En cada lote censé el número de especies de >>> malezas en tres posiciones: el alambrado, el borde y el centro del >>> lote. Estas medidas no son independientes. Entonces, las tres >>> posiciones en el lote están anidadas dentro de los cultivos, los >>> que a >>> su vez lo están dentro de los cuatro paisajes. Mi objetivo es >>> determinar en qué medida la variación en el número de especies de >>> malezas es explicada por el tipo de paisaje, el cultivo y la >>> posición >>> en el lote agrícola, o las interacciones entre factores. >>> >>> Usé la library (nlme) con el siguiente modelo: >>> >>> >>> alpha.lme<-lme(log(alpha+1)~1+Landscape+Crop+Position >>> +Landscape:Crop+Landscape:Position+Crop:Position, >>> random=~1|Landscape/Crop/Position, method="REML") >>> >>> Obtengo la siguiente solución en el ANVA: >>> >>>> anova(alpha.lme) >>> >>> numDF denDF F-value p- >>> value >>> (Intercept) 1 216 609.6535 >>> <.0001 >>> Landscape 3 0 0.7533 >>> NaN >>> Crop 2 0 >>> 0.7327 >>> NaN >>> Position 2 12 64.1800 >>> <.0001 >>> Landscape:Crop 6 0 0.2956 NaN >>> Landscape:Position 6 12 1.2043 0.3679 >>> Crop:Position 4 12 1.1807 >>> 0.3679 >>> Warning messages: >>> 1: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced >>> 2: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced >>> 3: In pf(q, df1, df2, lower.tail, log.p) : NaNs produced >>> >>> Y hasta aquí llegue. Veo que algo está mal con la distribución de >>> los >>> grados de libertad, ¿Qué es lo que tendría que odificar para >>> resolver >>> el problema? ¿Están mal elegidos los efectos aleatorios? ¿Tendría >>> que >>> usar otra formulación del modelo u otro modelo? >>> >>> Muchas gracias a todos >>> Saludos >>> Santiago >>> >>> >>> -- >>> Santiago. L. Poggio >>> Ing. Agr., Dr. >>> CONICET - Cátedra de Producción Vegetal >>> Departamento de Producción Vegetal >>> Facultad de Agronomía >>> Universidad de Buenos Aires >>> Av. San Martín 4453 >>> (C1417DSE) Buenos Aires >>> ARGENTINA >>> >>> _______________________________________________ >>> R-help-es mailing list >>> R-help-es en r-project.org >>> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> > > > > -- > Santiago. L. Poggio > Ing. Agr., Dr. > CONICET - Cátedra de Producción Vegetal > Departamento de Producción Vegetal > Facultad de Agronomía > Universidad de Buenos Aires > Av. San Martín 4453 > (C1417DSE) Buenos Aires > ARGENTINA
Santiago Me parece que tenes un modelo con 3 factores fijos. Tipo de paisaje, cultivo y posición. Los tres se encuentran cruzados, porque me imagino que a vos te interesa saber que efecto tiene la posición dentro de un lote y sus posibles interacciones con el cultivo sobre la emergencia o lo que sea de las malezas. Por ultimo, es cierto que las observaciones dentro de un lote estas correlacionadas (pero esto no está confundido con el efecto posición, ya que el efecto posición se evalua en muchos lotes). Para contemplar la correlación entre las observaciones dentro de un lote es que lo más simple es incluir el efecto aleatorio lote como bien lo señalan otros colegas. Prof. Julio Di Rienzo Estadística y Biometría FCA- U.N. Córdoba IBS CC Member http://sites.google.com/site/juliodirienzo "Biometry, the active pursuit of biological knowledge by quantitative methods." (R.A. Fisher, 1948) [[alternative HTML version deleted]]
Hola a todos, Muchas gracias por la ayuda de todos. He seguido la sugerencia Gabriela Cendoya de incluir el lote como efecto aleatorio. Saludos Santiago El día 24 de septiembre de 2010 17:15, Julio Alejandro Di Rienzo <dirienzo.julio en gmail.com> escribió:> Santiago > > Me parece que tenes un modelo con 3 factores fijos. Tipo de paisaje, cultivo > y posición. Los tres se encuentran cruzados, porque me imagino que a vos te > interesa saber que efecto tiene la posición dentro de un lote y sus > posibles interacciones con el cultivo sobre la emergencia o lo que sea de > las malezas. Por ultimo, es cierto que las observaciones dentro de un lote > estas correlacionadas (pero esto no está confundido con el efecto posición, > ya que el efecto posición se evalua en muchos lotes). Para contemplar la > correlación entre las observaciones dentro de un lote es que lo más simple > es incluir el efecto aleatorio lote como bien lo señalan otros colegas. > > Prof. Julio Di Rienzo > Estadística y Biometría > FCA- U.N. Córdoba > IBS CC Member > http://sites.google.com/site/juliodirienzo > "Biometry, the active pursuit of biological > knowledge by quantitative methods." > (R.A. Fisher, 1948) > > >-- Santiago. L. Poggio Ing. Agr., Dr. CONICET - Cátedra de Producción Vegetal Departamento de Producción Vegetal Facultad de Agronomía Universidad de Buenos Aires Av. San Martín 4453 (C1417DSE) Buenos Aires ARGENTINA