Hola, Esto es más una cuestión estadística que propiamente sobre R así que pido disculpas de antemano. La pregunta es la siguiente: En un modelo de efectos mixtos cuando a veces ocurre correlación entre coeficientes una solución posible es centrar la variable predictora. En el ejemplo siguiente tomado de Pinheiro & Bates (2000) se modela en múltiples sujetos una distancia anatómica en función de la edad: library(nlme) data(Orthodont) plot(Orthodont) m1<-lme(distance~age,data=Orthodont,random=~1|Subject) m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) El modelo 2 centra la edad tomando el valor 11 como referencia, con lo que el intercepto del modelo poblacional resultante sería la distancia a la edad de 11 años. En este ejemplo las mediciones de distancia fueron tomadas en cada sujeto a la misma edad. Pero que ocurriría si esas mediciones hubieran sido hechas a edades muy diferentes en cada sujeto y centráramos en vez de por 11 (que en este caso podría ser la media de todas las edades) lo hiciéramos por la media de edad particular de cada sujeto? Como se interpretaría ahora el intercepto? Y tendría sentido esta segunda forma de centrar si la variable dependiente fuera muy diferente en cada sujeto? Muchas gracias Saludos Jaime [[alternative HTML version deleted]]
Jaime Adjunto una imagen que ilustra el problema al que haces referencia. El esquema A describe el modelo m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) donde las rectas representan los sujetos que tienen todas la misma pendiente y ordenadas al origen sujeto específicas (random=~1|Subject) Los puntos negros sobre estas rectas representa las medias de edad para cada sujeto. La ordenada al origen (intercept) que se estima como parti fija de este modelo esta representada por el punto rojo y corresponde al valor promedio de la distancia a la edad de 11 años. Si centraras cada sujeto por la media de sus edades, las medias de edad de cada sujeto en la escala centrada sería 0. Esto esta representado en el esque B donde los centros de cada recta quedan alineados. En este caso, el intercept que estima el modelo correspondería al promedio de los valores esperados para las edades observadas en los sujetos incluidos en la muestra. Aunque se puede dar una interpretacion a la estimación del intercept, es obviamente insatisfactoria. Mi recomendación: Centrar un una constante comun a todos los sujetos como en el caso de modelo m2. Prof. Julio Di Rienzo Estadística y Biometría FCA- U.N. Córdoba IBS-RARG President http://sites.google.com/site/juliodirienzo "Biometry, the active pursuit of biological knowledge by quantitative methods." (R.A. Fisher, 1948) 2012/7/12 Jaime Otero Villar <j.o.villar en bio.uio.no>> Hola, > > Esto es más una cuestión estadística que propiamente sobre R así que > pido disculpas de antemano. La pregunta es la siguiente: > > En un modelo de efectos mixtos cuando a veces ocurre correlación entre > coeficientes una solución posible es centrar la variable predictora. > En el ejemplo siguiente tomado de Pinheiro & Bates (2000) se modela en > múltiples sujetos una distancia anatómica en función de la edad: > > library(nlme) > data(Orthodont) > plot(Orthodont) > > m1<-lme(distance~age,data=Orthodont,random=~1|Subject) > > m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) > > El modelo 2 centra la edad tomando el valor 11 como referencia, con lo > que el intercepto del modelo poblacional resultante sería la distancia > a la edad de 11 años. En este ejemplo las mediciones de distancia > fueron tomadas en cada sujeto a la misma edad. Pero que ocurriría si > esas mediciones hubieran sido hechas a edades muy diferentes en cada > sujeto y centráramos en vez de por 11 (que en este caso podría ser la > media de todas las edades) lo hiciéramos por la media de edad > particular de cada sujeto? Como se interpretaría ahora el intercepto? > Y tendría sentido esta segunda forma de centrar si la variable > dependiente fuera muy diferente en cada sujeto? > > Muchas gracias > > Saludos > > Jaime > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120712/c1aa56fb/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: Imagen1.png Type: image/png Size: 16582 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20120712/c1aa56fb/attachment-0001.png>
Si me permite, agrego a su pregunta ¿y si lo quito o veo el valor a 0? library(nlme) data(Orthodont) plot(Orthodont) m1<-lme(distance~age,data=Orthodont,random=~1|Subject) m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) m3<-lme(distance~age-1,data=Orthodont,random=~1|Subject) m4<-lme(distance~I(age-0),data=Orthodont,random=~1|Subject) fixef(m1) fixef(m2) fixef(m3) fixef(m4) anova(m1,m2,m3,m4) Se que el modelo sin el intercepto es más "feo", pero a mi me sirve quitar el intercepto para visualizar más fácil los resultados, mirando el siguiente ejemplo (en otros modelos al quietar el intercepto el modelo es "malo") # Pinheiro and Bates, pp. 222-247 # p. 222 options(contrasts = c("contr.treatment", "contr.poly")) fm1BW.lme <- lme(weight ~ Time * Diet, BodyWeight, random = ~ Time) #vs fmjBW.lme <- lme(weight ~ Time * Diet-1, BodyWeight, random = ~ Time) fixef(fm1BW.lme) fixef(fmjBW.lme) anova(fm1BW.lme, fmjBW.lme) Javier -----Mensaje original----- From: Jaime Otero Villar Sent: Thursday, July 12, 2012 11:31 AM To: r-help-es en r-project.org Subject: [R-es] intercepto en mixed-model Hola, Esto es más una cuestión estadística que propiamente sobre R así que pido disculpas de antemano. La pregunta es la siguiente: En un modelo de efectos mixtos cuando a veces ocurre correlación entre coeficientes una solución posible es centrar la variable predictora. En el ejemplo siguiente tomado de Pinheiro & Bates (2000) se modela en múltiples sujetos una distancia anatómica en función de la edad: library(nlme) data(Orthodont) plot(Orthodont) m1<-lme(distance~age,data=Orthodont,random=~1|Subject) m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) El modelo 2 centra la edad tomando el valor 11 como referencia, con lo que el intercepto del modelo poblacional resultante sería la distancia a la edad de 11 años. En este ejemplo las mediciones de distancia fueron tomadas en cada sujeto a la misma edad. Pero que ocurriría si esas mediciones hubieran sido hechas a edades muy diferentes en cada sujeto y centráramos en vez de por 11 (que en este caso podría ser la media de todas las edades) lo hiciéramos por la media de edad particular de cada sujeto? Como se interpretaría ahora el intercepto? Y tendría sentido esta segunda forma de centrar si la variable dependiente fuera muy diferente en cada sujeto? Muchas gracias Saludos Jaime [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
En mucho manuales se recomienda trabajar con variables centradas, ya que los Betas resultantes no están correlacionados. Comprueba summary(m1)$varFix ; summary(m2)$varFix Si el diseños no esta perfectametne balanzeado (estimaciones a diferentes edades), se introduce ruido en la estimación de los errores, pero no afecta significativamente a los efecto fijos. Puedes comprobarlo, con esta modificación de tu código Orthodont$age2 <- jitter( Orthodont$age) m3<-lme(distance~I(age2-mean(age2)),data=Orthodont,random=~1|Subject) summary(m3))$varFix Por los demás los tres modelos son prácticamente equivalentes. En diseños longitudinales con tiempos de medición irregulares de un proceso de crecimiento (pendientes distintas de cero), plantear central en la media de los individuos creo que no tiene ningún sentido. Saludos El 12/07/2012 16:31, Jaime Otero Villar escribió:> Hola, > > Esto es más una cuestión estadística que propiamente sobre R así que > pido disculpas de antemano. La pregunta es la siguiente: > > En un modelo de efectos mixtos cuando a veces ocurre correlación entre > coeficientes una solución posible es centrar la variable predictora. > En el ejemplo siguiente tomado de Pinheiro& Bates (2000) se modela en > múltiples sujetos una distancia anatómica en función de la edad: > > library(nlme) > data(Orthodont) > plot(Orthodont) > > m1<-lme(distance~age,data=Orthodont,random=~1|Subject) > > m2<-lme(distance~I(age-11),data=Orthodont,random=~1|Subject) > > El modelo 2 centra la edad tomando el valor 11 como referencia, con lo > que el intercepto del modelo poblacional resultante sería la distancia > a la edad de 11 años. En este ejemplo las mediciones de distancia > fueron tomadas en cada sujeto a la misma edad. Pero que ocurriría si > esas mediciones hubieran sido hechas a edades muy diferentes en cada > sujeto y centráramos en vez de por 11 (que en este caso podría ser la > media de todas las edades) lo hiciéramos por la media de edad > particular de cada sujeto? Como se interpretaría ahora el intercepto? > Y tendría sentido esta segunda forma de centrar si la variable > dependiente fuera muy diferente en cada sujeto? > > Muchas gracias > > Saludos > > Jaime > > [[alternative HTML version deleted]] > > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es-- +-------------------------------------------------------------- | Francisco J. Viciana Fernández | Coordinador del Registro de Población | Servicio de Estadísticas Demográficas y Sociales | Instituto de Estadística y Cartografía de Andalucía | Leonardo Da Vinci, nº 21. Isla de La Cartuja. | 41071 SEVILLA. | franciscoj.viciana@juntadeandalucia.es | Tlf.: +(34) 95 503 38 21 +-------------------------------------------------------------- [[alternative HTML version deleted]]