Hola compañeros de la lista. Tengo el siguiente set de datos: Repeticiones <- c(rep("RI", 14), rep("RII", 14), rep("RIII", 14)) Tiempo <- rep(c(0, 2, 4, 6, 8, 10, 12, 24, 36, 48, 60, 72, 96, 120), 3) Concentracion_celular <- c(0.4862, 0.5375, 0.4309, 0.4390, 0.4603, 0.4733, 0.3936, 0.9085, 0.5838, 0.5477, 0.6331, 0.8693, 1.0092, 0.6341, 0.5350, 0.4951, 0.4120, 0.5032, 0.5968, 0.5734, 0.5258, 4.2884, 1.0763, 0.6967, 1.6744, 0.6124, 1.1766, 0.6999, 0.5774, 0.6434, 0.4921, 0.5627, 0.7045, 0.7065, 0.5667, 1.8556, 1.3378, 1.2013, 1.6612, 0.5042, 1.2924, 1.0463) DATOS <- data.frame(REPETICIONES = Repeticiones, TIEMPO = factor(Tiempo), CONCENTRACION_CELULAR = Concentracion_celular) Se trata de cultivos bacterianos, realizado con tres repeticiones, a los que se les monitoreó la concentración celular en el tiempo (en horas). Para determinar si existe diferencia significativa en la concentración celular en los diferentes tiempos necesito aplicar un anova de medidas repetidas, lo que estoy haciendo con la siguiente instrucción (tomado de http://blog.gribblelab.org/2009/03/09/repeated-measures-anova-using-r/): # Modelo medidas repetidas: library(nlme) modelo.medidas.repetidas <- lme(CONCENTRACION_CELULAR ~ TIEMPO, random = ~1|REPETICIONES/TIEMPO, na.action = na.exclude, data = DATOS) ¿Es adecuado aplicar el modelo de esta forma para realizar un anova de medidas repetidas? ¿Tiene sentido que aparezca la variable TIEMPO en el argumento "random" o sólo con dejar REPETICIONES es suficiente? Lo he aplicado de las dos forma y me da el mismo resultado para el valor de p. De antemano muchas gracias por la ayuda. Saludos. -- Argel.
Hola, Sí, efectivamente para el análisis de este tipo de observaciones repetidas en el tiempo (longitudinal data) el análisis se realiza mediante modelos lineales mixtos (linear mixed models). En tu caso además el modelo es lineal ya que tus variables dependientes son continuas, de otro modo debieras de usar el equivalente logístico. La diferencia de usar "tiempo" en los efectos random, tiene que ver con las dos variantes que presentan este tipo de modelos y es que bien supongas que en tu caso el efecto del tratamiento (REPETICIONES) en el crecimiento celular tan sólo hace variar la ordenada en el origen (intercept) en el modelo lineal o bien que la variación en el crecimiento celular además de la ordenada en el origen también cambiar la pendiente del modelo. a) Que sólo cambie la ordenada en el origen, no aparecería el tiempo. b) Si aparece, es que también se espera que cambie la pendiente. Una forma cómoda de evaluar con qué modelo quedarse en realizar un análisis anova de los dos tipos de modelos y quedarse con el que ofrezca menor error. Con los datos que aportas, el código en R (he renombrado tu data.frame)> dat.df <- data.frame(rep = Repeticiones, time = factor(Tiempo), conc = Concentracion_celular)> library(nlme)> conc.mod.1<-lme(conc ~ time, random = ~1|rep, data=dat.df)> conc.mod.2<-lme(conc ~ time, random = ~1|rep/time, data=dat.df)> anova(conc.mod.1, conc.mod.2) Model df AIC BIC logLik Test L.Ratio p-valueconc.mod.1 1 16 89.35734 110.6726 -28.67867 conc.mod.2 2 17 91.35734 114.0048 -28.67867 1 vs 2 1.421086e-14 1> El análisis indica que el modelo simple (variación tan sólo en la ordenada en el origen) es el que ofrece menor error, y por tanto debiera de ser el adecuado a utilizar. Por ser más parsimonioso. Adicionalmente, puedes comprobar cuáles de los términos "tiempo" de tu modelo ( concentración ~ tiempo) son realmente significativos. Esto lo puedes realizar con la función "cftest()" del paquete multcomp. Y para el modelo primero:> cftest(conc.mod.1)Simultaneous Tests for General Linear Hypotheses Fit: lme.formula(fixed = conc ~ time, data = dat.df, random = ~1 | rep) Linear Hypotheses: Estimate Std. Error z value Pr(>|z|) (Intercept) == 0 0.53287 0.30141 1.768 0.0771 . time2 == 0 0.02580 0.40424 0.064 0.9491 time4 == 0 -0.08787 0.40424 -0.217 0.8279 time6 == 0 -0.03123 0.40424 -0.077 0.9384 time8 == 0 0.05433 0.40424 0.134 0.8931 time10 == 0 0.05153 0.40424 0.127 0.8986 time12 == 0 -0.03750 0.40424 -0.093 0.9261 time24 == 0 1.81797 0.40424 4.497 6.88e-06 *** time36 == 0 0.46643 0.40424 1.154 0.2486 time48 == 0 0.28237 0.40424 0.699 0.4849 time60 == 0 0.79003 0.40424 1.954 0.0507 . time72 == 0 0.12910 0.40424 0.319 0.7495 time96 == 0 0.62653 0.40424 1.550 0.1212 time120 == 0 0.26057 0.40424 0.645 0.5192 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Univariate p values reported) Con lo que realmente tu modelo puede simplificarse notablemente, ya que te quedarías tan sólo con los términos: Intercept, tiempo_24 y tiempo_60 para explicar el crecimiento celular. Saludos, Carlos Ortega www.qualityexcellence.es 2011/8/10 Argel Gastélum Arellánez <argel.gastelum@gmail.com>> Hola compañeros de la lista. > > Tengo el siguiente set de datos: > > Repeticiones <- c(rep("RI", 14), rep("RII", 14), rep("RIII", 14)) > Tiempo <- rep(c(0, 2, 4, 6, 8, 10, 12, 24, 36, 48, 60, 72, 96, 120), 3) > Concentracion_celular <- c(0.4862, 0.5375, 0.4309, 0.4390, 0.4603, 0.4733, > 0.3936, 0.9085, 0.5838, 0.5477, 0.6331, 0.8693, 1.0092, 0.6341, 0.5350, > 0.4951, 0.4120, 0.5032, 0.5968, 0.5734, 0.5258, 4.2884, 1.0763, 0.6967, > 1.6744, 0.6124, 1.1766, 0.6999, 0.5774, 0.6434, 0.4921, 0.5627, 0.7045, > 0.7065, 0.5667, 1.8556, 1.3378, 1.2013, 1.6612, 0.5042, 1.2924, 1.0463) > > DATOS <- data.frame(REPETICIONES = Repeticiones, TIEMPO = factor(Tiempo), > CONCENTRACION_CELULAR = Concentracion_celular) > > Se trata de cultivos bacterianos, realizado con tres repeticiones, a los > que se les monitoreó la concentración celular en el tiempo (en horas). Para > determinar si existe diferencia significativa en la concentración celular en > los diferentes tiempos necesito aplicar un anova de medidas repetidas, lo > que estoy haciendo con la siguiente instrucción (tomado de > http://blog.gribblelab.org/**2009/03/09/repeated-measures-**anova-using-r/<http://blog.gribblelab.org/2009/03/09/repeated-measures-anova-using-r/> > ): > > # Modelo medidas repetidas: > library(nlme) > > modelo.medidas.repetidas <- lme(CONCENTRACION_CELULAR ~ TIEMPO, random > ~1|REPETICIONES/TIEMPO, na.action = na.exclude, data = DATOS) > > ¿Es adecuado aplicar el modelo de esta forma para realizar un anova de > medidas repetidas? ¿Tiene sentido que aparezca la variable TIEMPO en el > argumento "random" o sólo con dejar REPETICIONES es suficiente? Lo he > aplicado de las dos forma y me da el mismo resultado para el valor de p. > > De antemano muchas gracias por la ayuda. > > Saludos. > > -- > Argel. > > ______________________________**_________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/**listinfo/r-help-es<https://stat.ethz.ch/mailman/listinfo/r-help-es> >[[alternative HTML version deleted]]
Hola Carlos, muchas gracias por tu ayuda. Tengo algunas dudas con respecto a lo que me explicas que describo abajo. El 10/08/11 16:20, Carlos Ortega escribió:> En tu caso además el modelo es lineal ya que tus variables > dependientes son continuas, de otro modo debieras de usar el > equivalente logístico.En este caso el crecimiento fue medido mediante la densidad óptica de muestras del cultivo. Si el crecimiento se representara como peso seco, en gramos/litro, también sería una variable continua y seguiría analizándose mediante un modelo lineal. En el caso de representar el crecimiento como número de células ¿tendría que usar el equivalente logístico?> La diferencia de usar "tiempo" en los efectos random, tiene que ver > con las dos variantes que presentan este tipo de modelos y es que bien > supongas que en tu caso el efecto del tratamiento (REPETICIONES) en el > crecimiento celular tan sólo hace variar la ordenada en el origen > (intercept) en el modelo lineal o bien que la variación en el > crecimiento celular además de la ordenada en el origen también cambiar > la pendiente del modelo. > > a) Que sólo cambie la ordenada en el origen, no aparecería el tiempo. > b) Si aparece, es que también se espera que cambie la pendiente. >¿Podrías por favor recomendarme alguna referencia dónde poder estudiar esto? He leído un poco sobre modelos mixtos con R pero esto no lo había entendido.> Una forma cómoda de evaluar con qué modelo quedarse en realizar un > análisis anova de los dos tipos de modelos y quedarse con el que > ofrezca menor error. > Con los datos que aportas, el código en R (he renombrado tu data.frame) > > dat.df<- data.frame(rep = Repeticiones, time = factor(Tiempo), conc = Concentracion_celular) > > library(nlme) > > conc.mod.1<-lme(conc ~ time, random = ~1|rep, data=dat.df) > > conc.mod.2<-lme(conc ~ time, random = ~1|rep/time, data=dat.df) > > anova(conc.mod.1, conc.mod.2) > Model df AIC BIC logLik Test L.Ratio p-value > conc.mod.1 1 16 89.35734 110.6726 -28.67867 > conc.mod.2 2 17 91.35734 114.0048 -28.67867 1 vs 2 1.421086e-14 1 > > El análisis indica que el modelo simple (variación tan sólo en la > ordenada en el origen) es el que ofrece menor error, y por tanto > debiera de ser el adecuado a utilizar. Por ser más parsimonioso.Perdón por mi ignorancia, ¿esto lo interpretas por los valores de AIC y BIC?, ¿el p-value cómo se interpreta en este tipo de comparación entre modelos? Si tengo varios experimentos de este tipo, con microorganismos diferentes, supongo que tendría que comparar ambos modelos lineales para cada uno de los casos.> Adicionalmente, puedes comprobar cuáles de los términos "tiempo" de tu > modelo ( concentración ~ tiempo) son realmente significativos. Esto lo > puedes realizar con la función "cftest()" del paquete multcomp.Esta función cftest da información muy interesante, no la conocía. Originalmente el objetivo de este análisis, además de detectar si la diferencia en la concentración celular es o no significativa a través del tiempo, era realizar una comparación de medias, lo que hice de la siguiente forma: Pares <- glht(conc.mod.1, linfct = mcp(time = "Tukey")) cld(Pares) ¿Es válido hacerlo de esta forma? De nuevo muchas gracias por tu ayuda. Saludos. -- Argel. [[alternative HTML version deleted]]
Hola Argel, Sobre las dudas que planteas. 1. No, el modelo logístico lo aplicarías cuando la variable es de tipo binario (si una de tus variables fuese Sexo por ejemplo, valor de la variable 0 ó 1). Medir la concentración o contar células proporcionan variables numéricas multivaluadas. 2. Como referencias para este tipo de modelos tienes la siguiente referencia. Aunque en los ejemplos se utiliza S-Plus el paquete que estás utilizando (nlme) fue creado por los autores de este libro (Pinheiro y Bates) : http://www.amazon.com/Mixed-Effects-Models-S-S-Plus/dp/0387989579/ref=sr_1_1?ie=UTF8&qid=1313050380&sr=8-1 También si quieres algo más aplicado y que incorpore análisis con librerías ya de R y de publicación más reciente te recomendaría especialmente este otro: http://www.amazon.com/Handbook-Statistical-Analyses-Using-Second/dp/1420079336/ref=sr_1_1?s=books&ie=UTF8&qid=1313050540&sr=1-1 Curiosamente utilicé en primera aproximación el paquete (lme4) y el procedimiento que se recomienda en este segundo libro pero no terminaba de converger el modelo para el modelo en el que en el random aparecía el tiempo. 3. La selección del mejor modelo la he hecho basándome en el p-value. 4. Si tienes varios modelos con diferentes microorganismos, su comparación no sé en principio que sentido tiene. Estás modelando la concentración de una especie sujeta a unas condiciones cuyo crecimiento no tiene porqué estar relacionado con el crecimiento que experimenta otra especie. En cualquier caso, los análisis de diferentes experimentos sobre un mismo tipo de efecto es algo que cada vez se hace más y hay una técnica estadística para ello que viene descrita de forma aplicada en modo de introducción y con ejemplos en el segundo libro que te he sugerido. El tipo de análisis se conoce como "Meta-Análisis". 5. Sobre función glht que has utilizado, sí es la adecuada para realizar comparaciones en modo pareado. Lo que no tengo claro es su utilidad para tu experimento. Quiero decir, que si por ejemplo el par de tiempos 120-8 es poco significativo, ¿qué quiere decir? ¿que podrías haberte ahorrado el haber realizado el experimento hasta 120?. Este tipo de situación de "Comparaciones múltiples" requiere un análisis especial de la técnica estadística a utilizar y su interpretación. De nuevo la segunda referencia es válida, aunque esta otra referencia muy reciente te puede ayudar también: http://www.amazon.com/Multiple-Comparisons-Using-Frank-Bretz/dp/1584885742/ref=sr_1_1?s=books&ie=UTF8&qid=1313064853&sr=1-1 Saludos, Carlos Ortega www.qualityexcellence.es 2011/8/11 Argel Gastélum Arellánez <argel.gastelum@gmail.com>> Hola Carlos, muchas gracias por tu ayuda. Tengo algunas dudas con > respecto a lo que me explicas que describo abajo. > > El 10/08/11 16:20, Carlos Ortega escribió: > > En tu caso además el modelo es lineal ya que tus variables > > dependientes son continuas, de otro modo debieras de usar el > > equivalente logístico. > > En este caso el crecimiento fue medido mediante la densidad óptica > de muestras del cultivo. Si el crecimiento se representara como peso > seco, en gramos/litro, también sería una variable continua y seguiría > analizándose mediante un modelo lineal. En el caso de representar el > crecimiento como número de células ¿tendría que usar el equivalente > logístico? > > > La diferencia de usar "tiempo" en los efectos random, tiene que ver > > con las dos variantes que presentan este tipo de modelos y es que bien > > supongas que en tu caso el efecto del tratamiento (REPETICIONES) en el > > crecimiento celular tan sólo hace variar la ordenada en el origen > > (intercept) en el modelo lineal o bien que la variación en el > > crecimiento celular además de la ordenada en el origen también cambiar > > la pendiente del modelo. > > > > a) Que sólo cambie la ordenada en el origen, no aparecería el tiempo. > > b) Si aparece, es que también se espera que cambie la pendiente. > > > > ¿Podrías por favor recomendarme alguna referencia dónde poder > estudiar esto? He leído un poco sobre modelos mixtos con R pero esto no > lo había entendido. > > > Una forma cómoda de evaluar con qué modelo quedarse en realizar un > > análisis anova de los dos tipos de modelos y quedarse con el que > > ofrezca menor error. > > Con los datos que aportas, el código en R (he renombrado tu data.frame) > > > dat.df<- data.frame(rep = Repeticiones, time = factor(Tiempo), conc > Concentracion_celular) > > > library(nlme) > > > conc.mod.1<-lme(conc ~ time, random = ~1|rep, data=dat.df) > > > conc.mod.2<-lme(conc ~ time, random = ~1|rep/time, data=dat.df) > > > anova(conc.mod.1, conc.mod.2) > > Model df AIC BIC logLik Test L.Ratio > p-value > > conc.mod.1 1 16 89.35734 110.6726 -28.67867 > > conc.mod.2 2 17 91.35734 114.0048 -28.67867 1 vs 2 1.421086e-14 > 1 > > > > El análisis indica que el modelo simple (variación tan sólo en la > > ordenada en el origen) es el que ofrece menor error, y por tanto > > debiera de ser el adecuado a utilizar. Por ser más parsimonioso. > > Perdón por mi ignorancia, ¿esto lo interpretas por los valores de > AIC y BIC?, ¿el p-value cómo se interpreta en este tipo de comparación > entre modelos? > Si tengo varios experimentos de este tipo, con microorganismos > diferentes, supongo que tendría que comparar ambos modelos lineales para > cada uno de los casos. > > > Adicionalmente, puedes comprobar cuáles de los términos "tiempo" de tu > > modelo ( concentración ~ tiempo) son realmente significativos. Esto lo > > puedes realizar con la función "cftest()" del paquete multcomp. > > Esta función cftest da información muy interesante, no la conocía. > Originalmente el objetivo de este análisis, además de detectar si la > diferencia en la concentración celular es o no significativa a través > del tiempo, era realizar una comparación de medias, lo que hice de la > siguiente forma: > > Pares <- glht(conc.mod.1, linfct = mcp(time = "Tukey")) > cld(Pares) > > ¿Es válido hacerlo de esta forma? > > De nuevo muchas gracias por tu ayuda. > > Saludos. > > -- > Argel. > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Hola Argel, solo quería acotar una pequeña cosa a lo que ya dijo Carlos. El modelo de crecimiento logístico es distinto de un modelo logistico. Usar un modelo de crecimiento logístico tiene sentido en tu caso. El problema es que no es una función lineal. Por lo tanto los parametros K y r0 deben ser estimados con funciones no lineales (nmle es una opción). El tiempo debe ser tomado como una variable continua en este caso. Por cierto parece que tuvieses un outlier. Ese punto de 4 y algo es más del doble que el mayor del resto de los puntos. Luciano El 11 de agosto de 2011 09:18, Carlos Ortega <coforfe@gmail.com> escribió:> Hola Argel, > > Sobre las dudas que planteas. > > 1. No, el modelo logístico lo aplicarías cuando la variable es de tipo > binario (si una de tus variables fuese Sexo por ejemplo, valor de la > variable 0 ó 1). Medir la concentración o contar células proporcionan > variables numéricas multivaluadas. > > 2. Como referencias para este tipo de modelos tienes la siguiente > referencia. Aunque en los ejemplos se utiliza S-Plus el paquete que estás > utilizando (nlme) fue creado por los autores de este libro (Pinheiro y > Bates) > : > > http://www.amazon.com/Mixed-Effects-Models-S-S-Plus/dp/0387989579/ref=sr_1_1?ie=UTF8&qid=1313050380&sr=8-1 > > También si quieres algo más aplicado y que incorpore análisis con librerías > ya de R y de publicación más reciente te recomendaría especialmente este > otro: > > http://www.amazon.com/Handbook-Statistical-Analyses-Using-Second/dp/1420079336/ref=sr_1_1?s=books&ie=UTF8&qid=1313050540&sr=1-1 > > Curiosamente utilicé en primera aproximación el paquete (lme4) y el > procedimiento que se recomienda en este segundo libro pero no terminaba de > converger el modelo para el modelo en el que en el random aparecía el > tiempo. > > 3. La selección del mejor modelo la he hecho basándome en el p-value. > > 4. Si tienes varios modelos con diferentes microorganismos, su comparación > no sé en principio que sentido tiene. Estás modelando la concentración de > una especie sujeta a unas condiciones cuyo crecimiento no tiene porqué > estar > relacionado con el crecimiento que experimenta otra especie. En cualquier > caso, los análisis de diferentes experimentos sobre un mismo tipo de efecto > es algo que cada vez se hace más y hay una técnica estadística para ello > que > viene descrita de forma aplicada en modo de introducción y con ejemplos en > el segundo libro que te he sugerido. El tipo de análisis se conoce como > "Meta-Análisis". > > 5. Sobre función glht que has utilizado, sí es la adecuada para realizar > comparaciones en modo pareado. Lo que no tengo claro es su utilidad para tu > experimento. Quiero decir, que si por ejemplo el par de tiempos 120-8 es > poco significativo, ¿qué quiere decir? ¿que podrías haberte ahorrado el > haber realizado el experimento hasta 120?. Este tipo de situación de > "Comparaciones múltiples" requiere un análisis especial de la técnica > estadística a utilizar y su interpretación. De nuevo la segunda referencia > es válida, aunque esta otra referencia muy reciente te puede ayudar > también: > > http://www.amazon.com/Multiple-Comparisons-Using-Frank-Bretz/dp/1584885742/ref=sr_1_1?s=books&ie=UTF8&qid=1313064853&sr=1-1 > > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > > 2011/8/11 Argel Gastélum Arellánez <argel.gastelum@gmail.com> > > > Hola Carlos, muchas gracias por tu ayuda. Tengo algunas dudas con > > respecto a lo que me explicas que describo abajo. > > > > El 10/08/11 16:20, Carlos Ortega escribió: > > > En tu caso además el modelo es lineal ya que tus variables > > > dependientes son continuas, de otro modo debieras de usar el > > > equivalente logístico. > > > > En este caso el crecimiento fue medido mediante la densidad óptica > > de muestras del cultivo. Si el crecimiento se representara como peso > > seco, en gramos/litro, también sería una variable continua y seguiría > > analizándose mediante un modelo lineal. En el caso de representar el > > crecimiento como número de células ¿tendría que usar el equivalente > > logístico? > > > > > La diferencia de usar "tiempo" en los efectos random, tiene que ver > > > con las dos variantes que presentan este tipo de modelos y es que bien > > > supongas que en tu caso el efecto del tratamiento (REPETICIONES) en el > > > crecimiento celular tan sólo hace variar la ordenada en el origen > > > (intercept) en el modelo lineal o bien que la variación en el > > > crecimiento celular además de la ordenada en el origen también cambiar > > > la pendiente del modelo. > > > > > > a) Que sólo cambie la ordenada en el origen, no aparecería el tiempo. > > > b) Si aparece, es que también se espera que cambie la pendiente. > > > > > > > ¿Podrías por favor recomendarme alguna referencia dónde poder > > estudiar esto? He leído un poco sobre modelos mixtos con R pero esto no > > lo había entendido. > > > > > Una forma cómoda de evaluar con qué modelo quedarse en realizar un > > > análisis anova de los dos tipos de modelos y quedarse con el que > > > ofrezca menor error. > > > Con los datos que aportas, el código en R (he renombrado tu data.frame) > > > > dat.df<- data.frame(rep = Repeticiones, time = factor(Tiempo), conc > > > Concentracion_celular) > > > > library(nlme) > > > > conc.mod.1<-lme(conc ~ time, random = ~1|rep, data=dat.df) > > > > conc.mod.2<-lme(conc ~ time, random = ~1|rep/time, data=dat.df) > > > > anova(conc.mod.1, conc.mod.2) > > > Model df AIC BIC logLik Test L.Ratio > > p-value > > > conc.mod.1 1 16 89.35734 110.6726 -28.67867 > > > conc.mod.2 2 17 91.35734 114.0048 -28.67867 1 vs 2 1.421086e-14 > > 1 > > > > > > El análisis indica que el modelo simple (variación tan sólo en la > > > ordenada en el origen) es el que ofrece menor error, y por tanto > > > debiera de ser el adecuado a utilizar. Por ser más parsimonioso. > > > > Perdón por mi ignorancia, ¿esto lo interpretas por los valores de > > AIC y BIC?, ¿el p-value cómo se interpreta en este tipo de comparación > > entre modelos? > > Si tengo varios experimentos de este tipo, con microorganismos > > diferentes, supongo que tendría que comparar ambos modelos lineales para > > cada uno de los casos. > > > > > Adicionalmente, puedes comprobar cuáles de los términos "tiempo" de tu > > > modelo ( concentración ~ tiempo) son realmente significativos. Esto lo > > > puedes realizar con la función "cftest()" del paquete multcomp. > > > > Esta función cftest da información muy interesante, no la conocía. > > Originalmente el objetivo de este análisis, además de detectar si la > > diferencia en la concentración celular es o no significativa a través > > del tiempo, era realizar una comparación de medias, lo que hice de la > > siguiente forma: > > > > Pares <- glht(conc.mod.1, linfct = mcp(time = "Tukey")) > > cld(Pares) > > > > ¿Es válido hacerlo de esta forma? > > > > De nuevo muchas gracias por tu ayuda. > > > > Saludos. > > > > -- > > Argel. > > > > [[alternative HTML version deleted]] > > > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Hola de nuevo Carlos, buen día. Muchas gracias por tus comentarios, me han ayudado mucho. Estudiaré las referencias que me recomiendas para entender mejor lo que estoy haciendo. Te comento un par de cosas más abajo, aunque no tienen mucho que ver con R, si están fuera de lugar en la lista ruego me disculpen. El 11/08/11 07:18, Carlos Ortega escribió:> 4. Si tienes varios modelos con diferentes microorganismos, su > comparación no sé en principio que sentido tiene. Estás modelando la > concentración de una especie sujeta a unas condiciones cuyo > crecimiento no tiene porqué estar relacionado con el crecimiento que > experimenta otra especie. En cualquier caso, los análisis de > diferentes experimentos sobre un mismo tipo de efecto es algo que cada > vez se hace más y hay una técnica estadística para ello que viene > descrita de forma aplicada en modo de introducción y con ejemplos en > el segundo libro que te he sugerido. El tipo de análisis se conoce > como "Meta-Análisis".Tienes razón, en realidad el objetivo en este momento no es comparar el crecimiento entre varios microorganismos, sino aplicar el análisis de medidas repetidas para una condición de cultivo en un microorganismo y determinar si existen diferencias significativas en la concentración celular de acuerdo con el tiempo de muestreo. Esto se haría de forma independiente para cada condición de cultivo.> 5. Sobre función glht que has utilizado, sí es la adecuada para > realizar comparaciones en modo pareado. Lo que no tengo claro es su > utilidad para tu experimento. Quiero decir, que si por ejemplo el par > de tiempos 120-8 es poco significativo, ¿qué quiere decir? ¿que > podrías haberte ahorrado el haber realizado el experimento hasta 120?. > Este tipo de situación de "Comparaciones múltiples" requiere un > análisis especial de la técnica estadística a utilizar y su > interpretación. De nuevo la segunda referencia es válida, aunque esta > otra referencia muy reciente te puede ayudar también: > http://www.amazon.com/Multiple-Comparisons-Using-Frank-Bretz/dp/1584885742/ref=sr_1_1?s=books&ie=UTF8&qid=1313064853&sr=1-1 > <http://www.amazon.com/Multiple-Comparisons-Using-Frank-Bretz/dp/1584885742/ref=sr_1_1?s=books&ie=UTF8&qid=1313064853&sr=1-1>El objetivo en este momento es como lo comentas. Por poner un ejemplo hipotético, si las diferencias en el producto de interés dejan de ser significativas a partir de las 24 h, entonces no tendría mucho sentido invertir más tiempo en el cultivo y se cosecharía el producto, en este caso las células, a las 12 h en vez de a las 120 h, lo que ahorraría mucho tiempo de proceso. Esto lo estoy tratando de determinar de esta forma debido a que no existe el clásico crecimiento exponencial bajo las condiciones que se están evaluando, como se presentaría en la mayoría de los cultivos bacterianos, en donde se cosecharían las células al final del crecimiento exponencial. ¿Habría una aproximación más adecuada para determinar esto que la comparación de medidas repetidas? De nuevo muchas gracias por tu ayuda. Saludos. -- Argel. [[alternative HTML version deleted]]