Hola a todos: Estoy comenzando a utilizar la librería survival, mi experiencia al respecto es nula. El material que leo y los ejemplos son entendibles, pero tengo una duda respecto a como preparar mis datos antes de utilizar la librería. Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo del tiempo de ciertas cosas que van pasando. Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado puede ser al primer tratamiento, segundo tratamiento, al producirse el resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero es comparable, si está muerto no doy más veneno). También conozco la fecha de nacimiento, podía tener la edad a cada tiempo. Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy próximo a lo necesario para el procesamiento del modelo en R. No se a ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar los datos (dentro o fuera de R) que el que me lleva pensar y hacer el modelo estadístico. Lo que yo pensé es almacenar los registros de una forma muy sencilla, las columnas serían las siguientes: Individuo, fecha, lo que paso. Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de protocolo”, “tratamiento”, “resultado”. Quedaría algo como (las fechas son cualquiera) javier 17/11/00 nacimiento javier 27/12/01 inicio protocolo javier 08/03/02 tratamiento javier 20/09/03 tratamiento javier 30/04/04 resultado Mirando ejemplos, las columnas preparadas son serían algo como: individuo fecha tratamiento resultado O Individuo entre fechas resultados La libreria survival tiene el siguiente ejemplo: fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) subject time1 time2 status age creatinine . . . 1 0 15 0 25 1.3 1 15 46 0 25 1.5 1 46 73 0 25 1.4 Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por ejemplo) Serían algo como: subject time status ( status es si o no para la fecha o día time). Necesitaría algo de información como para leer un poco más o comentarios de experiencia de algunos de ustedes sobre survival y R. Principalmente a como ir preparando los registros para ser eficiente y no perder tiempo, llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi trabajo por almacenar de forma incorrecta la información. Tengo dudas sobre como preparar los registros para importar y/o procesar en R antes de escribir el modelo para la librería Survival. [[alternative HTML version deleted]]
Hola, Empiezo por la parte que puede ser más fácil y es sobre algún libro que trate este tema pero aplicado a R. De lo más asequible, actualizado que conozco te recomendaría especialmente este libro: http://www.amazon.com/Handbook-Statistical-Analyses-Using-Second/dp/1420079336/ref=sr_1_1?s=books&ie=UTF8&qid=1317934799&sr=1-1 Y sobre el detalle de la organización de los datos, efectivamente como has visto en los ejemplos, se organizan de manera que los detalles de un individuo aparecen en una fila. En este tipo de modelos lo que monitoriza es el tiempo de supervivencia (lo que comentas como "entre fechas") y el resto de columnas suelen ser variables categóricas (tratamiento, sexo, etc) que sirven para contrastar si los tiempos de supervivencia están o no relacionados con estas variables. Pero como en tu caso, quieres mantener las fechas de diferentes hitos (nacimiento, tratamiento, etc), las puedes mantener en las primeras columnas de la tabla: Individuo Nacimiento Inicio_Protocolo Resultado Javier 17/11/00 27/12/01 30/04/04 Otro 20/10/00 16/09/01 25/03/03 .... Como no sé muy bien el significado de los eventos "Tratamiento" no los he puesto, pero vaya si los quieres mantener serían columnas adicionales. Sobre esta tabla, el ampliarla para conseguir el "Tiempo_Supervivencia" es inmediato (resta de fechas de las columnas "Resultado" y "Nacimiento"). Además del "Tiempo_Supervivencia" puedes llegar a analizar si el "Tiempo_hasta_inicio_tratamiento" o el "Tiempo_en_tratamiento" tiene o no efecto en los tiempos de supervivencia. Estas otras variables derivadas vuelven a ser de cálculo inmediato (resta de columnas con fechas). Hacer esto mismo sobre la estructura que tienes : javier 17/11/00 nacimiento javier 27/12/01 inicio protocolo javier 08/03/02 tratamiento javier 20/09/03 tratamiento javier 30/04/04 resultado es algo bastante más complicado (pero factible). Si ya tienes pasadas 5000 líneas en tu tabla, de esa otra forma, la forma de construir la nueva estructura puede hacerse en R con un blucle o con un par de manipulaciones en Excel... Saludos, Carlos Ortega www.qualityexcellence.es 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com>> Hola a todos: > > Estoy comenzando a utilizar la librería survival, mi experiencia al > respecto es nula. > > El material que leo y los ejemplos son entendibles, pero tengo una duda > respecto a como preparar mis datos antes de utilizar la librería. > > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de > datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo > del tiempo de ciertas cosas que van pasando. > Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o > cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado > puede ser al primer tratamiento, segundo tratamiento, al producirse el > resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero > es comparable, si está muerto no doy más veneno). También conozco la fecha > de nacimiento, podía tener la edad a cada tiempo. > > Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy > próximo a lo necesario para el procesamiento del modelo en R. No se a > ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar > los datos (dentro o fuera de R) que el que me lleva pensar y hacer el modelo > estadístico. > > Lo que yo pensé es almacenar los registros de una forma muy sencilla, las > columnas serían las siguientes: > > Individuo, fecha, lo que paso. > > Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de > protocolo”, “tratamiento”, “resultado”. > > Quedaría algo como (las fechas son cualquiera) > > javier 17/11/00 nacimiento > javier 27/12/01 inicio protocolo > javier 08/03/02 tratamiento > javier 20/09/03 tratamiento > javier 30/04/04 resultado > > Mirando ejemplos, las columnas preparadas son serían algo como: > individuo fecha tratamiento resultado > > O > Individuo entre fechas resultados > > La libreria survival tiene el siguiente ejemplo: > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) > > subject time1 time2 status age creatinine . . . > 1 0 15 0 25 1.3 > 1 15 46 0 25 1.5 > 1 46 73 0 25 1.4 > > Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal y > tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por > ejemplo) > Serían algo como: > > subject time status ( status es si o no para la fecha o día time). > > Necesitaría algo de información como para leer un poco más o comentarios de > experiencia de algunos de ustedes sobre survival y R. Principalmente a como > ir preparando los registros para ser eficiente y no perder tiempo, llevo más > de 5000 renglones pasados y no me gustaría tener que rehacer mi trabajo por > almacenar de forma incorrecta la información. Tengo dudas sobre como > preparar los registros para importar y/o procesar en R antes de escribir el > modelo para la librería Survival. > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Gracias por sus comentarios: (nunca se si lo envío a toda la lista, al respecto me equivoque mil veces) El libro: Modeling survival data: extending the Cox model Terry M. Therneau, Patricia M. Grambsch No está a mi alcance, y es muy difícil de comprar (ahora en Argentina hasta hay problemas para importar Biblias, burocracias políticas, mi mamá tiene librería). El libro; A Handbook of Statistical Analyses Using R, Second Edition [Paperback] Brian S. Everitt (Author), Torsten Hothorn (Author) Por suerte sí está a mi alcance, pude leer el capitulo correspondiente. Dentro de sus recomendaciones leí biograph y pensaba "en que lío me habré metido". Pero creo que podre salir a flote, no busco un análisis muy complicado, en primera instancia el tratamiento depende del anterior pero siempre es el mismo. Cuándo pensé en Survival también pensaba en Cox, hay otras formas pero no estoy realizando algo para estadísticos, el resultado final es "en porcentaje", es: esto (tratamiento) es un x % y por cada día los % (si o no) varían de la siguiente forma. Yo soy veterinario, esto es sobre veterinaria a campo y con vacas, mi jefe me dijo, ni idea de eso pero que se entienda. Por lo cuán la salida de un gráfico con las líneas a lo largo del tiempo, es lo que se necesita por un lado, y por el otro es: de estos dos tratamientos, este explica en un 10% y este en un 5%, ese punto me falta estudiar, tengo dudas (desconocimiento) sobre sobre las salidas de resultados por parte de R (tengo que estudiarlo y aprenderlo). Creo que es correcto pensar en la librería survival porque el tratamiento es siempre igual, es a lo largo del tiempo (repeticiones) y el resultado es si o no (cambia el número de repeticiones y días). Gracias a los tres por sus aportes, intentaré y cualquier cosa consulto nuevamente al conocimiento y experiencia de ustedes. Javier -----Mensaje original----- From: Ivonne Pacheco Sent: Friday, October 07, 2011 7:26 AM To: Marcuzzi, Javier Rubén Subject: Re: [R-es] Survival Hola Javier, Tuve mas o menos los mismos inconvenientes para preparar los datos y utilizar survival, pero este libro me ayudó mucho: Modeling survival data: extending the Cox model Terry M. Therneau, Patricia M. Grambsch En el capítulo 8 tiene un apartado donde explica cómo deben estar preparados los datos para cada tipo de modelo. Espero te sirva. Un saludo, **** Ivonne Pacheco García **** El día 6 de octubre de 2011 17:00, Marcuzzi, Javier Rubén <javier.ruben.marcuzzi en gmail.com> escribió:> Hola a todos: > > Estoy comenzando a utilizar la librería survival, mi experiencia al > respecto es nula. > > El material que leo y los ejemplos son entendibles, pero tengo una duda > respecto a como preparar mis datos antes de utilizar la librería. > > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de > datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo > del tiempo de ciertas cosas que van pasando. > Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o > cinco tratamientos, y el resultado (si o no). Cabe aclarar que el > resultado puede ser al primer tratamiento, segundo tratamiento, al > producirse el resultado no se realiza el siguiente tratamiento (no > enveneno a nadie, pero es comparable, si está muerto no doy más veneno). > También conozco la fecha de nacimiento, podía tener la edad a cada tiempo. > > Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy > próximo a lo necesario para el procesamiento del modelo en R. No se a > ustedes, pero para a mi muchas veces es más el tiempo que me lleva > acomodar los datos (dentro o fuera de R) que el que me lleva pensar y > hacer el modelo estadístico. > > Lo que yo pensé es almacenar los registros de una forma muy sencilla, las > columnas serían las siguientes: > > Individuo, fecha, lo que paso. > > Y en la columna ?lo que paso? usar palabras como, ?nacimiento?, ?inicio de > protocolo?, ?tratamiento?, ?resultado?. > > Quedaría algo como (las fechas son cualquiera) > > javier 17/11/00 nacimiento > javier 27/12/01 inicio protocolo > javier 08/03/02 tratamiento > javier 20/09/03 tratamiento > javier 30/04/04 resultado > > Mirando ejemplos, las columnas preparadas son serían algo como: > individuo fecha tratamiento resultado > > O > Individuo entre fechas resultados > > La libreria survival tiene el siguiente ejemplo: > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) > > subject time1 time2 status age creatinine . . . > 1 0 15 0 25 1.3 > 1 15 46 0 25 1.5 > 1 46 73 0 25 1.4 > > Yo no puedo contemplar esa forma porque mis datos no tienen un ?entre tal > y tal fecha?. (me es muy importante conocer si fue al día 22 o 23, por > ejemplo) > Serían algo como: > > subject time status ( status es si o no para la fecha o día time). > > Necesitaría algo de información como para leer un poco más o comentarios > de experiencia de algunos de ustedes sobre survival y R. Principalmente a > como ir preparando los registros para ser eficiente y no perder tiempo, > llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi > trabajo por almacenar de forma incorrecta la información. Tengo dudas > sobre como preparar los registros para importar y/o procesar en R antes de > escribir el modelo para la librería Survival. > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >
Hola, buenas tardes, Estaba revisando análisis sobre supervivencia en los mails del grupo y encontré este. No estoy segura si pueda usar este paquete para los datos que tengo. Mis datos se tratan del seguimiento anual de entre otras variables, la supervivencia de plantas. Tengo tres tratamientos y a partir de un censo inicial en el cual marqué cada individuo, registré su especie y altura, cada año, re-censamos y mi dato es un 1 o 0, según si el individuo está vivo o no. Como tal no tengo una edad de muerte, o una fecha exacta de la muerte del individuo. Consideran Uds. que este análisis me podría servir? alguna recomendación? Les agradezco mucho cualquier dato. Un saludo, ACS ---- *Angela Andrea Camargo Sanabria* Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com>> Hola a todos: > > Estoy comenzando a utilizar la librería survival, mi experiencia al > respecto es nula. > > El material que leo y los ejemplos son entendibles, pero tengo una duda > respecto a como preparar mis datos antes de utilizar la librería. > > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de > datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo > del tiempo de ciertas cosas que van pasando. > Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o > cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado > puede ser al primer tratamiento, segundo tratamiento, al producirse el > resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero > es comparable, si está muerto no doy más veneno). También conozco la fecha > de nacimiento, podía tener la edad a cada tiempo. > > Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy > próximo a lo necesario para el procesamiento del modelo en R. No se a > ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar > los datos (dentro o fuera de R) que el que me lleva pensar y hacer el > modelo estadístico. > > Lo que yo pensé es almacenar los registros de una forma muy sencilla, las > columnas serían las siguientes: > > Individuo, fecha, lo que paso. > > Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de > protocolo”, “tratamiento”, “resultado”. > > Quedaría algo como (las fechas son cualquiera) > > javier 17/11/00 nacimiento > javier 27/12/01 inicio protocolo > javier 08/03/02 tratamiento > javier 20/09/03 tratamiento > javier 30/04/04 resultado > > Mirando ejemplos, las columnas preparadas son serían algo como: > individuo fecha tratamiento resultado > > O > Individuo entre fechas resultados > > La libreria survival tiene el siguiente ejemplo: > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) > > subject time1 time2 status age creatinine . . . > 1 0 15 0 25 1.3 > 1 15 46 0 25 1.5 > 1 46 73 0 25 1.4 > > Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal > y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por > ejemplo) > Serían algo como: > > subject time status ( status es si o no para la fecha o día time). > > Necesitaría algo de información como para leer un poco más o comentarios > de experiencia de algunos de ustedes sobre survival y R. Principalmente a > como ir preparando los registros para ser eficiente y no perder tiempo, > llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi > trabajo por almacenar de forma incorrecta la información. Tengo dudas sobre > como preparar los registros para importar y/o procesar en R antes de > escribir el modelo para la librería Survival. > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Estimada Andrea Hay varias alternativas, yo use Survival, algo próximo es binomial. No sabría que decir cuándo no está la fecha de muerte o una fecha que es 1 o 0, justamente desde mi punto de vista Survival sirve para: ¿a cuánto tiempo sucede esto que es SI o NO?, si nunca sucedió en algunos no habría problema, pero su planteo me deja dudas respecto a si es adecuado Survival o sus alternativas. Javier Marcuzzi From: Angela Andrea Camargo Sanabria Sent: Wednesday, June 13, 2012 9:40 PM To: Marcuzzi, Javier Rubén Cc: r-help-es@r-project.org Subject: Re: [R-es] Survival Hola, buenas tardes, Estaba revisando análisis sobre supervivencia en los mails del grupo y encontré este. No estoy segura si pueda usar este paquete para los datos que tengo. Mis datos se tratan del seguimiento anual de entre otras variables, la supervivencia de plantas. Tengo tres tratamientos y a partir de un censo inicial en el cual marqué cada individuo, registré su especie y altura, cada año, re-censamos y mi dato es un 1 o 0, según si el individuo está vivo o no. Como tal no tengo una edad de muerte, o una fecha exacta de la muerte del individuo. Consideran Uds. que este análisis me podría servir? alguna recomendación? Les agradezco mucho cualquier dato. Un saludo, ACS ---- Angela Andrea Camargo Sanabria Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com> Hola a todos: Estoy comenzando a utilizar la librería survival, mi experiencia al respecto es nula. El material que leo y los ejemplos son entendibles, pero tengo una duda respecto a como preparar mis datos antes de utilizar la librería. Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo del tiempo de ciertas cosas que van pasando. Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado puede ser al primer tratamiento, segundo tratamiento, al producirse el resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero es comparable, si está muerto no doy más veneno). También conozco la fecha de nacimiento, podía tener la edad a cada tiempo. Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy próximo a lo necesario para el procesamiento del modelo en R. No se a ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar los datos (dentro o fuera de R) que el que me lleva pensar y hacer el modelo estadístico. Lo que yo pensé es almacenar los registros de una forma muy sencilla, las columnas serían las siguientes: Individuo, fecha, lo que paso. Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de protocolo”, “tratamiento”, “resultado”. Quedaría algo como (las fechas son cualquiera) javier 17/11/00 nacimiento javier 27/12/01 inicio protocolo javier 08/03/02 tratamiento javier 20/09/03 tratamiento javier 30/04/04 resultado Mirando ejemplos, las columnas preparadas son serían algo como: individuo fecha tratamiento resultado O Individuo entre fechas resultados La libreria survival tiene el siguiente ejemplo: fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) subject time1 time2 status age creatinine . . . 1 0 15 0 25 1.3 1 15 46 0 25 1.5 1 46 73 0 25 1.4 Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por ejemplo) Serían algo como: subject time status ( status es si o no para la fecha o día time). Necesitaría algo de información como para leer un poco más o comentarios de experiencia de algunos de ustedes sobre survival y R. Principalmente a como ir preparando los registros para ser eficiente y no perder tiempo, llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi trabajo por almacenar de forma incorrecta la información. Tengo dudas sobre como preparar los registros para importar y/o procesar en R antes de escribir el modelo para la librería Survival. [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]
Hola Angela, Puesto que tu variable respuesta Y es si la planta sobrevive al final del año, el tipo de modelo depende de cuantas observaciones tienes por planta y de lo que quieres estudiar. Considero que podrias ver el problema de dos formas: (1) cada planta es observada durante varios años y se registra la variable Y (por ejemplo, si una planta se observa tres veces obtendrias las secuencias (o trayectorias) 1-0, 1-1-0 o 1-1-1, donde las primera seria "incompleta") y (2) asumir que el periodo de observacion es fijo (digamos solo un año). En ambos casos, tienes un conjunto de p covariables X = (x_1, x_2,...,x_p). Para (1), podrias usar un modelo de efectos mixtos; para ello puedes usar nlme, lme4, o lmer. Aqui interesa la "trayectoria" de la planta y determinar cuales X''s afectan dicha trayectoria. En (2), si efectivamente el tiempo es "fijo", podrias usar un modelo de regresion logistica (puedes ajustarlo via glm()). El interes en este caso seria la probabilidad de que la planta sobreviva _despues_ del primer año dado que se tienen las condiciones x_1, x_2,...x_p. Otra alternativa seria utilizar analisis de supervivencia, pero necesitariamos mucho mas que observar la planta al final del año, i.e., seria mejor tener la fecha de comienzo del estudio, la fecha en que se observo por primera vez (segunda, tercera, ...) y la fecha de muerte. De esa forma tendrias que el status es "0" (muerta) o "1" (viva) y la covariable "tiempo", adicional a X. Podrias ampliarnos un poco mas el tipo de informacion que tienes y cual es el objetivo de tu estudio? Saludos, Jorge.- 2012/6/13 Angela Andrea Camargo Sanabria <>> Hola, buenas tardes, > > Estaba revisando análisis sobre supervivencia en los mails del grupo y > encontré este. No estoy segura si pueda usar este paquete para los datos > que tengo. > > Mis datos se tratan del seguimiento anual de entre otras variables, la > supervivencia de plantas. Tengo tres tratamientos y a partir de un censo > inicial en el cual marqué cada individuo, registré su especie y altura, > cada año, re-censamos y mi dato es un 1 o 0, según si el individuo está > vivo o no. Como tal no tengo una edad de muerte, o una fecha exacta de la > muerte del individuo. > > Consideran Uds. que este análisis me podría servir? alguna recomendación? > > Les agradezco mucho cualquier dato. > > Un saludo, > > ACS > > ---- > *Angela Andrea Camargo Sanabria* > Estudiante Doctorado en Ciencias Biológicas > Laboratorio de Ecología de poblaciones y comunidades tropicales > Centro de Investigaciones en Ecosistemas (CIEco) > UNAM, campus Morelia > Antigua Carretera a Pátzcuaro # 8701 > Col. Ex-Hacienda de San José de la Huerta, CP 58190 > Morelia, Michoacán, México > Tel.: 443-3222706 ext. 42511 > e-mail: aacamargo@cieco.unam.mx > skype: angela.camargo26 > > > > > 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com> > > > Hola a todos: > > > > Estoy comenzando a utilizar la librería survival, mi experiencia al > > respecto es nula. > > > > El material que leo y los ejemplos son entendibles, pero tengo una duda > > respecto a como preparar mis datos antes de utilizar la librería. > > > > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de > > datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo > > del tiempo de ciertas cosas que van pasando. > > Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro > o > > cinco tratamientos, y el resultado (si o no). Cabe aclarar que el > resultado > > puede ser al primer tratamiento, segundo tratamiento, al producirse el > > resultado no se realiza el siguiente tratamiento (no enveneno a nadie, > pero > > es comparable, si está muerto no doy más veneno). También conozco la > fecha > > de nacimiento, podía tener la edad a cada tiempo. > > > > Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy > > próximo a lo necesario para el procesamiento del modelo en R. No se a > > ustedes, pero para a mi muchas veces es más el tiempo que me lleva > acomodar > > los datos (dentro o fuera de R) que el que me lleva pensar y hacer el > > modelo estadístico. > > > > Lo que yo pensé es almacenar los registros de una forma muy sencilla, las > > columnas serían las siguientes: > > > > Individuo, fecha, lo que paso. > > > > Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio > de > > protocolo”, “tratamiento”, “resultado”. > > > > Quedaría algo como (las fechas son cualquiera) > > > > javier 17/11/00 nacimiento > > javier 27/12/01 inicio protocolo > > javier 08/03/02 tratamiento > > javier 20/09/03 tratamiento > > javier 30/04/04 resultado > > > > Mirando ejemplos, las columnas preparadas son serían algo como: > > individuo fecha tratamiento resultado > > > > O > > Individuo entre fechas resultados > > > > La libreria survival tiene el siguiente ejemplo: > > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) > > > > subject time1 time2 status age creatinine . . . > > 1 0 15 0 25 1.3 > > 1 15 46 0 25 1.5 > > 1 46 73 0 25 1.4 > > > > Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal > > y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por > > ejemplo) > > Serían algo como: > > > > subject time status ( status es si o no para la fecha o día time). > > > > Necesitaría algo de información como para leer un poco más o comentarios > > de experiencia de algunos de ustedes sobre survival y R. Principalmente a > > como ir preparando los registros para ser eficiente y no perder tiempo, > > llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi > > trabajo por almacenar de forma incorrecta la información. Tengo dudas > sobre > > como preparar los registros para importar y/o procesar en R antes de > > escribir el modelo para la librería Survival. > > > > > > > > [[alternative HTML version deleted]] > > > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Claro Jorge, Mira el objetivo (en este caso específico del estudio) es evaluar el efecto de la exclusión de mamíferos herbívoros sobre la supervivencia de plántulas y juveniles (30 - 99 cm de altura). Tengo dos tratamientos de exclusión y un control. Para esto en enero de 2008 se instalaron los experimentos, osea se colocaron las exclusiones en la selva, se identificaron, marcaron y midieron todos los individuos que quedaran dentro de este trio experimental. Tengo 25 replicas (25 sitios, cada uno con las tres parcelas). En 2010, 2011 y 2012 registro si los individuos están vivos o muertes y además mido su altura. Yo ya he utilizado un modelo lineal generalizado (glm) con error tipo binomial en donde la variable *y* es una variable respuesta de dos vectores (número de éxitos = número de sobrevivientes, número de fallas = número de muertes). Pero esto lo he hecho para cada año, 2010, 2011, etc, de forma separada, estoy en busca de algún análisis que me hablé de la dinámica, es decir, del cambio con el tiempo. Muchas gracias y estoy pendiente por si debo dar más información. Angela C. ---- Angela Andrea Camargo Sanabria Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2012/6/13 Jorge I Velez <jorgeivanvelez@gmail.com>> > Hola Angela, > > Puesto que tu variable respuesta Y es si la planta sobrevive al final delaño, el tipo de modelo depende de cuantas observaciones tienes por planta y de lo que quieres estudiar.> > Considero que podrias ver el problema de dos formas: (1) cada planta esobservada durante varios años y se registra la variable Y (por ejemplo, si una planta se observa tres veces obtendrias las secuencias (o trayectorias) 1-0, 1-1-0 o 1-1-1, donde las primera seria "incompleta") y (2) asumir que el periodo de observacion es fijo (digamos solo un año). En ambos casos, tienes un conjunto de p covariables X = (x_1, x_2,...,x_p). Para (1), podrias usar un modelo de efectos mixtos; para ello puedes usar nlme, lme4, o lmer. Aqui interesa la "trayectoria" de la planta y determinar cuales X''s afectan dicha trayectoria. En (2), si efectivamente el tiempo es "fijo", podrias usar un modelo de regresion logistica (puedes ajustarlo via glm()). El interes en este caso seria la probabilidad de que la planta sobreviva _despues_ del primer año dado que se tienen las condiciones x_1, x_2,...x_p.> > Otra alternativa seria utilizar analisis de supervivencia, peronecesitariamos mucho mas que observar la planta al final del año, i.e., seria mejor tener la fecha de comienzo del estudio, la fecha en que se observo por primera vez (segunda, tercera, ...) y la fecha de muerte. De esa forma tendrias que el status es "0" (muerta) o "1" (viva) y la covariable "tiempo", adicional a X.> > Podrias ampliarnos un poco mas el tipo de informacion que tienes y cuales el objetivo de tu estudio?> > Saludos, > Jorge.- > > > 2012/6/13 Angela Andrea Camargo Sanabria <> >> >> Hola, buenas tardes, >> >> Estaba revisando análisis sobre supervivencia en los mails del grupo y >> encontré este. No estoy segura si pueda usar este paquete para los datos >> que tengo. >> >> Mis datos se tratan del seguimiento anual de entre otras variables, la >> supervivencia de plantas. Tengo tres tratamientos y a partir de un censo >> inicial en el cual marqué cada individuo, registré su especie y altura, >> cada año, re-censamos y mi dato es un 1 o 0, según si el individuo está >> vivo o no. Como tal no tengo una edad de muerte, o una fecha exacta de la >> muerte del individuo. >> >> Consideran Uds. que este análisis me podría servir? alguna recomendación? >> >> Les agradezco mucho cualquier dato. >> >> Un saludo, >> >> ACS >> >> ---- >> *Angela Andrea Camargo Sanabria* >> >> Estudiante Doctorado en Ciencias Biológicas >> Laboratorio de Ecología de poblaciones y comunidades tropicales >> Centro de Investigaciones en Ecosistemas (CIEco) >> UNAM, campus Morelia >> Antigua Carretera a Pátzcuaro # 8701 >> Col. Ex-Hacienda de San José de la Huerta, CP 58190 >> Morelia, Michoacán, México >> Tel.: 443-3222706 ext. 42511 >> e-mail: aacamargo@cieco.unam.mx >> skype: angela.camargo26 >> >> >> >> >> 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com> >> >> > Hola a todos: >> > >> > Estoy comenzando a utilizar la librería survival, mi experiencia al >> > respecto es nula. >> > >> > El material que leo y los ejemplos son entendibles, pero tengo una duda >> > respecto a como preparar mis datos antes de utilizar la librería. >> > >> > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de >> > datos, planilla de cálculo, como yo quiera) son el seguimiento a lolargo>> > del tiempo de ciertas cosas que van pasando. >> > Básicamente tengo el individuo, la fecha de inicio del protocolo,cuatro o>> > cinco tratamientos, y el resultado (si o no). Cabe aclarar que elresultado>> > puede ser al primer tratamiento, segundo tratamiento, al producirse el >> > resultado no se realiza el siguiente tratamiento (no enveneno a nadie,pero>> > es comparable, si está muerto no doy más veneno). También conozco lafecha>> > de nacimiento, podía tener la edad a cada tiempo. >> > >> > Mi duda es porque leo los ejemplos y los datos ya están acomodados, omuy>> > próximo a lo necesario para el procesamiento del modelo en R. No se a >> > ustedes, pero para a mi muchas veces es más el tiempo que me llevaacomodar>> > los datos (dentro o fuera de R) que el que me lleva pensar y hacer el >> > modelo estadístico. >> > >> > Lo que yo pensé es almacenar los registros de una forma muy sencilla,las>> > columnas serían las siguientes: >> > >> > Individuo, fecha, lo que paso. >> > >> > Y en la columna “lo que paso” usar palabras como, “nacimiento”,“inicio de>> > protocolo”, “tratamiento”, “resultado”. >> > >> > Quedaría algo como (las fechas son cualquiera) >> > >> > javier 17/11/00 nacimiento >> > javier 27/12/01 inicio protocolo >> > javier 08/03/02 tratamiento >> > javier 20/09/03 tratamiento >> > javier 30/04/04 resultado >> > >> > Mirando ejemplos, las columnas preparadas son serían algo como: >> > individuo fecha tratamiento resultado >> > >> > O >> > Individuo entre fechas resultados >> > >> > La libreria survival tiene el siguiente ejemplo: >> > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine,data=mydata)>> > >> > subject time1 time2 status age creatinine . . . >> > 1 0 15 0 25 1.3 >> > 1 15 46 0 25 1.5 >> > 1 46 73 0 25 1.4 >> > >> > Yo no puedo contemplar esa forma porque mis datos no tienen un “entretal>> > y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por >> > ejemplo) >> > Serían algo como: >> > >> > subject time status ( status es si o no para la fecha o díatime).>> > >> > Necesitaría algo de información como para leer un poco más ocomentarios>> > de experiencia de algunos de ustedes sobre survival y R.Principalmente a>> > como ir preparando los registros para ser eficiente y no perder tiempo, >> > llevo más de 5000 renglones pasados y no me gustaría tener que rehacermi>> > trabajo por almacenar de forma incorrecta la información. Tengo dudassobre>> > como preparar los registros para importar y/o procesar en R antes de >> > escribir el modelo para la librería Survival. >> > >> > >> > >> > [[alternative HTML version deleted]] >> > >> > >> > _______________________________________________ >> > R-help-es mailing list >> > R-help-es@r-project.org >> > https://stat.ethz.ch/mailman/listinfo/r-help-es >> > >> > >> >> [[alternative HTML version deleted]] >> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >[[alternative HTML version deleted]]
Hola. Yo ya he utilizado un modelo lineal generalizado (glm) con error tipo> binomial en donde la variable *y* es una variable respuesta de dos vectores > (número de éxitos = número de sobrevivientes, número de fallas = número de > muertes). Pero esto lo he hecho para cada año, 2010, 2011, etc, de forma > separada, estoy en busca de algún análisis que me hablé de la dinámica, es > decir, del cambio con el tiempo. >Solo por curiosidad: ¿utilizaste la altura de las plantas como variable predictora en el modelo binario que mencionas? Quizá un refinamiento de este modelo pueda ser utilizar datos sin agrupar y considerando todos los años a un tiempo (una variable año que considere cada año como una categoría). Por otro lado, creo que lo más importante del comentario de Jorge con respecto a incluir el tiempo de la forma en que lo sugieres en tu modelo es el siguiente: Otra alternativa seria utilizar analisis de supervivencia, pero> necesitariamos mucho mas que observar la planta al final del año, i.e., > seria mejor tener la fecha de comienzo del estudio, la fecha en que se > observo por primera vez (segunda, tercera, ...) y la fecha de muerte. De > esa forma tendrias que el status es "0" (muerta) o "1" (viva) y la > covariable "tiempo", adicional a X.¿Tienes las fechas en que hiciste las revisiones? Si tienes esas fechas, entonces realizar un análisis de supervivencia será sencillo y creo que te generará más ganancia (por favor me corrigen) que tener solo los años en los que fueron hechos los experimentos y las revisiones. ¡Salud! -- «But Gwindor answered: ''The doom lies in yourself, not in your name.''» JRR Tolkien [[alternative HTML version deleted]]
Hola Freddy, Gracias por tomarte el tiempo! No he utilizado la altura en ninguna parte de este análisis. Y de otro lado, si tengo las fechas exactas en las que hice el levantamiento inicial y las revisiones anuales. Saludos, ---- *Angela Andrea Camargo Sanabria* Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2012/6/14 Freddy López <freddy.vate01@gmail.com>> Hola. > > Yo ya he utilizado un modelo lineal generalizado (glm) con error tipo >> binomial en donde la variable *y* es una variable respuesta de dos >> vectores >> >> (número de éxitos = número de sobrevivientes, número de fallas = número de >> muertes). Pero esto lo he hecho para cada año, 2010, 2011, etc, de forma >> separada, estoy en busca de algún análisis que me hablé de la dinámica, es >> decir, del cambio con el tiempo. >> > > Solo por curiosidad: ¿utilizaste la altura de las plantas como variable > predictora en el modelo binario que mencionas? Quizá un refinamiento de > este modelo pueda ser utilizar datos sin agrupar y considerando todos los > años a un tiempo (una variable año que considere cada año como una > categoría). > > Por otro lado, creo que lo más importante del comentario de Jorge con > respecto a incluir el tiempo de la forma en que lo sugieres en tu modelo es > el siguiente: > > Otra alternativa seria utilizar analisis de supervivencia, pero >> necesitariamos mucho mas que observar la planta al final del año, i.e., >> seria mejor tener la fecha de comienzo del estudio, la fecha en que se >> observo por primera vez (segunda, tercera, ...) y la fecha de muerte. De >> esa forma tendrias que el status es "0" (muerta) o "1" (viva) y la >> covariable "tiempo", adicional a X. > > > ¿Tienes las fechas en que hiciste las revisiones? Si tienes esas fechas, > entonces realizar un análisis de supervivencia será sencillo y creo que te > generará más ganancia (por favor me corrigen) que tener solo los años en > los que fueron hechos los experimentos y las revisiones. > > ¡Salud! > > -- > «But Gwindor answered: ''The doom lies in yourself, not in your name.''» > > JRR Tolkien > >[[alternative HTML version deleted]]
Angela Creo que Survival en esas condiciones no es apropiado, en cierta forma comprendo lo que deseas, haciendo un paralelismo con veterinaria, yo conozco la edad, o puedo calcularla, pero un punto interesante es que a partir de la fecha de inicio puedo realizar varias mediciones, aunque estas no necesariamente son vivo y muertos, si son de todo o nada, graficando da un gráfico como el de sobrevida, por lo cuál es sencillo adaptar o almacenar los datos para ser analizados con Survival, pero como usted comenta, con tan pocas mediciones, o dicho o otra forma, muchos datos en noviembre, desconociendo lo que pasa al tiempo de enero, febrero, marzo, ..., si esto se grafica sería como una escalera de tres escalones. Esto no sería apropiado para Survival. Pero puede ser que mi apreciación esté errónea, posiblemente la regresion de cox pueda aportarle información. Javier From: Angela Andrea Camargo Sanabria Sent: Thursday, June 14, 2012 1:41 PM To: Marcuzzi, Javier Rubén Cc: Jorge I Velez ; R-help-es Subject: Re: [R-es] Survival Hola Javier, Gracias por tus comentarios! Tengo una fecha fija de cuando inició el experimento, pero no puedo saber la edad de los individuos pues se trata de plántulas naturalmente establecidas en los sitios experimentales. Y las mediciones se hacen cada año (noviembre o diciembre aproximadamente). Saludos, ACS ---- Angela Andrea Camargo Sanabria Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2012/6/14 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com> Estimada Angela No alcanzo a entender su planteo, por un lado hay una fecha fija donde inician su trabajo, a esa fecha ¿que edad tienen los individuos?, y lo segundo que no alcanzo a comprender ¿cada cuánto tiempo miden si los individuos están vivos o muertos (2010, 2011, 2012)?, ¿son cuatro mediciones en el tiempo, inicio y una por año?, yo creo que lo principal es la escala de tiempo y los eventos en esta escala, de los cuales uno es vivo o muerto. Javier -----Mensaje original----- From: Angela Andrea Camargo Sanabria Sent: Thursday, June 14, 2012 9:07 AM To: Jorge I Velez Cc: R-help-es Subject: Re: [R-es] Survival Claro Jorge, Mira el objetivo (en este caso específico del estudio) es evaluar el efecto de la exclusión de mamíferos herbívoros sobre la supervivencia de plántulas y juveniles (30 - 99 cm de altura). Tengo dos tratamientos de exclusión y un control. Para esto en enero de 2008 se instalaron los experimentos, osea se colocaron las exclusiones en la selva, se identificaron, marcaron y midieron todos los individuos que quedaran dentro de este trio experimental. Tengo 25 replicas (25 sitios, cada uno con las tres parcelas). En 2010, 2011 y 2012 registro si los individuos están vivos o muertes y además mido su altura. Yo ya he utilizado un modelo lineal generalizado (glm) con error tipo binomial en donde la variable *y* es una variable respuesta de dos vectores (número de éxitos = número de sobrevivientes, número de fallas = número de muertes). Pero esto lo he hecho para cada año, 2010, 2011, etc, de forma separada, estoy en busca de algún análisis que me hablé de la dinámica, es decir, del cambio con el tiempo. Muchas gracias y estoy pendiente por si debo dar más información. Angela C. ---- Angela Andrea Camargo Sanabria Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2012/6/13 Jorge I Velez <jorgeivanvelez@gmail.com> Hola Angela, Puesto que tu variable respuesta Y es si la planta sobrevive al final del año, el tipo de modelo depende de cuantas observaciones tienes por planta y de lo que quieres estudiar. Considero que podrias ver el problema de dos formas: (1) cada planta es observada durante varios años y se registra la variable Y (por ejemplo, si una planta se observa tres veces obtendrias las secuencias (o trayectorias) 1-0, 1-1-0 o 1-1-1, donde las primera seria "incompleta") y (2) asumir que el periodo de observacion es fijo (digamos solo un año). En ambos casos, tienes un conjunto de p covariables X = (x_1, x_2,...,x_p). Para (1), podrias usar un modelo de efectos mixtos; para ello puedes usar nlme, lme4, o lmer. Aqui interesa la "trayectoria" de la planta y determinar cuales X''s afectan dicha trayectoria. En (2), si efectivamente el tiempo es "fijo", podrias usar un modelo de regresion logistica (puedes ajustarlo via glm()). El interes en este caso seria la probabilidad de que la planta sobreviva _despues_ del primer año dado que se tienen las condiciones x_1, x_2,...x_p. Otra alternativa seria utilizar analisis de supervivencia, pero necesitariamos mucho mas que observar la planta al final del año, i.e., seria mejor tener la fecha de comienzo del estudio, la fecha en que se observo por primera vez (segunda, tercera, ...) y la fecha de muerte. De esa forma tendrias que el status es "0" (muerta) o "1" (viva) y la covariable "tiempo", adicional a X. Podrias ampliarnos un poco mas el tipo de informacion que tienes y cual es el objetivo de tu estudio? Saludos, Jorge.- 2012/6/13 Angela Andrea Camargo Sanabria <> Hola, buenas tardes, Estaba revisando análisis sobre supervivencia en los mails del grupo y encontré este. No estoy segura si pueda usar este paquete para los datos que tengo. Mis datos se tratan del seguimiento anual de entre otras variables, la supervivencia de plantas. Tengo tres tratamientos y a partir de un censo inicial en el cual marqué cada individuo, registré su especie y altura, cada año, re-censamos y mi dato es un 1 o 0, según si el individuo está vivo o no. Como tal no tengo una edad de muerte, o una fecha exacta de la muerte del individuo. Consideran Uds. que este análisis me podría servir? alguna recomendación? Les agradezco mucho cualquier dato. Un saludo, ACS ---- *Angela Andrea Camargo Sanabria* Estudiante Doctorado en Ciencias Biológicas Laboratorio de Ecología de poblaciones y comunidades tropicales Centro de Investigaciones en Ecosistemas (CIEco) UNAM, campus Morelia Antigua Carretera a Pátzcuaro # 8701 Col. Ex-Hacienda de San José de la Huerta, CP 58190 Morelia, Michoacán, México Tel.: 443-3222706 ext. 42511 e-mail: aacamargo@cieco.unam.mx skype: angela.camargo26 2011/10/6 Marcuzzi, Javier Rubén <javier.ruben.marcuzzi@gmail.com> > Hola a todos: > > Estoy comenzando a utilizar la librería survival, mi experiencia al > respecto es nula. > > El material que leo y los ejemplos son entendibles, pero tengo una duda > respecto a como preparar mis datos antes de utilizar la librería. > > Mis datos (los cuales yo mido a campo y puedo escribirlos en la base de > datos, planilla de cálculo, como yo quiera) son el seguimiento a lo largo > del tiempo de ciertas cosas que van pasando. > Básicamente tengo el individuo, la fecha de inicio del protocolo, cuatro o > cinco tratamientos, y el resultado (si o no). Cabe aclarar que el resultado > puede ser al primer tratamiento, segundo tratamiento, al producirse el > resultado no se realiza el siguiente tratamiento (no enveneno a nadie, pero > es comparable, si está muerto no doy más veneno). También conozco la fecha > de nacimiento, podía tener la edad a cada tiempo. > > Mi duda es porque leo los ejemplos y los datos ya están acomodados, o muy > próximo a lo necesario para el procesamiento del modelo en R. No se a > ustedes, pero para a mi muchas veces es más el tiempo que me lleva acomodar > los datos (dentro o fuera de R) que el que me lleva pensar y hacer el > modelo estadístico. > > Lo que yo pensé es almacenar los registros de una forma muy sencilla, las > columnas serían las siguientes: > > Individuo, fecha, lo que paso. > > Y en la columna “lo que paso” usar palabras como, “nacimiento”, “inicio de > protocolo”, “tratamiento”, “resultado”. > > Quedaría algo como (las fechas son cualquiera) > > javier 17/11/00 nacimiento > javier 27/12/01 inicio protocolo > javier 08/03/02 tratamiento > javier 20/09/03 tratamiento > javier 30/04/04 resultado > > Mirando ejemplos, las columnas preparadas son serían algo como: > individuo fecha tratamiento resultado > > O > Individuo entre fechas resultados > > La libreria survival tiene el siguiente ejemplo: > fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata) > > subject time1 time2 status age creatinine . . . > 1 0 15 0 25 1.3 > 1 15 46 0 25 1.5 > 1 46 73 0 25 1.4 > > Yo no puedo contemplar esa forma porque mis datos no tienen un “entre tal > y tal fecha”. (me es muy importante conocer si fue al día 22 o 23, por > ejemplo) > Serían algo como: > > subject time status ( status es si o no para la fecha o día time). > > Necesitaría algo de información como para leer un poco más o comentarios > de experiencia de algunos de ustedes sobre survival y R. Principalmente a > como ir preparando los registros para ser eficiente y no perder tiempo, > llevo más de 5000 renglones pasados y no me gustaría tener que rehacer mi > trabajo por almacenar de forma incorrecta la información. Tengo dudas sobre > como preparar los registros para importar y/o procesar en R antes de > escribir el modelo para la librería Survival. > > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]