Hola, Espero que todos estén muy bien. Les cuento la situación: En estos momentos estamos trabajando en un proyecto sobre el modelado de unas series de tiempo semanales y estamos confeccionando un proceso de forma tal que cada semana solo hay que ejecutar un par de guiones que nos da el pronóstico de las 3 o 4 semanas siguientes. Con esta forma de trabajar se está apuntando a la automatización principalmente. El modelo que está involucrado en la predicción contempla variables predictoras y estas alimentan al modelo cada semana de forma que cada semana se 'actualizan' los parámetros (pues se estiman los parámetros con una semana adicional). La estructura del modelo no cambia. Existe el temor inminente que el proceso que estamos asumiendo que rige las series cambie de un momento a otro. Mis dudas son: ¿cuáles son las buenas prácticas con este procedimiento que estamos siguiendo?¿conocen ustedes documentación sobre cada cuánto tiempo se debe 'revisar' el modelo?¿es recomendable esta estrategia? De antemano agradezco sus comentarios y pregunto aquí porque sé que está repleto de expertos estadísticos aunque no haya orientado mi pregunta específicamente al uso de R (por cierto, todo lo tenemos hecho en R con una conexión a una base de datos para obtener los datos). Mil gracias y salud. -- «But Gwindor answered: 'The doom lies in yourself, not in your name.'» JRR Tolkien
Marcuzzi, Javier Rubén
2012-Apr-12 17:37 UTC
[R-es] Sobre series de tiempo y automatización.-
Estimado Freddy López No se si entendí justo lo que necesita, pero por lo comprendido de mi parte: ¿Cuánto es el tamaño de sus datos en la base de datos? Le pregunto esto porque si el modelo es fijo, pero por decirlo de alguna forma, puede quedar desactualizado al ingresar nuevos datos desde la base de datos, suponiendo y simplificando su trabajo, llevando todo a solo un ajuste de curvas donde únicamente se observa el R2, a lo largo de las semanas cuando de va ejecutando el modelo hay nuevos valores de R2 que corresponden a cada procesamiento. ¿Es posible guardar este parámetro (bueno, el que corresponda)? Sobre mi consulta sobre el tamaño de los datos, es porque antes trabajaba con un sistema de respaldo, cada día que realizaba un respaldo creaba todos los archivos de nuevo almacenados con la fecha, en el disco quedaba la fecha de mi respaldo anterior con todos los archivos, la fecha de mi respaldo actual con todos los archivos, ..., en caso de un problema podía regresar en las fechas y buscar el o los archivos necesarios (consumía disco rígido en una forma extraordinaria). Trasladando esto podría ser una consulta en la base de datos utilizando la fecha (hoy), que justo hoy no sería necesaria porque es el último día, pero si es almacenada como una variable en una lista, podría plantear consultas al día x, x1, x2, x3, ejecutando todo el modelo como modelo x1, modelox2, modelox3. Pero esto tiene un costo de procesamiento que posiblemente se pueda evitar al guardar en archivos almacenados por fechas. Resumiendo, podrían ser tres alternativas, guardar todo por fecha en el disco, procesar todo bajo un modelo (anterior y actual), o guardar parámetros en archivos de texto (podría haber un data.frame que lee el resultado del análisis anterior, se procesa, se agrega una fila al data.frame con los valores nuevos, se guarda el archivo). Javier -----Mensaje original----- From: Freddy López Sent: Thursday, April 12, 2012 12:51 PM To: r-help-es en r-project.org Subject: [R-es] Sobre series de tiempo y automatización.- Hola, Espero que todos estén muy bien. Les cuento la situación: En estos momentos estamos trabajando en un proyecto sobre el modelado de unas series de tiempo semanales y estamos confeccionando un proceso de forma tal que cada semana solo hay que ejecutar un par de guiones que nos da el pronóstico de las 3 o 4 semanas siguientes. Con esta forma de trabajar se está apuntando a la automatización principalmente. El modelo que está involucrado en la predicción contempla variables predictoras y estas alimentan al modelo cada semana de forma que cada semana se 'actualizan' los parámetros (pues se estiman los parámetros con una semana adicional). La estructura del modelo no cambia. Existe el temor inminente que el proceso que estamos asumiendo que rige las series cambie de un momento a otro. Mis dudas son: ¿cuáles son las buenas prácticas con este procedimiento que estamos siguiendo?¿conocen ustedes documentación sobre cada cuánto tiempo se debe 'revisar' el modelo?¿es recomendable esta estrategia? De antemano agradezco sus comentarios y pregunto aquí porque sé que está repleto de expertos estadísticos aunque no haya orientado mi pregunta específicamente al uso de R (por cierto, todo lo tenemos hecho en R con una conexión a una base de datos para obtener los datos). Mil gracias y salud. -- «But Gwindor answered: 'The doom lies in yourself, not in your name.'» JRR Tolkien _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es