rod lopez
2012-Sep-26 20:21 UTC
[R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA
> >Estimados muy buenas quería hacerles unas consulta: Estoy trabajando en mi tesis sobre mejoramiento animal y mi objetivo es evaluar la habilidad predictiva de modelos estadísticos mediante validación cruzada. Pero antes la intención es dividir mi base de datos en 3 partes y quisiera que todos los efectos incluidos en el estudio y cada uno de sus niveles, estén lo más equitativamente representados en los tres subconjuntos. Mis efectos son año (32 niveles), sexo (3 niveles), edad (2 niveles) y efecto genético animal (5561 niveles). ¿Existe alguna forma de realizar una partición al azar de mi base de datos en 3 partes pero que a su vez estén representados todos los efectos y sus niveles de forma representativa en los 3 subconjuntos? Desde ya muchas gracias. Saludos, Rodrigo. [[alternative HTML version deleted]]
Carlos J. Gil Bellosta
2012-Sep-26 20:30 UTC
[R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA
Utiliza el paquete caret. En http://cran.r-project.org/web/packages/caret/vignettes/caretMisc.pdf dice: "Similarly, createResample can be used to make simple bootstrap samples and createFolds can be used to generate balanced cross?validation groupings from a set of data." Creo que es más o menos lo que necesitas. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 26 de septiembre de 2012 22:21, rod lopez <rod99hare en gmail.com> escribió:>> >> > Estimados muy buenas quería hacerles unas consulta: > > Estoy trabajando en mi tesis sobre mejoramiento animal y mi objetivo es > evaluar la habilidad predictiva de modelos estadísticos mediante validación > cruzada. > > Pero antes la intención es dividir mi base de datos en 3 partes y quisiera > que todos los efectos incluidos en el estudio y cada uno de sus niveles, > estén lo más equitativamente representados en los tres subconjuntos. > > Mis efectos son año (32 niveles), sexo (3 niveles), edad (2 niveles) y > efecto genético animal (5561 niveles). > > ¿Existe alguna forma de realizar una partición al azar de mi base de datos > en 3 partes pero que a su vez estén representados todos los efectos y sus > niveles de forma representativa en los 3 subconjuntos? > > Desde ya muchas gracias. > > Saludos, > > Rodrigo. > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >
Argel Gastélum Arellánez
2012-Sep-26 21:40 UTC
[R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA
Hola Rodrigo, tal vez algo como lo que ejemplifican aquí (con el paquete "caret") te pueda servir: http://stats.stackexchange.com/questions/21717/how-to-train-and-validate-a-neural-network-model-in-r Saludos. Argel. El 26/09/12 15:30, Carlos J. Gil Bellosta escribió:> Utiliza el paquete caret. > > En http://cran.r-project.org/web/packages/caret/vignettes/caretMisc.pdf dice: > > "Similarly, createResample can be used to make simple bootstrap > samples and createFolds can be used to generate balanced > cross?validation groupings from a set of data." > > Creo que es más o menos lo que necesitas. > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com > > > El día 26 de septiembre de 2012 22:21, rod lopez <rod99hare en gmail.com> escribió: >>> >> Estimados muy buenas quería hacerles unas consulta: >> >> Estoy trabajando en mi tesis sobre mejoramiento animal y mi objetivo es >> evaluar la habilidad predictiva de modelos estadísticos mediante validación >> cruzada. >> >> Pero antes la intención es dividir mi base de datos en 3 partes y quisiera >> que todos los efectos incluidos en el estudio y cada uno de sus niveles, >> estén lo más equitativamente representados en los tres subconjuntos. >> >> Mis efectos son año (32 niveles), sexo (3 niveles), edad (2 niveles) y >> efecto genético animal (5561 niveles). >> >> ¿Existe alguna forma de realizar una partición al azar de mi base de datos >> en 3 partes pero que a su vez estén representados todos los efectos y sus >> niveles de forma representativa en los 3 subconjuntos? >> >> Desde ya muchas gracias. >> >> Saludos, >> >> Rodrigo. >> >> [[alternative HTML version deleted]] >> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Marcuzzi, Javier Rubén
2012-Sep-26 22:49 UTC
[R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA
Estimado Rod Lopez ¿Que tesis desea realizar, me refiero a grado o alguna superior? Me llama la atención que desee colocar el valor genético animal, año (32 niveles), etc. Entiendo que hay varias posibilidades, pero básicamente el modelo animal ya tiene esa información, en todos casos, si desea realizar una tesis el sistema MACE puede ayudarlo y desconozco si en R hay un paquete al respecto, sería todo un desafío llevar eso a R. Conozco algunos que intentaron genética y R, en modelo animal es complicado, en regresiones aleatorias es pesado, recuerdo que una persona que realizó su phd sobre evaluar la exactitud en genética animal, un comentario como que con R es complicado, hay herramientas mejores. Estaría genial que pueda mejorar los códigos al respecto. Javier Marcuzzi -----Mensaje original----- From: rod lopez Sent: Wednesday, September 26, 2012 5:21 PM To: R-help-es Subject: [R-es] DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA> >Estimados muy buenas quería hacerles unas consulta: Estoy trabajando en mi tesis sobre mejoramiento animal y mi objetivo es evaluar la habilidad predictiva de modelos estadísticos mediante validación cruzada. Pero antes la intención es dividir mi base de datos en 3 partes y quisiera que todos los efectos incluidos en el estudio y cada uno de sus niveles, estén lo más equitativamente representados en los tres subconjuntos. Mis efectos son año (32 niveles), sexo (3 niveles), edad (2 niveles) y efecto genético animal (5561 niveles). ¿Existe alguna forma de realizar una partición al azar de mi base de datos en 3 partes pero que a su vez estén representados todos los efectos y sus niveles de forma representativa en los 3 subconjuntos? Desde ya muchas gracias. Saludos, Rodrigo. [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es