Carlos J. Gil Bellosta
2010-Sep-09 13:23 UTC
[R-es] "Step" para modelos lineales usando medidas de error alternativas a AIC
Hola, ¿qué tal? Recientemente, enfrentándome a un problema de minería de datos (*), eché de menos una característica de R (que tal vez exista y de ahí mi pregunta en la lista). Quería plantear un modelo lineal con muchas variables de entrada y utilizar alguna de las variantes de "step" para descartar la mayor parte de las presumiblemente menos informativas. _step_ utiliza AIC como criterio de parada. Sin embargo, a mí me interesaba más poder detener la búsqueda de nuevas variables en función de criterios alternativos basados en los datos mismos: por ejemplo, la minimización del error cuadrático (o absoluto) medio sobre un conjunto de control. ¿Existe algo así ya implementado en R? Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com (*) No sin cierta dosis de oportunismo, aprovecho la ocasión para dar a conocer las circunstancias del problema (una competición) y mi resultado en ella: http://www.datanalytics.com/blog/2010/09/08/datanalytics-segunda-posicion-en-la-competicion-internacional-de-mineria-de-datos/
Jorge Ivan Velez
2010-Sep-09 13:45 UTC
[R-es] "Step" para modelos lineales usando medidas de error alternativas a AIC
Buenos dias Carlos, Dale una mirada a require(MuMIn) ?dredge y su primer ejemplo. Sin embargo, aunque no es tan "simple" como step() pues no hace el trabajo de manera automatica, te ofrece la posibilidad de evaluar varios criterios y seleccionar el "mejor" basado en uno o varios de ellos. Otra opcion es require(leaps) ?leaps Felicitaciones por los resultados en la competencia! Saludos, Jorge Ivan Velez 2010/9/9 Carlos J. Gil Bellosta <>> Hola, ¿qué tal? > > Recientemente, enfrentándome a un problema de minería de datos (*), > eché de menos una característica de R (que tal vez exista y de ahí mi > pregunta en la lista). > > Quería plantear un modelo lineal con muchas variables de entrada y > utilizar alguna de las variantes de "step" para descartar la mayor > parte de las presumiblemente menos informativas. > > _step_ utiliza AIC como criterio de parada. Sin embargo, a mí me > interesaba más poder detener la búsqueda de nuevas variables en > función de criterios alternativos basados en los datos mismos: por > ejemplo, la minimización del error cuadrático (o absoluto) medio sobre > un conjunto de control. > > ¿Existe algo así ya implementado en R? > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com > > > (*) No sin cierta dosis de oportunismo, aprovecho la ocasión para dar > a conocer las circunstancias del problema (una competición) y mi > resultado en ella: > > > http://www.datanalytics.com/blog/2010/09/08/datanalytics-segunda-posicion-en-la-competicion-internacional-de-mineria-de-datos/ > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]