Manuel Mendoza
2021-Aug-17 18:07 UTC
[R-es] Identificar las muestras que son iguales a la seleccionada en un loop
Buenos tardes, tengo una df, datarem, resultado de un remuestreo de data, que lógicamente tiene muestras repetidas muchas veces. Para hacer un leave-one-out, cada vez que quito una muestra tengo que quitar también las que son iguales a ella. Se me ocurrió hacer lo de abajo, pero no funciona porque "duplicated" no hace lo que yo creía y no sé cómo identificar las muestras que son iguales a la seleccionada (datarem[i, ]), aunque creo que es sencillo. Lo de después de aplicar rpart tampoco está bien, porque la muestra sobre la que predigo no es la misma que había quitado. Cualquier sugerencia al respecto también me vendría bien. preds <- c(0) # creamos un vector vacío for (i in 1:nrow(data)) { index <- which(duplicated(data.rem[i, ])) training <- training [-i, ] training <- datarem[-index, ] fitrp <- rpart(loc ~ .,data=training) Pred <- predict(fitrp,data[i,], type="class") preds[i] <- as.character(Pred) } data$preds<- preds Muchas gracias, como siempre. Manuel [[alternative HTML version deleted]]
Juan Abasolo
2021-Aug-17 22:58 UTC
[R-es] Identificar las muestras que son iguales a la seleccionada en un loop
Hola, Manuel; Mi respuesta supongo que será rebuscada, porque conozco poco. datos %>% filter(variable!=i) Disculpá si desbebo fuera del recipiente. Si sirve, casualidad. Saludos Juan Hau idatzi du Manuel Mendoza (mmendoza en fulbrightmail.org) erabiltzaileak (2021 abu. 17, ar. (20:08)):> Buenos tardes, tengo una df, datarem, resultado de un remuestreo de data, > que lógicamente tiene muestras repetidas muchas veces. Para hacer un > leave-one-out, cada vez que quito una muestra tengo que quitar también las > que son iguales a ella. Se me ocurrió hacer lo de abajo, pero no funciona > porque "duplicated" no hace lo que yo creía y no sé cómo identificar las > muestras que son iguales a la seleccionada (datarem[i, ]), aunque creo que > es sencillo. > Lo de después de aplicar rpart tampoco está bien, porque la muestra sobre > la que predigo no es la misma que había quitado. Cualquier sugerencia al > respecto también me vendría bien. > > preds <- c(0) # creamos un vector vacío > > for (i in 1:nrow(data)) { > index <- which(duplicated(data.rem[i, ])) > training <- training [-i, ] > training <- datarem[-index, ] > fitrp <- rpart(loc ~ .,data=training) > Pred <- predict(fitrp,data[i,], type="class") > preds[i] <- as.character(Pred) > } > data$preds<- preds > > Muchas gracias, como siempre. > Manuel > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Juan Abasolo, PhD Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea Bilboko Hezkuntza Fakultatea Euskal Herriko Unibertsitatea UPV/EHU Sarriena auzoa z/g 48940 - Leioa (Bizkaia) T : (+34) 94 601 7567 Telegram: @JuanAbasolo Skype : abasolo72 Tutoretza ordutegia <https://labur.eus/JAbasolo-tutoretzak> [blo <https://juanabasolo.netlify.app/>][gak <http://bosgarrena.blogspot.com/>] [[alternative HTML version deleted]]