Manuel Mendoza
2021-Aug-15 04:29 UTC
[R-es] Identificar muestras iguales a una en concreto
Buenos días, tengo una df, resultado de un remuestreo de data (data.rem), que lógicamente tiene muestras repetidas muchas veces. Para hacer un leave-one-out, cada vez que quito una muestra tengo que quitar también las que son iguales. Se me ocurrió hacer lo de abajo, pero no funciona porque "duplicated" no hace lo que yo creía y no sé cómo identificar las muestras que son iguales a la seleccionada (data.rem[i, ]). Lo de después del rpart tampoco está bien, porque la muestra sobre la que predigo no es la misma que había quitado. preds <- c(0) # creamos un vector vacío for (i in 1:nrow(data)) { index <- which(duplicated(data.rem[i, ])) training <- data.rem[-index, ] training <- training [-i, ] fitrp <- rpart(loc ~ .,data=training) Pred <- predict(fitrp,data[i,], type="class") preds[i] <- as.character(Pred) } data$preds<- preds Muchas gracias, como siempre. Manuel [[alternative HTML version deleted]]