Manuel Mendoza
2021-Aug-15 04:29 UTC
[R-es] Identificar muestras iguales a una en concreto
Buenos días, tengo una df, resultado de un remuestreo de data (data.rem),
que lógicamente tiene muestras repetidas muchas veces. Para hacer un
leave-one-out, cada vez que quito una muestra tengo que quitar también las
que son iguales. Se me ocurrió hacer lo de abajo, pero no funciona porque
"duplicated" no hace lo que yo creía y no sé cómo identificar las
muestras
que son iguales a la seleccionada (data.rem[i, ]).
Lo de después del rpart tampoco está bien, porque la muestra sobre la que
predigo no es la misma que había quitado.
preds <- c(0) # creamos un vector vacío
for (i in 1:nrow(data)) {
index <- which(duplicated(data.rem[i, ]))
training <- data.rem[-index, ]
training <- training [-i, ]
fitrp <- rpart(loc ~ .,data=training)
Pred <- predict(fitrp,data[i,], type="class")
preds[i] <- as.character(Pred)
}
data$preds<- preds
Muchas gracias, como siempre.
Manuel
[[alternative HTML version deleted]]