Sebastian Kruk
2018-Nov-09 19:46 UTC
[R-es] Data frame: eliminar caracteres raros y convertir 2 columnas a formato numerico
Estimados usuarios de R: Muy buenas tardes. Hace días que estoy dando vueltas con un data frame de 28 observaciones con 3 variables llamado data que lo obtuve de transformar unas tablas html. La primer y segunda variable tienen 28 niveles y la tercera 25 niveles. ¿Hay alguna forma de dejarlo sin factores? Tiene tres columnas, en la primera están los productos, en la segunda la cantidad vendida y en la tercera la plata. Por medio de la siguiente sentencia elimino los Â: data <- apply(data, 2, function(y) gsub("Â*", "", y)) Tiene como problema que hace que se me convierta en una lista el data frame. En la variable ventas y plata tengo algunas celdas vacías y el separador de miles es la coma y a su vez no tengo decimales. Para resolver lo anterior aplico: data[,2:3] <- apply(data[,2:3], 2, function(y) gsub(",", "", y)) Finalmente quiero pasar a formato numérico las últimas dos columnas usando: data[,2:3] <- apply(data[,2:3], 2, as.numeric) Pero no tiene efecto. ¿Me pueden dar alguna ayuda u orientar? Gracias, Sebastián. [[alternative HTML version deleted]]