Hola Mauricio. He trabajado en proyectos de calidad de datos, y lo primero y esencial es realizar un "profile" de la información. esto consiste es breves estadísticas descriptivas tanto en variables cualitativas y cuantitativas. Una vez que tengas claras las características de la forma como te envían la información, puedes configurar las funciones de R para que las cargue correctamente. Recomiendo usar la función data.table::fread, esta realiza muestreos en la información e infiere los posibles tipos de datos, separadores, etc. Una vez cargada la información en R puedes usar muchas mas funciones para revisar los datos. El tema de los factores a mi modo de ver, se debe tratar en las instancias finales al preparar la información para el modelamiento. Los factores son una especie de recodificación de los datos donde asigna un índice a un valor ... por ejemplo se tiene los valores en una variable: casa, auto, moto, bicicleta... si es tipo caracter se almacenan en memoria los caracteres... si es factor, hace la conversión internamente asignando por ejemplo: casa=1, auto=2, moto=3, bicicleta=4 ... de tal forma que en memoria se guardan los indices ... esto hace que la base tenga menos tamaño ... ya que guarda números en lugar de textos y otras cosas mas ... lo que al parecer te pasa a ti ... es que al hacerlo factor a un numero ... lo que te va a mostar es el indice ... mas no el valor del numero. si tienes 10, 5, 32, 49 ... el factor hará: 10=1, 5=2, 32=3, 49=4, lo cual lleva a confusión... Saludos. [[alternative HTML version deleted]]