Alfredo Alvarado
2014-Aug-13 17:18 UTC
[R-es] [Antes sin asunto] espacios en celdas excel y table
Buenas tardes tengan todos. Un saludo a todo el grupo. Muchas gracias por las orientaciones Jorge y Julio.. Efectivamente, el problema era que las celdas de excel no estaban del todo homogéneas. Me toco algo de trabajo manual al respecto. Con respecto a la opción de eliminar espacios, que era uno de los problemas, y ya cuando superé el tema de las diferencias de tipeo, o de cómo plasmaron la información en excel quienes la recopilaron, es strip.white=TRUE, del comando o función table. read.table(file.choose(), header = TRUE, sep =";", strip.white = TRUE) Nuevamente agradecido por las orientaciones.>Jorge I Velez <jorgeivanvelez en gmail.com> > >11 de ago. (hace 2 días) > >Hola Alfredo, > >Algunos comentarios/observaciones: > >1. No uses attach. Mejor, explora la funcion with() y/o within(). attach es muy peligroso. >2. Solo por curiosidad, como hiciste para crear la tabla usando >latabla$ciudad de origen? Supongo que deberia ser latabla$"ciudad de origen" >3. Lo que observas, tiene que ver con que en tus datos hay espacios "escondidos". Una forma de resolver este problema (desde R) es >utilizando el paquete stringr y la funcion str_trim. Hay dos ejemplos en la ayuda; creo que el primero de ellos ilustra lo que ocurre en tu >caso. > >Saludos cordiales, >Jorge.- > >2014-08-12 8:09 GMT+10:00 Alfredo Alvarado <david.alvarado.r en gmail.com>:> > Buenas tardes grupo, un saludo. > Busco su amable ayuda en los siguiente: > Tengo una tabla con alrededor de 20 variables en columnas. > La tabla proviene de un excel convertido en csv. > Estoy tomando dos variables: la columna correspondiente a "ciudad de > origen" y "apellido" de la persona. > hago: > attach(latabla) > y luego names(latabla), y me da las variables que digo, latabla$ciudad > de origen, y latabla$apellido. > Quiero ver las dos columnas para ver de acuerdo a la ciudad de origen > las frecuencias de los apellidos registrados: > table(latabla$ciudad de origen, latabla$apellido) > > Me da, efectivamente la tabla que quiero, en las filas la ciudad de > origen, en las columnas los apellidos, y en los campos, la frecuencia > de apellidos por ciudad de origen. > Sin embargo, la pregunta que tengo es que la tabla resultante genera > una fila sin nombre, y una columna sin nombre, la primera fila y la > primera columna, y le asigna un valor de 1, como si hubiera un dato, y > al resto 0. Es decir, como si ese campo vacío con esa columna vacía > generara un valor. > He revisado la tabla, la he cambiado, pero no logrop quitarle eso. > Por otra parte, y aún más importante, algunas ciudades, no todas, (de > 58, sólo 2), las repite como nombres de filas diferentes, aunque se > trata del mismo nombre, lo coloca como si se tratara de dos distintos. > Le cambié el nombre en excel y sigue haciendo lo mismo. > No tengo idea del por qué sucede esto último. Las otras ciudades las > usa como una sola fila y coloca los valores, a excepción de esas dos > ciudades que las divide como si fueran diferentes, y las pone una > debajo de la otra, dos veces el mismo nombre. > ¿Alguna idea que puedan ofrecerme al respecto? > De antemano, gracias a todos-. > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-esJulio Di Rienzo <dirienzo.julio en gmail.com> 12 de ago. (hace 1 día) para mí Alfredo fíjate si table no tiene un argumento como na.omit y en tal caso ponerlo en TRUE Enviado desde mi iPad