Hola. Tengo un archivo que viene separado por "|" y a su vez con (casi) todos los campos entre comillas ("..."), incluso los valores numéricos. Adjunto algunos datos de prueba. El error que da es que no encuentra 14 elementos en las filas (son 15 variables). Probé algunas variantes y traté de orientarme por la ayuda y Stack ( http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no encontré mejor solución que: 1) Abrir el archivo con Excel. 2) Reemplazar | por ; 3) Reemplazar " por [nada]; 4) Abrirlo con: datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "", encoding = "UTF-8") y digamos que funciona, salvo que la primera variable contiene un " al inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO CRITICO", NIÑO NEONATO", "etc).- ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos entre "") o bien a levantarlo luego del replace sin esas incómodas " al inicio de la primera variable y al final de la última? Muchas gracias. Saludos! -- Mauricio ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20170118/bed41b43/attachment.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: datos.csv Type: text/csv Size: 6154 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20170118/bed41b43/attachment.bin>
Hola, Prueba con esto: fread("datos.csv", sep = "|", header = TRUE, quote="") Con el parámetro quote, ignora las comillas del principio. No elimina todas, pero te permite cargar el conjunto sin problemas. Una vez cargado, ya puedes limpiar las columnas, quitando las comillas adicionales, etc... Saludos, Carlos Ortega www.qualityexcellence.es El 19 de enero de 2017, 0:22, Mauricio Monsalvo <m.monsalvo en gmail.com> escribió:> Hola. > Tengo un archivo que viene separado por "|" y a su vez con (casi) todos > los campos entre comillas ("..."), incluso los valores numéricos. Adjunto > algunos datos de prueba. El error que da es que no encuentra 14 elementos > en las filas (son 15 variables). > Probé algunas variantes y traté de orientarme por la ayuda y Stack ( > http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no > encontré mejor solución que: > 1) Abrir el archivo con Excel. > 2) Reemplazar | por ; > 3) Reemplazar " por [nada]; > 4) Abrirlo con: > datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "", > encoding = "UTF-8") > y digamos que funciona, salvo que la primera variable contiene un " al > inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO > CRITICO", NIÑO NEONATO", "etc).- > ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos > entre "") o bien a levantarlo luego del replace sin esas incómodas " al > inicio de la primera variable y al final de la última? > Muchas gracias. > Saludos! > > -- > Mauricio > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
No le gustó: Error in fread("datos.csv", sep = "|", header = TRUE, quote = "") : unused argument (quote = "") El 18 de enero de 2017, 20:35, Carlos Ortega <cof en qualityexcellence.es> escribió:> Hola, > > Prueba con esto: > > fread("datos.csv", sep = "|", header = TRUE, quote="") > > Con el parámetro quote, ignora las comillas del principio. > No elimina todas, pero te permite cargar el conjunto sin problemas. > Una vez cargado, ya puedes limpiar las columnas, quitando las comillas > adicionales, etc... > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > El 19 de enero de 2017, 0:22, Mauricio Monsalvo <m.monsalvo en gmail.com> > escribió: > >> Hola. >> Tengo un archivo que viene separado por "|" y a su vez con (casi) todos >> los campos entre comillas ("..."), incluso los valores numéricos. Adjunto >> algunos datos de prueba. El error que da es que no encuentra 14 elementos >> en las filas (son 15 variables). >> Probé algunas variantes y traté de orientarme por la ayuda y Stack ( >> http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no >> encontré mejor solución que: >> 1) Abrir el archivo con Excel. >> 2) Reemplazar | por ; >> 3) Reemplazar " por [nada]; >> 4) Abrirlo con: >> datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "", >> encoding = "UTF-8") >> y digamos que funciona, salvo que la primera variable contiene un " al >> inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO >> CRITICO", NIÑO NEONATO", "etc).- >> ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos >> entre "") o bien a levantarlo luego del replace sin esas incómodas " al >> inicio de la primera variable y al final de la última? >> Muchas gracias. >> Saludos! >> >> -- >> Mauricio >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >-- Mauricio [[alternative HTML version deleted]]
Hola, ¿qué tal? Abre el fichero con un editor de texto decente. Excel no es un editor de texto decente. Notepad, tampoco. Elige uno y hazte amigo de él para siempre. Con su concurso, sustituye todas (¡todas sin excepción!) las comillas por nada. Luego, guarda el fichero y read.table("datos.csv", header = T, sep = "|") funciona de maravilla. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 19 de enero de 2017, 0:22, Mauricio Monsalvo <m.monsalvo en gmail.com> escribió:> Hola. > Tengo un archivo que viene separado por "|" y a su vez con (casi) todos los > campos entre comillas ("..."), incluso los valores numéricos. Adjunto > algunos datos de prueba. El error que da es que no encuentra 14 elementos en > las filas (son 15 variables). > Probé algunas variantes y traté de orientarme por la ayuda y Stack > (http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no > encontré mejor solución que: > 1) Abrir el archivo con Excel. > 2) Reemplazar | por ; > 3) Reemplazar " por [nada]; > 4) Abrirlo con: > datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "", > encoding = "UTF-8") > y digamos que funciona, salvo que la primera variable contiene un " al > inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO > CRITICO", NIÑO NEONATO", "etc).- > ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos entre > "") o bien a levantarlo luego del replace sin esas incómodas " al inicio de > la primera variable y al final de la última? > Muchas gracias. > Saludos! > > -- > Mauricio > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es
Muchas gracias por tu sugerencia, Carlos. Andamos cortos de decencia por estos pagos, pero la voy a tomar en cuenta si no logro hacer el str_replace una vez cargado el archivo con fread!! El 19 de enero de 2017, 7:31, Carlos J. Gil Bellosta <cgb en datanalytics.com> escribió:> Hola, ¿qué tal? > > Abre el fichero con un editor de texto decente. Excel no es un editor > de texto decente. Notepad, tampoco. Elige uno y hazte amigo de él para > siempre. Con su concurso, sustituye todas (¡todas sin excepción!) las > comillas por nada. > > Luego, guarda el fichero y > > read.table("datos.csv", header = T, sep = "|") > > funciona de maravilla. > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com > > > > El día 19 de enero de 2017, 0:22, Mauricio Monsalvo > <m.monsalvo en gmail.com> escribió: > > Hola. > > Tengo un archivo que viene separado por "|" y a su vez con (casi) todos > los > > campos entre comillas ("..."), incluso los valores numéricos. Adjunto > > algunos datos de prueba. El error que da es que no encuentra 14 > elementos en > > las filas (son 15 variables). > > Probé algunas variantes y traté de orientarme por la ayuda y Stack > > (http://stackoverflow.com/search?q=read.table+sep%3D%22%7C%22), pero no > > encontré mejor solución que: > > 1) Abrir el archivo con Excel. > > 2) Reemplazar | por ; > > 3) Reemplazar " por [nada]; > > 4) Abrirlo con: > > datos <- read.table("datos.csv" , header=T, sep=";", dec=".", quote = "", > > encoding = "UTF-8") > > y digamos que funciona, salvo que la primera variable contiene un " al > > inicio ("67, "67, "etc) y la última siempre termina con un " (ACCIDENTADO > > CRITICO", NIÑO NEONATO", "etc).- > > ¿Podrían ayudarme a levantarlo de una (separado por | y con los datos > entre > > "") o bien a levantarlo luego del replace sin esas incómodas " al inicio > de > > la primera variable y al final de la última? > > Muchas gracias. > > Saludos! > > > > -- > > Mauricio > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Mauricio [[alternative HTML version deleted]]
miguel.angel.rodriguez.muinos en sergas.es
2017-Jan-19 11:03 UTC
[R-es] read.table con .csv separado por "|"
Muy bueno, Carlos. Tener un "editor de texto decente" me parece BÁSICO! ...de hecho, si tienes un "editor de código de R decente" ese mismo te sirve. :-) Un saludo, -- Miguel Ángel Rodríguez Muíños Dirección Xeral de Saúde Pública Consellería de Sanidade Xunta de Galicia http://dxsp.sergas.es El 19/01/2017 a las 11:31, Carlos J. Gil Bellosta escribió:> Hola, ¿qué tal? > > Abre el fichero con un editor de texto decente. Excel no es un editor > de texto decente. Notepad, tampoco. Elige uno y hazte amigo de él para > siempre. Con su concurso, sustituye todas (¡todas sin excepción!) las > comillas por nada. > > Luego, guarda el fichero y > > read.table("datos.csv", header = T, sep = "|") > > funciona de maravilla. > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com >________________________________ Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso-confidencialidad