Estimada comunidad, estoy extrayendo una linea de texto desde varios archivos (unos 200) de esta manera: dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, nrows=1) pero al tratar de leer esa linea desde el archivo numero 54 obtengo el siguiente error: Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings = character(0L)) : invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> type.convert todos los archivos fueron generados de la misma forma, exportados desde excel usando un breve script de VB par aplicaciones, pero solo algunos me dan ese error, que no se lo que significa, por lo tanto no se como repararlo. Ademas he examinado los archivos y no observo diferencias. Adjunto un archivo que se lee y uno que no se lee, en una de esas se me paso algo por no saber. Alguna idea ? Saludos y muchas gracias, Eric. -- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo. ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: d11-16.csv Type: text/csv Size: 1427 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140702/d04602b5/attachment.bin> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: d11-18.csv Type: text/csv Size: 1689 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20140702/d04602b5/attachment-0001.bin>
"Marcuzzi, Javier Rubén"
2014-Jul-02 20:08 UTC
[R-es] error al leer una linea desde un archivo de texto
Estimado Eric Una forma que a mi me ayudo mucho, era utilizar la forma de importar desde Rcmd, porque era gráfica y me escribía lo necesario. ¿Si la utiliza también da error? O en todos casos importar con R studio y ver que pasa (posibles errores). Como usted lee archivos generados por excel, posiblemente <b5>g es una etiqueta de "metadatos" que en excel se interpreta pero que por alguna razón se exporta *.csv. ¿Utiliza archivos xls generados por terceros?, porque cuándo a mi me pasan archivos en xls con datos para analizar me encuentro con "cada cosas". Javier Marcuzzi El 02/07/2014 04:32 p.m., neo escribió:> Estimada comunidad, estoy extrayendo una linea de texto desde varios > archivos (unos 200) de esta manera: > > > dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, > nrows=1) > > > pero al tratar de leer esa linea desde el archivo numero 54 obtengo el > siguiente error: > > > Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings > = character(0L)) : > invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> > type.convert > > > todos los archivos fueron generados de la misma forma, exportados desde > excel usando un breve script de VB par aplicaciones, pero solo algunos > me dan ese error, que no se lo que significa, por lo tanto no se como > repararlo. Ademas he examinado los archivos y no observo diferencias. > > Adjunto un archivo que se lee y uno que no se lee, en una de esas se me > paso algo por no saber. > > Alguna idea ? > > Saludos y muchas gracias, > > Eric. > > > > > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es[[alternative HTML version deleted]]
Carlos Ortega
2014-Jul-02 20:14 UTC
[R-es] error al leer una linea desde un archivo de texto
Hola, A mi me funciona para los dos casos que has enviado...> i <- c('d11-16.csv')> dat.i <- read.csv(i, header=FALSE, sep=",", dec=".", skip=11,+ nrows=1)> > j <- c('d11-18.csv')> dat.j <- read.csv(j, header=FALSE, sep=",", dec=".", skip=11,+ nrows=1)> dat.i V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V111 masa total en µg 30.04633 ug PEAKS MUY PEQUENOS NA NA NA NA NA NA NA> dat.j V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 1 masa total de HC en µg 104.5055 µg/ml NA NA NA NA NA NA NA NA>> version _platform x86_64-w64-mingw32 arch x86_64 os mingw32 system x86_64, mingw32 status major 3 minor 1.0 year 2014 month 04 day 10 svn rev 65387 language R version.string R version 3.1.0 (2014-04-10) nickname Spring Dance Saludos, Carlos Ortega www.qualityexcellence.es El 2 de julio de 2014, 21:32, neo <ericconchamunoz@gmail.com> escribió:> Estimada comunidad, estoy extrayendo una linea de texto desde varios > archivos (unos 200) de esta manera: > > > dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, > nrows=1) > > > pero al tratar de leer esa linea desde el archivo numero 54 obtengo el > siguiente error: > > > Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings > = character(0L)) : > invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> > type.convert > > > todos los archivos fueron generados de la misma forma, exportados desde > excel usando un breve script de VB par aplicaciones, pero solo algunos > me dan ese error, que no se lo que significa, por lo tanto no se como > repararlo. Ademas he examinado los archivos y no observo diferencias. > > Adjunto un archivo que se lee y uno que no se lee, en una de esas se me > paso algo por no saber. > > Alguna idea ? > > Saludos y muchas gracias, > > Eric. > > > > > -- > Forest Engineer > Master in Environmental and Natural Resource Economics > Ph.D. student in Sciences of Natural Resources at La Frontera University > Member in AguaDeTemu2030, citizen movement for Temuco with green city > standards for living > > Nota: Las tildes se han omitido para asegurar compatibilidad con algunos > lectores de correo. > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
A mi también me funciona para los dos casos:> dat <- read.csv("d11-16.csv", header=FALSE, sep=",", dec=".", skip=11,nrows=1)> datV1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 1 masa total en µg 30.04633 ug PEAKS MUY PEQUENOS NA NA NA NA NA NA NA> dat18 <- read.csv("d11-18.csv", header=FALSE, sep=",", dec=".", skip=11,nrows=1)> dat18V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 1 masa total de HC en µg 104.5055 µg/ml NA NA NA NA NA NA NA NA> sessionInfo()R version 3.0.2 (2013-09-25) Platform: i386-w64-mingw32/i386 (32-bit) locale: [1] LC_COLLATE=Spanish_Argentina.1252 LC_CTYPE=Spanish_Argentina.1252 LC_MONETARY=Spanish_Argentina.1252 LC_NUMERIC=C [5] LC_TIME=Spanish_Argentina.1252 attached base packages: [1] stats graphics grDevices utils datasets methods base>Daniel Merino El 2 de julio de 2014, 17:14, Carlos Ortega <cof@qualityexcellence.es> escribió:> Hola, > > A mi me funciona para los dos casos que has enviado... > > > i <- c('d11-16.csv')> dat.i <- read.csv(i, header=FALSE, sep=",", > dec=".", skip=11,+ nrows=1)> > j <- c('d11-18.csv')> dat.j > <- read.csv(j, header=FALSE, sep=",", dec=".", skip=11,+ > nrows=1)> dat.i V1 V2 V3 V4 V5 V6 V7 > V8 V9 V10 V11 > 1 masa total en µg 30.04633 ug PEAKS MUY PEQUENOS NA NA NA NA NA NA > NA> dat.j V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 > V11 > 1 masa total de HC en µg 104.5055 µg/ml NA NA NA NA NA NA NA NA > > > > > > > > > version _ > platform x86_64-w64-mingw32 > arch x86_64 > os mingw32 > system x86_64, mingw32 > status > major 3 > minor 1.0 > year 2014 > month 04 > day 10 > svn rev 65387 > language R > version.string R version 3.1.0 (2014-04-10) > nickname Spring Dance > > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > > > El 2 de julio de 2014, 21:32, neo <ericconchamunoz@gmail.com> escribió: > > > Estimada comunidad, estoy extrayendo una linea de texto desde varios > > archivos (unos 200) de esta manera: > > > > > > dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, > > nrows=1) > > > > > > pero al tratar de leer esa linea desde el archivo numero 54 obtengo el > > siguiente error: > > > > > > Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings > > = character(0L)) : > > invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> > > type.convert > > > > > > todos los archivos fueron generados de la misma forma, exportados desde > > excel usando un breve script de VB par aplicaciones, pero solo algunos > > me dan ese error, que no se lo que significa, por lo tanto no se como > > repararlo. Ademas he examinado los archivos y no observo diferencias. > > > > Adjunto un archivo que se lee y uno que no se lee, en una de esas se me > > paso algo por no saber. > > > > Alguna idea ? > > > > Saludos y muchas gracias, > > > > Eric. > > > > > > > > > > -- > > Forest Engineer > > Master in Environmental and Natural Resource Economics > > Ph.D. student in Sciences of Natural Resources at La Frontera University > > Member in AguaDeTemu2030, citizen movement for Temuco with green city > > standards for living > > > > Nota: Las tildes se han omitido para asegurar compatibilidad con algunos > > lectores de correo. > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Daniel [[alternative HTML version deleted]]
Jorge I Velez
2014-Jul-03 07:57 UTC
[R-es] error al leer una linea desde un archivo de texto
Hola Eric, Me incliniaria mas por un problema de enconding. Intenta agregando enconding = 'latin1' al final de read.csv() A lo mejor enviandonos tu sessionInfo() podriamos ayudarte un poco mas. Saludos, Jorge.- 2014-07-03 5:32 GMT+10:00 neo <ericconchamunoz@gmail.com>:> Estimada comunidad, estoy extrayendo una linea de texto desde varios > archivos (unos 200) de esta manera: > > > dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, > nrows=1) > > > pero al tratar de leer esa linea desde el archivo numero 54 obtengo el > siguiente error: > > > Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings > = character(0L)) : > invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> > type.convert > > > todos los archivos fueron generados de la misma forma, exportados desde > excel usando un breve script de VB par aplicaciones, pero solo algunos > me dan ese error, que no se lo que significa, por lo tanto no se como > repararlo. Ademas he examinado los archivos y no observo diferencias. > > Adjunto un archivo que se lee y uno que no se lee, en una de esas se me > paso algo por no saber. > > Alguna idea ? > > Saludos y muchas gracias, > > Eric. > > > > > -- > Forest Engineer > Master in Environmental and Natural Resource Economics > Ph.D. student in Sciences of Natural Resources at La Frontera University > Member in AguaDeTemu2030, citizen movement for Temuco with green city > standards for living > > Nota: Las tildes se han omitido para asegurar compatibilidad con algunos > lectores de correo. > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Hola Javier, los archivos los genero yo mismo, asi es que en principio al menos, no hay demasiadas cosas raras, son solo simples calculos de planilla electronica. Gracias por sus sugerencias. Las probare. Eric. On 02/07/14 16:08, "Marcuzzi, Javier Rubén" wrote:> Estimado Eric > > Una forma que a mi me ayudo mucho, era utilizar la forma de importar > desde Rcmd, porque era gráfica y me escribía lo necesario. > > ¿Si la utiliza también da error? > > O en todos casos importar con R studio y ver que pasa (posibles errores). > > Como usted lee archivos generados por excel, posiblemente <b5>g es una > etiqueta de "metadatos" que en excel se interpreta pero que por alguna > razón se exporta *.csv. ¿Utiliza archivos xls generados por terceros?, > porque cuándo a mi me pasan archivos en xls con datos para analizar me > encuentro con "cada cosas". > > Javier Marcuzzi > > El 02/07/2014 04:32 p.m., neo escribió: >> Estimada comunidad, estoy extrayendo una linea de texto desde varios >> archivos (unos 200) de esta manera: >> >> >> dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, >> nrows=1) >> >> >> pero al tratar de leer esa linea desde el archivo numero 54 obtengo el >> siguiente error: >> >> >> Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings >> = character(0L)) : >> invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> >> type.convert >> >> >> todos los archivos fueron generados de la misma forma, exportados desde >> excel usando un breve script de VB par aplicaciones, pero solo algunos >> me dan ese error, que no se lo que significa, por lo tanto no se como >> repararlo. Ademas he examinado los archivos y no observo diferencias. >> >> Adjunto un archivo que se lee y uno que no se lee, en una de esas se me >> paso algo por no saber. >> >> Alguna idea ? >> >> Saludos y muchas gracias, >> >> Eric. >> >> >> >> >> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es > > > [[alternative HTML version deleted]] > > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.
Francisco Viciana
2014-Jul-04 11:03 UTC
[R-es] error al leer una linea desde un archivo de texto
La de Jorge, es la respuesta correcta, aunque le sobraba una "n" al parámetro encoding = 'latin1' Los dos fichero que ajuntados por "Eric" son detectados como 'latin-1' por mi emacs, luego la manera correcta de leerlos independiente del operativo, GUI y la configuración del lenguaje de nuestro equipo es: read.csv('d11-18.csv',encoding = 'latin1') El problema proviene del la letra griega "mu" que se emprea para representar µg (microgramos ? creo recordar ... ). Los "encoding" y trabajar con mas de un sistema operativo es una fuente permanente de dolor de cabeza. Mi recomendaciones usar siempre que podáis UTF-8. Fran El 03/07/2014 9:57, Jorge I Velez escribió:> Hola Eric, > > Me incliniaria mas por un problema de enconding. Intenta agregando > enconding = 'latin1' al final de read.csv() > > A lo mejor enviandonos tu sessionInfo() podriamos ayudarte un poco mas. > > Saludos, > Jorge.- > > > 2014-07-03 5:32 GMT+10:00 neo <ericconchamunoz en gmail.com>: > >> Estimada comunidad, estoy extrayendo una linea de texto desde varios >> archivos (unos 200) de esta manera: >> >> >> dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, >> nrows=1) >> >> >> pero al tratar de leer esa linea desde el archivo numero 54 obtengo el >> siguiente error: >> >> >> Error in type.convert(data[[i]], as.is = as.is[i], dec = dec, na.strings >> = character(0L)) : >> invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> >> type.convert >> >> >> todos los archivos fueron generados de la misma forma, exportados desde >> excel usando un breve script de VB par aplicaciones, pero solo algunos >> me dan ese error, que no se lo que significa, por lo tanto no se como >> repararlo. Ademas he examinado los archivos y no observo diferencias. >> >> Adjunto un archivo que se lee y uno que no se lee, en una de esas se me >> paso algo por no saber. >> >> Alguna idea ? >> >> Saludos y muchas gracias, >> >> Eric. >> >> >> >> >> -- >> Forest Engineer >> Master in Environmental and Natural Resource Economics >> Ph.D. student in Sciences of Natural Resources at La Frontera University >> Member in AguaDeTemu2030, citizen movement for Temuco with green city >> standards for living >> >> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos >> lectores de correo. >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- +-------------------------------------------------------------- | Francisco J. Viciana Fernández | Coordinador del Registro de Población | Servicio de Estadísticas Demográficas y Sociales | Instituto de Estadística y Cartografía de Andalucía | Leonardo Da Vinci, nº 21. Isla de La Cartuja. | 41071 SEVILLA. | franciscoj.viciana en juntadeandalucia.es +--------------------------------------------------------------
Que raro, habia enviado este email, pero creo que nunca salio de mi compu ... gracias a todos por sus sugerencias ... eric. Estimados todos, gracias por las sugerencias, al final lo resolvi de un modo "carretero" como decimos aca, por el camino largo. Como no eran demasiados los archivos corte el contenido y lo pegue en un nuevo archivo y funciono. Sin embargo, sigo sin saber la causa. Mi sesion info es: R version 3.0.2 (2013-09-25) Platform: x86_64-pc-linux-gnu (64-bit) locale: [1] LC_CTYPE=en_GB.utf8 LC_NUMERIC=C [3] LC_TIME=en_GB.utf8 LC_COLLATE=en_GB.utf8 [5] LC_MONETARY=en_GB.utf8 LC_MESSAGES=en_GB.utf8 [7] LC_PAPER=en_GB.utf8 LC_NAME=en_GB.utf8 [9] LC_ADDRESS=en_GB.utf8 LC_TELEPHONE=en_GB.utf8 [11] LC_MEASUREMENT=en_GB.utf8 LC_IDENTIFICATION=en_GB.utf8 attached base packages: [1] parallel splines grid stats graphics grDevices utils [8] datasets methods base other attached packages: [1] latticeExtra_0.6-26 RColorBrewer_1.0-5 Biobase_2.22.0 [4] BiocGenerics_0.8.0 Hmisc_3.14-4 Formula_1.1-1 [7] survival_2.37-7 flowViz_1.26.16 lattice_0.20-24 [10] flowCore_1.28.24 knitr_1.6 flowPlots_1.10.0 [13] rkward_0.6.1 loaded via a namespace (and not attached): [1] cluster_1.14.4 corpcor_1.6.6 DEoptimR_1.0-1 evaluate_0.5.5 [5] feature_1.2.10 formatR_0.10 graph_1.40.1 hexbin_1.26.3 [9] IDPmisc_1.1.17 KernSmooth_2.23-10 ks_1.9.2 MASS_7.3-29 [13] misc3d_0.8-4 mvtnorm_0.9-99992 pcaPP_1.9-49 rgl_0.93.986 [17] robustbase_0.91-1 rrcov_1.3-4 stats4_3.0.2 stringr_0.6.2 [21] tools_3.0.2 On Thu 03 Jul 2014 03:57:17 CLT, Jorge I Velez wrote:> Hola Eric, > > Me incliniaria mas por un problema de enconding. Intenta agregando > enconding = 'latin1' al final de read.csv() > > A lo mejor enviandonos tu sessionInfo() podriamos ayudarte un poco mas. > > Saludos, > Jorge.- > > > 2014-07-03 5:32 GMT+10:00 neo <ericconchamunoz en gmail.com > <mailto:ericconchamunoz en gmail.com>>: > > Estimada comunidad, estoy extrayendo una linea de texto desde varios > archivos (unos 200) de esta manera: > > > dat <- read.csv(filenames[i], header=FALSE, sep=",", dec=".", skip=11, > nrows=1) > > > pero al tratar de leer esa linea desde el archivo numero 54 obtengo el > siguiente error: > > > Error in type.convert(data[[i]], as.is <http://as.is> = as.is > <http://as.is>[i], dec = dec, na.strings > = character(0L)) : > invalid multibyte string at '<b5>g' Calls: read.csv -> read.table -> > type.convert > > > todos los archivos fueron generados de la misma forma, exportados > desde > excel usando un breve script de VB par aplicaciones, pero solo algunos > me dan ese error, que no se lo que significa, por lo tanto no se como > repararlo. Ademas he examinado los archivos y no observo diferencias. > > Adjunto un archivo que se lee y uno que no se lee, en una de esas > se me > paso algo por no saber. > > Alguna idea ? > > Saludos y muchas gracias, > > Eric. > > > > > -- > Forest Engineer > Master in Environmental and Natural Resource Economics > Ph.D. student in Sciences of Natural Resources at La Frontera > University > Member in AguaDeTemu2030, citizen movement for Temuco with green city > standards for living > > Nota: Las tildes se han omitido para asegurar compatibilidad con > algunos > lectores de correo. > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org <mailto:R-help-es en r-project.org> > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.