Hola, Tengo un problema cuando trato de leer datos que contienen caracteres en Unicode en R 2.10 (windows). La tabla que trato de leer tiene caracteres en Unicode en el nombre de las columnas ( si los tiene en el nombre de las filas no falla aunque me modifica el nombre ) La linea que utilizo es: read.table("example_unicode.txt", sep="\t", dec=".", header=T, fileEncoding = "UCS-2LE", fill=T) ID a s d 1 3 0 NA NA Warning messages: 1: In read.table("example_unicode.txt", sep = "\t", dec = ".", : invalid input found on input connection ''example_unicode.txt'' 2: In read.table("example_unicode.txt", sep = "\t", dec = ".", : incomplete final line found by readTableHeader on ''example_unicode.txt'' ¿Puede ser un bug en la función read.table? Gracias! Patricia [[alternative HTML version deleted]]
Hola, ¿qué tal? Es difícil saber cuál puede ser el problema: ignoro la configuración de tu sistema. ?read.table dice: encoding: encoding to be assumed for input strings. It is used to mark character strings as known to be in Latin-1 or UTF-8: it is not used to re-encode the input, but allows R to handle encoded strings in their native encoding (if one of those two). See ?Value?. Prueba read.table("example_unicode.txt", sep="\t", dec=".", header=T, encoding = "UTF-8", fill=T) a ver si funciona. (Nunca he sabido muy a las ciertas cómo saber cuál es el "encoding" de un fichero de texto. Lo suelo abrir con el navegador de internet y voy probando.) Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com
Hola, Podemos conocer la codificación de un fichero con el comando file en GNU/Linux. Un ejemplo: juanjo en foundation:~/ejemplo $ file db/seeds.rb db/seeds.rb: UTF-8 Unicode English text juanjo en foundation:~/ejemplo $ file db/schema.rb db/schema.rb: ASCII English text Aquí podéis ver cómo cambiar la codificación con iconv: http://mindspill.net/computing/linux-notes/determine-and-change-file-character-encoding.html Un saludo! El 21/04/10 17:24, Carlos J. Gil Bellosta escribió:> Hola, ¿qué tal? > > Es difícil saber cuál puede ser el problema: ignoro la configuración > de tu sistema. > > ?read.table dice: > > encoding: encoding to be assumed for input strings. It is used to mark > character strings as known to be in Latin-1 or UTF-8: it is > not used to re-encode the input, but allows R to handle > encoded strings in their native encoding (if one of those > two). See ?Value?. > > Prueba > > read.table("example_unicode.txt", sep="\t", dec=".", header=T, > encoding = "UTF-8", fill=T) > > a ver si funciona. > > (Nunca he sabido muy a las ciertas cómo saber cuál es el "encoding" de > un fichero de texto. Lo suelo abrir con el navegador de internet y voy > probando.) > > Un saludo, > > Carlos J. Gil Bellosta > http://www.datanalytics.com > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >
miguel.angel.rodriguez.muinos en sergas.es
2010-Jul-02 09:59 UTC
[R-es] The R Journal (Junio 2010)
Hola a tod en s. Ya está accesible el Volume 2/1, June 2010, del R Journal. Por si os interesa. http://journal.r-project.org/current.html Artículos: - IsoGene: An R Package for Analyzing Dose-response Studies in Microarray Experiments - MCMC for Generalized Linear Mixed Models with glmmBUGS - Mapping and Measuring Country Shapes - tmvtnorm: A Package for the Truncated Multivariate Normal Distribution - neuralnet: Training of neural networks - glmperm: A Permutation of Regressor Residuals Test for Inference in Generalized Linear Models - Online Reproducible Research: An Application to Multivariate Analysis of Bacterial DNA Fingerprint Data - Two-sided Exact Tests and Matching Confidence Intervals for Discrete Data Un Saludo, ==============================Miguel Ángel Rodríguez Muíños Servicio de Epidemioloxía Dirección Xeral de Saúde Pública e Planificación Consellería de Sanidade Xunta de Galicia http://www.galiciasaude.es/dxsp ============================== Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso_confidencialidad.htm XACOBEO 2010: http://www.xacobeo.org