thr3ads.net - R help es - [R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín) [Apr 2010]

If this information is useful, please help other people find it:
Share via:

Sebastian Kruk

2010-Apr-23 02:05 UTC

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Estimados:

Yo tengo un archivo de texto Unicode y no funciona read.table con
encoding Latin-1 o UTF-8 estando en un entorno Windows.

Si no es con ninguno de los anteriores, ¿como lo importo?

¿Cómo puedo saber que codificación tiene?

Gracias,

Sebastián.


El día 22 de abril de 2010 07:00,  <r-help-es-request en r-project.org>
escribió:> Envíe los mensajes para la lista R-help-es a
>        r-help-es en r-project.org
>
> Para subscribirse o anular su subscripción a través de la WEB
>        https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> O por correo electrónico, enviando un mensaje con el texto "help"
en
> el asunto (subject) o en el cuerpo a:
>        r-help-es-request en r-project.org
>
> Puede contactar con el responsable de la lista escribiendo a:
>        r-help-es-owner en r-project.org
>
> Si responde a algún contenido de este mensaje, por favor, edite la
> linea del asunto (subject) para que el texto sea mas especifico que:
> "Re: Contents of R-help-es digest...". Además, por favor, incluya
en
> la respuesta sólo aquellas partes del mensaje a las que está
> respondiendo.
>
>
> Asuntos del día:
>
>   1. Re: Votaciones concurso logotipo (Usuario R)
>   2. Re: Paquete lsmeans (Gabriela Cendoya)
>   3. Leer datos de Unicode (Usuario R)
>   4. Re: Leer datos de Unicode (Carlos J. Gil Bellosta )
>   5. Re: Leer datos de Unicode (Juan Jos?é Vidal Agust?ín)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Wed, 21 Apr 2010 12:05:39 +0200
> From: Usuario R <r.user.spain en gmail.com>
> To: r-help-es <r-help-es en r-project.org>
> Subject: Re: [R-es] Votaciones concurso logotipo
> Message-ID:
>        <y2ne013b3631004210305r4bf3a17aye5cef25551c02a72 en
mail.gmail.com>
> Content-Type: text/plain
>
> Hola a todos,
>
> Ya tenemos el resultado del concurso de los logotipos... Y el ganador
es....
> Juan José Vidal Agustín con el logotipo I
>
> Publico el resto de votaciones para que veáis el resultado:
>
> I - 43 - Juan José Vidal Agustín
> C - 41 - Rodrigo Tizón
> D - 37 - Patricia García
> F - 28 - Jose Miguel Contreras García
> E - 20 - Miguel Angel Rodriguez Muinosa
> H - 15 - Juan José Vidal Agustín
> A - 6 - Xavier de Blas
> B - 4 - Xavier de Blas
> G - 1 - Juan Jose Vidal Agustín.
>
> La mayoría de las votaciones se han hecho en privado y no en la lista por
lo
> que evidentemente el resultado sumando los puntos que se han publicado en
la
> lista no coincide con este, si alguien necesita verificar el resultado,
> podéis pedirme los emails del resto de personas que me contestaron en
> privado.
>
> Un saludo
> Patricia
>
>        [[alternative HTML version deleted]]
>
>
>
> ------------------------------
>
> Message: 2
> Date: Wed, 21 Apr 2010 11:26:25 -0300
> From: "Gabriela Cendoya" <gcendoya en balcarce.inta.gov.ar>
> To: "Julio Di Rienzo" <dirienzo.julio en gmail.com>,      
"r-help-es"
>        <r-help-es en r-project.org>
> Subject: Re: [R-es] Paquete lsmeans
> Message-ID: <1A19FA885793481B9265C3AEB315A681 en
balcarce.inta.gov.ar>
> Content-Type: text/plain; format=flowed; charset="iso-8859-1";
>        reply-type=original
>
> Hola Julio:
>               en este momento no tengo tiempo de mirar el paquete pero a
> penas pueda lo haré, porque yo también me he encontrado con la necesidad de
> hacer estimaciones a partir de modelos ajustados con lme y no me resultaron
> fáciles.
>              ¿le diste una leída a los mensajes de la lista [R-sig-ME]?
> uno de los últimos que leí  donde discutían este tema fue " lme and
> prediction intervals", también en esa seguidilla de e-mails
 recomiendan
> leer "Exegeses on Linear Models" de Bill Venables no esta
publicado pero se
> encuentra fácil en Internet.
>         Ojala algún día pueda terminar de entender los problemas de
> estimación en modelos mixtos!!!
>             Gabriela
>
> ______________________________
> Lic. María Gabriela Cendoya
> Magíster en Biometría
> Profesor Adjunto
> Cátedra de Estadística y Diseño
> Facultad de Ciencias Agrarias
> Universidad Nacional de Mar del Plata
> ______________________________
> ----- Original Message -----
> From: "Julio Di Rienzo" <dirienzo.julio en gmail.com>
> To: "r-help-es" <r-help-es en r-project.org>
> Sent: Tuesday, April 20, 2010 11:59 PM
> Subject: [R-es] Paquete lsmeans
>
>
> Estimados amigos
>
> Alguna vez tuve que calcular las lsmeans de una modelo ajustado con lme.
> Después de buscar infructuosamente un paquete que las calculara (convencido
> de que alguno debe haber) termine armando uno (lsmeans)  que calcula las
> medias ajustadas y sus errores estándares para distintos términos del
> modelo  (acepta modelos ajustados con lm, gls y lme). Permite también hacer
> comparación de medias y  obtener las combinaciones lineales necesarias para
> obtener las medias. El paquete esta en el repositorio de R-forge.
> Espero que sea útil para alguno de Uds. y cualquier sugerencia será
> bienvenida.
>
> Saludos
>
> Prof. Julio Di Rienzo
> Estadística y Biometría
> FCA- U.N. Córdoba
> IBS CC Member
> http://sites.google.com/site/juliodirienzo
> "Biometry, the active pursuit of biological
> knowledge by quantitative methods."
> (R.A. Fisher, 1948)
>
> [[alternative HTML version deleted]]
>
>
>
>
>
--------------------------------------------------------------------------------
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> ___________________________________________________________________________
>
> Aviso:
> ====>
> El contenido del presente e-mail y sus posibles adjuntos pertenecen al INTA
y pueden contener información confidencial. Si usted no es el destinatario
original de este mensaje y por este medio pudo acceder a dicha información, por
favor solicitamos contactar al remitente y eliminar el mensaje de inmediato. Se
encuentra prohibida la divulgación, copia, distribución o cualquier otro uso de
la información contenida en el presente e-mail por parte de personas distintas
al destinatario.
>
>
> This e-mail contents and its possible attachments belong to INTA and may
contain confidential information. If this message was not originally addressed
to you, but you have accessed to such information by this means, please contact
the sender and eliminate this message immediately. Circulation, copy,
distribution, or any other use of the information contained in this e-mail is
not allowed on part of those different from the addressee.
>
>
> Antes de imprimir este mensaje, asegúrese de que sea necesario. Proteger el
medio ambiente está también en su mano.
>
>
>
> ------------------------------
>
> Message: 3
> Date: Wed, 21 Apr 2010 17:06:22 +0200
> From: Usuario R <r.user.spain en gmail.com>
> To: r-help-es <r-help-es en r-project.org>
> Subject: [R-es] Leer datos de Unicode
> Message-ID:
>        <p2je013b3631004210806j79a73ba1va305db98ab4ee9f0 en
mail.gmail.com>
> Content-Type: text/plain
>
> Hola,
>
> Tengo un problema cuando trato de leer datos que contienen caracteres en
> Unicode en R 2.10 (windows). La tabla que trato de leer tiene caracteres en
> Unicode en el nombre de las columnas ( si los tiene en el nombre de las
> filas no falla aunque me modifica el nombre )
>
> La linea que utilizo es:
>
> read.table("example_unicode.txt", sep="\t",
dec=".", header=T, fileEncoding
> = "UCS-2LE", fill=T)
>
> ID a s d
> 1 3 0 NA NA
> Warning messages:
> 1: In read.table("example_unicode.txt", sep = "\t", dec
= ".", :
> invalid input found on input connection 'example_unicode.txt'
> 2: In read.table("example_unicode.txt", sep = "\t", dec
= ".", :
> incomplete final line found by readTableHeader on
'example_unicode.txt'
>
> ¿Puede ser un bug en la función read.table?
> Gracias!
>
> Patricia
>
>        [[alternative HTML version deleted]]
>
>
>
> ------------------------------
>
> Message: 4
> Date: Wed, 21 Apr 2010 17:24:27 +0200
> From: "Carlos J. Gil Bellosta " <cgb en datanalytics.com>
> To: r-help-es <r-help-es en r-project.org>
> Subject: Re: [R-es] Leer datos de Unicode
> Message-ID:
>        <i2ob028350f1004210824ifdf6a740lf3b26526265ab99c en
mail.gmail.com>
> Content-Type: text/plain; charset=windows-1252
>
> Hola, ¿qué tal?
>
> Es difícil saber cuál puede ser el problema: ignoro la configuración
> de tu sistema.
>
> ?read.table dice:
>
> encoding: encoding to be assumed for input strings.  It is used to mark
>          character strings as known to be in Latin-1 or UTF-8: it is
>          not used to re-encode the input, but allows R to handle
>          encoded strings in their native encoding (if one of those
>          two).  See ?Value?.
>
> Prueba
>
> read.table("example_unicode.txt", sep="\t",
dec=".", header=T,
> encoding = "UTF-8", fill=T)
>
> a ver si funciona.
>
> (Nunca he sabido muy a las ciertas cómo saber cuál es el
"encoding" de
> un fichero de texto. Lo suelo abrir con el navegador de internet y voy
> probando.)
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
>
> ------------------------------
>
> Message: 5
> Date: Thu, 22 Apr 2010 02:01:09 +0200
> From: Juan Jos?é Vidal Agust?ín  <juanjova en um.es>
> To: r-help-es en r-project.org
> Subject: Re: [R-es] Leer datos de Unicode
> Message-ID: <4BCF91C5.104 en um.es>
> Content-Type: text/plain; charset=UTF-8; format=flowed
>
> Hola,
>
> Podemos conocer la codificación de un fichero con el comando file en
> GNU/Linux. Un ejemplo:
>
> juanjo en foundation:~/ejemplo $ file db/seeds.rb
> db/seeds.rb: UTF-8 Unicode English text
>
> juanjo en foundation:~/ejemplo $ file db/schema.rb
> db/schema.rb: ASCII English text
>
> Aquí podéis ver cómo cambiar la codificación con iconv:
>
http://mindspill.net/computing/linux-notes/determine-and-change-file-character-encoding.html
>
>
> Un saludo!
>
>
>
> El 21/04/10 17:24, Carlos J. Gil Bellosta escribió:
>> Hola, ¿qué tal?
>>
>> Es difícil saber cuál puede ser el problema: ignoro la configuración
>> de tu sistema.
>>
>> ?read.table dice:
>>
>> encoding: encoding to be assumed for input strings.  It is used to mark
>>            character strings as known to be in Latin-1 or UTF-8: it is
>>            not used to re-encode the input, but allows R to handle
>>            encoded strings in their native encoding (if one of those
>>            two).  See ?Value?.
>>
>> Prueba
>>
>> read.table("example_unicode.txt", sep="\t",
dec=".", header=T,
>> encoding = "UTF-8", fill=T)
>>
>> a ver si funciona.
>>
>> (Nunca he sabido muy a las ciertas cómo saber cuál es el
"encoding" de
>> un fichero de texto. Lo suelo abrir con el navegador de internet y voy
>> probando.)
>>
>> Un saludo,
>>
>> Carlos J. Gil Bellosta
>> http://www.datanalytics.com
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> ------------------------------
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> Fin de Resumen de R-help-es, Vol 14, Envío 21
> *********************************************
>

Carlos J. Gil Bellosta

2010-Apr-23 09:05 UTC

head link

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Hola, ¿qué tal?

Saber qué codificación usa un fichero de texto no es un problema
trivial ni que tenga una solución única. Entre otras cosas, porque el
"encoding" no está declarado en el fichero. Y ficheros que contengan
caracteres "normales" pueden haber estado originalmente guardados en
cualquier codificación exótica.

Una manera relativamente sencilla de averiguar la codificación es
abrir el fichero con el navegador de internet. En fireffox puedes ir a

Ver > Codificación de caracteres

y después probar con los que aparecenen en la lista hasta que el
fichero se vea "correctamente".

Dependiendo de lo que averigues, igual tienes que recodificar el
fichero. Existeun programa, iconv, que no sé si está portado a
Windows. Creo que gVim, el editor de texto, permite realizar cambios
de codificación al guardar un fichero:

http://stackoverflow.com/questions/778069/how-can-i-change-a-files-encoding-with-vim

Un saludo,

Carlos J. Gil Bellosta
http://www.datanalytics.com


El día 23 de abril de 2010 04:05, Sebastian Kruk
<residuo.solow en gmail.com> escribió:> Estimados:
>
> Yo tengo un archivo de texto Unicode y no funciona read.table con
> encoding Latin-1 o UTF-8 estando en un entorno Windows.
>
> Si no es con ninguno de los anteriores, ¿como lo importo?
>
> ¿Cómo puedo saber que codificación tiene?
>
> Gracias,
>
> Sebastián.

Usuario R

2010-Apr-23 09:21 UTC

head link

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Hola

Yo acabo de probar eso con mi ficher y aparece en mi navegador correctamente
si le pongo la codifiación en UTF-16 despues trato de leerlo en R con

read.table( "x.txt" ,
sep = "\t",
dec = ".",
header = TRUE,
fileEncoding = "UTF-16"
)

Y nada, no lo lee bien, al menos en Windows voy a probar en linux ...

gracias!




El 23 de abril de 2010 11:05, Carlos J. Gil Bellosta
<gilbellosta@gmail.com>escribió:
> Hola, ¿qué tal?
>
> Saber qué codificación usa un fichero de texto no es un problema
> trivial ni que tenga una solución única. Entre otras cosas, porque el
> "encoding" no está declarado en el fichero. Y ficheros que
contengan
> caracteres "normales" pueden haber estado originalmente guardados
en
> cualquier codificación exótica.
>
> Una manera relativamente sencilla de averiguar la codificación es
> abrir el fichero con el navegador de internet. En fireffox puedes ir a
>
> Ver > Codificación de caracteres
>
> y después probar con los que aparecenen en la lista hasta que el
> fichero se vea "correctamente".
>
> Dependiendo de lo que averigues, igual tienes que recodificar el
> fichero. Existeun programa, iconv, que no sé si está portado a
> Windows. Creo que gVim, el editor de texto, permite realizar cambios
> de codificación al guardar un fichero:
>
>
>
http://stackoverflow.com/questions/778069/how-can-i-change-a-files-encoding-with-vim
>
> Un saludo,
>
> Carlos J. Gil Bellosta
> http://www.datanalytics.com
>
>
> El día 23 de abril de 2010 04:05, Sebastian Kruk
> <residuo.solow@gmail.com> escribió:
> > Estimados:
> >
> > Yo tengo un archivo de texto Unicode y no funciona read.table con
> > encoding Latin-1 o UTF-8 estando en un entorno Windows.
> >
> > Si no es con ninguno de los anteriores, ¿como lo importo?
> >
> > ¿Cómo puedo saber que codificación tiene?
> >
> > Gracias,
> >
> > Sebastián.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Patricia García González
r-es.org/

	[[alternative HTML version deleted]]

Usuario R

2010-Apr-23 09:53 UTC

head link

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Hola

En linux funciona perfectamente.

Deduzco que windows está modificando el formato del fichero y R no consigue
trabajar con eso....

saludos

Patricia


El 23 de abril de 2010 11:21, Usuario R <r.user.spain@gmail.com> escribió:
> Hola
>
> Yo acabo de probar eso con mi ficher y aparece en mi navegador
> correctamente si le pongo la codifiación en UTF-16 despues trato de leerlo
> en R con
>
> read.table( "x.txt" ,
> sep = "\t",
> dec = ".",
> header = TRUE,
> fileEncoding = "UTF-16"
> )
>
> Y nada, no lo lee bien, al menos en Windows voy a probar en linux ...
>
> gracias!
>
>
>
>
> El 23 de abril de 2010 11:05, Carlos J. Gil Bellosta <
> gilbellosta@gmail.com> escribió:
>
> Hola, ¿qué tal?
>>
>> Saber qué codificación usa un fichero de texto no es un problema
>> trivial ni que tenga una solución única. Entre otras cosas, porque el
>> "encoding" no está declarado en el fichero. Y ficheros que
contengan
>> caracteres "normales" pueden haber estado originalmente
guardados en
>> cualquier codificación exótica.
>>
>> Una manera relativamente sencilla de averiguar la codificación es
>> abrir el fichero con el navegador de internet. En fireffox puedes ir a
>>
>> Ver > Codificación de caracteres
>>
>> y después probar con los que aparecenen en la lista hasta que el
>> fichero se vea "correctamente".
>>
>> Dependiendo de lo que averigues, igual tienes que recodificar el
>> fichero. Existeun programa, iconv, que no sé si está portado a
>> Windows. Creo que gVim, el editor de texto, permite realizar cambios
>> de codificación al guardar un fichero:
>>
>>
>>
http://stackoverflow.com/questions/778069/how-can-i-change-a-files-encoding-with-vim
>>
>> Un saludo,
>>
>> Carlos J. Gil Bellosta
>> http://www.datanalytics.com
>>
>>
>> El día 23 de abril de 2010 04:05, Sebastian Kruk
>> <residuo.solow@gmail.com> escribió:
>> > Estimados:
>> >
>> > Yo tengo un archivo de texto Unicode y no funciona read.table con
>> > encoding Latin-1 o UTF-8 estando en un entorno Windows.
>> >
>> > Si no es con ninguno de los anteriores, ¿como lo importo?
>> >
>> > ¿Cómo puedo saber que codificación tiene?
>> >
>> > Gracias,
>> >
>> > Sebastián.
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Patricia García González
> r-es.org/
>


-- 
Patricia García González
r-es.org/

	[[alternative HTML version deleted]]

Seemingly Similar Threads

Search for more apparently analagous threads

R help es - Apr 2010 - 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

[R-es] 5. Re: Leer datos de Unicode (Juan JosŽé Vidal Agust’ín)

Seemingly Similar Threads