La ?ltima versi?n de R (4.2.0. patched), a la que estoy cogiendo una man?a nada despreciable, no me carga correctamente ficheros de texto latinos (con ?? y otros caracteres) aunque especifique el encoding ISO-8859-1. Obtengo el mismo resultado con ?readLines(fichero)? que con ?readLines(fichero, encoding = ?ISO-8859-1?)?. Por ejemplo, estas l?neas me las carga as?: [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. ACTIVOS)" [2] " MES: MAYO A\xd1O: 2022" ? cuando el contenido del fichero es ?ste: [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. ACTIVOS)" [2] " MES: MAYO A?O: 2022" En las notas oficiales de la nueva versi?n se hace referencia a que se ha cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece perfecto, pero si especificas un juego de caracteres espec?fico, R deber?a ser obediente, ?no? No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding? A ver si pod?is ayudarme, please. Gracias [[alternative HTML version deleted]]
Hola Isidro: Yo creo que puedes solucionarlo con algo así: readLines(con <- file("fichero.txt", encoding = ""), encoding="latin1") Es decir, especificando el encoding como "" en la connection e indicando el encoding del fichero en readLines. Lo cuentan en la sección "Encoding" de ?connections. Un saludo, Marcelino El 03/06/2022 a las 9:39, Isidro Hidalgo Arellano escribió:> La ?ltima versi?n de R (4.2.0. patched), a la que estoy cogiendo una man?a > nada despreciable, no me carga correctamente ficheros de texto latinos (con > ?? y otros caracteres) aunque especifique el encoding ISO-8859-1. > > Obtengo el mismo resultado con ?readLines(fichero)? que con > ?readLines(fichero, encoding = ?ISO-8859-1?)?. > > Por ejemplo, estas l?neas me las carga as?: > > > > [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. > ACTIVOS)" > > [2] " MES: MAYO A\xd1O: > 2022" > > > > ? cuando el contenido del fichero es ?ste: > > > > [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. > ACTIVOS)" > > [2] " MES: MAYO A?O: > 2022" > > > > En las notas oficiales de la nueva versi?n se hace referencia a que se ha > cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece > perfecto, pero si especificas un juego de caracteres espec?fico, R deber?a > ser obediente, ?no? > > > > No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona > perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding? > > > > A ver si pod?is ayudarme, please. Gracias > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es-- Marcelino de la Cruz Rot Depto. de Biología y Geología Física y Química Inorgánica Universidad Rey Juan Carlos Móstoles España
Estimado Isidro Hidalgo Avellano No sé que sistema operativo está utilizando, en estos momentos yo estoy en Mac m1, pero en Windows 10 intel, yo tenía problemas al mover los archivos de una carpeta a otra, y eran problemas de codificación , por ejemplo, de la carpeta prueba los movía a la carpeta final, aún estando todo R cerrado, solo el sistema, al abrir nuevamente, todo funcionaba menos la codificación. Nunca comprendí que pasaba. Javier Rubén Marcuzzi> El 3 jun. 2022, a las 04:39, Isidro Hidalgo Arellano <ihidalgo en jccm.es> escribió: > > La última versión de R (4.2.0. patched), a la que estoy cogiendo una manía > nada despreciable, no me carga correctamente ficheros de texto latinos (con > “Ñ” y otros caracteres) aunque especifique el encoding ISO-8859-1. > > Obtengo el mismo resultado con “readLines(fichero)” que con > “readLines(fichero, encoding = “ISO-8859-1”)”. > > Por ejemplo, estas líneas me las carga así > : > > > > [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. > ACTIVOS)" > > [2] " MES: MAYO A\xd1O: > 2022" > > > > > cuando el contenido del fichero es éste: > > > > [1] " ESTADISTICA MENSUAL DE EMPLEO POR MUNICIPIOS (DTES. > ACTIVOS)" > > [2] " MES: MAYO AÑO: > 2022" > > > > En las notas oficiales de la nueva versión se hace referencia a que se ha > cambiado algo para que en Windows se utilice por defecto UTF-8. Me parece > perfecto, pero si especificas un juego de caracteres específico, R debería > ser obediente, ¿no? > > > > No es un problema de RStudio, he comprobado que R 4.1.3. a pelo funciona > perfectamente, pero R 4.2.0. patched falla, no hace caso del encoding > > > > > A ver si podéis ayudarme, please. Gracias > > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es