"Ra�l Vaquerizo"
2016-Mar-13 18:58 UTC
[R-es] Importación de texto con caracteres especiales
Compañeros, Me plantearon una duda el otro día en el blog sobre la problemática de leer un archivo de texto con caracteres españoles tales como tildes y eñes (http://analisisydecision.es/analisis-de-textos-con-r/#comment-93993) En un principio pensé que sería un problema de diccionarios en R-Studio y que lo resolvería en 10 minutos y aquí llevo una hora y no soy capaz de que este código tan simple lea tildes: ubicacion="http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congreso.txt" texto = read.table (ubicacion,sep="\r",encoding="UTF-8",stringsAsFactors FALSE)> sessionInfo()R version 3.2.2 (2015-08-14) Platform: x86_64-apple-darwin13.4.0 (64-bit) Running under: OS X 10.10.5 (Yosemite) locale: [1] C/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8 attached base packages: [1] stats graphics grDevices utils datasets methods base other attached packages: [1] shapefiles_0.7 foreign_0.8-66 sp_1.2-1 shiny_0.13.0 loaded via a namespace (and not attached): [1] R6_2.1.1 htmltools_0.3 tools_3.2.2 Rcpp_0.12.1 grid_3.2.2 digest_0.6.8 xtable_1.8-0 [8] httpuv_1.3.3 mime_0.4 lattice_0.20-33 En mi viejo win-32 fincionaba, ahora en Linux tampoco me funciona y en mi nuevo Win-64 no sabría deciros porque mi mujer lo tiene lleno de virus. Si no es un problema de diccionario, ¿qué está pasando? Saludos. Ra?l Vaquerizo Romero www.analisisydecision.es
Hola Raúl, Utiliza como encoding "latin1"... #-----------------> ubicacion="http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congreso.txt "> texto <- read.table(ubicacion,sep="\r",encoding="latin1",stringsAsFactors = FALSE)> head(texto)V1 1 ORDEN DEL DÍA: 2 - Toma en consideración de la proposición de reforma del artículo 135 de la Constitución española, presentada por los grupos parlamentarios Socialista y Popular en el Congreso. BOCG. Congreso de los Diputados, serie B, número 329-1, de 26 de agosto de 2011. (Número de expediente 100/000001.) ... (Página2) 3 - Acuerdo de tramitación directa y en lectura única de la citada proposición de reforma constitucional, en virtud de lo dispuesto en el artículo 150 del Reglamento del Congreso de los Diputados. (Número de expediente 100/000001.) ... (Página2) 4 #-------------------- Gracias, Carlos Ortega www.qualityexcellence.es El 13 de marzo de 2016, 19:58, "Raúl Vaquerizo" < rvaquerizo en analisisydecision.es> escribió:> Compañeros, > > Me plantearon una duda el otro día en el blog sobre la problemática de > leer un archivo de texto con caracteres españoles tales como tildes y eñes > (http://analisisydecision.es/analisis-de-textos-con-r/#comment-93993) En > un principio pensé que sería un problema de diccionarios en R-Studio y que > lo resolvería en 10 minutos y aquí llevo una hora y no soy capaz de que > este código tan simple lea tildes: > > ubicacion=" > http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congreso.txt > " > texto = read.table (ubicacion,sep="\r",encoding="UTF-8",stringsAsFactors > FALSE) > > > sessionInfo() > R version 3.2.2 (2015-08-14) > Platform: x86_64-apple-darwin13.4.0 (64-bit) > Running under: OS X 10.10.5 (Yosemite) > > locale: > [1] C/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8 > > attached base packages: > [1] stats graphics grDevices utils datasets methods base > > other attached packages: > [1] shapefiles_0.7 foreign_0.8-66 sp_1.2-1 shiny_0.13.0 > > loaded via a namespace (and not attached): > [1] R6_2.1.1 htmltools_0.3 tools_3.2.2 Rcpp_0.12.1 > grid_3.2.2 digest_0.6.8 xtable_1.8-0 > [8] httpuv_1.3.3 mime_0.4 lattice_0.20-33 > > En mi viejo win-32 fincionaba, ahora en Linux tampoco me funciona y en mi > nuevo Win-64 no sabría deciros porque mi mujer lo tiene lleno de virus. Si > no es un problema de diccionario, ¿qué está pasando? Saludos. > > > Ra?l Vaquerizo Romero > www.analisisydecision.es > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Javier Marcuzzi
2016-Mar-13 21:20 UTC
[R-es] Importación de texto con caracteres especiales
Estimados Pienso que la opción de encoding tendría que funcionar, aunque se me ocurre una alternativa con expresiones regulares, tipo : http://stackoverflow.com/questions/10294284/remove-all-special-characters-from-a-string-in-r Javier Rubén Marcuzzi De: Carlos Ortega Enviado: domingo, 13 de marzo de 2016 16:17 Para: Raúl Vaquerizo CC: Lista R Asunto: Re: [R-es]Importación de texto con caracteres especiales Hola Raúl, Utiliza como encoding "latin1"... #-----------------> ubicacion="http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congreso.txt "> texto <- read.table(ubicacion,sep="\r",encoding="latin1",stringsAsFactors = FALSE)> head(texto)V1 1 ORDEN DEL DÍA: 2 - Toma en consideración de la proposición de reforma del artículo 135 de la Constitución española, presentada por los grupos parlamentarios Socialista y Popular en el Congreso. BOCG. Congreso de los Diputados, serie B, número 329-1, de 26 de agosto de 2011. (Número de expediente 100/000001.) ... (Página2) 3 - Acuerdo de tramitación directa y en lectura única de la citada proposición de reforma constitucional, en virtud de lo dispuesto en el artículo 150 del Reglamento del Congreso de los Diputados. (Número de expediente 100/000001.) ... (Página2) 4 #-------------------- Gracias, Carlos Ortega www.qualityexcellence.es El 13 de marzo de 2016, 19:58, "Raúl Vaquerizo" < rvaquerizo en analisisydecision.es> escribió:> Compañeros, > > Me plantearon una duda el otro día en el blog sobre la problemática de > leer un archivo de texto con caracteres españoles tales como tildes y eñes > (http://analisisydecision.es/analisis-de-textos-con-r/#comment-93993) En > un principio pensé que sería un problema de diccionarios en R-Studio y que > lo resolvería en 10 minutos y aquí llevo una hora y no soy capaz de que > este código tan simple lea tildes: > > ubicacion=" > http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congreso.txt > " > texto = read.table (ubicacion,sep="\r",encoding="UTF-8",stringsAsFactors > FALSE) > > > sessionInfo() > R version 3.2.2 (2015-08-14) > Platform: x86_64-apple-darwin13.4.0 (64-bit) > Running under: OS X 10.10.5 (Yosemite) > > locale: > [1] C/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8 > > attached base packages: > [1] stats graphics grDevices utils datasets methods base > > other attached packages: > [1] shapefiles_0.7 foreign_0.8-66 sp_1.2-1 shiny_0.13.0 > > loaded via a namespace (and not attached): > [1] R6_2.1.1 htmltools_0.3 tools_3.2.2 Rcpp_0.12.1 > grid_3.2.2 digest_0.6.8 xtable_1.8-0 > [8] httpuv_1.3.3 mime_0.4 lattice_0.20-33 > > En mi viejo win-32 fincionaba, ahora en Linux tampoco me funciona y en mi > nuevo Win-64 no sabría deciros porque mi mujer lo tiene lleno de virus. Si > no es un problema de diccionario, ¿qué está pasando? Saludos. > > > Ra?l Vaquerizo Romero > www.analisisydecision.es > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]
"Ra�l Vaquerizo"
2016-Mar-13 21:43 UTC
[R-es] Importación de texto con caracteres especiales
Muchas gracias Carlos, no se me había ocurrido que no se pudiera con UTF-8. A veces hay que empezar por las soluciones más simples. El Dom, 13 de Marzo de 2016, 8:16 pm, Carlos Ortega escribió:> Hola Raúl, > > > Utiliza como encoding "latin1"... > > > #----------------- > >> ubicacion=" > http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_congr > eso.txt " > >> texto <- read.table > (ubicacion,sep="\r",encoding="latin1",stringsAsFactors = FALSE) > >> head(texto) > > > > > V1 > 1 > > > > ORDEN DEL > DÍA: > 2 - Toma en consideración de la proposición de reforma del artículo 135 de > la Constitución española, presentada por los grupos parlamentarios > Socialista y Popular en el Congreso. BOCG. Congreso de los Diputados, > serie B, número 329-1, de 26 de agosto de 2011. (Número de expediente > 100/000001.) ... (Página2) > 3 - Acuerdo > de tramitación directa y en lectura única de la citada proposición de > reforma constitucional, en virtud de lo dispuesto en el artículo 150 del > Reglamento del Congreso de los Diputados. (Número de expediente > 100/000001.) ... (Página2) > 4 > #-------------------- > > > > Gracias, > Carlos Ortega > www.qualityexcellence.es > > El 13 de marzo de 2016, 19:58, "Raúl Vaquerizo" < > rvaquerizo en analisisydecision.es> escribió: > >> Compañeros, >> >> >> Me plantearon una duda el otro día en el blog sobre la problemática de >> leer un archivo de texto con caracteres españoles tales como tildes y >> eñes >> (http://analisisydecision.es/analisis-de-textos-con-r/#comment-93993) >> En >> un principio pensé que sería un problema de diccionarios en R-Studio y >> que lo resolvería en 10 minutos y aquí llevo una hora y no soy capaz de >> que este código tan simple lea tildes: >> >> ubicacion=" >> http://analisisydecision.es/wp-content/uploads/2011/09/intervencion_con >> greso.txt " >> texto = read.table (ubicacion,sep="\r",encoding="UTF-8",stringsAsFactors >> >> FALSE) >> >> >>> sessionInfo() >> R version 3.2.2 (2015-08-14) >> Platform: x86_64-apple-darwin13.4.0 (64-bit) >> Running under: OS X 10.10.5 (Yosemite) >> >> >> locale: >> [1] C/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8 >> >> >> attached base packages: [1] stats graphics grDevices utils >> datasets methods base >> >> other attached packages: [1] shapefiles_0.7 foreign_0.8-66 sp_1.2-1 >> shiny_0.13.0 >> >> loaded via a namespace (and not attached): [1] R6_2.1.1 >> htmltools_0.3 tools_3.2.2 Rcpp_0.12.1 grid_3.2.2 digest_0.6.8 >> xtable_1.8-0 [8] httpuv_1.3.3 mime_0.4 lattice_0.20-33 >> >> >> En mi viejo win-32 fincionaba, ahora en Linux tampoco me funciona y en >> mi nuevo Win-64 no sabría deciros porque mi mujer lo tiene lleno de >> virus. Si no es un problema de diccionario, ¿qué está pasando? Saludos. >> >> >> Ra?l Vaquerizo Romero >> www.analisisydecision.es >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >Ra?l Vaquerizo Romero www.analisisydecision.es