Hola Jorge:
Puedes limpiar con la función: vec <- gsub("\u0093", " ",
vec) o vec <-
gsub("\u0093", "", vec), siendo vec tu vector de textos o
palabras. Yo
limpio texto con esa función, es bastante útil. También puedes limpiar
números, puntuación y espacios en blanco con el paquete "tm", para
tratamiento de texto es bastante completo.
Un saludo,
Milagros Camacho Bellido
El 17/03/2016 a las 4:00, Jorge I Velez escribió:> Buenas noches a todos,
>
> Estoy trabajando con textos y me gustaría realizar algunos cambios dentro
> de las palabras.
>
> Cómo puedo elimiar "\u" y los números en
"\u0093\u0085anunció", de tal
> forma que el resultado sea "anunció"? En total tengo un poco
menos
> de 50,000 palabras, así que a continuación proporciono un ejemplo:
>
> # palabras
> words <- c("además", "\u0093\u0085anunció",
"acerca", "cierto", "el",
> "en", "es", "exagera", "frente",
"hizo")
> words
>
> Muchas gracias por la ayuda.
>
> Saludos,
> Jorge Velez.-
>
>
> # session
> R version 3.2.3 (2015-12-10)
> Platform: x86_64-apple-darwin14.5.0 (64-bit)
> Running under: OS X 10.11.2 (El Capitan)
>
> locale:
> [1] en_AU.UTF-8/en_AU.UTF-8/en_AU.UTF-8/C/en_AU.UTF-8/en_AU.UTF-8
>
> attached base packages:
> [1] stats graphics grDevices utils datasets parallel compiler
> [8] methods base
>
> other attached packages:
> [1] sentiment_1.0 plyr_1.8.3 rjson_0.2.15
> [4] RCurl_1.95-4.8 bitops_1.0-6 igraph_1.0.1
> [7] stringr_1.0.0 tm_0.6-2 NLP_0.1-9
> [10] wordcloud_2.5 RColorBrewer_1.1-2 readxl_0.1.0
>
> loaded via a namespace (and not attached):
> [1] Rcpp_0.12.3 slam_0.1-32 magrittr_1.5 stringi_1.0-1 tools_3.2.3
>
> [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
---
El software de antivirus Avast ha analizado este correo electrónico en busca de
virus.
https://www.avast.com/antivirus