Displaying 4 results from an estimated 4 matches for "grama".
Did you mean:
gram
2015 Apr 10
3
Loop sobre muchos data frames
...todos!
Estoy en un proyecto de text mining y por razones de los recursos con que
cuento tuve que separar los archivos de texto de input del proyecto en
muchos archivos pequeños.
Luego de transformar cada uno de estos archivos en un corpus separado,
puedo aplicar limpieza sobre cada corpus, buscar n-gramas, construir cada
termDocumentMatrix y finalmente reunir todo en una sola TDM.
Pero estoy atorado en el paso de transformar cada uno de los archivos en
corpus mediante un loop. Es decir que en lugar de hacer esto infinitas
veces:
#Librerias necesarias
library(tm)
corpus_001<-Corpus(VectorSourc...
2015 Apr 10
5
Loop sobre muchos data frames
...mining y por razones de los recursos con que
>> cuento tuve que separar los archivos de texto de input del proyecto en
>> muchos archivos pequeños.
>> Luego de transformar cada uno de estos archivos en un corpus separado,
>> puedo aplicar limpieza sobre cada corpus, buscar n-gramas, construir cada
>> termDocumentMatrix y finalmente reunir todo en una sola TDM.
>>
>> Pero estoy atorado en el paso de transformar cada uno de los archivos en
>> corpus mediante un loop. Es decir que en lugar de hacer esto infinitas
>> veces:
>>
>> #Librer...
2015 Apr 12
2
Loop sobre muchos data frames
...>> que
>>>> cuento tuve que separar los archivos de texto de input del proyecto en
>>>> muchos archivos pequeños.
>>>> Luego de transformar cada uno de estos archivos en un corpus separado,
>>>> puedo aplicar limpieza sobre cada corpus, buscar n-gramas, construir
>>>> cada
>>>> termDocumentMatrix y finalmente reunir todo en una sola TDM.
>>>>
>>>> Pero estoy atorado en el paso de transformar cada uno de los archivos en
>>>> corpus mediante un loop. Es decir que en lugar de hacer esto in...
2024 Nov 26
0
Resumen de R-help-es, Vol 187, Envío 10
...En cambio el código que adjuntas lo que hace es generar dos objetos
(text1 y text2) y concatenar las palabras con paste.
Ese paquete menciona que permite manejar "corpora" del paquete tm. En
text mining, el proceso suele ser 1. generar un corpus 2. generar tokens
(pueden ser bi-tri-n-gramas) 3. generar matrices dfm 4. hacer cálculos
sobre ellas.
tm es quizás un poco engorroso, por lo que yo siempre recomiendo quanteda.
https://quanteda.io/articles/quickstart.html
Y en concreto para lo de medir distancias:
https://quanteda.io/reference/textstat_simil.html
Pero, oye, a lo mejor...