Displaying 4 results from an estimated 4 matches for "unnest_token".
Did you mean:
unnest_tokens
2020 Apr 28
3
Stopwords: Topic modelling con LDA
...hable de cosas similares.
Mi pregunta es, ¿incluiríais estas palabras que me aparecen en todos los
topics o casi todos como stopwords? ¿Hay alguna forma de refinar más el
análisis y que haya más diferencias entre topics?
Este es el código que estoy usando:
Reviews_dtm <-text_df12star %>%
unnest_tokens(word, text) %>%
anti_join(stop_words)%>%
count(Brand, word) %>%
cast_dtm(Brand, word, n)
Reviews_lda <- LDA(Reviews12_dtm, k = 15, control = list(seed = 2016))
Un saludo
Miriam
2020 Nov 04
1
Eliminar números de texto
Buenas,
Estoy analizando texto en R y no encuentro cómo eliminar los números y
símbolos del texto como ",", "%", etc.
Estoy pasando este código, text_data es donde está el texto en la variable
"text".
tidy_data <- text_data%>%
unnest_tokens(word, text)%>%
anti_join(stop_words)
¿Cómo podría añadirse a ese código?
Muchas gracias
2020 Apr 29
2
[Posible SPAM] Re: Stopwords: Topic modelling con LDA
...palabras que me aparecen en todos los
>> topics o casi todos como stopwords? Hay alguna forma de refinar más el
>> análisis y que haya más diferencias entre topics?
>>
>> Este es el código que estoy usando:
>>
>> Reviews_dtm <-text_df12star %>%
>> unnest_tokens(word, text) %>%
>> anti_join(stop_words)%>%
>> count(Brand, word) %>%
>> cast_dtm(Brand, word, n)
>>
>>
>> Reviews_lda <- LDA(Reviews12_dtm, k = 15, control = list(seed = 2016))
>>
>> Un saludo
>>
>> Miriam
>>
>...
2020 Feb 10
2
Cannot allocate a vector of size...
Muchas gracias Xabier.
He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me
dice también que "cannot allocate a vector of size 12 gb".
He hecho tdm<-as.matrix(tdm)
¿Está bien hecho eso para trabajar con la sparse matrix?
Gracias!
El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi escribió:
> La respuesta de Carlos creo que es mucho mas