similar to: Listas de "stopwords" y raíces de palabras para

Displaying 20 results from an estimated 110 matches similar to: "Listas de "stopwords" y raíces de palabras para"

2015 Jul 07
3
Pasar un listado de variables como argumento de una función
Hola: Gracias de nuevo por la ayuda! La solución, como no, funciona. Pero yo quería alguna cosa más flexible y universal que le pudiera pasar como parámetro diferentes opciones de incluir i excluir variables. Si estuviera fuera de la función seria: ===================== DATOS <- data.frame(SE = c("M", "H", "M", "M", "H"),
2018 Feb 15
2
Pasar una lista de palabras por una variable del dataframe
Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!
2017 Aug 15
3
Contar palabras sin tener en cuenta observaciones con NA
Buenas a todos, Necesito crear una variable "Numero.palabras" que sea el número de palabras de la variable "titulo". Al crearla, cuando en la variable "titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el comando que tengo que meter para que me de el resultado correcto? Muchas
2007 Jan 22
1
stopwords
Hello all, Does anybody know if the word ''other'' is a special word for ferret ? I don''t manage to index it ! Johan Johan Duflost Analyst Programmer Belgian Biodiversity Platform ( http://www.biodiversity.be) Belgian Federal Science Policy Office (http://www.belspo.be ) Tel:+32 2 650 5751 Fax: +32 2 650 5124
2004 Dec 14
1
stopwords
Hi! I would like to use the lists of stopwords provided with Xapian. Are there some standard way to remove stopwords automatically, or should I implement it mysel in the indexer? Regards, Georges Dupret
2008 Mar 12
1
how can i use stopwords?
Hi, I do not understand the stopword function... I've set the termgenerator like this: $self->{'Stemmer'} = new Search::Xapian::Stem(german2); $self->{'Stopper'} = new Search::Xapian::SimpleStopper(); $self->{'TermGenerator'} = new Search::Xapian::TermGenerator; $self->{'TermGenerator'}->set_stemmer( $self->{'Stemmer'} );
2011 Oct 04
1
Reading stopwords from a csv file
I am using the tm package to do text miniing: I have a huge list of stopwords (2000+) that are in a csv file. I read it as follows: stopwordlist <- read.csv("stopwords to be Removed 10042011.csv") myStopwords <- as.character(stopwordlist$stopwords) When try removing the stopwords using tr1=tm_map(tr1,removeWords,myStopwords) I am getting the following error: Error in
2007 Nov 11
0
Stopwords in tm package
Hi to all, I need to append/delete stopwords from the list that i can use from de TM package. I use Portuguese stopwords. When i see the list of stopwords using >stopwords("portuguese") I have some words with special characters like this: "verdadeiro" "voc??" "voc??s" "vos" I try to change the portuguese.dat file from
2017 Nov 28
5
Búsqueda de palabras en una variable de R
Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? Gracias!
2009 Nov 12
2
package "tm" fails to remove "the" with remove stopwords
I am using code that previously worked to remove stopwords using package "tm". Even manually adding "the" to the list does not work to remove "the". This package has undergone extensive redevelopment with changes to the function syntax, so perhaps I am just missing something. Please see my simple example, output, and sessionInfo() below. Thanks! Mark require(tm)
2009 Mar 26
1
ideas on picking stopwords
I'm looking at adding some stopwords to my indexing procedure, and was wondering if anyone had any good rules of thumb on how to pick which words to blacklist. It all seems a little... well... vague. Although I guess it kind of depends on the sort of documents you're wanting to index. My current idea is to write a little script to output the terms with the highest frequency in my
2018 May 22
4
Pasar palabras de una lista a una variable del dataframe
Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.
2020 Apr 28
3
Stopwords: Topic modelling con LDA
Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de
2020 Apr 29
2
[Posible SPAM] Re: Stopwords: Topic modelling con LDA
Hola, Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o tf-idf que se considerara como umbral para establecer que una palabra es muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen.
2018 May 23
2
Pasar palabras de una lista a una variable del dataframe
Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames)
2003 May 20
0
De um amigo
INFORMACAO CONFIDENCIAL Prezado(a) Amigo(a): Esta carta/e-mail nada tem de semelhante As muitas "aldrabices" que circulam pela Internet. Ela ? uma mensagem rara que tem um conteUdo que pode modificar a sua vida para melhor. Assim, peco-lhe um pouco de paciencia, e que a leia com atencao, muita atencao, e no final, muito provavelmente, se sentira recompensado(a). Este e um assunto que
2003 Apr 12
0
De um amigo
INFORMACAO CONFIDENCIAL Prezado(a) Amigo(a): Esta carta/e-mail nada tem de semelhante As muitas "aldrabices" que circulam pela Internet. Ela ? uma mensagem rara que tem um conteUdo que pode modificar a sua vida para melhor. Assim, peCo-lhe um pouco de paciencia, e que a leia com atencao, muita atencao, e no final, muito provavelmente, se sentira recompensado(a). Este e
2015 Jul 06
2
Pasar un listado de variables como argumento de una función
Hola: Quiero que una función realice una serie de cálculos pero eliminando las variables que no interesan (diferentes según e fichero a analizar). Intento pasar esta lista como argumento con un c("VAR1", "VAR2", etc), pero no lo consigo. Un ejemplo seria: DATOS <- data.frame(SE=c("M", "H", "M", "M", "H"),
2014 Jul 25
3
wordcloud y tabla de palabras
Buenas noches grupo. Saludos cordiales. He seguido en la búsqueda de una forma que me permita realizar la comparación de dos documentos pertenecientes a los años 2005 y 2013, y que pueda representar finalmente con wordcloud y con una table en la que las columnas sean los años de cada informe "2005" y "2013", y las filas sean las palabras con la frecuencia de cada una de ellas
2014 Jul 28
2
wordcloud y tabla de palabras
Hola, La referencia (gracias por proporcionarla) que has incluido es bastante clara y se puede seguir. ¿Has podido sobre tus dos discursos utilizar la misma lógica? La forma de salir de dudas, para empezar, es que adjuntaras el código que estás empleando por ver si hay algún error evidente. Aunque la forma adecuada para que te podamos ayudar es con un ejemplo reproducible: código + datos.