thr3ads.net - search: "palabras"

Displaying 20 results from an estimated 184 matches for "palabras".

Contar palabras sin tener en cuenta observaciones con NA

2017 Aug 15

Contar palabras sin tener en cuenta observaciones con NA

Buenas a todos, Necesito crear una variable "Numero.palabras" que sea el número de palabras de la variable "titulo". Al crearla, cuando en la variable "titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el comando que tengo que meter para que me de e...

Búsqueda de palabras en una variable de R

2017 Nov 28

Búsqueda de palabras en una variable de R

Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecut...

Pasar palabras de una lista a una variable del dataframe

2018 May 22

Pasar palabras de una lista a una variable del dataframe

Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.

Stopwords: Topic modelling con LDA

2020 Apr 28

Stopwords: Topic modelling con LDA

Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de cosméticos, por lo que la temát...

Pasar una lista de palabras por una variable del dataframe

2018 Feb 15

Pasar una lista de palabras por una variable del dataframe

Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

2020 Apr 29

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

...3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen. > > Y también aplicaría tf-idf a tus comentarios. Con tf-idf seguro que > desaparecen como relevantes esas palabras comunes, será otra forma de > confirmar que es buena la decisión de hacer el análisis eliminandolas. > > Saludos, > Carlos Ortega > https://protection.puc.rediris.es/fmlurlsvc/?fewReq=:B:JVI2PTg1Nip6MT0iPCplaDE8PTY8PSp/ZWtibXh5fmkxNW1qPG49bm09PzluaDtpPzk9aG5uPj89bm0/bj06bjpvOWk7PDtua...

Pasar palabras de una lista a una variable del dataframe

2018 May 23

Pasar palabras de una lista a una variable del dataframe

Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames) >...

Listas de "stopwords" y raíces de palabras para

2009 Mar 12

Listas de "stopwords" y raíces de palabras para

>Me gustaría saber si alguien conoce listas de palabras y de raíces >para ser usadas en un proyecto de minería de texto usando el paquete >tm de R. Hola Carlos, Depende de la tarea la mejora en el rendimiento mediante la eliminación de 'palabras vacias' y el uso de radicalización (stemming) o lematización. Vas a reducir el volumen del di...

gsub with regular expression

2010 Jun 25

gsub with regular expression

If I have a text with 7 words per line and I would like to put first and second word joined in a vector and the rest of words one per column in a matrix how can I do it? First 2 lines of my text file: "2008/12/31 12:23:31 numero 343.233.233 Rodeo Vaca Ruido" "2010/02/01 02:35:31 palabra 111.111.222 abejorro Rodeo Vaca" Results: Vector: 2008/12/31 12:23:31 2010/02/01 02:35:31

Optimizar código

2018 Feb 06

Optimizar código

Hola a todos, Os pongo aquí debajo un pequeño fragmento de código. Resulta que dispongo de una CADENA que tiene dos columnas. Una con palabras y la otra que dice si es bueno o malo. En otra variable tengo una LISTA. Quiero cruzar todas las palabras de la lista con todas las de la cadena y cuando alguna coincida, que me indique en qué fila está y también si la palabra es "buena" o "mala". El código que os pongo más abaj...

data - R es

2013 Jan 11

data - R es

...de R por nosotros no es nada nueva, pero ¿como se puede hacer para extraer de nuestra lista los problemas que aparecieron y necesitaron la colaboración de todos? ¿como encontrar las preguntas por ejemplo de lme4 relacionadas a xx? ¿se puede hacer algo medio automatizado de acuerdo a la cantidad de palabras que se repiten o sus relaciones en esta lista? Se podrá documentar nuestras dudas y errores para aprender y compartir soluciones. Javier Marcuzzi

Tamaño de la matriz de términos y memoria. Paquete TM

2012 Dec 13

Tamaño de la matriz de términos y memoria. Paquete TM

...Corpus(VectorSource(txt)) # lleva a minúsculas corpus <- tm_map(corpus, tolower) # quita espacios en blanco corpus <- tm_map(corpus, stripWhitespace) # remueve la puntuación corpus <- tm_map(corpus, removePunctuation) # carga el archivo de palabras vacías personalizada en español y lo convierte a ASCII sw <- readLines("D:/Publico/Documents/TextMinigSpanishResources/Stopwords.es.txt",encoding="UTF-8") sw = iconv(sw, to="ASCII//TRANSLIT") # remueve palabras vacías genericas...

Denominación alternativa para la que quiso llamarse "Comunidad de Usuarios de R": ¿ideas?

2012 Feb 15

Denominación alternativa para la que quiso llamarse "Comunidad de Usuarios de R": ¿ideas?

Hola, ¿qué tal? Escribo en esta lista para recabar la ayuda de socios de la asociación y la comunidad de usuarios de R. Resulta que el nombre de la asociación que se eligió originariamente, "Comunidad de Usuarios de R", ha sido rechazada por el registro español de asociaciones a instancias del Ministerio de Sanidad, Servicios Sociales e Igualdad (¡nada menos!) por incumplir el artículo

Minería de texto

2012 Oct 25

Minería de texto

Cordial Saludo Actualmente estoy realizando una función para gráficar una nube de palabras el código que tengo es el siguiente: library(twitteR)library(tm)library(wordcloud)library(RXKCD)library(RColorBrewer) tweets=searchTwitter(''@afflorezr'', n=1500) generateCorpus= function(tweets,my.stopwords=c(),min.freq){ #Install the textmining library require(tm) require(wor...

Encoding y (r)Jython.-

2011 Dec 11

Encoding y (r)Jython.-

Hola, Tengo un problemillo con el encoding de unas palabras y trabajarlas en R por medio de rJython. Os explico: cuando quiero utilizar cualquier dato que contenga acentos o eñes o cualquiera de estos caracteres que no usan los angloparlantes obtengo un error. Ejemplo, en R: > jython.call(rJython,''ascii'',''señoría'') E...

Cannot allocate a vector of size...

2020 Feb 10

Cannot allocate a vector of size...

...de memoria RAM, no del disco duro de tu ordenador. > > Entiendo que tal y como sugiere Carlos, (1) lo mejor es que antes de pasar > de sparse matrix a matriz normal, consideres en reducir la cantidad de > columnas (o filas) de tu matriz. Imagino que es una matriz con frecuencias > de palabras, a lo mejor puedes eliminar aquellas columnas que representen > términos muy poco usados. O (2) sigas usando la sparse matrix para tu > analisis. > > Espero que se entienda y te sirva de ayuda, > > Saludos, > > Xavier Tibau > > > > Missatge de l'adreça <mi...

wordcloud y tabla de palabras

2014 Jul 25

wordcloud y tabla de palabras

...en la búsqueda de una forma que me permita realizar la comparación de dos documentos pertenecientes a los años 2005 y 2013, y que pueda representar finalmente con wordcloud y con una table en la que las columnas sean los años de cada informe "2005" y "2013", y las filas sean las palabras con la frecuencia de cada una de ellas por cada informe: ---------------------------------- | | 2005 | 2013 | ---------------------------------- | terminos | | | ---------------------------------- | terminos | | | --------------------------...

comparaciones planeadas

2012 May 06

comparaciones planeadas

Hola a todos, hace poquito una persona escribía con una duda que se parece, o es, la misma que yo vengo teniendo. Se trata de hacer comparaciones planeadas. Supongamos un experimento en el que participan 4 grupos de niños 8por ejemplo de distintos coles). Estos niños leen palabras largas y cortas, frecuentes e infrecuentes. Por lo tanto el diseño es fácil, un intergrupo "niños" y dos intragrupo "frecuencia" y "longitud". La variable dependiente es el tiempo que tardan en leer las palabras "tiempo" Si hacemos el anova siguiente anova=...

wordcloud y tabla de palabras

2014 Jul 28

wordcloud y tabla de palabras

...Los uní antes, como en el siguiente ejemplo > > http://www.webmining.cl/2014/05/text-mining-comparacion-de-2-discursos-presidenciales-del-21-de-mayo-usando-r/ > y tampoco logré aplicarle colnames, ni tener la forma de matriz que se > requiere para colocar los años en las columnas y las palabras contadas > en las filas. > Realmente he estado estudiando la herramienta R, y leído varios > artículos y revisado materiales relacionados para buscar la manera, > pero no logro dar con la manera de visualizar. > Gracias nuevamente por la atención. Y gracias por la disposición. > C...

Scrapping con R

2013 Feb 01

Scrapping con R

Buenas tardes a todos: No sé si alguno de vosotros sabe si con R es posible buscar una palabra en una web (por ejemplo, buscar "Alicante" en www.lasprovincias.es) y que, cada vez que lo encuentre, vaya almacenado las urls en un data.frame gracias de antemano! -- Beatriz Martínez [[alternative HTML version deleted]]

search for: palabras