search for: palabras

Displaying 20 results from an estimated 173 matches for "palabras".

2017 Aug 15
3
Contar palabras sin tener en cuenta observaciones con NA
Buenas a todos, Necesito crear una variable "Numero.palabras" que sea el número de palabras de la variable "titulo". Al crearla, cuando en la variable "titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el comando que tengo que meter para que me de e...
2017 Nov 28
5
Búsqueda de palabras en una variable de R
Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecut...
2018 May 22
4
Pasar palabras de una lista a una variable del dataframe
Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.
2020 Apr 28
3
Stopwords: Topic modelling con LDA
Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de cosméticos, por lo que la temát...
2018 Feb 15
2
Pasar una lista de palabras por una variable del dataframe
Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!
2020 Apr 29
2
[Posible SPAM] Re: Stopwords: Topic modelling con LDA
...3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen. > > Y también aplicaría tf-idf a tus comentarios. Con tf-idf seguro que > desaparecen como relevantes esas palabras comunes, será otra forma de > confirmar que es buena la decisión de hacer el análisis eliminandolas. > > Saludos, > Carlos Ortega > https://protection.puc.rediris.es/fmlurlsvc/?fewReq=:B:JVI2PTg1Nip6MT0iPCplaDE8PTY8PSp/ZWtibXh5fmkxNW1qPG49bm09PzluaDtpPzk9aG5uPj89bm0/bj06bjpvOWk7PDtua...
2018 May 23
2
Pasar palabras de una lista a una variable del dataframe
Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames) >...
2009 Mar 12
0
Listas de "stopwords" y raíces de palabras para
>Me gustaría saber si alguien conoce listas de palabras y de raíces >para ser usadas en un proyecto de minería de texto usando el paquete >tm de R. Hola Carlos, Depende de la tarea la mejora en el rendimiento mediante la eliminación de 'palabras vacias' y el uso de radicalización (stemming) o lematización. Vas a reducir el volumen del di...
2010 Jun 25
3
gsub with regular expression
If I have a text with 7 words per line and I would like to put first and second word joined in a vector and the rest of words one per column in a matrix how can I do it? First 2 lines of my text file: "2008/12/31 12:23:31 numero 343.233.233 Rodeo Vaca Ruido" "2010/02/01 02:35:31 palabra 111.111.222 abejorro Rodeo Vaca" Results: Vector: 2008/12/31 12:23:31 2010/02/01 02:35:31
2018 Feb 06
4
Optimizar código
Hola a todos, Os pongo aquí debajo un pequeño fragmento de código. Resulta que dispongo de una CADENA que tiene dos columnas. Una con palabras y la otra que dice si es bueno o malo. En otra variable tengo una LISTA. Quiero cruzar todas las palabras de la lista con todas las de la cadena y cuando alguna coincida, que me indique en qué fila está y también si la palabra es "buena" o "mala". El código que os pongo más abaj...
2013 Jan 11
5
data - R es
...de R por nosotros no es nada nueva, pero ¿como se puede hacer para extraer de nuestra lista los problemas que aparecieron y necesitaron la colaboración de todos? ¿como encontrar las preguntas por ejemplo de lme4 relacionadas a xx? ¿se puede hacer algo medio automatizado de acuerdo a la cantidad de palabras que se repiten o sus relaciones en esta lista? Se podrá documentar nuestras dudas y errores para aprender y compartir soluciones. Javier Marcuzzi
2012 Dec 13
2
Tamaño de la matriz de términos y memoria. Paquete TM
...Corpus(VectorSource(txt)) # lleva a minúsculas corpus <- tm_map(corpus, tolower) # quita espacios en blanco corpus <- tm_map(corpus, stripWhitespace) # remueve la puntuación corpus <- tm_map(corpus, removePunctuation) # carga el archivo de palabras vacías personalizada en español y lo convierte a ASCII sw <- readLines("D:/Publico/Documents/TextMinigSpanishResources/Stopwords.es.txt",encoding="UTF-8") sw = iconv(sw, to="ASCII//TRANSLIT") # remueve palabras vacías genericas...
2012 Feb 15
34
Denominación alternativa para la que quiso llamarse "Comunidad de Usuarios de R": ¿ideas?
Hola, ¿qué tal? Escribo en esta lista para recabar la ayuda de socios de la asociación y la comunidad de usuarios de R. Resulta que el nombre de la asociación que se eligió originariamente, "Comunidad de Usuarios de R", ha sido rechazada por el registro español de asociaciones a instancias del Ministerio de Sanidad, Servicios Sociales e Igualdad (¡nada menos!) por incumplir el artículo
2012 Oct 25
2
Minería de texto
Cordial Saludo Actualmente estoy realizando una función para gráficar una nube de palabras el código que tengo es el siguiente: library(twitteR)library(tm)library(wordcloud)library(RXKCD)library(RColorBrewer) tweets=searchTwitter(''@afflorezr'', n=1500) generateCorpus= function(tweets,my.stopwords=c(),min.freq){ #Install the textmining library require(tm) require(wor...
2011 Dec 11
2
Encoding y (r)Jython.-
Hola, Tengo un problemillo con el encoding de unas palabras y trabajarlas en R por medio de rJython. Os explico: cuando quiero utilizar cualquier dato que contenga acentos o eñes o cualquiera de estos caracteres que no usan los angloparlantes obtengo un error. Ejemplo, en R: > jython.call(rJython,''ascii'',''señoría'') E...
2020 Feb 10
2
Cannot allocate a vector of size...
...de memoria RAM, no del disco duro de tu ordenador. > > Entiendo que tal y como sugiere Carlos, (1) lo mejor es que antes de pasar > de sparse matrix a matriz normal, consideres en reducir la cantidad de > columnas (o filas) de tu matriz. Imagino que es una matriz con frecuencias > de palabras, a lo mejor puedes eliminar aquellas columnas que representen > términos muy poco usados. O (2) sigas usando la sparse matrix para tu > analisis. > > Espero que se entienda y te sirva de ayuda, > > Saludos, > > Xavier Tibau > > > > Missatge de l'adreça <mi...
2014 Jul 25
3
wordcloud y tabla de palabras
...en la búsqueda de una forma que me permita realizar la comparación de dos documentos pertenecientes a los años 2005 y 2013, y que pueda representar finalmente con wordcloud y con una table en la que las columnas sean los años de cada informe "2005" y "2013", y las filas sean las palabras con la frecuencia de cada una de ellas por cada informe: ---------------------------------- | | 2005 | 2013 | ---------------------------------- | terminos | | | ---------------------------------- | terminos | | | --------------------------...
2012 May 06
4
comparaciones planeadas
Hola a todos, hace poquito una persona escribía con una duda que se parece, o es, la misma que yo vengo teniendo. Se trata de hacer comparaciones planeadas. Supongamos un experimento en el que participan 4 grupos de niños 8por ejemplo de distintos coles). Estos niños leen palabras largas y cortas, frecuentes e infrecuentes. Por lo tanto el diseño es fácil, un intergrupo "niños" y dos intragrupo "frecuencia" y "longitud". La variable dependiente es el tiempo que tardan en leer las palabras "tiempo" Si hacemos el anova siguiente   anova=...
2014 Jul 28
2
wordcloud y tabla de palabras
...Los uní antes, como en el siguiente ejemplo > > http://www.webmining.cl/2014/05/text-mining-comparacion-de-2-discursos-presidenciales-del-21-de-mayo-usando-r/ > y tampoco logré aplicarle colnames, ni tener la forma de matriz que se > requiere para colocar los años en las columnas y las palabras contadas > en las filas. > Realmente he estado estudiando la herramienta R, y leído varios > artículos y revisado materiales relacionados para buscar la manera, > pero no logro dar con la manera de visualizar. > Gracias nuevamente por la atención. Y gracias por la disposición. > C...
2013 Feb 01
4
Scrapping con R
Buenas tardes a todos: No sé si alguno de vosotros sabe si con R es posible buscar una palabra en una web (por ejemplo, buscar "Alicante" en www.lasprovincias.es) y que, cada vez que lo encuentre, vaya almacenado las urls en un data.frame gracias de antemano! -- Beatriz Martínez [[alternative HTML version deleted]]