similar to: Búsqueda de palabras en una variable de R

Displaying 20 results from an estimated 1000 matches similar to: "Búsqueda de palabras en una variable de R"

2018 May 22
4
Pasar palabras de una lista a una variable del dataframe
Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.
2018 Feb 15
2
Pasar una lista de palabras por una variable del dataframe
Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!
2017 Aug 15
3
Contar palabras sin tener en cuenta observaciones con NA
Buenas a todos, Necesito crear una variable "Numero.palabras" que sea el número de palabras de la variable "titulo". Al crearla, cuando en la variable "titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el comando que tengo que meter para que me de el resultado correcto? Muchas
2018 May 23
2
Pasar palabras de una lista a una variable del dataframe
Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames)
2020 Feb 10
2
Cannot allocate a vector of size...
Muchas gracias Xabier. He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me dice también que "cannot allocate a vector of size 12 gb". He hecho tdm<-as.matrix(tdm) ¿Está bien hecho eso para trabajar con la sparse matrix? Gracias! El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi escribió: > La respuesta de Carlos creo que es mucho mas
2020 Apr 29
2
[Posible SPAM] Re: Stopwords: Topic modelling con LDA
Hola, Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o tf-idf que se considerara como umbral para establecer que una palabra es muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen.
2020 Apr 28
3
Stopwords: Topic modelling con LDA
Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de
2020 Feb 10
2
Cannot allocate a vector of size...
Buenas, El archivo de R ocupa 33 megas. La matriz que quiero construir cupa 14 gb. En el disco local (C) tengo 400 gb disponibles de 670. No estoy muy puesta en trabajar con este tipo de datos. ¿Qué diferencia es trabajar con data.frame? Gracias! El Vie, 7 de Febrero de 2020, 18:07, Xavier-Andoni Tibau Alberdi escribió: > Depende de la operació que quieras hacer con la matriz. Si quitas filas
2018 Sep 29
4
Cambiar formato fecha
Holaefectivamente  lubridate te podría servir library(lubridate) data$fecha_nueva<-dmy(data$ReviewData) El Viernes 28 de septiembre de 2018 16:41, Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> escribió: Estimada Miriam Le respondo corto, estoy en el celular, escriba str(los datos), su fecha puede ser en realidad texto. Hay varias formas, lubridate, pero yo aprendí
2018 Oct 02
3
Cambiar formato fecha
Buenas Cuantas filas tienes?? Yo creo que el problema es la no homogeneidad de las fechas. Has probado a separar las q estan en um formato y en otro, reconvertirlas con lubridate y volver a juntarlas?? Si tienes una fecha q es 04/05/17 es que el el 4 de mayo o el 5 de abril?? Un saludo Jes?s Obtener Outlook para Android<https://aka.ms/ghei36> ________________________________ From:
2018 Oct 03
2
Cambiar formato fecha
Estimada Miriam Alzate Puede enviar un archivo con todas las fechas, y a partir de este probamos crear un data.frame a partir de sus datos. Con solo la columna de fecha alcanzaría. Javier Rubén Marcuzzi El mar., 2 oct. 2018 a las 11:26, <miriam.alzate en unavarra.es> escribió: > Es el 4 de mayo. Tengo 65000 filas... Los formatos son o bien: 04/05/2017 > o 4/05/17. Entonces las que
2018 Oct 01
2
Cambiar formato fecha
Hola Miriam, ¿Has probado en cualquier caso?. "lubridate" es capaz de gestionar estas diferencias. Usa la función "dmy()", que entenderá esas pequeñas diferencias con respecto al día. Puede gestionar incluso diferencias mucho mayores... Saludos, Carlos Ortega www.qualityexcellence.es El lun., 1 oct. 2018 a las 19:05, Miriam Alzate (<miriam.alzate en unavarra.es>)
2018 Apr 09
2
Warning en modelo ZINB
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me sigue dando el aviso... El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió: > Si, creo que el motivo del warning puede ser ese. Es hipotético, pero > plausible. Sobre todo cuando tienes más de un 90% de ceros. > > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs > binomial >
2018 Apr 09
3
Warning en modelo ZINB
¿Quieres decir que para un nivel de una variable categorica todas las observaciones de la variable respuesta sean ceros? Gracias El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió: > ¿Podría ser que para algún nivel de alguna variable independiente > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese > tipo de warning. > > El lun., 9 abr. 2018 a
2018 Mar 01
2
Agregar variable ponderando con otra
Buenas tardes, Estoy intentando conseguir la media de la variable "numerocaracteres" por "producto" de mi base de datos, datos. Lo estoy haciendo con la función aggregate de este modo: AggregatedData<- aggregate(numerocaracteres ~ producto, data=datos, FUN=mean) El problema me viene porque quiero utilizar una variable de ponderación de modo que para construir la media
2018 Sep 12
2
Crear columna en data frame agregando otra y fusionando
No es lo que busco..La idea es crear una variable nueva, por ejemplo "Nueva", que sea la media de "Wordcount" agregada por "Product.Id". Pero quiero que esta variable se a?ada a mi base de datos fusionandose directamente por "Product.Id". Al hacerlo me da este error: Reviews.211216$Adjetives.Product<- aggregate(adj.x ~ Product.Id,
2020 Feb 07
2
Cannot allocate a vector of size...
Es la primera vez que trabajo con este tipo de datos...No se si se puede dividir esa matriz. ¿Cómo lo podría hacer? Muchas gracias! El Vie, 7 de Febrero de 2020, 17:55, Xavier-Andoni Tibau Alberdi escribió: > Significa que tus datos són muy grandes y no se pueden guardar en la RAM. > Tienes alternativas para dividir la matriz? > > El vie., 7 feb. 2020 17:26, <miriam.alzate en
2017 Oct 23
5
Filtrar datos con una excepción
Buenas, En un conjunto de datos, llamado Datos, necesito quedarme con todas la observaciones del conjunto excepto con las observaciones que cumplan dos requisitos a la vez. Necesitaría tener todos los datos excepto cuando se de simultáneamente que: Datos$evolucionsi=0 y Datos$evolucionno=0. ¿Cómo lo filtaría? Muchas gracias
2017 Oct 21
2
Replacement error
Hola a todos, Necesito crear una variable que sólo coja los valores positivos de otra, y que los negativos o 0 los rellene con 0. Sin embargo, me está dando este error con el código que estoy metiendo: > Datos$variable.nueva<-Datos$variable.antigua[Datos$variable.antigua>0] Error in `$<-.data.frame`(`*tmp*`, Evolution.Bestselling.Positive, value = c(0.00572935181893588, :
2018 Oct 22
3
Agregar variable entre dos fechas
Muchas gracias por la respuesta pero me da NA. ?Qu? puede ocurrir? Un saludo El 22/10/2018 a las 20:12, Jes?s Para Fern?ndez escribi?: > Puedes hacerlo pasando tus datos a data.frame > > library(data.table) > datos <- data.table(datos) > datos[Fecha >= '2016-12-21' & Fecha <= '2016-12-28',.(rating.sem = > mean(Rating)),by=Id.producto] > > Un