thr3ads.net - similar to: "Búsqueda de palabras en una variable de R"

Displaying 20 results from an estimated 1000 matches similar to: "Búsqueda de palabras en una variable de R"

Pasar palabras de una lista a una variable del dataframe

2018 May 22

Pasar palabras de una lista a una variable del dataframe

Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.

Pasar una lista de palabras por una variable del dataframe

2018 Feb 15

Pasar una lista de palabras por una variable del dataframe

Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!

Contar palabras sin tener en cuenta observaciones con NA

2017 Aug 15

Contar palabras sin tener en cuenta observaciones con NA

Buenas a todos, Necesito crear una variable "Numero.palabras" que sea el número de palabras de la variable "titulo". Al crearla, cuando en la variable "titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el comando que tengo que meter para que me de el resultado correcto? Muchas

Pasar palabras de una lista a una variable del dataframe

2018 May 23

Pasar palabras de una lista a una variable del dataframe

Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames)

Cannot allocate a vector of size...

2020 Feb 10

Cannot allocate a vector of size...

Muchas gracias Xabier. He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me dice también que "cannot allocate a vector of size 12 gb". He hecho tdm<-as.matrix(tdm) ¿Está bien hecho eso para trabajar con la sparse matrix? Gracias! El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi escribió: > La respuesta de Carlos creo que es mucho mas

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

2020 Apr 29

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

Hola, Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o tf-idf que se considerara como umbral para establecer que una palabra es muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen.

Stopwords: Topic modelling con LDA

2020 Apr 28

Stopwords: Topic modelling con LDA

Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de

Cannot allocate a vector of size...

2020 Feb 10

Cannot allocate a vector of size...

Buenas, El archivo de R ocupa 33 megas. La matriz que quiero construir cupa 14 gb. En el disco local (C) tengo 400 gb disponibles de 670. No estoy muy puesta en trabajar con este tipo de datos. ¿Qué diferencia es trabajar con data.frame? Gracias! El Vie, 7 de Febrero de 2020, 18:07, Xavier-Andoni Tibau Alberdi escribió: > Depende de la operació que quieras hacer con la matriz. Si quitas filas

Cambiar formato fecha

2018 Sep 29

Cambiar formato fecha

Holaefectivamente lubridate te podría servir library(lubridate) data$fecha_nueva<-dmy(data$ReviewData) El Viernes 28 de septiembre de 2018 16:41, Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> escribió: Estimada Miriam Le respondo corto, estoy en el celular, escriba str(los datos), su fecha puede ser en realidad texto. Hay varias formas, lubridate, pero yo aprendí

Cambiar formato fecha

2018 Oct 02

Cambiar formato fecha

Buenas Cuantas filas tienes?? Yo creo que el problema es la no homogeneidad de las fechas. Has probado a separar las q estan en um formato y en otro, reconvertirlas con lubridate y volver a juntarlas?? Si tienes una fecha q es 04/05/17 es que el el 4 de mayo o el 5 de abril?? Un saludo Jes?s Obtener Outlook para Android<https://aka.ms/ghei36> ________________________________ From:

Cambiar formato fecha

2018 Oct 03

Cambiar formato fecha

Estimada Miriam Alzate Puede enviar un archivo con todas las fechas, y a partir de este probamos crear un data.frame a partir de sus datos. Con solo la columna de fecha alcanzaría. Javier Rubén Marcuzzi El mar., 2 oct. 2018 a las 11:26, <miriam.alzate en unavarra.es> escribió: > Es el 4 de mayo. Tengo 65000 filas... Los formatos son o bien: 04/05/2017 > o 4/05/17. Entonces las que

Cambiar formato fecha

2018 Oct 01

Cambiar formato fecha

Hola Miriam, ¿Has probado en cualquier caso?. "lubridate" es capaz de gestionar estas diferencias. Usa la función "dmy()", que entenderá esas pequeñas diferencias con respecto al día. Puede gestionar incluso diferencias mucho mayores... Saludos, Carlos Ortega www.qualityexcellence.es El lun., 1 oct. 2018 a las 19:05, Miriam Alzate (<miriam.alzate en unavarra.es>)

Warning en modelo ZINB

2018 Apr 09

Warning en modelo ZINB

Hola de nuevo Carlos, he probado a quitar esa variable categórica y me sigue dando el aviso... El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió: > Si, creo que el motivo del warning puede ser ese. Es hipotético, pero > plausible. Sobre todo cuando tienes más de un 90% de ceros. > > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs > binomial >

Warning en modelo ZINB

2018 Apr 09

Warning en modelo ZINB

¿Quieres decir que para un nivel de una variable categorica todas las observaciones de la variable respuesta sean ceros? Gracias El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió: > ¿Podría ser que para algún nivel de alguna variable independiente > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese > tipo de warning. > > El lun., 9 abr. 2018 a

Agregar variable ponderando con otra

2018 Mar 01

Agregar variable ponderando con otra

Buenas tardes, Estoy intentando conseguir la media de la variable "numerocaracteres" por "producto" de mi base de datos, datos. Lo estoy haciendo con la función aggregate de este modo: AggregatedData<- aggregate(numerocaracteres ~ producto, data=datos, FUN=mean) El problema me viene porque quiero utilizar una variable de ponderación de modo que para construir la media

Crear columna en data frame agregando otra y fusionando

2018 Sep 12

Crear columna en data frame agregando otra y fusionando

No es lo que busco..La idea es crear una variable nueva, por ejemplo "Nueva", que sea la media de "Wordcount" agregada por "Product.Id". Pero quiero que esta variable se a?ada a mi base de datos fusionandose directamente por "Product.Id". Al hacerlo me da este error: Reviews.211216$Adjetives.Product<- aggregate(adj.x ~ Product.Id,

Cannot allocate a vector of size...

2020 Feb 07

Cannot allocate a vector of size...

Es la primera vez que trabajo con este tipo de datos...No se si se puede dividir esa matriz. ¿Cómo lo podría hacer? Muchas gracias! El Vie, 7 de Febrero de 2020, 17:55, Xavier-Andoni Tibau Alberdi escribió: > Significa que tus datos són muy grandes y no se pueden guardar en la RAM. > Tienes alternativas para dividir la matriz? > > El vie., 7 feb. 2020 17:26, <miriam.alzate en

Filtrar datos con una excepción

2017 Oct 23

Filtrar datos con una excepción

Buenas, En un conjunto de datos, llamado Datos, necesito quedarme con todas la observaciones del conjunto excepto con las observaciones que cumplan dos requisitos a la vez. Necesitaría tener todos los datos excepto cuando se de simultáneamente que: Datos$evolucionsi=0 y Datos$evolucionno=0. ¿Cómo lo filtaría? Muchas gracias

Replacement error

2017 Oct 21

Replacement error

Hola a todos, Necesito crear una variable que sólo coja los valores positivos de otra, y que los negativos o 0 los rellene con 0. Sin embargo, me está dando este error con el código que estoy metiendo: > Datos$variable.nueva<-Datos$variable.antigua[Datos$variable.antigua>0] Error in `$<-.data.frame`(`*tmp*`, Evolution.Bestselling.Positive, value = c(0.00572935181893588, :

Agregar variable entre dos fechas

2018 Oct 22

Agregar variable entre dos fechas

Muchas gracias por la respuesta pero me da NA. ?Qu? puede ocurrir? Un saludo El 22/10/2018 a las 20:12, Jes?s Para Fern?ndez escribi?: > Puedes hacerlo pasando tus datos a data.frame > > library(data.table) > datos <- data.table(datos) > datos[Fecha >= '2016-12-21' & Fecha <= '2016-12-28',.(rating.sem = > mean(Rating)),by=Id.producto] > > Un

similar to: Búsqueda de palabras en una variable de R