thr3ads.net - similar to: "Contar palabras sin tener en cuenta observaciones con NA"

Displaying 20 results from an estimated 1000 matches similar to: "Contar palabras sin tener en cuenta observaciones con NA"

Pasar palabras de una lista a una variable del dataframe

2018 May 22

Pasar palabras de una lista a una variable del dataframe

Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.

Búsqueda de palabras en una variable de R

2017 Nov 28

Búsqueda de palabras en una variable de R

Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? Gracias!

Pasar una lista de palabras por una variable del dataframe

2018 Feb 15

Pasar una lista de palabras por una variable del dataframe

Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!

Pasar palabras de una lista a una variable del dataframe

2018 May 23

Pasar palabras de una lista a una variable del dataframe

Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames)

Contar comas de una variable

2018 Feb 07

Contar comas de una variable

Buenas tardes, Necesito contar cuántas comas hay en cada celda. Los datos tienen esta forma: Pros Comas Opinión 1 calidad, 1 Opinión 2 calidad, diseño, color, 3 Opinión 3 precio, accesibilidad, sienta bien, luminoso, 4 La variable Pros es la que tengo y la variable Comas es la

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

2020 Apr 29

[Posible SPAM] Re: Stopwords: Topic modelling con LDA

Hola, Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o tf-idf que se considerara como umbral para establecer que una palabra es muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen.

Cannot allocate a vector of size...

2020 Feb 10

Cannot allocate a vector of size...

Muchas gracias Xabier. He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me dice también que "cannot allocate a vector of size 12 gb". He hecho tdm<-as.matrix(tdm) ¿Está bien hecho eso para trabajar con la sparse matrix? Gracias! El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi escribió: > La respuesta de Carlos creo que es mucho mas

Stopwords: Topic modelling con LDA

2020 Apr 28

Stopwords: Topic modelling con LDA

Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de

Cannot allocate a vector of size...

2020 Feb 10

Cannot allocate a vector of size...

Buenas, El archivo de R ocupa 33 megas. La matriz que quiero construir cupa 14 gb. En el disco local (C) tengo 400 gb disponibles de 670. No estoy muy puesta en trabajar con este tipo de datos. ¿Qué diferencia es trabajar con data.frame? Gracias! El Vie, 7 de Febrero de 2020, 18:07, Xavier-Andoni Tibau Alberdi escribió: > Depende de la operació que quieras hacer con la matriz. Si quitas filas

Agregar variable entre dos fechas

2018 Oct 22

Agregar variable entre dos fechas

Muchas gracias por la respuesta pero me da NA. ?Qu? puede ocurrir? Un saludo El 22/10/2018 a las 20:12, Jes?s Para Fern?ndez escribi?: > Puedes hacerlo pasando tus datos a data.frame > > library(data.table) > datos <- data.table(datos) > datos[Fecha >= '2016-12-21' & Fecha <= '2016-12-28',.(rating.sem = > mean(Rating)),by=Id.producto] > > Un

Cambiar formato fecha

2018 Sep 29

Cambiar formato fecha

Holaefectivamente lubridate te podría servir library(lubridate) data$fecha_nueva<-dmy(data$ReviewData) El Viernes 28 de septiembre de 2018 16:41, Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> escribió: Estimada Miriam Le respondo corto, estoy en el celular, escriba str(los datos), su fecha puede ser en realidad texto. Hay varias formas, lubridate, pero yo aprendí

Cambiar formato fecha

2018 Oct 02

Cambiar formato fecha

Buenas Cuantas filas tienes?? Yo creo que el problema es la no homogeneidad de las fechas. Has probado a separar las q estan en um formato y en otro, reconvertirlas con lubridate y volver a juntarlas?? Si tienes una fecha q es 04/05/17 es que el el 4 de mayo o el 5 de abril?? Un saludo Jes?s Obtener Outlook para Android<https://aka.ms/ghei36> ________________________________ From:

Warning en modelo ZINB

2018 Apr 09

Warning en modelo ZINB

Hola de nuevo Carlos, he probado a quitar esa variable categórica y me sigue dando el aviso... El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió: > Si, creo que el motivo del warning puede ser ese. Es hipotético, pero > plausible. Sobre todo cuando tienes más de un 90% de ceros. > > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs > binomial >

Filtrar datos con una excepción

2017 Oct 23

Filtrar datos con una excepción

Buenas, En un conjunto de datos, llamado Datos, necesito quedarme con todas la observaciones del conjunto excepto con las observaciones que cumplan dos requisitos a la vez. Necesitaría tener todos los datos excepto cuando se de simultáneamente que: Datos$evolucionsi=0 y Datos$evolucionno=0. ¿Cómo lo filtaría? Muchas gracias

Crear columna en data frame agregando otra y fusionando

2018 Sep 12

Crear columna en data frame agregando otra y fusionando

No es lo que busco..La idea es crear una variable nueva, por ejemplo "Nueva", que sea la media de "Wordcount" agregada por "Product.Id". Pero quiero que esta variable se a?ada a mi base de datos fusionandose directamente por "Product.Id". Al hacerlo me da este error: Reviews.211216$Adjetives.Product<- aggregate(adj.x ~ Product.Id,

Cambiar formato fecha

2018 Oct 03

Cambiar formato fecha

Estimada Miriam Alzate Puede enviar un archivo con todas las fechas, y a partir de este probamos crear un data.frame a partir de sus datos. Con solo la columna de fecha alcanzaría. Javier Rubén Marcuzzi El mar., 2 oct. 2018 a las 11:26, <miriam.alzate en unavarra.es> escribió: > Es el 4 de mayo. Tengo 65000 filas... Los formatos son o bien: 04/05/2017 > o 4/05/17. Entonces las que

Cambiar formato fecha

2018 Oct 01

Cambiar formato fecha

Hola Miriam, ¿Has probado en cualquier caso?. "lubridate" es capaz de gestionar estas diferencias. Usa la función "dmy()", que entenderá esas pequeñas diferencias con respecto al día. Puede gestionar incluso diferencias mucho mayores... Saludos, Carlos Ortega www.qualityexcellence.es El lun., 1 oct. 2018 a las 19:05, Miriam Alzate (<miriam.alzate en unavarra.es>)

Warning en modelo ZINB

2018 Apr 09

Warning en modelo ZINB

¿Quieres decir que para un nivel de una variable categorica todas las observaciones de la variable respuesta sean ceros? Gracias El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió: > ¿Podría ser que para algún nivel de alguna variable independiente > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese > tipo de warning. > > El lun., 9 abr. 2018 a

Error al fusionar tablas

2017 Jan 16

Error al fusionar tablas

Buenas tardes, Estoy tratando de fusionar dos data.frames pero no obtengo lo deseado. Un data.frame (Df1)tiene 53.657 observaciones (y 8 variables) que pertenecen una a cada individuo de la muestra. El otro (Df2) tiene 63.987 observaciones (y 17 variables), de los 53.657 individuos previos porque algun individuo tiene varias observaciones. Ambos solo coinciden por la variable

Crear columna en data frame agregando otra y fusionando

2018 Sep 12

Crear columna en data frame agregando otra y fusionando

Buenas, Necesito crear una variable que viene de agregar otra por la media. El dataframe tiene 65000 obsrvaciones.Tengo estas variables Product.Id (145 diferentes) Word.Count Review.number Necesito agregar la variable Word.Count por Product.Id. Al agregarlo, tengo un data.frame de 2 variables y 145 observaciones pero en vez de tener que fusionar después por Product.Id los dos dataframe me

similar to: Contar palabras sin tener en cuenta observaciones con NA