similar to: Contar palabras sin tener en cuenta observaciones con NA

Displaying 20 results from an estimated 1000 matches similar to: "Contar palabras sin tener en cuenta observaciones con NA"

2018 May 22
4
Pasar palabras de una lista a una variable del dataframe
Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.
2017 Nov 28
5
Búsqueda de palabras en una variable de R
Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? Gracias!
2018 Feb 15
2
Pasar una lista de palabras por una variable del dataframe
Hola, Tengo un grupo de 600 palabras que he recogido en una lista en R llamada "Atributos". Necesito saber cuántas veces cualquiera de esas palabras aparece en cada observación de la variable "Opinion" del dataframe "Datos", esta es una variable de texto. ¿Qué paquete se usaría? Gracias!
2018 May 23
2
Pasar palabras de una lista a una variable del dataframe
Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió: > Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames)
2018 Feb 07
4
Contar comas de una variable
Buenas tardes, Necesito contar cuántas comas hay en cada celda. Los datos tienen esta forma: Pros Comas Opinión 1 calidad, 1 Opinión 2 calidad, diseño, color, 3 Opinión 3 precio, accesibilidad, sienta bien, luminoso, 4 La variable Pros es la que tengo y la variable Comas es la
2020 Apr 29
2
[Posible SPAM] Re: Stopwords: Topic modelling con LDA
Hola, Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o tf-idf que se considerara como umbral para establecer que una palabra es muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los de tf-idf ente 0 y 0.07. Un saludo El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió: > Hola, > Yo de primeras los quitaría para qué otros topics aparecen.
2020 Feb 10
2
Cannot allocate a vector of size...
Muchas gracias Xabier. He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me dice también que "cannot allocate a vector of size 12 gb". He hecho tdm<-as.matrix(tdm) ¿Está bien hecho eso para trabajar con la sparse matrix? Gracias! El Lun, 10 de Febrero de 2020, 16:15, Xavier-Andoni Tibau Alberdi escribió: > La respuesta de Carlos creo que es mucho mas
2020 Apr 28
3
Stopwords: Topic modelling con LDA
Buenos días, Estoy realizando un análisis de topic models con el método LDA. En principio, he quitado del análisis las palabras "stopwords" universales. A la hora de ver los topics y sus palabras más frecuentes encuentro que son muy similares y hay palabras que aparecen en todos los topics. Los textos que estoy analizando son opiniones de consumidores sobre una categoría concreta de
2020 Feb 10
2
Cannot allocate a vector of size...
Buenas, El archivo de R ocupa 33 megas. La matriz que quiero construir cupa 14 gb. En el disco local (C) tengo 400 gb disponibles de 670. No estoy muy puesta en trabajar con este tipo de datos. ¿Qué diferencia es trabajar con data.frame? Gracias! El Vie, 7 de Febrero de 2020, 18:07, Xavier-Andoni Tibau Alberdi escribió: > Depende de la operació que quieras hacer con la matriz. Si quitas filas
2018 Oct 22
3
Agregar variable entre dos fechas
Muchas gracias por la respuesta pero me da NA. ?Qu? puede ocurrir? Un saludo El 22/10/2018 a las 20:12, Jes?s Para Fern?ndez escribi?: > Puedes hacerlo pasando tus datos a data.frame > > library(data.table) > datos <- data.table(datos) > datos[Fecha >= '2016-12-21' & Fecha <= '2016-12-28',.(rating.sem = > mean(Rating)),by=Id.producto] > > Un
2018 Sep 29
4
Cambiar formato fecha
Holaefectivamente  lubridate te podría servir library(lubridate) data$fecha_nueva<-dmy(data$ReviewData) El Viernes 28 de septiembre de 2018 16:41, Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> escribió: Estimada Miriam Le respondo corto, estoy en el celular, escriba str(los datos), su fecha puede ser en realidad texto. Hay varias formas, lubridate, pero yo aprendí
2018 Oct 02
3
Cambiar formato fecha
Buenas Cuantas filas tienes?? Yo creo que el problema es la no homogeneidad de las fechas. Has probado a separar las q estan en um formato y en otro, reconvertirlas con lubridate y volver a juntarlas?? Si tienes una fecha q es 04/05/17 es que el el 4 de mayo o el 5 de abril?? Un saludo Jes?s Obtener Outlook para Android<https://aka.ms/ghei36> ________________________________ From:
2018 Apr 09
2
Warning en modelo ZINB
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me sigue dando el aviso... El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió: > Si, creo que el motivo del warning puede ser ese. Es hipotético, pero > plausible. Sobre todo cuando tienes más de un 90% de ceros. > > El coeficiente de ese nivel para el modelo de la mixtura (ceros vs > binomial >
2017 Oct 23
5
Filtrar datos con una excepción
Buenas, En un conjunto de datos, llamado Datos, necesito quedarme con todas la observaciones del conjunto excepto con las observaciones que cumplan dos requisitos a la vez. Necesitaría tener todos los datos excepto cuando se de simultáneamente que: Datos$evolucionsi=0 y Datos$evolucionno=0. ¿Cómo lo filtaría? Muchas gracias
2018 Sep 12
2
Crear columna en data frame agregando otra y fusionando
No es lo que busco..La idea es crear una variable nueva, por ejemplo "Nueva", que sea la media de "Wordcount" agregada por "Product.Id". Pero quiero que esta variable se a?ada a mi base de datos fusionandose directamente por "Product.Id". Al hacerlo me da este error: Reviews.211216$Adjetives.Product<- aggregate(adj.x ~ Product.Id,
2018 Oct 03
2
Cambiar formato fecha
Estimada Miriam Alzate Puede enviar un archivo con todas las fechas, y a partir de este probamos crear un data.frame a partir de sus datos. Con solo la columna de fecha alcanzaría. Javier Rubén Marcuzzi El mar., 2 oct. 2018 a las 11:26, <miriam.alzate en unavarra.es> escribió: > Es el 4 de mayo. Tengo 65000 filas... Los formatos son o bien: 04/05/2017 > o 4/05/17. Entonces las que
2018 Oct 01
2
Cambiar formato fecha
Hola Miriam, ¿Has probado en cualquier caso?. "lubridate" es capaz de gestionar estas diferencias. Usa la función "dmy()", que entenderá esas pequeñas diferencias con respecto al día. Puede gestionar incluso diferencias mucho mayores... Saludos, Carlos Ortega www.qualityexcellence.es El lun., 1 oct. 2018 a las 19:05, Miriam Alzate (<miriam.alzate en unavarra.es>)
2018 Apr 09
3
Warning en modelo ZINB
¿Quieres decir que para un nivel de una variable categorica todas las observaciones de la variable respuesta sean ceros? Gracias El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió: > ¿Podría ser que para algún nivel de alguna variable independiente > categórica solo hubiese ceros? En ese caso, casi seguro, aparecería ese > tipo de warning. > > El lun., 9 abr. 2018 a
2017 Jan 16
2
Error al fusionar tablas
Buenas tardes, Estoy tratando de fusionar dos data.frames pero no obtengo lo deseado. Un data.frame (Df1)tiene 53.657 observaciones (y 8 variables) que pertenecen una a cada individuo de la muestra. El otro (Df2) tiene 63.987 observaciones (y 17 variables), de los 53.657 individuos previos porque algun individuo tiene varias observaciones. Ambos solo coinciden por la variable
2018 Sep 12
2
Crear columna en data frame agregando otra y fusionando
Buenas, Necesito crear una variable que viene de agregar otra por la media. El dataframe tiene 65000 obsrvaciones.Tengo estas variables Product.Id (145 diferentes) Word.Count Review.number Necesito agregar la variable Word.Count por Product.Id. Al agregarlo, tengo un data.frame de 2 variables y 145 observaciones pero en vez de tener que fusionar después por Product.Id los dos dataframe me