Miriam Alzate
2018-May-22 16:45 UTC
[R-es] Pasar palabras de una lista a una variable del dataframe
Buenas tardes, Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras aparecen en cada observación de mi variable "texto". La variable "texto" es de tipo caracter. ¿Cómo lo haríais? Muchas gracias.
Carlos Ortega
2018-May-22 18:15 UTC
[R-es] Pasar palabras de una lista a una variable del dataframe
Hola, Aquí tienes un ejemplo (reproducible)... #-----------------------> # Generar nombres de mujer > library(randNames) > val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female') > head(val_tmp)# A tibble: 6 x 25 gender email dob registered phone cell nat name.title name.first name.last location.street location.city location.state <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> 1 female angeles.? 1958-0? 2004-05-06 ? 932-2? 683-? ES ms angeles vega 3550 calle del ? lugo cataluña 2 female esther.s? 1947-0? 2004-04-16 ? 982-5? 674-? ES mrs esther santos 9690 calle de l? toledo islas baleares 3 female eva.parr? 1967-0? 2013-04-02 ? 902-3? 644-? ES miss eva parra 2484 calle de t? la palma melilla 4 female sandra.p? 1957-0? 2005-03-28 ? 919-8? 642-? ES ms sandra prieto 9084 calle de á? parla castilla y le? 5 female veronica? 1952-0? 2004-03-20 ? 959-4? 609-? ES mrs veronica moreno 9672 calle del ? elche la rioja 6 female alejandr? 1973-0? 2005-03-28 ? 907-9? 680-? ES miss alejandra saez 1507 calle de p? san sebastián castilla la m? # ... with 12 more variables: location.postcode <int>, login.username <chr>, login.password <chr>, login.salt <chr>, login.md5 <chr>, # login.sha1 <chr>, login.sha256 <chr>, id.name <chr>, id.value <chr>, picture.large <chr>, picture.medium <chr>, # picture.thumbnail <chr>> val_end <- val_tmp$name.first > > # Como ejemplo elijo los 10 primeros de esos nombres. > my_lista <- val_end[1:10] > my_lista[1] "angeles" "esther" "eva" "sandra" "veronica" "alejandra" "irene" "lidia" "vanesa" "mercedes"> > # Hago efectiva la comparación. > library(stringr) > res_coincide <- str_match_all(val_end, my_lista) > res_end <- table(unlist(res_coincide)) > res_endalejandra angeles esther eva irene lidia mercedes sandra vanesa veronica 2 3 3 1 2 1 1 3 2 1>#----------------------- Gracias, Carlos. El 22 de mayo de 2018, 18:45, Miriam Alzate <miriam.alzate en unavarra.es> escribió:> Buenas tardes, > > Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras > aparecen en cada observación de mi variable "texto". La variable "texto" es > de tipo caracter. ¿Cómo lo haríais? > > Muchas gracias. > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Jorge I Velez
2018-May-22 19:04 UTC
[R-es] Pasar palabras de una lista a una variable del dataframe
Una forma es con %in%. ?JIV El El mar, 22 de may. de 2018 a las 11:46 a. m., Miriam Alzate < miriam.alzate en unavarra.es> escribió:> Buenas tardes, > > Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras > aparecen en cada observación de mi variable "texto". La variable "texto" > es de tipo caracter. ¿Cómo lo haríais? > > Muchas gracias. > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Sent from my phone. Please excuse my brevity and misspelling. [[alternative HTML version deleted]]
Javier Marcuzzi
2018-May-22 19:41 UTC
[R-es] Pasar palabras de una lista a una variable del dataframe
Estimados Estoy de acuerdo con lo que ustedes dicen, en mi caso estoy utilizando c# por comodidad porque tengo fuentes de datos con más de un millón de palabras, lógicamente hay repetidas, pero lo que habría que tener en cuenta y sucede en mi caso particular, lo que no quiere decir que a Mirian Alzate le ocurra, son las palabras compuestas, voy a dar un ejemplo, infarto, miocardio y infarto de miocardio, en mi caso particular para el análisis infarto de miocardio es una palabra compuesta. La lista de palabras puede llegar a requerir un recorrido por cada elemento para descomponer palabras compuestas, desconozco el término en español, yo en mi algoritmo lo llamo palabra compuesta. No difiere mucho de lo expuesto, es solo un caso que me tocó. Javier Rubén Marcuzzi El mar., 22 may. 2018 a las 16:05, Jorge I Velez (<jorgeivanvelez en gmail.com>) escribió:> Una forma es con %in%. ?JIV > > El El mar, 22 de may. de 2018 a las 11:46 a. m., Miriam Alzate < > miriam.alzate en unavarra.es> escribió: > > > Buenas tardes, > > > > Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras > > aparecen en cada observación de mi variable "texto". La variable "texto" > > es de tipo caracter. ¿Cómo lo haríais? > > > > Muchas gracias. > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > -- > Sent from my phone. Please excuse my brevity and misspelling. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
miri@m@@lz@te m@ili@g off u@@v@rr@@es
2018-May-23 00:29 UTC
[R-es] Pasar palabras de una lista a una variable del dataframe
Muchas gracias Carlos, Me da error al hacerlo. Mi variable donde quiero que localice las palabras de la lista tiene más de una palabra, no se si puede ser por eso. Gracias El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió:> Hola, > > Aquí tienes un ejemplo (reproducible)... > > #----------------------- >> # Generar nombres de mujer >> library(randNames) >> val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female') >> head(val_tmp) > # A tibble: 6 x 25 > gender email dob registered phone cell nat name.title > name.first name.last location.street location.city location.state > <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> > <chr> <chr> <chr> <chr> <chr> > 1 female angeles.? 1958-0? 2004-05-06 ? 932-2? 683-? ES ms > angeles vega 3550 calle del ? lugo cataluña > 2 female esther.s? 1947-0? 2004-04-16 ? 982-5? 674-? ES mrs > esther santos 9690 calle de l? toledo islas baleares > 3 female eva.parr? 1967-0? 2013-04-02 ? 902-3? 644-? ES miss eva > parra 2484 calle de t? la palma melilla > 4 female sandra.p? 1957-0? 2005-03-28 ? 919-8? 642-? ES ms > sandra prieto 9084 calle de á? parla castilla y le? > 5 female veronica? 1952-0? 2004-03-20 ? 959-4? 609-? ES mrs > veronica moreno 9672 calle del ? elche la rioja > 6 female alejandr? 1973-0? 2005-03-28 ? 907-9? 680-? ES miss > alejandra saez 1507 calle de p? san sebastián castilla la m? > # ... with 12 more variables: location.postcode <int>, login.username > <chr>, login.password <chr>, login.salt <chr>, login.md5 <chr>, > # login.sha1 <chr>, login.sha256 <chr>, id.name <chr>, id.value <chr>, > picture.large <chr>, picture.medium <chr>, > # picture.thumbnail <chr> >> val_end <- val_tmp$name.first >> >> # Como ejemplo elijo los 10 primeros de esos nombres. >> my_lista <- val_end[1:10] >> my_lista > [1] "angeles" "esther" "eva" "sandra" "veronica" > "alejandra" "irene" "lidia" "vanesa" "mercedes" >> >> # Hago efectiva la comparación. >> library(stringr) >> res_coincide <- str_match_all(val_end, my_lista) >> res_end <- table(unlist(res_coincide)) >> res_end > > alejandra angeles esther eva irene lidia mercedes > sandra vanesa veronica > 2 3 3 1 2 1 1 > 3 2 1 >> > #----------------------- > > > Gracias, > Carlos. > > El 22 de mayo de 2018, 18:45, Miriam Alzate <miriam.alzate en unavarra.es> > escribió: > >> Buenas tardes, >> >> Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras >> aparecen en cada observación de mi variable "texto". La variable "texto" >> es >> de tipo caracter. ¿Cómo lo haríais? >> >> Muchas gracias. >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >