Ruben Tobalina Ramirez
2019-Nov-27 14:42 UTC
[R-es] Distinto número de elemento en dataframe usando rvest
Hola de nuevo, sigo con mis pruebas webscrapeando. Estoy cogiendo la programación de varias cadenas de la web de Movistar usando el paquete *rvest *y los voy guardando en un data frame. El problema surge cuando el numero de elementos cada cadena varia. Por ejemplo en el caso de IB3 hay menos elementos de Genero que de programas, por que supongo que un programa no tiene genero o lo que sea. ¿Hay alguna forma de poner un espacio en blanco cuando rvest no encuentre un valor y seguir teniendo el mismo numero de elemento? os pongo un ejemplo del código que estoy usando: url <- " http://www.movistarplus.es/guiamovil/IB3/2019-12-01" webpage <- read_html(url) # Nombre Cadena nombreCadena <- webpage %>% html_nodes('.info-canal .titulo') %>% html_text(trim = TRUE) # Titulo programa titulo <- webpage %>% html_nodes('#canales .container_box .program .title') %>% html_text(trim = TRUE) #genero genero <- webpage %>% html_nodes('#canales .container_box .program .genre')%>% html_text(trim = TRUE) Un abrazo! -- Rubén. [[alternative HTML version deleted]]