Estimado Rubén
No importa, el código es algo más largo pero no tanto, sería algo como :
Si existe lo siguiente
Borrar esto
So no existe
No borrar nada
Para mi gusto no iría por expresiones regulares, por si las dudas en algún caso
borro de más, hay que saber dominarlas, pero también son una alternativa.
Aunque si yo quiero, para el webscraping, puedo crear código para enloquecer a
cualquier análisis, por lo cuál, es posible que lo que usted analiza tenga algo
para ?complicarle la vida?.
Javier Marcuzzi
> El 9 jul 2025, a las 6:01?p. m., Ruben Tobalina Ramirez <lagrimaescrita
en gmail.com> escribió:
>
> Buenas noches Javier,
>
> Gracias por la respuesta, yo también lo había pensado. Creo que no me vale
porque el span dentro del h2 no se repite en todos los casos.
>
> Rubén.
>
> El dc., 9 de jul. 2025, 22:55, Javier Marcuzzi <javier.ruben.marcuzzi en
gmail.com <mailto:javier.ruben.marcuzzi en gmail.com>> va escriure:
>> Buenas tardes Rubén
>>
>> Lo que usted desea no se puede, pero hay una solución. Primero, si
selecciona el h2 lo que está dentro de esta etiqueta se selecciona. Segundo, lo
que está mal es la selección, sin embargo, puede solucionar esta buscando y
borrando el código <span clas?. , supuestamente este se podría repetir en
todos los datos, por lo cuál el localizarlo y eliminarlo sería una solución.
>>
>> Por lo cuál al restallado de rvest tendría que procesarlo con otro
script en R que limpie el código repetido en todos los registros.
>>
>> ¿Esa solución le es útil?
>>
>> Javier Marcuzzi
>>
>> > El 9 jul 2025, a las 8:39?a. m., Ruben Tobalina Ramirez
<lagrimaescrita en gmail.com <mailto:lagrimaescrita en gmail.com>>
escribió:
>> >
>> > Hola, buenas tardes,
>> >
>> > Estoy usando *rvest* para hacer webscraping y me surge una duda
con el
>> > siguiente codigo:
>> >
>> > *x <- '<h2>Alerta Cobra <span
class="title">(Alarm für Cobra 11 - Die
>> > Autobahnpolizei)</span>\n</h2>'*
>> > *x %>% read_html() %>% html_nodes(xpath = "//h2")*
>> >
>> > Me gustaria quedarme con lo que contiene el tag *h2*, pero
quitando *span*.
>> > En este ejemplo seria solo *Alerta Cobra. *He probado usando los
>> > típicos operadores como *!* o *:not(span)*, pero no ha resultado
bien.
>> >
>> > Una orientación de como hacerlo me vendría bien, muchas gracias de
antemano.
>> >
>> > --
>> > Rubén.
>> >
>> > [[alternative HTML version deleted]]
>> >
>> > _______________________________________________
>> > R-help-es mailing list
>> > R-help-es en r-project.org <mailto:R-help-es en
r-project.org>
>> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
[[alternative HTML version deleted]]