Displaying 2 results from an estimated 2 matches for "textreusetextdocu".
2024 Nov 25
1
Problemas usando paquete textreuse
Muy buenas:
He encontrado el paquete textreuse y lo quiero utilizar para comparar dos
archivos pdf.
Me ha sido imposible cargar los archivos para utilizar las funciones
TextReuseCorpus() o TextReuseTextDocument().
En la documentación del paquete los archivos los cargan desde
¿Alguien sabe cómo se hace?
He conseguido calcular la similitud de jaccard utilizando este paquete,
pero para ello he empleado el siguiente código.
library(pdftools)
library(textreuse)
text1 <- pdf_text("uno.pdf&quo...
2024 Nov 26
0
Resumen de R-help-es, Vol 187, Envío 10
...pas si sale repetida.
Javier, el paquete textreuse lo que hace es añadir metadatos de
pre-proceso a la lectura de ficheros de texto, y por tanto parte de
fichero. No lo conocía, pero leyendo
https://cran.r-project.org/web/packages/textreuse/vignettes/textreuse-introduction.html
verás que tanto TextReuseTextDocument como TextReuseTextCorpus tienen
como input rutas de sistema (a fichero -solo .txt? no sé, habría que
mirar; o a directorio, respectivamente).
En cambio el código que adjuntas lo que hace es generar dos objetos
(text1 y text2) y concatenar las palabras con paste.
Ese paquete menciona que pe...