Probé en su momento con "openxlsx" y su nueva versión "openxlsx2" que reescribieron el paquete.. pero la SheetReader seguía siendo el más rápido con diferencia... El lun, 10 mar 2025 a las 12:16, Isidro Hidalgo Arellano (<ihidalgo en jccm.es>) escribió:> Lo probaré, Carlos. > > Gracias > > P.D.: haré una comparativa en un trío de ficheros que tengo y os cuento. > > > > Isidro Hidalgo Arellano > > Oficina del Dato > > Junta de Comunidades de Castilla ? La Mancha > > > > *De:* Carlos Ortega <cof en qualityexcellence.es> > *Enviado el:* lunes, 10 de marzo de 2025 11:53 > *Para:* Isidro Hidalgo Arellano <ihidalgo en jccm.es> > *CC:* r-help-es en r-project.org > *Asunto:* Re: [R-es] Excel > > > > Hola, > > > > Prueba "SheetReader"... el más rápido de todos los que he probado... está > hecho en C++. > > https://cran.r-project.org/web/packages/SheetReader/index.html > > > > Gracias, > > Carlos Ortega > > > http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es > > > > El lun, 10 mar 2025 a las 11:22, Isidro Hidalgo Arellano via R-help-es (< > r-help-es en r-project.org>) escribió: > > ¿Qué paquete es más rápido para leer muchos ficheros Excel que suponen > conjuntamente millones de registros? > Que no use Java, por favor. Estoy usando "readxl", precisamente porque no > tiene Java, pero es leeeeento. > Muchas gracias > > Isidro Hidalgo Arellano > Oficina del Dato > Junta de Comunidades de Castilla - La Mancha > > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > -- > > Saludos, > Carlos Ortega > > http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Estimados Para escribir un archivo xlsx, posiblemente, y no lo he probado personalmente, una opción es c++ y R tiene formas simples de utilizar código c++, al respecto hay una alternativa que podría ser útil y es https://www.libxl.com/examples.html También está la versión de la propia Microsoft, habría que probar porque si son muchos, lo que anda fácil con copos puede fallar. Javier Marcuzzi> El 10 mar 2025, a las 8:49?a. m., Carlos Ortega <cof en qualityexcellence.es> escribió: > > Probé en su momento con "openxlsx" y su nueva versión "openxlsx2" que > reescribieron el paquete.. pero la SheetReader seguía siendo el más rápido > con diferencia... > > El lun, 10 mar 2025 a las 12:16, Isidro Hidalgo Arellano (<ihidalgo en jccm.es <mailto:ihidalgo en jccm.es>>) > escribió: > >> Lo probaré, Carlos. >> >> Gracias >> >> P.D.: haré una comparativa en un trío de ficheros que tengo y os cuento. >> >> >> >> Isidro Hidalgo Arellano >> >> Oficina del Dato >> >> Junta de Comunidades de Castilla ? La Mancha >> >> >> >> *De:* Carlos Ortega <cof en qualityexcellence.es> >> *Enviado el:* lunes, 10 de marzo de 2025 11:53 >> *Para:* Isidro Hidalgo Arellano <ihidalgo en jccm.es> >> *CC:* r-help-es en r-project.org >> *Asunto:* Re: [R-es] Excel >> >> >> >> Hola, >> >> >> >> Prueba "SheetReader"... el más rápido de todos los que he probado... está >> hecho en C++. >> >> https://cran.r-project.org/web/packages/SheetReader/index.html >> >> >> >> Gracias, >> >> Carlos Ortega >> >> >> http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es >> >> >> >> El lun, 10 mar 2025 a las 11:22, Isidro Hidalgo Arellano via R-help-es (< >> r-help-es en r-project.org <mailto:r-help-es en r-project.org>>) escribió: >> >> ¿Qué paquete es más rápido para leer muchos ficheros Excel que suponen >> conjuntamente millones de registros? >> Que no use Java, por favor. Estoy usando "readxl", precisamente porque no >> tiene Java, pero es leeeeento. >> Muchas gracias >> >> Isidro Hidalgo Arellano >> Oficina del Dato >> Junta de Comunidades de Castilla - La Mancha >> >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org <mailto:R-help-es en r-project.org> >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> >> >> -- >> >> Saludos, >> Carlos Ortega >> >> http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es >> > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es <http://www.qualityexcellence.es/> > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org <mailto:R-help-es en r-project.org> > https://stat.ethz.ch/mailman/listinfo/r-help-es[[alternative HTML version deleted]]
Buenas tardes:
Por si a alguien le resulta de utilidad, ya he podido sacar tiempo para hacer
pruebas con 3 ficheros Excel, de?
* 99,9 MB y 2 hojas
* 245 MB y 2 hojas
* 738 MB y 3 hojas
Los tiempos de lectura de la carga de las 7 hojas en los 3 ficheros para cada
paquete han sido (en un portátil bastante modesto):
* SheetReader: inestable, he intentado varias veces la carga y RStudio me ha
sacado la típica bombita de crash. Pero me ha parecido más rápido que el resto
(vista la carga de las primeras hojas, antes de petar)
* readxl: 38 minutos
* openxlsx: 20 minutos
* openxlsx2: inestable, también ha salido la bombita.
No he especificado formato de columnas, porque me interesaba leer ?a lo bruto?,
sin conocimiento previo del fichero.
Lo que tengo claro es que usaré SheetReader y si peta, openxlsx.
Gracias por los consejos y saludos,
Isidro Hidalgo Arellano
Oficina del Dato
Junta de Comunidades de Castilla ? La Mancha
De: Carlos Ortega <cof en qualityexcellence.es>
Enviado el: lunes, 10 de marzo de 2025 12:49
Para: Isidro Hidalgo Arellano <ihidalgo en jccm.es>
CC: r-help-es en r-project.org
Asunto: Re: [R-es] Excel
Probé en su momento con "openxlsx" y su nueva versión
"openxlsx2" que reescribieron el paquete.. pero la SheetReader seguía
siendo el más rápido con diferencia...
El lun, 10 mar 2025 a las 12:16, Isidro Hidalgo Arellano (<ihidalgo en
jccm.es<mailto:ihidalgo en jccm.es>>) escribió:
Lo probaré, Carlos.
Gracias
P.D.: haré una comparativa en un trío de ficheros que tengo y os cuento.
Isidro Hidalgo Arellano
Oficina del Dato
Junta de Comunidades de Castilla ? La Mancha
De: Carlos Ortega <cof en qualityexcellence.es<mailto:cof en
qualityexcellence.es>>
Enviado el: lunes, 10 de marzo de 2025 11:53
Para: Isidro Hidalgo Arellano <ihidalgo en jccm.es<mailto:ihidalgo en
jccm.es>>
CC: r-help-es en r-project.org<mailto:r-help-es en r-project.org>
Asunto: Re: [R-es] Excel
Hola,
Prueba "SheetReader"... el más rápido de todos los que he probado...
está hecho en C++.
https://cran.r-project.org/web/packages/SheetReader/index.html
Gracias,
Carlos Ortega
http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es
El lun, 10 mar 2025 a las 11:22, Isidro Hidalgo Arellano via R-help-es
(<r-help-es en r-project.org<mailto:r-help-es en r-project.org>>)
escribió:
¿Qué paquete es más rápido para leer muchos ficheros Excel que suponen
conjuntamente millones de registros?
Que no use Java, por favor. Estoy usando "readxl", precisamente porque
no tiene Java, pero es leeeeento.
Muchas gracias
Isidro Hidalgo Arellano
Oficina del Dato
Junta de Comunidades de Castilla - La Mancha
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Saludos,
Carlos Ortega
http://secure-web.cisco.com/1WtqfMrbdCZ06l7QITkV2xTYN-BC14GNFo4kSbLdNmK-fKYBsnCfF4XDwVNWgv0JyyiSU0gBz1Cb4wLEFVrsvXx_fWaKxYvoRAx4xsS0Hbxl0AI5uWAKcV1LcwsuM_7lEAKnCk8RJnSzk_P0UUBo-2q3pCPoLHlz2aiN8v1TZIC-uRekGscj_XgjTqOjcmKb6nLwn2CN-PsSfPnOr6TC3IET1Hc4ynMfzK-fnA8BN7vyEVKctnMye4cbYVjCtelWFeN4S-Zeo8Va-FdkCfLj0vA/http%3A%2F%2Fwww.qualityexcellence.es
--
Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>
[[alternative HTML version deleted]]