Estimados: Estoy tratando de importar datos de un archivo de 3.156.367 registros exactamente, por unas 40 variables. La idea es empezar a implementar Data Mining con rattle, el tema es que queda freezado el rstudio al intentar leerlo. Esta instalado en: CPU: AMD x3 RAM: 4 GB HD: 250 SO: Ubuntu Raring Swap: 4 GB Por lo que leí existe un paquete RevoScaleR pero es propietario y no tengo idea (no encontré) si existe alguno equivalente. Un abrazo -- Eduardo [[alternative HTML version deleted]]
Prueba la función fread del paquete data.table. Un saludo. Olivier On 27 de mayo de 2014 19:40:21 CEST, "Eduardo Bieñkowski" <edukoski@gmail.com> wrote:>Estimados: >Estoy tratando de importar datos de un archivo de 3.156.367 registros >exactamente, por unas 40 variables. >La idea es empezar a implementar Data Mining con rattle, el tema es que >queda freezado el rstudio al intentar leerlo. > >Esta instalado en: >CPU: AMD x3 >RAM: 4 GB >HD: 250 >SO: Ubuntu Raring >Swap: 4 GB > >Por lo que le�� existe un paquete RevoScaleR pero es propietario y no >tengo >idea (no encontr��) si existe alguno equivalente. > >Un abrazo > >-- >Eduardo > > [[alternative HTML version deleted]] > > > >------------------------------------------------------------------------ > >_______________________________________________ >R-help-es mailing list >R-help-es@r-project.org >https://stat.ethz.ch/mailman/listinfo/r-help-es-- Enviado desde mi teléfono con K-9 Mail. [[alternative HTML version deleted]]
Hola, Si al final vas a usar "rattle", realmente RStudio te va a aportar poco, casi te diría que tendrás más problemas a la hora de visualizar resultados. Algunos aparecerán en la propia consola gráfica de rattle y otros en la de RStudio... Prueba directamente a arrancar "rattle" desde la consola R-GUI (no RStudio) y así liberarás una buena cantidad de RAM. Por otro lado a la hora de arrancar "rattle" antes de proceder con el análisis puedes indicar en la pantalla de importación que utilice una muestra de tu conjunto. Si es que sin RStudio tampoco es capaz de importar todo el fichero. Saludos Carlos Ortega www.qualityexcellence.es El 27 de mayo de 2014, 19:40, Eduardo Bieñkowski <edukoski@gmail.com>escribió:> Estimados: > Estoy tratando de importar datos de un archivo de 3.156.367 registros > exactamente, por unas 40 variables. > La idea es empezar a implementar Data Mining con rattle, el tema es que > queda freezado el rstudio al intentar leerlo. > > Esta instalado en: > CPU: AMD x3 > RAM: 4 GB > HD: 250 > SO: Ubuntu Raring > Swap: 4 GB > > Por lo que leí existe un paquete RevoScaleR pero es propietario y no tengo > idea (no encontré) si existe alguno equivalente. > > Un abrazo > > -- > Eduardo > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Hola, Secundo la sugerencia de Olivier. El paquete data.table y su función fread son espectaculares. Te puede interesar este artículo de blog: http://davetang.org/muse/2013/09/03/handling-big-data-in-r/ y este otro: http://theodi.org/blog/fig-data-11-tips-how-handle-big-data-r-and-1-bad-pun Saludos. Oscar. ----------------------------------------------------------------- Oscar Perpiñán Lamigueiro Dpto. Ingeniería Eléctrica (ETSIDI-UPM) Grupo de Sistemas Fotovoltaicos (IES-UPM) URL: http://oscarperpinan.github.io Twitter: @oscarperpinan El día 27 de mayo de 2014, 20:35, Olivier Nuñez <onunez en unex.es> escribió:> Prueba la función fread del paquete data.table. > Un saludo. Olivier > > > On 27 de mayo de 2014 19:40:21 CEST, "Eduardo Bieñkowski" <edukoski en gmail.com> wrote: >>Estimados: >>Estoy tratando de importar datos de un archivo de 3.156.367 registros >>exactamente, por unas 40 variables. >>La idea es empezar a implementar Data Mining con rattle, el tema es que >>queda freezado el rstudio al intentar leerlo. >> >>Esta instalado en: >>CPU: AMD x3 >>RAM: 4 GB >>HD: 250 >>SO: Ubuntu Raring >>Swap: 4 GB >> >>Por lo que le?? existe un paquete RevoScaleR pero es propietario y no >>tengo >>idea (no encontr??) si existe alguno equivalente. >> >>Un abrazo >> >>-- >>Eduardo >> >> [[alternative HTML version deleted]] >> >> >> >>------------------------------------------------------------------------ >> >>_______________________________________________ >>R-help-es mailing list >>R-help-es en r-project.org >>https://stat.ethz.ch/mailman/listinfo/r-help-es > > -- > Enviado desde mi teléfono con K-9 Mail. > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >