Hola a todos, Quería saber si alguien tiene un buen tutorial para el paquete data.table. Estoy levantando los micro datos del censo Uruguayo del 2011, con una maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora no puedo hacer operaciones sencillas como contar los mayores de 18 años de edad por departamento. Bueno si alguien tiene un tutorial de dicho paquete o algún otro para manejo de tablas de grandes dimensiones les agradezco una respuesta. Saludos, Gracias, Diego [[alternative HTML version deleted]]
Hola Diego, La página web de este gran paquete tiene bastante documentación de todo tipo: http://datatable.r-forge.r-project.org/ También puede interesarte las preguntas que se hacen en stackoverflow: http://stackoverflow.com/tags/data.table Saludos. Oscar. Diego Forteza writes:> Hola a todos, > > Quer.a saber si alguien tiene un buen tutorial para el paquete data.table. > Estoy levantando los micro datos del censo Uruguayo del 2011, con una > maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora no > puedo hacer operaciones sencillas como contar los mayores de 18 a.os de > edad por departamento. > > Bueno si alguien tiene un tutorial de dicho paquete o alg.n otro para > manejo de tablas de grandes dimensiones les agradezco una respuesta. > > Saludos, > Gracias, > Diego > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es-- Oscar Perpiñán Lamigueiro Grupo de Sistemas Fotovoltaicos (IES-UPM) Dpto. Ingeniería Eléctrica (ETSIDI-UPM) URL: http://http://oscarperpinan.github.io Twitter: @oscarperpinan
Hola Diego, tienes un paquete llamado "colbycol" que puede que solucione el problema que tienes. Te transcribo exactamente como lo describe su autor Carlos J. Gil Bellosta: Es un paquete que permite leer con R ficheros de texto de gran volumen con los que la función habitual, "read.table", no puede. La novedad reside en que los ficheros se leen columna a columna, que es como R los almacena internamente al transformarlos en data-frames. http://cran.r-project.org/web/packages/colbycol/ Espero que esto te sirva, no conozco nada más. Creo que el leer los datos de la forma que lo haces, tiene sus limitaciones respecto a tamaño. El 16 de octubre de 2013 17:10, Diego Forteza <diegoforteza@gmail.com>escribió:> Hola a todos, > > Quería saber si alguien tiene un buen tutorial para el paquete data.table. > Estoy levantando los micro datos del censo Uruguayo del 2011, con una > maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora no > puedo hacer operaciones sencillas como contar los mayores de 18 años de > edad por departamento. > > Bueno si alguien tiene un tutorial de dicho paquete o algún otro para > manejo de tablas de grandes dimensiones les agradezco una respuesta. > > Saludos, > Gracias, > Diego > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]
Hola, Yo en vez de data.table, probaría con el paquete "*sqldf*" que tiene una sintaxis en sus queries más sencilla que la de data.table. Y en términos de volumen [1] y velocidad [2] de respuesta son bastante equivalentes. [1]: http://stackoverflow.com/questions/4761073/r-how-to-rbind-two-huge-data-frames-without-running-out-of-memory [2]: http://stackoverflow.com/questions/4322219/whats-the-fastest-way-to-merge-join-data-frames-in-r Saludos, Carlos Ortega www.qualityexcellence.es El 16 de octubre de 2013 17:10, Diego Forteza <diegoforteza@gmail.com>escribió:> Hola a todos, > > Quería saber si alguien tiene un buen tutorial para el paquete data.table. > Estoy levantando los micro datos del censo Uruguayo del 2011, con una > maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora no > puedo hacer operaciones sencillas como contar los mayores de 18 años de > edad por departamento. > > Bueno si alguien tiene un tutorial de dicho paquete o algún otro para > manejo de tablas de grandes dimensiones les agradezco una respuesta. > > Saludos, > Gracias, > Diego > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Gracias a todos, voy a investigar las distintas opciones que me enviaron. Saludos, Diego 2013/10/16 Carlos Ortega <cof@qualityexcellence.es>> Hola, > > Yo en vez de data.table, probaría con el paquete "*sqldf*" que tiene una > sintaxis en sus queries más sencilla que la de data.table. Y en términos de > volumen [1] y velocidad [2] de respuesta son bastante equivalentes. > > [1]: > http://stackoverflow.com/questions/4761073/r-how-to-rbind-two-huge-data-frames-without-running-out-of-memory > [2]: > http://stackoverflow.com/questions/4322219/whats-the-fastest-way-to-merge-join-data-frames-in-r > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > > El 16 de octubre de 2013 17:10, Diego Forteza <diegoforteza@gmail.com>escribió: > >> Hola a todos, >> >> >> Quería saber si alguien tiene un buen tutorial para el paquete data.table. >> Estoy levantando los micro datos del censo Uruguayo del 2011, con una >> maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora >> no >> puedo hacer operaciones sencillas como contar los mayores de 18 años de >> edad por departamento. >> >> Bueno si alguien tiene un tutorial de dicho paquete o algún otro para >> manejo de tablas de grandes dimensiones les agradezco una respuesta. >> >> Saludos, >> Gracias, >> Diego >> >> [[alternative HTML version deleted]] >> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es@r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >> > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es >[[alternative HTML version deleted]]
Hola, ¿qué tal? Yo escribí algo al respecto hace un tiempo. Es un resumen del "vignette" del paquete y explica cómo hacer agregaciones y cruces usando data.table. http://www.datanalytics.com/blog/2013/05/09/data-table-ii-agregaciones/ http://www.datanalytics.com/blog/2013/05/02/data-table-i-cruces/ data.table se puede beber el censo de Uruguay (¿menos de 4 millones de registros?). Alternativamente, puedes usar xtabs para agregaciones. Lo he venido usando estos días con tablas de 7 millones de registros y tarda 3-4 segundos (en una máquina buena). Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 16 de octubre de 2013 17:10, Diego Forteza <diegoforteza en gmail.com> escribió:> Hola a todos, > > Quería saber si alguien tiene un buen tutorial para el paquete data.table. > Estoy levantando los micro datos del censo Uruguayo del 2011, con una > maquina no muy buena, solo lo he logrado utilizando dicho paquete. Ahora no > puedo hacer operaciones sencillas como contar los mayores de 18 años de > edad por departamento. > > Bueno si alguien tiene un tutorial de dicho paquete o algún otro para > manejo de tablas de grandes dimensiones les agradezco una respuesta. > > Saludos, > Gracias, > Diego > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >