Pedro Concejero Cerezo
2013-Jan-25 09:44 UTC
[R-es] Resumen de R-help-es, Vol 47, Envío 46
Hola, Paulina, Desde luego poderse se puede, leer, manipular y analizar ese conjunto de datos en R incluso en equipos relativamente modestos. Hay multitud de soluciones y todo depende tanto del tipo de datos que quieres leer como de las manipulaciones que quieres hacer con ellos. Algunas preguntas para guiar estas recomendaciones serían: - ¿Tienes que tener todos los datos simultáneamente en memoria para el análisis? Porque si no es así ahorras mucho espacio en memoria y tiempo leyendo nada más lo necesario para el análisis. Un paquete para hacer esto es el de nuestro colega Carlos Gil de Bellosta, colbycol. - Los datos de entrada ¿dónde están? Puede ser texto plano, pero también puedes tenerlo en una base de datos que te permite hacer consultas, muestreo etc. antes de la carga. A mi me ha funcionado (pero hace tiempo) muy bien mysql con RMySQL en diferentes sistemas, y también tienes librerías para acceder a b.d. via ODBC. - Por último ¿qué tipo de análisis necesitas? Para descriptivos básicos y una variedad de modelos estadísticos existen paquetes que no requieren tener los datos en memoria y están muy optimizados, pero tienes que conocer los requisitos de tipos de datos que permiten cada uno y las librerías disponibles para según qué tipo de análisis. Una buena referencia de estas librerías está aquí: http://www.slideshare.net/bytemining/r-hpc En suma, posibilidades muchísimas, y si quieres una recomendación más a medida necesitaría más info. sobre datos y lo que quieres hacer. Saludos, Pedro ------------------------------ Message: 6 Date: Thu, 24 Jan 2013 22:56:39 +0100 From: Carlos Ortega <cof@qualityexcellence.es><mailto:cof@qualityexcellence.es> To: Paulina Dÿffffedaz <paulipollet@yahoo.es><mailto:paulipollet@yahoo.es> Cc: "r-help-es@r-project.org"<mailto:r-help-es@r-project.org> <r-help-es@r-project.org><mailto:r-help-es@r-project.org> Subject: Re: [R-es] Importar grandes volumenes de datos Message-ID: <CAOKbq8j=zwxGiqLXQ269Wp5JNDy0YRNTXoW7sqrhjukscMZGRg@mail.gmail.com><mailto:CAOKbq8j=zwxGiqLXQ269Wp5JNDy0YRNTXoW7sqrhjukscMZGRg@mail.gmail.com> Content-Type: text/plain Hola Paulina, El que puedas o no depende de tu máquina, del Sistema Operativo, de si es de 32 o 64 bits, de la RAM, etc. Sobre un Windows-7, 32-bits y 4 Gb de RAM he trabajado con cierta comodidad recientemente sobre un conjunto de equivalente al que comentas. Obviamente el primer paso es cargar el conjunto, pero después también depende del tipo de análisis que quieras hacer. Saludos, Carlos Ortega www.qualityexcellence.es<http://www.qualityexcellence.es> El 24 de enero de 2013 22:33, Paulina Dÿffffedaz <paulipollet@yahoo.es><mailto:paulipollet@yahoo.es>escribió: Hola tod@s Estoy subiendo información pero esta es extensa y R no me permite tengo 18''000.000 de registros con 30 campos, alguien puede indicarme como subir esta informacion o no es posible? Gracias por su ayuda [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org<mailto:R-help-es@r-project.org> https://stat.ethz.ch/mailman/listinfo/r-help-es -- Pedro Concejero User Modeling - Analytics @ Telefónica I+D<http://www.tid.es/es/Paginas/default.aspx> Part of Telefónica Digital<http://www.telefonica.com/es/digital/html/home/home.shtml> / Telefónica Digital Hub (english)<http://blog.digital.telefonica.com/> E-mail: pedro.concejero@tid.es<mailto:pedro.concejero@tid.es> skype: pedro.concejero twitter: @ConcejeroPedro linkedin <http://www.linkedin.com/in/pedroconcejero/es> ________________________________ Este mensaje se dirige exclusivamente a su destinatario. Puede consultar nuestra política de envío y recepción de correo electrónico en el enlace situado más abajo. This message is intended exclusively for its addressee. We only send and receive email on the basis of the terms set out at: http://www.tid.es/ES/PAGINAS/disclaimer.aspx [[alternative HTML version deleted]]