Pedro Concejero Cerezo
2013-Jan-25 09:44 UTC
[R-es] Resumen de R-help-es, Vol 47, Envío 46
Hola, Paulina,
Desde luego poderse se puede, leer, manipular y analizar ese conjunto de datos
en R incluso en equipos relativamente modestos. Hay multitud de soluciones y
todo depende tanto del tipo de datos que quieres leer como de las manipulaciones
que quieres hacer con ellos. Algunas preguntas para guiar estas recomendaciones
serían:
- ¿Tienes que tener todos los datos simultáneamente en memoria para el análisis?
Porque si no es así ahorras mucho espacio en memoria y tiempo leyendo nada más
lo necesario para el análisis. Un paquete para hacer esto es el de nuestro
colega Carlos Gil de Bellosta, colbycol.
- Los datos de entrada ¿dónde están? Puede ser texto plano, pero también puedes
tenerlo en una base de datos que te permite hacer consultas, muestreo etc. antes
de la carga. A mi me ha funcionado (pero hace tiempo) muy bien mysql con RMySQL
en diferentes sistemas, y también tienes librerías para acceder a b.d. via ODBC.
- Por último ¿qué tipo de análisis necesitas? Para descriptivos básicos y una
variedad de modelos estadísticos existen paquetes que no requieren tener los
datos en memoria y están muy optimizados, pero tienes que conocer los requisitos
de tipos de datos que permiten cada uno y las librerías disponibles para según
qué tipo de análisis. Una buena referencia de estas librerías está aquí:
http://www.slideshare.net/bytemining/r-hpc
En suma, posibilidades muchísimas, y si quieres una recomendación más a medida
necesitaría más info. sobre datos y lo que quieres hacer.
Saludos,
Pedro
------------------------------
Message: 6
Date: Thu, 24 Jan 2013 22:56:39 +0100
From: Carlos Ortega
<cof@qualityexcellence.es><mailto:cof@qualityexcellence.es>
To: Paulina Dÿffffedaz
<paulipollet@yahoo.es><mailto:paulipollet@yahoo.es>
Cc: "r-help-es@r-project.org"<mailto:r-help-es@r-project.org>
<r-help-es@r-project.org><mailto:r-help-es@r-project.org>
Subject: Re: [R-es] Importar grandes volumenes de datos
Message-ID:
<CAOKbq8j=zwxGiqLXQ269Wp5JNDy0YRNTXoW7sqrhjukscMZGRg@mail.gmail.com><mailto:CAOKbq8j=zwxGiqLXQ269Wp5JNDy0YRNTXoW7sqrhjukscMZGRg@mail.gmail.com>
Content-Type: text/plain
Hola Paulina,
El que puedas o no depende de tu máquina, del Sistema Operativo, de si es
de 32 o 64 bits, de la RAM, etc.
Sobre un Windows-7, 32-bits y 4 Gb de RAM he trabajado con cierta comodidad
recientemente sobre un conjunto de equivalente al que comentas.
Obviamente el primer paso es cargar el conjunto, pero después también
depende del tipo de análisis que quieras hacer.
Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>
El 24 de enero de 2013 22:33, Paulina Dÿffffedaz
<paulipollet@yahoo.es><mailto:paulipollet@yahoo.es>escribió:
Hola tod@s
Estoy subiendo información pero esta es extensa y R no me permite tengo
18''000.000 de registros con 30 campos, alguien puede indicarme como
subir
esta informacion o no es posible?
Gracias por su ayuda
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es@r-project.org<mailto:R-help-es@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es
--
Pedro Concejero
User Modeling - Analytics @ Telefónica
I+D<http://www.tid.es/es/Paginas/default.aspx>
Part of Telefónica
Digital<http://www.telefonica.com/es/digital/html/home/home.shtml> /
Telefónica Digital Hub (english)<http://blog.digital.telefonica.com/>
E-mail: pedro.concejero@tid.es<mailto:pedro.concejero@tid.es>
skype: pedro.concejero
twitter: @ConcejeroPedro
linkedin <http://www.linkedin.com/in/pedroconcejero/es>
________________________________
Este mensaje se dirige exclusivamente a su destinatario. Puede consultar nuestra
política de envío y recepción de correo electrónico en el enlace situado más
abajo.
This message is intended exclusively for its addressee. We only send and receive
email on the basis of the terms set out at:
http://www.tid.es/ES/PAGINAS/disclaimer.aspx
[[alternative HTML version deleted]]
