Saludos.Esta vez les escribo no por una ayuda, sino mas bien para solicitarles opiniones y consejos (implicitamente tiene que ver con R).Estoy incursionando en el mundo de los proyectos y me han pedido que estructure una área de R&D (research & development).Esta área es altamente técnica formada por analistas expertos (estadísticos y matemáticos), y va ha usar open source. Claro está, el core de análisis es R pero necesito definir un complemento para R en el aspecto de base de datos (con complemento quiero decir que interactuen de una forma óptima). Esta base debe brindar un alto rendimiento para consultas complejas y mínimos tiempos de respuesta para grandes volúmenes de datos (teradatos). He estado averiguando sobre el tema, pero quisiera saber de sus experiencias.Muchas gracias de antemano.. Atte.Patricio. [[alternative HTML version deleted]]
Nosotros trabajamos con una BD en Oracle donde algunas de las tablas tienen mas 70.000.000 millones de registros, y usamos R en modo cliente-servidor para hacer extracciones y análisis concreto. Las funciones interna de la base de datos, sin embargo se hacen en PL/SQL. Para un uso de estas características, con R como cliente de la base de datos, cualquier sistema seria valido: mysql, postgresql o quizás incluso SQLite, la selección concreta tendríais que valorarlo vuestro analista de base de datos. Pero si lo que quiere es implantar las rutinas R, directamente en la misma base datos, la única solución que conozco en postgresql, mediante PL/R: http://www.joeconway.com/plr/ No tenga experiencia en su uso, pero suena interesante, aquí otra referencia: http://www.gisandchips.org/2009/09/24/integracion-de-r-en-postgresql-mi-primera-funcion-en-plr/ +-------------------------------------------------------------- | Francisco J. Viciana Fernández | Coordinador del Registro de Población | Servicio de Estadísticas Demográficas y Sociales | Instituto de Estadística de Andalucía | Leonardo Da Vinci, nº 21. Isla de La Cartuja. | 41071 SEVILLA. | franciscoj.viciana en juntadeandalucia.es +--------------------------------------------------------------> > Saludos.Esta vez les escribo no por una ayuda, sino mas bien para solicitarles > opiniones y consejos (implicitamente tiene que ver con R).Estoy incursionando > en el mundo de los proyectos y me han pedido que estructure una área de R&D > (research & development).Esta área es altamente técnica formada por analistas > expertos (estadísticos y matemáticos), y va ha usar open source. Claro está, > el core de análisis es R pero necesito definir un complemento para R en el > aspecto de base de datos (con complemento quiero decir que interactuen de una > forma óptima). Esta base debe brindar un alto rendimiento para consultas > complejas y mínimos tiempos de respuesta para grandes volúmenes de datos > (teradatos). He estado averiguando sobre el tema, pero quisiera saber de sus > experiencias.Muchas gracias de antemano.. > Atte.Patricio. > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >
Hola, ¿qué tal? Yo me decantaría por Postgres a cierraojos. Es la base de datos abierta más completa. Y mucho más fácil de mantener y configurar que Oracle. Si tenéis datos "tan grandes", puedes explorar Greenplum, que es una extensión MPP de Postgres, es decir, un sistema distribuido de de datos en cuyos nodos corren instancias de Postgres (una versión algo modificada). Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 26 de noviembre de 2011 09:02, Francisco José Viciana Fernández <franciscoj.viciana en juntadeandalucia.es> escribió:> Nosotros trabajamos con una BD en Oracle donde algunas de las tablas tienen > mas 70.000.000 millones de registros, y usamos R en modo cliente-servidor para > hacer extracciones y análisis concreto. Las funciones interna de la base de > datos, sin embargo se hacen en PL/SQL. > > Para un uso de estas características, con R como cliente de la base de datos, > cualquier sistema seria valido: mysql, postgresql o quizás incluso SQLite, la > selección concreta tendríais que valorarlo vuestro analista de base de datos. > > Pero si lo que quiere es implantar las rutinas R, directamente en la misma > base datos, la única solución que conozco en postgresql, mediante PL/R: > http://www.joeconway.com/plr/ > > No tenga experiencia en su uso, pero suena interesante, aquí otra referencia: > http://www.gisandchips.org/2009/09/24/integracion-de-r-en-postgresql-mi-primera-funcion-en-plr/ > > > > +-------------------------------------------------------------- > | Francisco J. Viciana Fernández > | Coordinador del Registro de Población > | Servicio de Estadísticas Demográficas y Sociales > | Instituto de Estadística de Andalucía > | Leonardo Da Vinci, nº 21. Isla de La Cartuja. > | 41071 SEVILLA. > | franciscoj.viciana en juntadeandalucia.es > +-------------------------------------------------------------- > > > > > >> >> Saludos.Esta vez les escribo no por una ayuda, sino mas bien para solicitarles >> opiniones y consejos (implicitamente tiene que ver con R).Estoy incursionando >> en el mundo de los proyectos y me han pedido que estructure una área de R&D >> (research & development).Esta área es altamente técnica formada por analistas >> expertos (estadísticos y matemáticos), y va ha usar open source. Claro está, >> el core de análisis es R pero necesito definir un complemento para R en el >> aspecto de base de datos (con complemento quiero decir que interactuen de una >> forma óptima). Esta base debe brindar un alto rendimiento para consultas >> complejas y mínimos tiempos de respuesta para grandes volúmenes de datos >> (teradatos). He estado averiguando sobre el tema, pero quisiera saber de sus >> experiencias.Muchas gracias de antemano.. >> Atte.Patricio. >> >> [[alternative HTML version deleted]] >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >