Te agradezco la repsuesta, aunque no te he entendido muy bien.
Se que para Spark está PySpark que entiendo que lo que hace es comunicar Python
con Spark, al igual que SparkR comunica R con spark.
Lo que había entendido es que con esas librerias podia hacer lo que quisiera en
R o Python como lo haria en local pero con los volumenes de informacion que
Spark me permite, pero por lo que te leo, esto no es del todo así???
en cuanto al muestreo de datos, totalmente de acuerdo contigo. Smart data antes
que Big data
________________________________
De: José Luis Cañadas <canadasreche en gmail.com>
Enviado: lunes, 5 de diciembre de 2016 10:57
Para: Jesús Para Fernández
Cc: r-help-es en r-project.org
Asunto: Re: [R-es] Big data con R o phyton?
Hola
Hombre, aprender python no estorba. Pero en realidad en temas de bigdata python
lo que tiene es pyspark que es una api para los modelos que hay en spark. En R
está sparkR pero no están todos los modelos que hay en mllib de spark, se supone
que el paquete sparklyr soluciona este tema, a ver como evoluciona.
Por otro lado tienes h2o http://www.h2o.ai/ , que puede integrarse con spark y
tiene apis para R, python y scala. Y bueno, también existe la posibilidad de
muestrear los datos, ¿o ya no nos acordamos?
Saludos
El 5 de diciembre de 2016, 10:49, Jesús Para Fernández <j.para.fernandez en
hotmail.com<mailto:j.para.fernandez en hotmail.com>> escribió:
Merece la pena aprender python para Big data con Spark o usando la libreria que
acaba de salir para R es suficiente? Qué creeis?
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
R-help-es en r-project.org<mailto:R-help-es en r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es
[[alternative HTML version deleted]]