similar to: OFFTOPIC: SPARK Y H2O

Displaying 20 results from an estimated 900 matches similar to: "OFFTOPIC: SPARK Y H2O"

2018 Dec 29
2
Rmarkdown -H2O
Buenas noches: Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf? [cid:image001.png en 01D49FC5.4D2AEEE0] Muchas Gracias. Un
2017 Jan 04
3
Big data con R
Hola. Últimamente ha habido en la lista varios hilos sobre análisis de grandes volúmenes de datos con R. Las alternativas que se han mencionado son: - Usar una máquina más potente, vía Amazon Web Services, por ejemplo - Paralelización con openMp - h2o y su paquete para R, - Paquete sparklyr como wrapper de los algoritmos de spark, Y por supuesto, utilizar muestreo o incluso si tenemos
2016 Dec 05
2
Big data con R o phyton?
Merece la pena aprender python para Big data con Spark o usando la libreria que acaba de salir para R es suficiente? Qué creeis? [[alternative HTML version deleted]]
2017 Oct 04
2
Leer parquet files desde R
Hola Carlos. spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado para leer el fichero de parquet. El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola José Luis, > > ¿Has probado directamente con "dplyr"?... > > spark_read_parquet >
2016 Jun 15
5
Hadoop
Hola buenas, me preguntaba si alguno usa hadoop Spark en su día día y si me podíais recomendar un buen curso para empezar. Estuve en la charla de meetup de madrid hace unos meses de Rspark y estuvo bien, ahora me preguntaba si es posible profundizar. Pero me gustaría tener recomendaciones de cualquier material que podáis recomendar, cursos de coursera que hayais hecho, libros que hayais leido,
2017 Jun 22
2
Ayuda R no puede hubicar un vector de 42gb
http://go.cloudera.com/ml-h20-es-webinar?src=email1&elqTrackId=af5517eab2f543afbb31a0686d9ca566&elq=c68d9a8c25ba4b12944b8065d8a06e33&elqaid=4541&elqat=1&elqCampaignId= El 22 de junio de 2017, 22:59, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola, > > Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees > algo te lo estás
2015 Dec 11
2
SVM hadoop
Hola Mª Luz, Te cuento un poco mi visión: Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo, se me ocurren 3 escenarios: (1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por eso necesito hadoop/spark (2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por usuario) y por eso necesito hadoop/spark para parelilizar estos procesos
2017 Jul 02
2
Big datasheet
Alguien sabe donde puedo encontrar algun datasheet gigante, de más de 5 gigas, para poder practicar con grandes volumenes de información? Lo que quiero es probar a cargarlos con h20 y crear modelos con ellos. Me gustaria sobretodo problemas de clasificación... Gracias Jesús [[alternative HTML version deleted]]
2017 Jan 15
3
¿Está R perdiendo la batalla?
Hace poco me puse al tema del big data y la verdad es que een este campo la decisión parece clara. Python ahora mismo está un paso por delante de R, aunque sparklyR puede igualar la contienda. Pero lo que me empieza a preocupar es que parece que si nos alejamos del Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está perdiendo R la batalla? [[alternative HTML version deleted]]
2017 Aug 19
0
H2O issue
Hi to all! I am using H2O with R on Ubuntu. I start it using h2o.init() Then I execute my R/H2O code, just h2o.distance(df1,df2) that expends 3 mins to run. When this is runing I do an htop to see the resources, and I see the issue, that only 1 of the 4 available threads is in use. The other 3 at 0%. I check the cluster status with h2o.clusterStatus I see that the number of theards is
2015 Dec 10
2
SVM hadoop
Hola, Puedes poner un RStudio en Amazon, poner "caret" y a correr.... No sé si tendrás suficiente con lo que te pueda ofrecer Amazon para tu problema... creo que sí... ;-).... O directamente hacerlo aquí, que toda esta instalación ya la tienen hecha: http://www.teraproc.com/front-page-posts/r-on-demand/ Gracias, Carlos. El 10 de diciembre de 2015, 14:43, MªLuz Morales <mlzmrls
2015 Mar 21
2
Familia *pply
Muchas gracias a ambos Carlos y Jorge por las respuestas. Pido disculpas en la demora de respuesta, pero estuvo complicada la semana. La pregunta era un ejercicio de ejemplo para poder entender mejor los usos, creo que me armaré una guía en markdown con ejemplos varios para ir consultando cuando me salgan dudas de como usarlos. En realidad no importaba tanto si mejorara demasiado los tiempos
2018 Aug 27
3
Media
Estimada lista la pregunta es muy básica, pero necesito saber la Long media para cada año. Estoy pillando en el bucle. > head(talla) X Long Año 1 1 56 2016 2 2 58 2016 3 3 58 2016 4 4 58 2016 5 5 58 2016 6 6 58 2016 > tail(talla) X Long Año 2567630 2567630 86 2000 2567631 2567631 88 2000 2567632 2567632 88 2000 2567633 2567633 88 2000
2015 May 08
3
pregunta
Estimados Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda Saludos Jos? > setwd("D:/Public/Documents/R/bioimpedancia") > a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".") Error in read.table(file = file, header = header, sep = sep, quote = quote, : more
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Gil Bellosta ¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla. Ahora en R. En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría
2015 May 15
2
comportamiento de data.table al hacer calculos por grupos
Muchas gracias Freddy y Carlos ... estuve intentando con .() y con list(), para calcular la media y el error estandar al mismo tiempo en dos columnas, pero me arrojaba un error que no supe interpretar. Ahora ya funciona como sugiere Carlos. Muchas gracias de nuevo. Saludos, Eric. On 14/05/15 19:28, Carlos Ortega wrote: > Hola, > > La forma de hacerlo con data.table es esta: >
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Ortega Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay
2017 Jun 04
2
CV en R
H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y
2002 Nov 18
0
Spark Press Release
........................................................... SPARK PRESS RELEASE :: One Year Of Interactive IP Video ........................................................... SPARK CELEBRATES ONE YEAR OF IP VIDEO SERVICE World's First Totally IP VIDEO Based Service Indianapolis, Indiana - November 11th, 2002 - While the telecommunications world heaved and shrugged under a collapsing
2017 May 18
4
PLOTEO DEL DATO MENSUAL DESDE EL ACUMULADO
Interesante. Cada uno de los valores de mi tabla tiene asociada una fecha. Se le podría asignar un tipo de ?break? ,para que le ?diff? sea asociado a cada mes? Por ejemplo? [Descripción: FIRMA3] De: Carlos Ortega [mailto:cof en qualityexcellence.es] Enviado el: jueves, 18 de mayo de 2017 12:35 Para: Javier Valdes Cantallopts (DGA) CC: r-help-es en r-project.org Asunto: Re: PLOTEO DEL DATO