thr3ads.net - similar to: "OFFTOPIC: SPARK Y H2O"

Displaying 20 results from an estimated 900 matches similar to: "OFFTOPIC: SPARK Y H2O"

2018 Dec 29

Rmarkdown -H2O

Buenas noches: Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf? [cid:image001.png en 01D49FC5.4D2AEEE0] Muchas Gracias. Un

Big data con R

2017 Jan 04

Big data con R

Hola. Últimamente ha habido en la lista varios hilos sobre análisis de grandes volúmenes de datos con R. Las alternativas que se han mencionado son: - Usar una máquina más potente, vía Amazon Web Services, por ejemplo - Paralelización con openMp - h2o y su paquete para R, - Paquete sparklyr como wrapper de los algoritmos de spark, Y por supuesto, utilizar muestreo o incluso si tenemos

Big data con R o phyton?

2016 Dec 05

Big data con R o phyton?

Merece la pena aprender python para Big data con Spark o usando la libreria que acaba de salir para R es suficiente? Qué creeis? [[alternative HTML version deleted]]

Leer parquet files desde R

2017 Oct 04

Leer parquet files desde R

Hola Carlos. spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado para leer el fichero de parquet. El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola José Luis, > > ¿Has probado directamente con "dplyr"?... > > spark_read_parquet >

Hadoop

2016 Jun 15

Hadoop

Hola buenas, me preguntaba si alguno usa hadoop Spark en su día día y si me podíais recomendar un buen curso para empezar. Estuve en la charla de meetup de madrid hace unos meses de Rspark y estuvo bien, ahora me preguntaba si es posible profundizar. Pero me gustaría tener recomendaciones de cualquier material que podáis recomendar, cursos de coursera que hayais hecho, libros que hayais leido,

Ayuda R no puede hubicar un vector de 42gb

2017 Jun 22

Ayuda R no puede hubicar un vector de 42gb

http://go.cloudera.com/ml-h20-es-webinar?src=email1&elqTrackId=af5517eab2f543afbb31a0686d9ca566&elq=c68d9a8c25ba4b12944b8065d8a06e33&elqaid=4541&elqat=1&elqCampaignId= El 22 de junio de 2017, 22:59, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola, > > Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees > algo te lo estás

SVM hadoop

2015 Dec 11

SVM hadoop

Hola Mª Luz, Te cuento un poco mi visión: Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo, se me ocurren 3 escenarios: (1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por eso necesito hadoop/spark (2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por usuario) y por eso necesito hadoop/spark para parelilizar estos procesos

Big datasheet

2017 Jul 02

Big datasheet

Alguien sabe donde puedo encontrar algun datasheet gigante, de más de 5 gigas, para poder practicar con grandes volumenes de información? Lo que quiero es probar a cargarlos con h20 y crear modelos con ellos. Me gustaria sobretodo problemas de clasificación... Gracias Jesús [[alternative HTML version deleted]]

¿Está R perdiendo la batalla?

2017 Jan 15

¿Está R perdiendo la batalla?

Hace poco me puse al tema del big data y la verdad es que een este campo la decisión parece clara. Python ahora mismo está un paso por delante de R, aunque sparklyR puede igualar la contienda. Pero lo que me empieza a preocupar es que parece que si nos alejamos del Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está perdiendo R la batalla? [[alternative HTML version deleted]]

H2O issue

2017 Aug 19

H2O issue

Hi to all! I am using H2O with R on Ubuntu. I start it using h2o.init() Then I execute my R/H2O code, just h2o.distance(df1,df2) that expends 3 mins to run. When this is runing I do an htop to see the resources, and I see the issue, that only 1 of the 4 available threads is in use. The other 3 at 0%. I check the cluster status with h2o.clusterStatus I see that the number of theards is

SVM hadoop

2015 Dec 10

SVM hadoop

Hola, Puedes poner un RStudio en Amazon, poner "caret" y a correr.... No sé si tendrás suficiente con lo que te pueda ofrecer Amazon para tu problema... creo que sí... ;-).... O directamente hacerlo aquí, que toda esta instalación ya la tienen hecha: http://www.teraproc.com/front-page-posts/r-on-demand/ Gracias, Carlos. El 10 de diciembre de 2015, 14:43, MªLuz Morales <mlzmrls

Familia *pply

2015 Mar 21

Familia *pply

Muchas gracias a ambos Carlos y Jorge por las respuestas. Pido disculpas en la demora de respuesta, pero estuvo complicada la semana. La pregunta era un ejercicio de ejemplo para poder entender mejor los usos, creo que me armaré una guía en markdown con ejemplos varios para ir consultando cuando me salgan dudas de como usarlos. En realidad no importaba tanto si mejorara demasiado los tiempos

Media

2018 Aug 27

Media

Estimada lista la pregunta es muy básica, pero necesito saber la Long media para cada año. Estoy pillando en el bucle. > head(talla) X Long Año 1 1 56 2016 2 2 58 2016 3 3 58 2016 4 4 58 2016 5 5 58 2016 6 6 58 2016 > tail(talla) X Long Año 2567630 2567630 86 2000 2567631 2567631 88 2000 2567632 2567632 88 2000 2567633 2567633 88 2000

pregunta

2015 May 08

pregunta

Estimados Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda Saludos Jos? > setwd("D:/Public/Documents/R/bioimpedancia") > a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".") Error in read.table(file = file, header = header, sep = sep, quote = quote, : more

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Gil Bellosta ¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla. Ahora en R. En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría

comportamiento de data.table al hacer calculos por grupos

2015 May 15

comportamiento de data.table al hacer calculos por grupos

Muchas gracias Freddy y Carlos ... estuve intentando con .() y con list(), para calcular la media y el error estandar al mismo tiempo en dos columnas, pero me arrojaba un error que no supe interpretar. Ahora ya funciona como sugiere Carlos. Muchas gracias de nuevo. Saludos, Eric. On 14/05/15 19:28, Carlos Ortega wrote: > Hola, > > La forma de hacerlo con data.table es esta: >

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Ortega Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay

CV en R

2017 Jun 04

CV en R

H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y

Spark Press Release

2002 Nov 18

Spark Press Release

........................................................... SPARK PRESS RELEASE :: One Year Of Interactive IP Video ........................................................... SPARK CELEBRATES ONE YEAR OF IP VIDEO SERVICE World's First Totally IP VIDEO Based Service Indianapolis, Indiana - November 11th, 2002 - While the telecommunications world heaved and shrugged under a collapsing

PLOTEO DEL DATO MENSUAL DESDE EL ACUMULADO

2017 May 18

PLOTEO DEL DATO MENSUAL DESDE EL ACUMULADO

Interesante. Cada uno de los valores de mi tabla tiene asociada una fecha. Se le podría asignar un tipo de ?break? ,para que le ?diff? sea asociado a cada mes? Por ejemplo? [Descripción: FIRMA3] De: Carlos Ortega [mailto:cof en qualityexcellence.es] Enviado el: jueves, 18 de mayo de 2017 12:35 Para: Javier Valdes Cantallopts (DGA) CC: r-help-es en r-project.org Asunto: Re: PLOTEO DEL DATO

similar to: OFFTOPIC: SPARK Y H2O