thr3ads.net - similar to: "Ayuda R no puede hubicar un vector de 42gb"

Displaying 20 results from an estimated 500 matches similar to: "Ayuda R no puede hubicar un vector de 42gb"

2017 Jul 01

OFFTOPIC: SPARK Y H2O

Buenas erreros!! Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no.... Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje. H2O es una herramienta que nos

Big data con R

2017 Jan 04

Big data con R

Hola. Últimamente ha habido en la lista varios hilos sobre análisis de grandes volúmenes de datos con R. Las alternativas que se han mencionado son: - Usar una máquina más potente, vía Amazon Web Services, por ejemplo - Paralelización con openMp - h2o y su paquete para R, - Paquete sparklyr como wrapper de los algoritmos de spark, Y por supuesto, utilizar muestreo o incluso si tenemos

CV en R

2017 Jun 04

CV en R

H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y

information.gain de la libreria FSelector

2015 Jun 02

information.gain de la libreria FSelector

Hola, estoy intentando calcular la ganancia de información para una serie de variables (series temporales con distinta longuitud, ej: Presion Arterial, Frecuencia cardíaca,...) en relación con una variable binaria (0:paciente no muere; 1:paciente muere). Para ello voy a usar la función information.gain de la libreria FSelector. Sabeis si es posible calcular la ganancia de información para

Any alternative to Single User Mode

2015 Jun 15

Any alternative to Single User Mode

On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com> wrote: > > > On 06/14/2015 06:47 PM, Animesh Pandey wrote: > >> I actually opened the Virtual Disk Image (.vdi) on http://www.vmxray.com/ >> . >> I could see that despite my disk being of 100GB only ~65GB was being >> shown. >> All the stuff related ot the local user was not visible at

Any alternative to Single User Mode

2015 Jun 15

Any alternative to Single User Mode

On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com> wrote: > > > On 06/14/2015 07:36 PM, Animesh Pandey wrote: > >> On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com> wrote: >> >> >>> On 06/14/2015 06:47 PM, Animesh Pandey wrote: >>> >>> I actually opened the Virtual Disk Image (.vdi) on >>>>

information.gain de la libreria FSelector

2015 Jun 02

information.gain de la libreria FSelector

Hola Javier, yo soy licenciada en Físicas pero también tengo algo de información médica (doctorado en Neurociencia) Un saludo El 2 de junio de 2015, 15:35, <javier.ruben.marcuzzi en gmail.com> escribió: > Estimada María Luz Morales > > ¿Qué título universitario tiene usted?, es para pensar en como poder > ayudarla, si desde la parte médica o la de R > > Javier Rubén

Any alternative to Single User Mode

2015 Jun 15

Any alternative to Single User Mode

On Sun, Jun 14, 2015 at 10:51 PM, jd1008 <jd1008 at gmail.com> wrote: > > > On 06/14/2015 08:02 PM, Animesh Pandey wrote: > >> On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com> wrote: >> >> >>> On 06/14/2015 07:36 PM, Animesh Pandey wrote: >>> >>> On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com>

Big datasheet

2017 Jul 02

Big datasheet

Alguien sabe donde puedo encontrar algun datasheet gigante, de más de 5 gigas, para poder practicar con grandes volumenes de información? Lo que quiero es probar a cargarlos con h20 y crear modelos con ellos. Me gustaria sobretodo problemas de clasificación... Gracias Jesús [[alternative HTML version deleted]]

Any alternative to Single User Mode

2015 Jun 15

Any alternative to Single User Mode

I actually opened the Virtual Disk Image (.vdi) on http://www.vmxray.com/. I could see that despite my disk being of 100GB only ~65GB was being shown. All the stuff related ot the local user was not visible at all. After I restarted my VM, the OS gets stuck here ( http://i.stack.imgur.com/KVYxV.png). Even after trying the single user login it was stuck there. But the emergency mode worked alright.

Random Forests

2018 Jan 20

Random Forests

Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes. > treesize(RFfit) [1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317 4294 4321 4283 4362 [17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347 4329 4348 4298 4335 [33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336 4308 4351 4374 4324 [49] 4386 4359 4311 4346 4300

CV en R

2017 Jun 04

CV en R

Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más. En tu pseudo-código mezclas algoritmos supervisados y no-supervisados. Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O. Saludos, Carlos Ortega www.qualityexcellence.es El 4 de junio de 2017,

Random Forests

2018 Jan 22

Random Forests

Muchas gracias Carlos, como siempre. Es raro que se me pasase. En su momento miré todos los argumentos del RF, como hago siempre, pero ese lo había olvidado. La verdad es que funcionaba estupendamente, pero me parecía extraño. Aunque dado que los RF no sobreajustan, no hay problema con que sus árboles sean todo lo grandes que quieras. Lo he testado con una base de datos externa y explica

pregunta

2015 May 08

pregunta

Estimados Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda Saludos Jos? > setwd("D:/Public/Documents/R/bioimpedancia") > a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".") Error in read.table(file = file, header = header, sep = sep, quote = quote, : more

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Gil Bellosta ¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla. Ahora en R. En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría

Any alternative to Single User Mode

2015 Jun 15

Any alternative to Single User Mode

On Mon, Jun 15, 2015 at 12:33 AM, jd1008 <jd1008 at gmail.com> wrote: > > > On 06/14/2015 10:27 PM, Animesh Pandey wrote: > >> On Sun, Jun 14, 2015 at 10:51 PM, jd1008 <jd1008 at gmail.com> wrote: >> >> >>> On 06/14/2015 08:02 PM, Animesh Pandey wrote: >>> >>> On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com>

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Ortega Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay

Rmarkdown -H2O

2018 Dec 29

Rmarkdown -H2O

Buenas noches: Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf? [cid:image001.png en 01D49FC5.4D2AEEE0] Muchas Gracias. Un

Leer parquet files desde R

2017 Oct 04

Leer parquet files desde R

Hola Carlos. spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado para leer el fichero de parquet. El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola José Luis, > > ¿Has probado directamente con "dplyr"?... > > spark_read_parquet >

Trabajar con un dataset muy grande

2016 Dec 30

Trabajar con un dataset muy grande

hola a todos, Me gustaria saber qué haceis cuando el dataset para trabsjar es tan grande que R no lo soporta. Lo troceo con alguna otra herramienta? Cual? Gracias y feliz año! Victoria > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org <javascript:;> > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Enviado con

similar to: Ayuda R no puede hubicar un vector de 42gb