Displaying 20 results from an estimated 500 matches similar to: "Ayuda R no puede hubicar un vector de 42gb"
2017 Jul 01
2
OFFTOPIC: SPARK Y H2O
Buenas erreros!!
Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no....
Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje.
H2O es una herramienta que nos
2017 Jan 04
3
Big data con R
Hola.
Últimamente ha habido en la lista varios hilos sobre análisis de grandes
volúmenes de datos con R.
Las alternativas que se han mencionado son:
- Usar una máquina más potente, vía Amazon Web Services, por ejemplo
- Paralelización con openMp
- h2o y su paquete para R,
- Paquete sparklyr como wrapper de los algoritmos de spark,
Y por supuesto, utilizar muestreo o incluso si tenemos
2017 Jun 04
2
CV en R
H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un
clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y
no tienes porqué usar Spark si no necesitas una solución tiempo real o
"near real-time". H2O tiene otra solución para interaccionar con Spark
(Sparkling Water).
Incluso sobre un clúster, puedes usar "sparklyr" y
2015 Jun 02
2
information.gain de la libreria FSelector
Hola,
estoy intentando calcular la ganancia de información para una serie de
variables (series temporales con distinta longuitud, ej: Presion Arterial,
Frecuencia cardíaca,...) en relación con una variable binaria (0:paciente
no muere; 1:paciente muere). Para ello voy a usar la función
information.gain de la libreria FSelector.
Sabeis si es posible calcular la ganancia de información para
2015 Jun 15
3
Any alternative to Single User Mode
On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com> wrote:
>
>
> On 06/14/2015 06:47 PM, Animesh Pandey wrote:
>
>> I actually opened the Virtual Disk Image (.vdi) on http://www.vmxray.com/
>> .
>> I could see that despite my disk being of 100GB only ~65GB was being
>> shown.
>> All the stuff related ot the local user was not visible at
2015 Jun 15
2
Any alternative to Single User Mode
On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com> wrote:
>
>
> On 06/14/2015 07:36 PM, Animesh Pandey wrote:
>
>> On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com> wrote:
>>
>>
>>> On 06/14/2015 06:47 PM, Animesh Pandey wrote:
>>>
>>> I actually opened the Virtual Disk Image (.vdi) on
>>>>
2015 Jun 02
2
information.gain de la libreria FSelector
Hola Javier,
yo soy licenciada en Físicas pero también tengo algo de información médica
(doctorado en Neurociencia)
Un saludo
El 2 de junio de 2015, 15:35, <javier.ruben.marcuzzi en gmail.com> escribió:
> Estimada María Luz Morales
>
> ¿Qué título universitario tiene usted?, es para pensar en como poder
> ayudarla, si desde la parte médica o la de R
>
> Javier Rubén
2015 Jun 15
2
Any alternative to Single User Mode
On Sun, Jun 14, 2015 at 10:51 PM, jd1008 <jd1008 at gmail.com> wrote:
>
>
> On 06/14/2015 08:02 PM, Animesh Pandey wrote:
>
>> On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com> wrote:
>>
>>
>>> On 06/14/2015 07:36 PM, Animesh Pandey wrote:
>>>
>>> On Sun, Jun 14, 2015 at 9:06 PM, jd1008 <jd1008 at gmail.com>
2017 Jul 02
2
Big datasheet
Alguien sabe donde puedo encontrar algun datasheet gigante, de más de 5 gigas, para poder practicar con grandes volumenes de información?
Lo que quiero es probar a cargarlos con h20 y crear modelos con ellos. Me gustaria sobretodo problemas de clasificación...
Gracias
Jesús
[[alternative HTML version deleted]]
2015 Jun 15
3
Any alternative to Single User Mode
I actually opened the Virtual Disk Image (.vdi) on http://www.vmxray.com/.
I could see that despite my disk being of 100GB only ~65GB was being shown.
All the stuff related ot the local user was not visible at all.
After I restarted my VM, the OS gets stuck here (
http://i.stack.imgur.com/KVYxV.png). Even after trying the single user
login it was stuck there. But the emergency mode worked alright.
2018 Jan 20
2
Random Forests
Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes.
> treesize(RFfit)
[1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317
4294 4321 4283 4362
[17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347
4329 4348 4298 4335
[33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336
4308 4351 4374 4324
[49] 4386 4359 4311 4346 4300
2017 Jun 04
2
CV en R
Si nos dices el tipo de problema que estás intentando solucionar y el
tamaño del dataset podemos recomendarte algo más.
En tu pseudo-código mezclas algoritmos supervisados y no-supervisados.
Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y
éstos los probaría dentro de H2O.
Saludos,
Carlos Ortega
www.qualityexcellence.es
El 4 de junio de 2017,
2018 Jan 22
2
Random Forests
Muchas gracias Carlos, como siempre.
Es raro que se me pasase. En su momento miré todos los argumentos del
RF, como hago siempre, pero ese lo había olvidado. La verdad es que
funcionaba estupendamente, pero me parecía extraño. Aunque dado que
los RF no sobreajustan, no hay problema con que sus árboles sean todo
lo grandes que quieras. Lo he testado con una base de datos externa y
explica
2015 May 08
3
pregunta
Estimados
Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda
Saludos
Jos?
> setwd("D:/Public/Documents/R/bioimpedancia")
> a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".")
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
more
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Gil Bellosta
¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla.
Ahora en R.
En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría
2015 Jun 15
1
Any alternative to Single User Mode
On Mon, Jun 15, 2015 at 12:33 AM, jd1008 <jd1008 at gmail.com> wrote:
>
>
> On 06/14/2015 10:27 PM, Animesh Pandey wrote:
>
>> On Sun, Jun 14, 2015 at 10:51 PM, jd1008 <jd1008 at gmail.com> wrote:
>>
>>
>>> On 06/14/2015 08:02 PM, Animesh Pandey wrote:
>>>
>>> On Sun, Jun 14, 2015 at 9:47 PM, jd1008 <jd1008 at gmail.com>
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Ortega
Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay
2018 Dec 29
2
Rmarkdown -H2O
Buenas noches:
Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf?
[cid:image001.png en 01D49FC5.4D2AEEE0]
Muchas Gracias.
Un
2017 Oct 04
2
Leer parquet files desde R
Hola Carlos.
spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado
para leer el fichero de parquet.
El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es>
escribió:
> Hola José Luis,
>
> ¿Has probado directamente con "dplyr"?...
>
> spark_read_parquet
>
2016 Dec 30
3
Trabajar con un dataset muy grande
hola a todos,
Me gustaria saber qué haceis cuando el dataset para trabsjar es tan grande
que R no lo soporta.
Lo troceo con alguna otra herramienta?
Cual?
Gracias y feliz año!
Victoria
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org <javascript:;>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
--
Enviado con