similar to: Big datasheet

Displaying 20 results from an estimated 300 matches similar to: "Big datasheet"

2017 Jun 22
2
Ayuda R no puede hubicar un vector de 42gb
http://go.cloudera.com/ml-h20-es-webinar?src=email1&elqTrackId=af5517eab2f543afbb31a0686d9ca566&elq=c68d9a8c25ba4b12944b8065d8a06e33&elqaid=4541&elqat=1&elqCampaignId= El 22 de junio de 2017, 22:59, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola, > > Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees > algo te lo estás
2016 Dec 05
2
Big data con R o phyton?
Merece la pena aprender python para Big data con Spark o usando la libreria que acaba de salir para R es suficiente? Qué creeis? [[alternative HTML version deleted]]
2017 Jul 01
2
OFFTOPIC: SPARK Y H2O
Buenas erreros!! Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no.... Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje. H2O es una herramienta que nos
2015 May 08
3
pregunta
Estimados Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda Saludos Jos? > setwd("D:/Public/Documents/R/bioimpedancia") > a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".") Error in read.table(file = file, header = header, sep = sep, quote = quote, : more
2018 Dec 29
2
Rmarkdown -H2O
Buenas noches: Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf? [cid:image001.png en 01D49FC5.4D2AEEE0] Muchas Gracias. Un
2017 Oct 04
2
Leer parquet files desde R
Hola Carlos. spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado para leer el fichero de parquet. El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola José Luis, > > ¿Has probado directamente con "dplyr"?... > > spark_read_parquet >
2016 Jun 15
5
Hadoop
Hola buenas, me preguntaba si alguno usa hadoop Spark en su día día y si me podíais recomendar un buen curso para empezar. Estuve en la charla de meetup de madrid hace unos meses de Rspark y estuvo bien, ahora me preguntaba si es posible profundizar. Pero me gustaría tener recomendaciones de cualquier material que podáis recomendar, cursos de coursera que hayais hecho, libros que hayais leido,
2014 Oct 16
2
Heatmap de paro (o de otra cosa) en España
Hola Pedro. El INE cambió los ficheros de microdatos no hace mucho, aquí dejo como se haría ahora, (utilizando MicroDatosEs). Lo que cambia es la función para recodificar. http://rpubs.com/joscani/unemplrate El 15/10/14 a las #4, Carlos Ortega escribió: > Hola Pedro, > > Acabo de recordar que hace poco José Luis Cañadas (participa en esta lista) > publicó un enlace suyo a un
2017 Jun 04
2
CV en R
H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y
2004 Aug 26
1
Plotting groupedData objects
I am trying to create a plot similar to Figure 3.2 in Bates and Pinheiro. I have repeated measurements on about 80 subjects from 2 treatment groups. I would like to have the panels for the two treatment groups in separate groups and within those groups have the panels ordered on maximum value (as is the default). I am ok with getting plots similar to Figs 3.1 and 3.2, but can't see how to
2017 Feb 19
2
Reconocimiento de texto
Buenas Juan, Ya había visto ese paquete pero creo que no soy capaz de explotarlo del todo. Yo lo que tengo son imágenes solo de números y sobre una superficie gris. Entonces me gustaría poder entrenar a mi “modelo” para que solo muestre como posible salida números y siempre en un fondo gris. Aun asi, muchas gracias por la recomendación Jesús Enviado desde
2017 Jan 15
3
¿Está R perdiendo la batalla?
Hace poco me puse al tema del big data y la verdad es que een este campo la decisión parece clara. Python ahora mismo está un paso por delante de R, aunque sparklyR puede igualar la contienda. Pero lo que me empieza a preocupar es que parece que si nos alejamos del Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está perdiendo R la batalla? [[alternative HTML version deleted]]
2004 Jan 07
11
Random ping jumps
Hello, I''ve got this problem. There is an linux server with 2.4.24 kernel and pinging from him to internet (or from lan) ping randomly jumps up: 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=387 ttl=59 time=30.0 ms 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=388 ttl=59 time=32.6 ms 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=389 ttl=59 time=34.9 ms
2004 Dec 06
2
Minor annoyances: Samba 3.0.2/Win2k and WinXP
I have three users that are having trouble with my Samba network. This trouble is composed of two (possibly distinct) issues. My network is controlled by a Red Hat ES 3 server running Samba 3.0.2 with an LDAP backend. Issue 1: Laptop users, with "Offline Files" that are made of their "My Documents" directories. These directories are stored on the Samba server (so they can
2017 Jan 04
3
Big data con R
Hola. Últimamente ha habido en la lista varios hilos sobre análisis de grandes volúmenes de datos con R. Las alternativas que se han mencionado son: - Usar una máquina más potente, vía Amazon Web Services, por ejemplo - Paralelización con openMp - h2o y su paquete para R, - Paquete sparklyr como wrapper de los algoritmos de spark, Y por supuesto, utilizar muestreo o incluso si tenemos
2005 Jan 17
1
bold face labelling/expression
Dear colleagues, I have a great problem in using "expression" for axes labels. I want the labels in bold face (i.e.: par(font.lab=2)). When typing boxplot(y ~ groups, names = "" , xlab = "", ylab = "", axes = F) axis(side=1, at=c(1,2), xlab=c(expression(H[2]*O),"others")), I do not get a bold face labelling. Does anyone know, how I could
2017 Jun 04
2
CV en R
Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más. En tu pseudo-código mezclas algoritmos supervisados y no-supervisados. Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O. Saludos, Carlos Ortega www.qualityexcellence.es El 4 de junio de 2017,
2003 Apr 14
1
factor differences in anova
Hello, (maybe a quite basic statistical question, but I'm just struggling with it) I'm doing an anova: > Res1<-aov(H2O~location+topo+horizon+pF+Error(location:topo:horizon)) (water retention of soils) which gives a significant difference at factor "location". Which function should I use to now which locations (there are 3: A, B and C) differ significantly and which do
2015 Dec 11
2
SVM hadoop
Hola Mª Luz, Te cuento un poco mi visión: Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo, se me ocurren 3 escenarios: (1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por eso necesito hadoop/spark (2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por usuario) y por eso necesito hadoop/spark para parelilizar estos procesos
2012 Dec 05
1
Problems with Acer netbook freezing on syslinux bootup
Hi! I'm not a programmer, so I will try and be as clear as I can. I currently have an Acer Aspire One which has issues with syslinux 4.06 When I try and make a usb bootable install key using common automated programs under windows (Universal USB installer from Pendrivelinux, LiLi and unetbootin), they all fail when booted on the netbook. Now, I know it's an issue with syslinux for many