thr3ads.net - similar to: "Big datasheet"

Displaying 20 results from an estimated 300 matches similar to: "Big datasheet"

Ayuda R no puede hubicar un vector de 42gb

2017 Jun 22

Ayuda R no puede hubicar un vector de 42gb

http://go.cloudera.com/ml-h20-es-webinar?src=email1&elqTrackId=af5517eab2f543afbb31a0686d9ca566&elq=c68d9a8c25ba4b12944b8065d8a06e33&elqaid=4541&elqat=1&elqCampaignId= El 22 de junio de 2017, 22:59, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola, > > Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees > algo te lo estás

Big data con R o phyton?

2016 Dec 05

Big data con R o phyton?

Merece la pena aprender python para Big data con Spark o usando la libreria que acaba de salir para R es suficiente? Qué creeis? [[alternative HTML version deleted]]

OFFTOPIC: SPARK Y H2O

2017 Jul 01

OFFTOPIC: SPARK Y H2O

Buenas erreros!! Una cuestión de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no.... Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje. H2O es una herramienta que nos

pregunta

2015 May 08

pregunta

Estimados Al dirigir la lectura de un folder tYA1.csv me da este error y no me percato del motivo, adjunto archivo. Espero su ayuda Saludos Jos? > setwd("D:/Public/Documents/R/bioimpedancia") > a<-read.csv("tYA1.csv",header=TRUE, sep=",", dec=".") Error in read.table(file = file, header = header, sep = sep, quote = quote, : more

Rmarkdown -H2O

2018 Dec 29

Rmarkdown -H2O

Buenas noches: Estoy realizando un documento rmarkdown donde realiza un modelo de random forest con la librería H2O, el problema lo tengo cuando lo compilo con knit a pdf, ya que en el documento me sale con rayas con el porcentaje de entrenamiento que lleva. ¿Alguien sabe como eliminarlas para que no aparezca en el documento en pdf? [cid:image001.png en 01D49FC5.4D2AEEE0] Muchas Gracias. Un

Leer parquet files desde R

2017 Oct 04

Leer parquet files desde R

Hola Carlos. spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado para leer el fichero de parquet. El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola José Luis, > > ¿Has probado directamente con "dplyr"?... > > spark_read_parquet >

Hadoop

2016 Jun 15

Hadoop

Hola buenas, me preguntaba si alguno usa hadoop Spark en su día día y si me podíais recomendar un buen curso para empezar. Estuve en la charla de meetup de madrid hace unos meses de Rspark y estuvo bien, ahora me preguntaba si es posible profundizar. Pero me gustaría tener recomendaciones de cualquier material que podáis recomendar, cursos de coursera que hayais hecho, libros que hayais leido,

Heatmap de paro (o de otra cosa) en España

2014 Oct 16

Heatmap de paro (o de otra cosa) en España

Hola Pedro. El INE cambió los ficheros de microdatos no hace mucho, aquí dejo como se haría ahora, (utilizando MicroDatosEs). Lo que cambia es la función para recodificar. http://rpubs.com/joscani/unemplrate El 15/10/14 a las #4, Carlos Ortega escribió: > Hola Pedro, > > Acabo de recordar que hace poco José Luis Cañadas (participa en esta lista) > publicó un enlace suyo a un

CV en R

2017 Jun 04

CV en R

H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y

Plotting groupedData objects

2004 Aug 26

Plotting groupedData objects

I am trying to create a plot similar to Figure 3.2 in Bates and Pinheiro. I have repeated measurements on about 80 subjects from 2 treatment groups. I would like to have the panels for the two treatment groups in separate groups and within those groups have the panels ordered on maximum value (as is the default). I am ok with getting plots similar to Figs 3.1 and 3.2, but can't see how to

Reconocimiento de texto

2017 Feb 19

Reconocimiento de texto

Buenas Juan, Ya había visto ese paquete pero creo que no soy capaz de explotarlo del todo. Yo lo que tengo son imágenes solo de números y sobre una superficie gris. Entonces me gustaría poder entrenar a mi “modelo” para que solo muestre como posible salida números y siempre en un fondo gris. Aun asi, muchas gracias por la recomendación Jesús Enviado desde

¿Está R perdiendo la batalla?

2017 Jan 15

¿Está R perdiendo la batalla?

Hace poco me puse al tema del big data y la verdad es que een este campo la decisión parece clara. Python ahora mismo está un paso por delante de R, aunque sparklyR puede igualar la contienda. Pero lo que me empieza a preocupar es que parece que si nos alejamos del Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está perdiendo R la batalla? [[alternative HTML version deleted]]

Random ping jumps

2004 Jan 07

Random ping jumps

Hello, I''ve got this problem. There is an linux server with 2.4.24 kernel and pinging from him to internet (or from lan) ping randomly jumps up: 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=387 ttl=59 time=30.0 ms 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=388 ttl=59 time=32.6 ms 64 bytes from fortas.ktu.lt (193.219.160.131): icmp_seq=389 ttl=59 time=34.9 ms

Minor annoyances: Samba 3.0.2/Win2k and WinXP

2004 Dec 06

Minor annoyances: Samba 3.0.2/Win2k and WinXP

I have three users that are having trouble with my Samba network. This trouble is composed of two (possibly distinct) issues. My network is controlled by a Red Hat ES 3 server running Samba 3.0.2 with an LDAP backend. Issue 1: Laptop users, with "Offline Files" that are made of their "My Documents" directories. These directories are stored on the Samba server (so they can

Big data con R

2017 Jan 04

Big data con R

Hola. Últimamente ha habido en la lista varios hilos sobre análisis de grandes volúmenes de datos con R. Las alternativas que se han mencionado son: - Usar una máquina más potente, vía Amazon Web Services, por ejemplo - Paralelización con openMp - h2o y su paquete para R, - Paquete sparklyr como wrapper de los algoritmos de spark, Y por supuesto, utilizar muestreo o incluso si tenemos

bold face labelling/expression

2005 Jan 17

bold face labelling/expression

Dear colleagues, I have a great problem in using "expression" for axes labels. I want the labels in bold face (i.e.: par(font.lab=2)). When typing boxplot(y ~ groups, names = "" , xlab = "", ylab = "", axes = F) axis(side=1, at=c(1,2), xlab=c(expression(H[2]*O),"others")), I do not get a bold face labelling. Does anyone know, how I could

CV en R

2017 Jun 04

CV en R

Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más. En tu pseudo-código mezclas algoritmos supervisados y no-supervisados. Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O. Saludos, Carlos Ortega www.qualityexcellence.es El 4 de junio de 2017,

factor differences in anova

2003 Apr 14

factor differences in anova

Hello, (maybe a quite basic statistical question, but I'm just struggling with it) I'm doing an anova: > Res1<-aov(H2O~location+topo+horizon+pF+Error(location:topo:horizon)) (water retention of soils) which gives a significant difference at factor "location". Which function should I use to now which locations (there are 3: A, B and C) differ significantly and which do

SVM hadoop

2015 Dec 11

SVM hadoop

Hola Mª Luz, Te cuento un poco mi visión: Lo primero de todo es tener claro qué quiero hacer exactamente en paralelo, se me ocurren 3 escenarios: (1) Aplicar un modelo en este caso SVM sobre unos datos muy grandes y por eso necesito hadoop/spark (2) Realizar muchos modelos SVM sobre datos pequeños (por ejemplo uno por usuario) y por eso necesito hadoop/spark para parelilizar estos procesos

Problems with Acer netbook freezing on syslinux bootup

2012 Dec 05

Problems with Acer netbook freezing on syslinux bootup

Hi! I'm not a programmer, so I will try and be as clear as I can. I currently have an Acer Aspire One which has issues with syslinux 4.06 When I try and make a usb bootable install key using common automated programs under windows (Universal USB installer from Pendrivelinux, LiLi and unetbootin), they all fail when booted on the netbook. Now, I know it's an issue with syslinux for many

similar to: Big datasheet