Displaying 20 results from an estimated 300 matches similar to: "Leer parquet files desde R"
2017 Oct 04
Leer parquet files desde R
Hola Carlos.
spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado
para leer el fichero de parquet.
El mié., 4 oct. 2017 22:11, Carlos Ortega <cof en qualityexcellence.es>
> Hola José Luis,
> ¿Has probado directamente con "dplyr"?...
> spark_read_parquet
2017 Aug 28
GFID attir is missing after adding large amounts of data
Hi Cluster Community,
we are seeing some problems when adding multiple terrabytes of data to a 2 node replicated GlusterFS installation.
The version is 3.8.11 on CentOS 7.
The machines are connected via 10Gbit LAN and are running 24/7. The OS is virtualized on VMWare.
After a restart of node-1 we see that the log files are growing to multiple Gigabytes a day.
Also there seem to be problems
2017 Aug 29
GFID attir is missing after adding large amounts of data
This is strange, a couple of questions:
1. What volume type is this? What tuning have you done? gluster v info output would be helpful here.
2. How big are your bricks?
3. Can you write me a quick reproducer so I can try this in the lab? Is it just a single multi TB file you are untarring or many? If you give me the steps to repro, and I hit it, we can get a bug open.
4. Other than
2017 Sep 01
GFID attir is missing after adding large amounts of data
I re-added gluster-users to get some more eye on this.
----- Original Message -----
> From: "Christoph Sch?bel" <christoph.schaebel at dc-square.de>
> To: "Ben Turner" <bturner at redhat.com>
> Sent: Wednesday, August 30, 2017 8:18:31 AM
> Subject: Re: [Gluster-users] GFID attir is missing after adding large amounts of data
> Hello Ben,
2017 Jul 27
GFID is null after adding large amounts of data
Hi Cluster Community,
we are seeing some problems when adding multiple terrabytes of data to a 2 node replicated GlusterFS installation.
The version is 3.8.11 on CentOS 7.
The machines are connected via 10Gbit LAN and are running 24/7. The OS is virtualized on VMWare.
After a restart of node-1 we see that the log files are growing to multiple Gigabytes a day.
Also there seem to be problems
2024 Dec 16
rerddap v1.2.0
I am pleased to announce that rerddap v1.2.0 is now on CRAN. The major changes are that 'tabledap()' now has the option to download the data as parquet files if the ERDDAP server is at least version 2.25, and the data frame created by 'tabledap()' now has the units as attributes. There are also several minor bug fixes. The changes in 'tabledap()' should not affect any
2016 Oct 11
Alto rendimiento
En el sitio de https://www.rstudio.com/ hay un aviso sobre http://spark.rstudio.com/index.html ( sparklyr ).
Microsoft publico un artículo donde comparan el R Server que está dentro de SQL server (o por separado, depende un poco), o el Microsoft R, junto con algunas librerías que se pueden compilar y obtener lo mismo en Ubuntu.
Supongamos que tengo el dinero como para comprar por
2016 Oct 11
Alto rendimiento
Estimado Carlos Gil Bellosta
¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla.
Ahora en R.
En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría
2018 Mar 07
Reglas de asociación en un cluster Hadoop
Quizás no es el ámbito más apropiado, pero vale la pena intentar.
¿Existe alguna implementación en R del modelo de reglas de asociación que
pueda realizar el cálculo en paralelo sobre un cluster Hadoop?
He visto los paquetes que 'paralelizan' R, pero no mencionan nada acerca de
modelos de reglas de asociación.
Oscar Benitez
[[alternative HTML version deleted]]
2017 Jun 22
I am using Spark and the Sparklyr library in R.
I have a file with several lines. For example
awer.ttp.net Code 554
abcd.ttp.net Code 747
asdf.ttp.net Part 554
xyz.ttp.net Part 747
I want to split just column A of the table and I want a new row added to the table D, with values awe, abcd, asdf, and xyz. I am trying to use a command in
2016 Oct 11
Alto rendimiento
Estimado Carlos Ortega
Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay
2014 Feb 18
Leer el tipo de dato desde fichero
Otro tipo de ficheros estándar y estructurados es XML, que R puede importar
directamente con el paquete XML. Dependiendo de la interoperabilidad
necesaria, los metadatos pueden ir en el propio fichero o utlizar ficheros
DTD. Eso sí, es un poco más estricto y complicado que csv o JSON.
Un saludo,
Emilio L. Cano
Emilio L. Cano
2017 Jan 15
¿Está R perdiendo la batalla?
Hace poco me puse al tema del big data y la verdad es que een este campo la decisión parece clara. Python ahora mismo está un paso por delante de R, aunque sparklyR puede igualar la contienda.
Pero lo que me empieza a preocupar es que parece que si nos alejamos del Big Data, Python tb está ganando adeptos a pasos agigantados. ¿Está perdiendo R la batalla?
[[alternative HTML version deleted]]
2014 Aug 30
help: shiny leer ficheros desde google drive
Hola buenas,
Un compañero y yo estamos haciendo una aplicación shiny. Nos ha quedado
bastante aparente y en sevidor local (con R) funciona bastante bien. El
problema es que cuando cargamos los ficheros en la web deja de fucionar
¿Por qué? Pues porque al principio de la aplicacion cargamos unos datos de
nuestro ordenador y esto no es posible a la hora de poner los datos
ShinyApps.io (una de las
2020 Oct 14
Can anyone advise me on running R and Rstudio on an AWS virtual machine
This is a funny one and if it's off topic here, I would be grateful if I could be guided to where it would be on topic. I have done some searching but not very successfully so far.
Situation: I am doing some analyses of data that are stored in a postgres database in the AWS cloud and using the RJDBC and dplyr packages for the specifics of yanking the data to my own machine. They work and
2017 Jun 22
Rows are horizontal, columns are vertical.
You really need to spend some time with an R tutorial.
dta <- read.table( "yourfile", header=TRUE, as.is=TRUE )
dta2 <- dta
dta2$D <- c( "awe", "abcd", "asdf", "xyz" )
dta2 <- dta2[ , c( "A", "D" ) ]
Sent from my phone. Please excuse my brevity.
On June 22, 2017
2015 Apr 24
Codificación UTF-8 en un Mc
Hola, Emilio
Muchas gracias por la respuesta. El problema es que la otra persona no
sabe nada de R, e instalarle RStudio va a ser casi peor.
Además, parece que el origen es que tiene su Mac con configuración USA
por un tema de correos y fechas; así que creo que lo que necesitaría es
algo que cambie solo la configuración de la sesión de R a UTF-8 o algo
Quizás no es posible ....
2017 Aug 14
Statistical / data mining methods in R and not in SAS?
Hi, and sorry for asking such an unspecific question.
Does anybody know of statistical / data mining methods that are available in R
that are not in SAS ? With SAS I mean the SAS System Version 9.4 and SAS
Enterprise Miner. I don't expect a complete list, just two or three examples
or hints where and what to look for.
I found some older comparisons, and the R methods mentioned there
2014 Feb 17
Leer el tipo de dato desde fichero
Hola a todos,
Tengo un fichero CSV que se genera desde una aplicación, y que me gustaría
importar en R. El problema es que el fichero es "genérico", por lo que en
un principio no se muy bien el tipo de datos que me voy a encontrar. Desde
R se los mostraré al usuario para que decida sobre qué campos quiere hacer
qué análisis. Por tanto, en el propio CSV debería contener (en la cabecera,
2014 Jul 02
error al leer una linea desde un archivo de texto
A mi también me funciona para los dos casos:
> dat <- read.csv("d11-16.csv", header=FALSE, sep=",", dec=".", skip=11,
> dat
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1 masa total en µg 30.04633 ug PEAKS MUY PEQUENOS NA NA NA NA NA NA NA
> dat18 <- read.csv("d11-18.csv", header=FALSE,