Displaying 12 results from an estimated 12 matches for "paralelizar".
2017 Aug 13
2
Paralelizar el cálculo de distancias
Buenas,
Quiero ver si he paralelizado correctamente el proceso. Tengo dos dataframes, A y B y quiero calcular la distancia euclídea de todas las filas de A sobre todas las filas de B. Para ello he hecho lo siguiente
#cargo las librerias
library(foreach)
library(doParallel)
#establezco el numero de clusters, en mi caso 4, ya que el procesador tiene 4 nucleos
cl<-makeCluster(4)
2015 Dec 11
2
SVM hadoop
...edes usar R y cualquier paquete que
incluya SVM. Si esto no te vale y quieres hacerlo sobre el total de los
datos (En mi opinión esto no garantiza que vayas a conseguir mejores
resultados..). Por lo que estuve investigando (si me equivoco que alguien
me corrija!) los SVM no son de lo mejorcito para paralelizar, Spark como
comentó Carlos tiene implementado SVM lineal pero hoy por hoy no lo podrás
ejecutar desde R (si desde python). Otras opciones que te recomiendo es
probar con otros algoritmos, mira por ejemplo h2o (http://h2o.ai/)
(2) Con esto te vale perfectamente RHADOOP y cualquier svm implementado...
2015 Dec 10
2
SVM hadoop
...ficiente porque mi
> objetivo es trabajar con big data
>
> El 10 de diciembre de 2015, 13:23, Carlos Ortega <cof en qualityexcellence.es
> > escribió:
>
>> Hola,
>>
>> ¿Y no te valdría el ejecutar tu código con "caret" y activar la opción de
>> paralelizar?.
>> El escenario "caret + paralelización + svm" funciona sin problemas.
>>
>> Adjunto una captura de pantalla del libro de "Kuhn" (Applied Predictive
>> Modeling) con los tiempos de ejecución que se obtienen al ejecutar
>> diferentes modelos (SVM,...
2012 Oct 02
0
duda snowfall: "Error in cut.default(i, breaks) : 'breaks' are not unique"
Hola:
Soy bastante novato en el mundillo de la paralelización en R, y desde
hace unos meses que uso Snowfall (con R 2.15.1 sobre GNU/Linux 64 bits)
para paralelizar un script (por ahora usando las diferentes cpu''s de un
servidor del trabajo; en un futuro, para lanzar el script en un cluster,
etc.)
La cosa es que después de "refactorizar" (¿se dice así en castellano?)
el código para dejarlo un poco más limpio, he puesto diversas variables...
2015 Dec 10
3
SVM hadoop
Estimados
Un día leí algo en el siguiente hipervínculo, pero nunca lo use.
http://blog.revolutionanalytics.com/2015/06/using-hadoop-with-r-it-depends.html
Javier Rubén Marcuzzi
De: Carlos J. Gil Bellosta
Enviado: miércoles, 9 de diciembre de 2015 14:33
Para: MªLuz Morales
CC: r-help-es
Asunto: Re: [R-es] SVM hadoop
No, no correrán en paralelo si usas los SVM de paquetes como e1071.
No
2019 Feb 07
6
Optimización identificación de casos similares
Buen día a todos,
Agradezco su ayuda con lo siguiente:
Tengo 100.000 registros con nombres de personas con su respectivo número de
documento, quiero identificar casos que tengan un porcentaje de igualdad
alto, no del 100% porque ya esos los tengo identificados, sino casos como
por ejemplo:
Nombre: Juan Pérez Documento: 123456789
Nombre: Juan Pérez Documento: 1234056789
Este caso sería una
2016 Apr 12
2
Procesos paralelos
...la solucion.
Utilizo R en muchos procesos ETL y la cuestión es que me encuentro con que tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces millones de registros) que mientras R las realiza parece que no está haciendo nada.
La solución que conseguí hacer en su momento fue paralelizar el proceso de inserción en dos procesos distintos usando el paquete snowfall.
-Un proceso se encargaba de la propia inserción de los datos.
-El otro proceso mostraba una barra de progreso que se construía consultando la tabla (tab) donde se insertaban los registros (datos) para monitorizar su proce...
2012 Oct 04
0
Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada
...efault(i, breaks) :
''breaks'' are not unique"
Message-ID: <506AFA87.3060406@vhir.org>
Content-Type: text/plain
Hola:
Soy bastante novato en el mundillo de la paralelización en R, y desde
hace unos meses que uso Snowfall (con R 2.15.1 sobre GNU/Linux 64 bits)
para paralelizar un script (por ahora usando las diferentes cpu''s de un
servidor del trabajo; en un futuro, para lanzar el script en un cluster,
etc.)
La cosa es que después de "refactorizar" (¿se dice así en castellano?)
el código para dejarlo un poco más limpio, he puesto diversas variables...
2016 Sep 15
2
Opinion/discusion segundo lenguaje
...a
usar (más profundamente) Python. Luego en intercambio de opiniones con
otros compañeros ya me surgen las dudas. ¿Para que?
Entiendo que R puede ser medio lerdo en algunas cosas pero con el
desarrollo que ha tenido y mantiene muchas de sus limitaciones se han
ido salvando y hay paquetes para paralelizar, vectorizar, etc que lo
hacen cada vez más ágil.
Sabiendo que en la lista hay muchos "poliglotas", ¿ustedes que opinan?,
¿vale la pena entrar en un lenguaje nuevo o continuar profundizando en R?
Si vale la pena python, ¿en que cosas? ¿Archivos grandes? ¿Algún proceso
en particular que...
2011 Mar 01
6
usar multiples procesadores en R
Hola a tod en s,
estoy realizando unas operaciones con muchos datos con el paquete
"vegan", concretamente la función "metaMDS" y me gustaría saber si
puedo usar más de un procesador a la vez para acelerar los cálculos.
He visto el paquete "multicore" pero no sé usarlo, ¿alguien lo ha
usado para algo así?
Gracias y saludos,
Javier
--
http://oikos.inf.um.es
2016 Apr 12
2
Procesos paralelos
...> Utilizo R en muchos procesos ETL y la cuesti?n es que me encuentro con que tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces millones de registros) que mientras R las realiza parece que no est? haciendo nada.
>
> La soluci?n que consegu? hacer en su momento fue paralelizar el proceso de inserci?n en dos procesos distintos usando el paquete snowfall.
> -Un proceso se encargaba de la propia inserci?n de los datos.
> -El otro proceso mostraba una barra de progreso que se constru?a consultando la tabla (tab) donde se insertaban los registros (datos) para monitoriza...
2016 Apr 12
2
Procesos paralelos
...esos ETL y la cuesti n es que me encuentro con que
> tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces
> millones de registros) que mientras R las realiza parece que no est haciendo
> nada.
> >
> > La soluci n que consegu hacer en su momento fue paralelizar el proceso de
> inserci n en dos procesos distintos usando el paquete snowfall.
> > -Un proceso se encargaba de la propia inserci n de los datos.
> > -El otro proceso mostraba una barra de progreso que se constru a
> consultando la tabla (tab) donde se insertaban los registros...