search for: paralelizar

Displaying 12 results from an estimated 12 matches for "paralelizar".

2017 Aug 13
2
Paralelizar el cálculo de distancias
Buenas, Quiero ver si he paralelizado correctamente el proceso. Tengo dos dataframes, A y B y quiero calcular la distancia euclídea de todas las filas de A sobre todas las filas de B. Para ello he hecho lo siguiente #cargo las librerias library(foreach) library(doParallel) #establezco el numero de clusters, en mi caso 4, ya que el procesador tiene 4 nucleos cl<-makeCluster(4)
2015 Dec 11
2
SVM hadoop
...edes usar R y cualquier paquete que incluya SVM. Si esto no te vale y quieres hacerlo sobre el total de los datos (En mi opinión esto no garantiza que vayas a conseguir mejores resultados..). Por lo que estuve investigando (si me equivoco que alguien me corrija!) los SVM no son de lo mejorcito para paralelizar, Spark como comentó Carlos tiene implementado SVM lineal pero hoy por hoy no lo podrás ejecutar desde R (si desde python). Otras opciones que te recomiendo es probar con otros algoritmos, mira por ejemplo h2o (http://h2o.ai/) (2) Con esto te vale perfectamente RHADOOP y cualquier svm implementado...
2015 Dec 10
2
SVM hadoop
...ficiente porque mi > objetivo es trabajar con big data > > El 10 de diciembre de 2015, 13:23, Carlos Ortega <cof en qualityexcellence.es > > escribió: > >> Hola, >> >> ¿Y no te valdría el ejecutar tu código con "caret" y activar la opción de >> paralelizar?. >> El escenario "caret + paralelización + svm" funciona sin problemas. >> >> Adjunto una captura de pantalla del libro de "Kuhn" (Applied Predictive >> Modeling) con los tiempos de ejecución que se obtienen al ejecutar >> diferentes modelos (SVM,...
2012 Oct 02
0
duda snowfall: "Error in cut.default(i, breaks) : 'breaks' are not unique"
Hola: Soy bastante novato en el mundillo de la paralelización en R, y desde hace unos meses que uso Snowfall (con R 2.15.1 sobre GNU/Linux 64 bits) para paralelizar un script (por ahora usando las diferentes cpu''s de un servidor del trabajo; en un futuro, para lanzar el script en un cluster, etc.) La cosa es que después de "refactorizar" (¿se dice así en castellano?) el código para dejarlo un poco más limpio, he puesto diversas variables...
2015 Dec 10
3
SVM hadoop
Estimados Un día leí algo en el siguiente hipervínculo, pero nunca lo use. http://blog.revolutionanalytics.com/2015/06/using-hadoop-with-r-it-depends.html Javier Rubén Marcuzzi De: Carlos J. Gil Bellosta Enviado: miércoles, 9 de diciembre de 2015 14:33 Para: MªLuz Morales CC: r-help-es Asunto: Re: [R-es] SVM hadoop No, no correrán en paralelo si usas los SVM de paquetes como e1071. No
2019 Feb 07
6
Optimización identificación de casos similares
Buen día a todos, Agradezco su ayuda con lo siguiente: Tengo 100.000 registros con nombres de personas con su respectivo número de documento, quiero identificar casos que tengan un porcentaje de igualdad alto, no del 100% porque ya esos los tengo identificados, sino casos como por ejemplo: Nombre: Juan Pérez Documento: 123456789 Nombre: Juan Pérez Documento: 1234056789 Este caso sería una
2016 Apr 12
2
Procesos paralelos
...la solucion. Utilizo R en muchos procesos ETL y la cuestión es que me encuentro con que tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces millones de registros) que mientras R las realiza parece que no está haciendo nada. La solución que conseguí hacer en su momento fue paralelizar el proceso de inserción en dos procesos distintos usando el paquete snowfall. -Un proceso se encargaba de la propia inserción de los datos. -El otro proceso mostraba una barra de progreso que se construía consultando la tabla (tab) donde se insertaban los registros (datos) para monitorizar su proce...
2012 Oct 04
0
Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada
...efault(i, breaks) :     ''breaks'' are not unique" Message-ID: <506AFA87.3060406@vhir.org> Content-Type: text/plain Hola: Soy bastante novato en el mundillo de la paralelización en R, y desde hace unos meses que uso Snowfall (con R 2.15.1 sobre GNU/Linux 64 bits) para paralelizar un script (por ahora usando las diferentes cpu''s de un servidor del trabajo; en un futuro, para lanzar el script en un cluster, etc.) La cosa es que después de "refactorizar" (¿se dice así en castellano?) el código para dejarlo un poco más limpio, he puesto diversas variables...
2016 Sep 15
2
Opinion/discusion segundo lenguaje
...a usar (más profundamente) Python. Luego en intercambio de opiniones con otros compañeros ya me surgen las dudas. ¿Para que? Entiendo que R puede ser medio lerdo en algunas cosas pero con el desarrollo que ha tenido y mantiene muchas de sus limitaciones se han ido salvando y hay paquetes para paralelizar, vectorizar, etc que lo hacen cada vez más ágil. Sabiendo que en la lista hay muchos "poliglotas", ¿ustedes que opinan?, ¿vale la pena entrar en un lenguaje nuevo o continuar profundizando en R? Si vale la pena python, ¿en que cosas? ¿Archivos grandes? ¿Algún proceso en particular que...
2011 Mar 01
6
usar multiples procesadores en R
Hola a tod en s, estoy realizando unas operaciones con muchos datos con el paquete "vegan", concretamente la función "metaMDS" y me gustaría saber si puedo usar más de un procesador a la vez para acelerar los cálculos. He visto el paquete "multicore" pero no sé usarlo, ¿alguien lo ha usado para algo así? Gracias y saludos, Javier -- http://oikos.inf.um.es
2016 Apr 12
2
Procesos paralelos
...> Utilizo R en muchos procesos ETL y la cuesti?n es que me encuentro con que tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces millones de registros) que mientras R las realiza parece que no est? haciendo nada. > > La soluci?n que consegu? hacer en su momento fue paralelizar el proceso de inserci?n en dos procesos distintos usando el paquete snowfall. > -Un proceso se encargaba de la propia inserci?n de los datos. > -El otro proceso mostraba una barra de progreso que se constru?a consultando la tabla (tab) donde se insertaban los registros (datos) para monitoriza...
2016 Apr 12
2
Procesos paralelos
...esos ETL y la cuesti n es que me encuentro con que > tengo que hacer inserts en un BBDD de SQL Server de varios miles (a veces > millones de registros) que mientras R las realiza parece que no est haciendo > nada. > > > > La soluci n que consegu hacer en su momento fue paralelizar el proceso de > inserci n en dos procesos distintos usando el paquete snowfall. > > -Un proceso se encargaba de la propia inserci n de los datos. > > -El otro proceso mostraba una barra de progreso que se constru a > consultando la tabla (tab) donde se insertaban los registros...