thr3ads.net - similar to: "Trabajar con un dataset muy grande"

Displaying 20 results from an estimated 2000 matches similar to: "Trabajar con un dataset muy grande"

2015 Apr 29

cantidad de datos

Estimados Creo que se puede presentar un problema con el sistema operativo, al ser de 32 bit si no recuerdo mal soporta hasta 4 GB, aunque no estoy del todo seguro. Los 292 GB que informa Carlos son una enormidad, esos requerimientos son complicados. ¿Qué posibilidad hay de trabajar con memoria virtual en windows? Aunque me parece que no sería optimo, prefiero intentar en Linux y R. Su

cantidad de datos

2015 Apr 29

cantidad de datos

Estimados dos consultas. -Debo de trabajar con 280,000.00 casos y 20 variables. Quisiera saber si el programa soporta sin ningún inconveniente análisis cluster y discriminantes, así como análisis uni variados y bi variados. -Cuando se grafica un dendograma como puedo hacer para que todas las líneas de los casos, partan desde el X, porque cuando se genera se visualiza bien desordenado (unas líneas

cantidad de datos

2015 Apr 29

cantidad de datos

Bueno mi máquina es: HP Windows 7 Procesador Core I5 de 2.5 GHz 4 GB de Ram (2.94 GB utilizables) Sistema operativo de 32 bits Versión de R, 3.2.0 Atte. Ricardo Alva Valiente Analista de Control Preventivo Unidad de Prevención Of. Recuperaciones ? CC Boulevard Chiclayo '(074) 232740 RPC 978194441 RPM *157793 ?riav en cajatrujillo.com.pe

Optimización identificación de casos similares

2019 Feb 07

Optimización identificación de casos similares

Buen día a todos, Agradezco su ayuda con lo siguiente: Tengo 100.000 registros con nombres de personas con su respectivo número de documento, quiero identificar casos que tengan un porcentaje de igualdad alto, no del 100% porque ya esos los tengo identificados, sino casos como por ejemplo: Nombre: Juan Pérez Documento: 123456789 Nombre: Juan Pérez Documento: 1234056789 Este caso sería una

cantidad de datos

2015 Apr 29

cantidad de datos

Hola. Yo en vez de utilizar análisis cluster que impliquen distancias, probaría con un kmedias o con un pam (partition around medoids) pero utilizando muestras, la función clara de la librería cluster puede ayudarte. Pego el details de la ayuda de 'clara' Details clara is fully described in chapter 3 of Kaufman and Rousseeuw (1990). Compared to other partitioning methods such as pam,

R SE QUEDA PEGADO e imposibilitado de trabajar.

2016 Sep 05

R SE QUEDA PEGADO e imposibilitado de trabajar.

Hola Carlos: -Mira, mi máquina es nueva, con 16 giga de memoria Ram, así que no creo que sea problema de recursos -En general me pasa esto cuando despliego un Plot. (Después que me paro y vuelvo a mi escritorio, pasado 15 min) el plot se deforma en la pantalla y después al eliminarlo se queda pegado. -Me pasa sobre Rstudio. -Windows 7 PROF. De: Carlos Ortega [mailto:cof en qualityexcellence.es]

cantidad de datos

2015 Apr 29

cantidad de datos

El inconveniente con un K-medias, es que se tiene que se tiene que pre definir el número de segmentos, pero eso es algo con lo q no cuento. La solución de Javier me parece q sería la única opción. Atte. Ricardo Alva Valiente -----Mensaje original----- De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de javier.ruben.marcuzzi en gmail.com Enviado el: miércoles, 29 de abril de

cantidad de datos

2015 Apr 29

cantidad de datos

Buen aporte?excelente!! Atte. Ricardo Alva Valiente De: Jose Luis Cañadas Reche [mailto:canadasreche en gmail.com] Enviado el: miércoles, 29 de abril de 2015 12:51 PM Para: Alva Valiente, Ricardo (RIAV); 'javier.ruben.marcuzzi en gmail.com'; R-help-es en r-project.org Asunto: Re: [R-es] cantidad de datos Podrías hacer varios kmedias con diferente número de clusters y comprobar como

Problema con un xml demasiado Grande

2017 Jan 20

Problema con un xml demasiado Grande

Hola, muy buenas, Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce alguna forma de cargar solo ese campo del xml en R sin cargar el xml completo? La salida seria un archivo .txt, donde cada fila fuera un artículo ó

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Ortega Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay

R SE QUEDA PEGADO e imposibilitado de trabajar.

2016 Sep 05

R SE QUEDA PEGADO e imposibilitado de trabajar.

Estimados: Tengo problemas con mi programa R. Cada vez que dejo stand-by mi compu por unos minutos, R se queda pegado, e imposibilitado de trabajar, lo que me obliga a cerrarlo y volver a abrirlo cada vez que sucede. De: Carlos Ortega [mailto:cof en qualityexcellence.es] Enviado el: miércoles, 31 de agosto de 2016 3:49 Para: javier valdes CC: Javier Valdes Cantallopts (DGA); r-help-es en

vegdist Error en double(N * (N - 1)/2) : tama?o del vector especificado es muy grande

2013 Feb 08

vegdist Error en double(N * (N - 1)/2) : tama?o del vector especificado es muy grande

---------- Forwarded message ---------- From: <r-help-owner@r-project.org> Date: 2013/2/8 Subject: vegdist Error en double(N * (N - 1)/2) : tama?o del vector especificado es muy grande To: caro.bello58@gmail.com Message rejected by filter rule match ---------- Mensaje reenviado ---------- From: caro bello <caro.bello58@gmail.com> To: r-help@r-project.org Cc: Date: Fri, 8 Feb 2013

ORACLE SQL/ LEER DATOS EN R

2017 Dec 06

ORACLE SQL/ LEER DATOS EN R

Con oracle puedes usar, si tu máquina es de 64bits la librería Roracle que va muy bien y no es muy complicada de instalar. Hay que distinguir 2 cosas, cuando accedes a la base de datos y allí haces la consulta, eso da igual si lo haces con RODBC o Roracle y cuando cargas los datos en tu data.frame, en esta operación, ya no está usando el gestor de base de datos sino tu propio R. La velocidad y

usar multiples procesadores en R

2011 Mar 01

usar multiples procesadores en R

Hola a tod en s, estoy realizando unas operaciones con muchos datos con el paquete "vegan", concretamente la función "metaMDS" y me gustaría saber si puedo usar más de un procesador a la vez para acelerar los cálculos. He visto el paquete "multicore" pero no sé usarlo, ¿alguien lo ha usado para algo así? Gracias y saludos, Javier -- http://oikos.inf.um.es

Importar grandes volumenes de datos

2013 Jan 24

Importar grandes volumenes de datos

Hola tod@s Estoy subiendo información pero esta es extensa y R no me permite tengo 18''000.000 de registros con 30 campos, alguien puede indicarme como subir esta informacion o no es posible? Gracias por su ayuda [[alternative HTML version deleted]]

Alto rendimiento

2016 Oct 11

Alto rendimiento

Estimado Carlos Gil Bellosta ¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla. Ahora en R. En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría

escribir modelo libreria e1071 en un archivo

2011 Sep 22

escribir modelo libreria e1071 en un archivo

Hola a todos, Estoy utilizando la libreria e1071 para clasificar unos datos. Me gustaría poder guardar los modelos en el disco duro y no en memoria de R. He visto que hay una función: save : que guarda el modelo en memoria y load: que carga ese modelo Ejemplo: #saving the best model save(calibrate.rf.model1, file=''bestmodel.rda'') #loading the best model

ORACLE SQL/ LEER DATOS EN R

2017 Dec 06

ORACLE SQL/ LEER DATOS EN R

Estimados usuarios de R Buenos días a todos los usuarios. Estamos intentando abrir una base de datos de ORACLE en R. Es una base de datos muy grande con datos inviduales sobre empleo de los individuos y sus caracteristicas. He echado un vistazo a https://www.r-bloggers.com/connecting-r-to-an-oracle-database/,y aparecen algunas instrucciones y el paquete RODBC. Alguien tiene experiencia con estas

STATA base de datos

2017 Dec 06

STATA base de datos

Estimados Pienso que falta memoria, aparte de las sugerencias ya aportadas, de pronto se podrían colocar algunos rm(liberar_de_memoria), para no tener ocupado espacio que no es requerido porque ese paso ya fue realizado. Javier Rubén Marcuzzi El 6 de diciembre de 2017, 13:58, Antonio Rodriguez Andres < antoniorodriguezandres70 en gmail.com> escribió: > Carlos > He tecleado lo

STATA base de datos

2017 Dec 06

STATA base de datos

OK. Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo que quieras). Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de memoria. Y comienza una nueva sesión con RStudio cargando los datos con "fread()". Por otro lado, este conjunto de datos ¿cómo es de grande (filas y columnas)?. ¿Y qué máquina tienes?. ¿Cuanta RAM tienes?. Gracias, Carlos.

similar to: Trabajar con un dataset muy grande