similar to: Trabajar con un dataset muy grande

Displaying 20 results from an estimated 2000 matches similar to: "Trabajar con un dataset muy grande"

2015 Apr 29
2
cantidad de datos
Estimados Creo que se puede presentar un problema con el sistema operativo, al ser de 32 bit si no recuerdo mal soporta hasta 4 GB, aunque no estoy del todo seguro. Los 292 GB que informa Carlos son una enormidad, esos requerimientos son complicados. ¿Qué posibilidad hay de trabajar con memoria virtual en windows? Aunque me parece que no sería optimo, prefiero intentar en Linux y R. Su
2015 Apr 29
2
cantidad de datos
Estimados dos consultas. -Debo de trabajar con 280,000.00 casos y 20 variables. Quisiera saber si el programa soporta sin ningún inconveniente análisis cluster y discriminantes, así como análisis uni variados y bi variados. -Cuando se grafica un dendograma como puedo hacer para que todas las líneas de los casos, partan desde el X, porque cuando se genera se visualiza bien desordenado (unas líneas
2015 Apr 29
2
cantidad de datos
Bueno mi máquina es: HP Windows 7 Procesador Core I5 de 2.5 GHz 4 GB de Ram (2.94 GB utilizables) Sistema operativo de 32 bits Versión de R, 3.2.0 Atte. Ricardo Alva Valiente Analista de Control Preventivo Unidad de Prevención Of. Recuperaciones ? CC Boulevard Chiclayo '(074) 232740 RPC 978194441 RPM *157793 ?riav en cajatrujillo.com.pe
2015 Apr 29
2
cantidad de datos
Hola. Yo en vez de utilizar análisis cluster que impliquen distancias, probaría con un kmedias o con un pam (partition around medoids) pero utilizando muestras, la función clara de la librería cluster puede ayudarte. Pego el details de la ayuda de 'clara' Details clara is fully described in chapter 3 of Kaufman and Rousseeuw (1990). Compared to other partitioning methods such as pam,
2019 Feb 07
6
Optimización identificación de casos similares
Buen día a todos, Agradezco su ayuda con lo siguiente: Tengo 100.000 registros con nombres de personas con su respectivo número de documento, quiero identificar casos que tengan un porcentaje de igualdad alto, no del 100% porque ya esos los tengo identificados, sino casos como por ejemplo: Nombre: Juan Pérez Documento: 123456789 Nombre: Juan Pérez Documento: 1234056789 Este caso sería una
2016 Sep 05
4
R SE QUEDA PEGADO e imposibilitado de trabajar.
Hola Carlos: -Mira, mi máquina es nueva, con 16 giga de memoria Ram, así que no creo que sea problema de recursos -En general me pasa esto cuando despliego un Plot. (Después que me paro y vuelvo a mi escritorio, pasado 15 min) el plot se deforma en la pantalla y después al eliminarlo se queda pegado. -Me pasa sobre Rstudio. -Windows 7 PROF. De: Carlos Ortega [mailto:cof en qualityexcellence.es]
2015 Apr 29
2
cantidad de datos
El inconveniente con un K-medias, es que se tiene que se tiene que pre definir el número de segmentos, pero eso es algo con lo q no cuento. La solución de Javier me parece q sería la única opción. Atte. Ricardo Alva Valiente -----Mensaje original----- De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de javier.ruben.marcuzzi en gmail.com Enviado el: miércoles, 29 de abril de
2015 Apr 29
2
cantidad de datos
Buen aporte?excelente!! Atte. Ricardo Alva Valiente De: Jose Luis Cañadas Reche [mailto:canadasreche en gmail.com] Enviado el: miércoles, 29 de abril de 2015 12:51 PM Para: Alva Valiente, Ricardo (RIAV); 'javier.ruben.marcuzzi en gmail.com'; R-help-es en r-project.org Asunto: Re: [R-es] cantidad de datos Podrías hacer varios kmedias con diferente número de clusters y comprobar como
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Ortega Comprendo que hay que tener el paquete compilado para acceder al alto rendimiento, por lo cuál si está todo preparado para trabajar en un clúster y para aprovechar múltiples hilos, no habría problemas, calculo que si una librería no tiene esa tecnología no traería inconvenientes, ¿o por el contrario si está distribuido crea varias instancias y al correr separadas hay
2016 Sep 05
2
R SE QUEDA PEGADO e imposibilitado de trabajar.
Estimados: Tengo problemas con mi programa R. Cada vez que dejo stand-by mi compu por unos minutos, R se queda pegado, e imposibilitado de trabajar, lo que me obliga a cerrarlo y volver a abrirlo cada vez que sucede. De: Carlos Ortega [mailto:cof en qualityexcellence.es] Enviado el: miércoles, 31 de agosto de 2016 3:49 Para: javier valdes CC: Javier Valdes Cantallopts (DGA); r-help-es en
2011 Mar 01
6
usar multiples procesadores en R
Hola a tod en s, estoy realizando unas operaciones con muchos datos con el paquete "vegan", concretamente la función "metaMDS" y me gustaría saber si puedo usar más de un procesador a la vez para acelerar los cálculos. He visto el paquete "multicore" pero no sé usarlo, ¿alguien lo ha usado para algo así? Gracias y saludos, Javier -- http://oikos.inf.um.es
2016 Oct 11
2
Alto rendimiento
Estimado Carlos Gil Bellosta ¿Cómo está usted? En estos lados de América del sur comienza la primavera, desde la ventana miro la parra contando las posibles uvas, siempre aparece un ave que se arrima a la ventana o incluso llegan hasta la computadora como si supiesen usarla. Ahora en R. En ese esquema un modelo lineal tendría que ir con mlib que es aportada por sparklyr, en ese caso tendría
2017 Dec 06
2
ORACLE SQL/ LEER DATOS EN R
Con oracle puedes usar, si tu máquina es de 64bits la librería Roracle que va muy bien y no es muy complicada de instalar. Hay que distinguir 2 cosas, cuando accedes a la base de datos y allí haces la consulta, eso da igual si lo haces con RODBC o Roracle y cuando cargas los datos en tu data.frame, en esta operación, ya no está usando el gestor de base de datos sino tu propio R. La velocidad y
2013 Jan 24
2
Importar grandes volumenes de datos
Hola tod@s   Estoy subiendo información pero esta es extensa y R no me permite tengo 18''000.000  de registros con 30 campos, alguien puede indicarme como subir esta informacion o no es posible?   Gracias por su ayuda [[alternative HTML version deleted]]
2017 Jan 20
4
Problema con un xml demasiado Grande
Hola, muy buenas, Me bajé un archivo xml de la wikipedia en español. Al intentar abrirlo en R el ordenador no es capaz, ya que pesa descomprimido 10 GB. De ese xml solo me interesa un campo, el referente al texto del artículo. ¿Alguiém conoce alguna forma de cargar solo ese campo del xml en R sin cargar el xml completo? La salida seria un archivo .txt, donde cada fila fuera un artículo ó
2013 Feb 08
1
vegdist Error en double(N * (N - 1)/2) : tama?o del vector especificado es muy grande
---------- Forwarded message ---------- From: <r-help-owner@r-project.org> Date: 2013/2/8 Subject: vegdist Error en double(N * (N - 1)/2) : tama?o del vector especificado es muy grande To: caro.bello58@gmail.com Message rejected by filter rule match ---------- Mensaje reenviado ---------- From: caro bello <caro.bello58@gmail.com> To: r-help@r-project.org Cc: Date: Fri, 8 Feb 2013
2017 Dec 06
3
STATA base de datos
Estimados Pienso que falta memoria, aparte de las sugerencias ya aportadas, de pronto se podrían colocar algunos rm(liberar_de_memoria), para no tener ocupado espacio que no es requerido porque ese paso ya fue realizado. Javier Rubén Marcuzzi El 6 de diciembre de 2017, 13:58, Antonio Rodriguez Andres < antoniorodriguezandres70 en gmail.com> escribió: > Carlos > He tecleado lo
2017 Jun 22
2
Ayuda R no puede hubicar un vector de 42gb
http://go.cloudera.com/ml-h20-es-webinar?src=email1&elqTrackId=af5517eab2f543afbb31a0686d9ca566&elq=c68d9a8c25ba4b12944b8065d8a06e33&elqaid=4541&elqat=1&elqCampaignId= El 22 de junio de 2017, 22:59, Carlos Ortega <cof en qualityexcellence.es> escribió: > Hola, > > Tendrás RStudioServer en un nodo frontera de tu clúster. Y cuando lees > algo te lo estás
2017 Dec 06
2
ORACLE SQL/ LEER DATOS EN R
Estimados usuarios de R Buenos días a todos los usuarios. Estamos intentando abrir una base de datos de ORACLE en R. Es una base de datos muy grande con datos inviduales sobre empleo de los individuos y sus caracteristicas. He echado un vistazo a https://www.r-bloggers.com/connecting-r-to-an-oracle-database/,y aparecen algunas instrucciones y el paquete RODBC. Alguien tiene experiencia con estas
2017 Dec 06
3
STATA base de datos
OK. Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo que quieras). Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de memoria. Y comienza una nueva sesión con RStudio cargando los datos con "fread()". Por otro lado, este conjunto de datos ¿cómo es de grande (filas y columnas)?. ¿Y qué máquina tienes?. ¿Cuanta RAM tienes?. Gracias, Carlos.