search for: bigkmeans

Displaying 6 results from an estimated 6 matches for "bigkmeans".

2012 Feb 02
0
bigkmeans not parallel
I'm using bigkmeans in 'biganalytics' to cluster my 60,000 by 600,000 matrix. I'm using a 8 core Linux VM. I have register parallel backend with >registerDoMC() And I checked how many cores registered with >getDoParWorkers() It returns 8, which is the number of cores I have on my machine. And I r...
2012 Feb 20
1
bigmemory not really parallel
...eally big matrix that I want to run k-means on. I tried: >data <- read.big.memory('mydata.csv',type='double',backingfile='mydata.bin',descriptorfile='mydata.desc') I'm using doMC to register multicore. >library(doMC) >registerDoMC(cores=8) >ans<-bigkmeans(data,k) In system monitor, it seems only one thread running R. Is there anything I did wrong? Thanks in advance for any suggestions. Best, Lishu [[alternative HTML version deleted]]
2011 Aug 10
4
Clustering Large Applications..sort of
...ust trees with minimal spanning trees or perhaps hand-rolling a hierarchical k-medoids which works extremely efficiently and without cluster number assumptions. Anybody have any suggestions as to possible libraries which I have missed or suggestions in general? Note: this is not a question for 'Bigkmeans' unless there exists a 'findbigkmeansnumberofclusters' function also. Thank you in advance for your assistance, Ken [[alternative HTML version deleted]]
2013 Jul 26
1
variación en los resultados de k medias (Alfredo Alvarez)
...gle.es/search?q=kmeans+not+give+same+output+different+runs) es pasarle los centroides al algoritmo, pero esto no siempre -mejor dicho, raras veces- es factible. Otra cosa es el algoritmo kmeans que elijas, y aquí lanzo también una pregunta por si alguien lo conoce: probando el kmeans estándar y el bigkmeans de biganalytics (creedme que es una pequeña maravilla que divide el tiempo de ejecución por 2 ó 3 al menos, y permite manejar objetos que no caben en memoria -usando bigmemory), dan resultados muy diferentes. Lo que más me preocupa es el tamaño de los clusters, pero no veo por ninguna parte que eso...
2013 Jul 26
0
variación en los resultados de k medias (Alfredo Alvarez)
...gle.es/search?q=kmeans+not+give+same+output+different+runs) es pasarle los centroides al algoritmo, pero esto no siempre -mejor dicho, raras veces- es factible. Otra cosa es el algoritmo kmeans que elijas, y aquí lanzo también una pregunta por si alguien lo conoce: probando el kmeans estándar y el bigkmeans de biganalytics (creedme que es una pequeña maravilla que divide el tiempo de ejecución por 2 ó 3 al menos, y permite manejar objetos que no caben en memoria -usando bigmemory), dan resultados muy diferentes. Lo que más me preocupa es el tamaño de los clusters, pero no veo por ninguna parte que eso...
2010 Jul 18
6
CRAN (and crantastic) updates this week
...ng during the execution -- one primary objective is the statistical correct computation of the candidate algorithms' order. * biganalytics (1.0.14) Jay and Mike http://crantastic.org/packages/biganalytics This package extends the bigmemory package with various analytics. Functions bigkmeans and binit may also be used with native R objects. For tapply-like functions, the bigtabulate package may also be helpful. For linear algebra support, see bigalgebra. For mutex (locking) support for advanced shared-memory usage, see synchronicity. * bigtabulate (1.0.11) Jay and Mike ht...