Displaying 6 results from an estimated 6 matches for "bigkmeans".
2012 Feb 02
0
bigkmeans not parallel
I'm using bigkmeans in 'biganalytics' to cluster my 60,000 by 600,000 matrix.
I'm using a 8 core Linux VM.
I have register parallel backend with
>registerDoMC()
And I checked how many cores registered with
>getDoParWorkers()
It returns 8, which is the number of cores I have on my machine.
And I r...
2012 Feb 20
1
bigmemory not really parallel
...eally big matrix that I want to run k-means on.
I tried:
>data <-
read.big.memory('mydata.csv',type='double',backingfile='mydata.bin',descriptorfile='mydata.desc')
I'm using doMC to register multicore.
>library(doMC)
>registerDoMC(cores=8)
>ans<-bigkmeans(data,k)
In system monitor, it seems only one thread running R. Is there anything I
did wrong?
Thanks in advance for any suggestions.
Best,
Lishu
[[alternative HTML version deleted]]
2011 Aug 10
4
Clustering Large Applications..sort of
...ust trees with minimal spanning trees or perhaps
hand-rolling a hierarchical k-medoids which works extremely efficiently and
without cluster number assumptions. Anybody have any suggestions as to
possible libraries which I have missed or suggestions in general? Note: this
is not a question for 'Bigkmeans' unless there exists a
'findbigkmeansnumberofclusters' function also.
Thank you in advance for your
assistance,
Ken
[[alternative HTML version deleted]]
2013 Jul 26
1
variación en los resultados de k medias (Alfredo Alvarez)
...gle.es/search?q=kmeans+not+give+same+output+different+runs)
es pasarle los centroides al algoritmo, pero esto no siempre -mejor dicho,
raras veces- es factible.
Otra cosa es el algoritmo kmeans que elijas, y aquí lanzo también una
pregunta por si alguien lo conoce: probando el kmeans estándar y el
bigkmeans de biganalytics (creedme que es una pequeña maravilla que divide
el tiempo de ejecución por 2 ó 3 al menos, y permite manejar objetos que no
caben en memoria -usando bigmemory), dan resultados muy diferentes. Lo que
más me preocupa es el tamaño de los clusters, pero no veo por ninguna parte
que eso...
2013 Jul 26
0
variación en los resultados de k medias (Alfredo Alvarez)
...gle.es/search?q=kmeans+not+give+same+output+different+runs) es pasarle los centroides al algoritmo, pero esto no siempre -mejor dicho, raras veces- es factible.
Otra cosa es el algoritmo kmeans que elijas, y aquí lanzo también una pregunta por si alguien lo conoce: probando el kmeans estándar y el bigkmeans de biganalytics (creedme que es una pequeña maravilla que divide el tiempo de ejecución por 2 ó 3 al menos, y permite manejar objetos que no caben en memoria -usando bigmemory), dan resultados muy diferentes. Lo que más me preocupa es el tamaño de los clusters, pero no veo por ninguna parte que eso...
2010 Jul 18
6
CRAN (and crantastic) updates this week
...ng during the execution -- one primary objective is
the statistical correct computation of the candidate algorithms'
order.
* biganalytics (1.0.14)
Jay and Mike
http://crantastic.org/packages/biganalytics
This package extends the bigmemory package with various analytics.
Functions bigkmeans and binit may also be used with native R
objects. For tapply-like functions, the bigtabulate package may also
be helpful. For linear algebra support, see bigalgebra. For mutex
(locking) support for advanced shared-memory usage, see
synchronicity.
* bigtabulate (1.0.11)
Jay and Mike
ht...