derrickburns / generalized-kmeans-clustering 1.2.2

Apache License 2.0 Website GitHub

Production-ready K-Means clustering for Apache Spark with pluggable Bregman divergences (KL, Itakura-Saito, L1, etc). 6 algorithms, 740 tests, cross-version persistence. Drop-in replacement for MLlib with mathematically correct distance functions for probability distributions, spectral data, and count data.

clustering
euclidean-distance
embeddings
kullback-leibler-divergence
cosine-similarity
entropy
spark-mllib
k-means
bregman-divergence
similarity-search
spark
itakura-saito-divergence

Scala versions: 2.10

Found 1 artifact

massivedatascience-clusterer 1.2.2

11 years ago
Apache-2.0

JVM:

2.10