derrickburns / generalized-kmeans-clustering 1.2.2

Apache License 2.0 Website GitHub

Production-ready K-Means clustering for Apache Spark with pluggable Bregman divergences (KL, Itakura-Saito, L1, etc). 6 algorithms, 740 tests, cross-version persistence. Drop-in replacement for MLlib with mathematically correct distance functions for probability distributions, spectral data, and count data.

Scala versions: 2.10

Latest version

[![massivedatascience-clusterer Scala version support](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer/latest.svg)](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer)

JVM badge

[![massivedatascience-clusterer Scala version support](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer/latest-by-scala-version.svg?platform=jvm)](https://index.scala-lang.org/derrickburns/generalized-kmeans-clustering/massivedatascience-clusterer)