Search topics:spark

Page 7 of 207 results

pierrenodet/spark-ensemble 0.9.1

Ensemble Learning for Apache Spark 🌲

Scala versions: 2.13 2.12

spark-ml scala bagging machine-learning boosting ensemble-learning stacking gbm spark

23 2
cognitedata/cdp-spark-datasource 3.21.1183

Spark data source for Cognite Data Fusion

Scala versions: 2.13

cognite datasource scala spark

22 37
whylabs/whylogs-java 0.1.3

Profile and monitor your ML data pipeline end-to-end

Scala versions: 2.12

whylogs apache-spark calculate-statistics statistics approximate-statistics data-quality java dataset statistical-properties aiops mlops spark ai-pipelines

178 6
isarn/isarn-sketches-spark 0.6.0-sp3.2

Routines and data structures for using isarn-sketches idiomatically in Apache Spark

Scala versions: 2.12

dataframes sketching-algorithm apache-spark aggregator data-sketches dataframe variable-importance datasets t-digest data-sketching spark scala spark-ml pyspark dataset udaf python feature-importance

29 2
arcizon/spark-filetransfer 0.3.0

API for reading and writing data via various file transfer protocols from Apache Spark.

Scala versions: 2.12 2.11

mit-license scala spark

21 1
kotlin/kotlin-spark-api 1.2.4

This projects gives Kotlin bindings and several extensions for Apache Spark. We are looking to have this as a part of Apache Spark 3.x

Scala versions: 2.13 2.12

bigdata nullability spark scala kotlin

471 17
romans-weapon/spear-framework 3.1.1-3.0

Rapid ETL/ELT-connectors/pipeline development leveraged on top of Apache Spark

Scala versions: 2.12

kafka spark scala shell-script docker-compose hadoop

19 2
florentf9/sparkml-som 0.2

:sparkles: Spark ML implementation of SOM algorithm (Kohonen self-organizing map)

Scala versions: 2.11

self-organizing-map som scalable spark-ml spark machine-learning spark-mllib clustering

18 1
woltapp/spark-osm-datasource 0.3.0

Native Spark OSM PBF data source

Scala versions: 2.12 2.11

osm pbf spark

18 2
s22s/pre-lt-raster-frames 0.6.1

Spark DataFrames for earth observation data

Scala versions: 2.11

geotrellis earth-observation sparksql spark-ml spark scala image-processing machine-learning

19 6
qubole/streaminglens 0.5.3

Qubole Streaminglens tool for tuning Spark Structured Streaming Pipelines

Scala versions: 2.11

micro-batches structured-streaming streaming sparklens cluster-management spark streaming-pipeline scala spark-streaming sla

17 2
derrickoswald/cimspark 2.12-3.0.1-5.1.1

Spark access to Common Information Model (CIM) files

azure docker spark scala r xml-parser amazon-web-services cim rdd maven

17 4
hammerlab/spark-util 3.1.0

low-level helpers for Apache Spark libraries and tests

Scala versions: 2.12 2.11

hadoop kryo scala spark

16 1
piotr-kalanski/data-quality-monitoring 0.3.8

Data Quality Monitoring Tool

Scala versions: 2.11

data-quality monitoring scala spark

16 1
getsentry/sentry-spark 0.0.1-alpha04

Apache Spark Sentry Integration

Scala versions: 2.11

crash-reporting tag-archived monitoring sentry spark error-monitoring

16 0 2
qubole/s3-sqs-connector 0.5.1

A library for reading data from Amzon S3 with optimised listing using Amazon SQS using Spark SQL Streaming ( or Structured streaming).

Scala versions: 2.11

streaming scala spark-streaming s3 structured-streaming spark sqs

17 2
hunters-ai/spark-adaptive-file-connector 1.0.0

Adaptive File Source Connector for Spark, optimised for reading from object stores

Scala versions: 2.12

hacktoberfest s3 scala spark

15 1
absaoss/spark-hofs 0.5.0

Scala API for Apache Spark SQL high-order functions

Scala versions: 2.13 2.12 2.11

high-order-functions scala spark sql

14 5
jtnystrom/discount 3.0.1

Very large scale k-mer counting and analysis on Apache Spark.

Scala versions: 2.13 2.12

kmer-counting genomics kmers spark scala kmer-frequency-count bioinformatics

17 1
qubole/spark-state-store 1.0.0

Rocksdb state storage implementation for Structured Streaming.

Scala versions: 2.11

structured-streaming streaming real-time-processing scalability spark state-management rocksdb performance qubole

17 3

2
3
4
5
6
7 (current)
8
9
10
11