Search topics:spark

Page 7 of 203 results

isarn/isarn-sketches-spark 0.6.0-sp3.2

Routines and data structures for using isarn-sketches idiomatically in Apache Spark

Scala versions: 2.12

dataframes sketching-algorithm apache-spark aggregator data-sketches dataframe variable-importance datasets t-digest data-sketching spark scala spark-ml pyspark dataset udaf python feature-importance

29 2
arcizon/spark-filetransfer 0.3.0

API for reading and writing data via various file transfer protocols from Apache Spark.

Scala versions: 2.12 2.11

mit-license scala spark

21 0 1
florentf9/sparkml-som 0.2

:sparkles: Spark ML implementation of SOM algorithm (Kohonen self-organizing map)

Scala versions: 2.11

self-organizing-map som scalable spark-ml spark machine-learning spark-mllib clustering

20 1
kotlin/kotlin-spark-api 1.2.4

This projects gives Kotlin bindings and several extensions for Apache Spark. We are looking to have this as a part of Apache Spark 3.x

Scala versions: 2.13 2.12

bigdata nullability spark scala kotlin

481 1 17
derrickoswald/cimspark 2.12-3.0.1-5.1.1

Spark access to Common Information Model (CIM) files

azure docker spark scala r xml-parser amazon-web-services cim rdd maven

19 0 5
romans-weapon/spear-framework 3.1.1-3.0

Rapid ETL/ELT-connectors/pipeline development leveraged on top of Apache Spark

Scala versions: 2.12

kafka spark scala shell-script docker-compose hadoop

19 0 2
s22s/pre-lt-raster-frames 0.6.1

Spark DataFrames for earth observation data

Scala versions: 2.11

geotrellis earth-observation sparksql spark-ml spark scala image-processing machine-learning

20 0 6
woltapp/spark-osm-datasource 0.3.0

Native Spark OSM PBF data source

Scala versions: 2.12 2.11

osm pbf spark

18 0 2
qubole/streaminglens 0.5.3

Qubole Streaminglens tool for tuning Spark Structured Streaming Pipelines

Scala versions: 2.11

micro-batches structured-streaming streaming sparklens cluster-management spark streaming-pipeline scala spark-streaming sla

17 2
qubole/s3-sqs-connector 0.5.1

A library for reading data from Amzon S3 with optimised listing using Amazon SQS using Spark SQL Streaming ( or Structured streaming).

Scala versions: 2.11

streaming scala spark-streaming s3 structured-streaming spark sqs

19 2
hammerlab/spark-util 3.1.0

low-level helpers for Apache Spark libraries and tests

Scala versions: 2.12 2.11

hadoop kryo scala spark

16 0 1
getsentry/sentry-spark 0.0.1-alpha04

Apache Spark Sentry Integration

Scala versions: 2.11

crash-reporting tag-archived monitoring sentry spark error-monitoring

16 0 2
piotr-kalanski/data-quality-monitoring 0.3.8

Data Quality Monitoring Tool

Scala versions: 2.11

data-quality monitoring scala spark

15 0 1
hunters-ai/spark-adaptive-file-connector 1.0.0

Adaptive File Source Connector for Spark, optimised for reading from object stores

Scala versions: 2.12

hacktoberfest s3 scala spark

15 0 1
jtnystrom/discount 3.0.1

Very large scale k-mer counting and analysis on Apache Spark.

Scala versions: 2.13 2.12

kmer-counting genomics kmers spark scala kmer-frequency-count bioinformatics

18 3 1
absaoss/spark-hofs 0.5.0

Scala API for Apache Spark SQL high-order functions

Scala versions: 2.13 2.12 2.11

high-order-functions scala spark sql

14 0 5
qubole/spark-state-store 1.0.0

Rocksdb state storage implementation for Structured Streaming.

Scala versions: 2.11

structured-streaming streaming real-time-processing scalability spark state-management rocksdb performance qubole

17 0 3
fqaiser94/mse 0.2.4

Make Structs Easy (MSE)

Scala versions: 2.12 2.11

pyspark spark scala python struct nested

18 0 1
data-tools/big-data-types 1.4.1

A library to transform Scala product types and Schemes from different systems into other Schemes. Any implemented type automatically gets methods to convert it into the rest of the types and vice versa. E.g: a Spark Schema can be transformed into a BigQuery table.

Scala versions: 3.x 2.13 2.12

apache-spark bigquery-tables typeclass typeclass-derivation spark typesafe schemas database-types cassandra bigquery scala circe

14 44 5
zuinnote/spark-hadoopcryptoledger-ds 1.3.2

A Spark datasource for the HadoopCryptoLedger library

Scala versions: 2.12 2.11

read bitcoin cryptoledger hadoopcryptoledger altcoin spark datasource auxpow ethereum

13 2

2
3
4
5
6
7 (current)
8
9
10
11