Apache Storm - краткое описание

Apache Storm - распределенная система для обработки больших обьемов данных в реальном времени.
Гарантирует отказоустойчивость благодаря механизму отслеживания успешной обработки данных. Лучше использовать вместе с Apache Kafka.

Storm быстрее чем аналог Spark Streaming ;)


Полезные ссылки:
Документация
развертывания кластера
Описание от IBM
Цыкл статей на habre
Аналог от Spark - Spark Streaming
Hortonworks: real-time events
Udacity course: Real-Time Analytics with Apache Storm

Коментарі

Популярні дописи з цього блогу

Минимальные требование для кластера Hadoop(with Spark)

Apache Spark Resource Management и модель приложений от YARN

Apache Spark - основные команды