Energy Blog: Mahout відмовляється від MapReduce

понеділок, 31 березня 2014 р.

Mahout відмовляється від MapReduce

Apache Mahout переходить на використання Apache Spark та H20 для побудови масштaбованих алгоритмів машинного навчання.
Apache Spark - система організації паралельної обробки даних, написана на Scala. На відміну від технології MapReduce дані обробляються в оперативній пам"яті.
H20 теж проводить обрахунки в оперативній пам"яті і оптимізований для проведення обчислень над даними, які зберігаються в розподіленій файлові системі HDFS.

Використання Apache Spark та H20 дозволяє значно пришвидшити виконання обчислень , а також використовувати, зокрема, deep learning.

Більше про H20
Більше про Apache Spark
Оригінал новини

Energy Blog

GitHub

понеділок, 31 березня 2014 р.

Mahout відмовляється від MapReduce

Немає коментарів:

Дописати коментар

GitHub

понеділок, 31 березня 2014 р.

Mahout відмовляється від MapReduce

Немає коментарів:

Дописати коментар

понеділок, 31 березня 2014 р.