понеділок, 31 березня 2014 р.

Mahout відмовляється від MapReduce

Apache Mahout  переходить на використання Apache Spark та H20 для побудови масштaбованих алгоритмів машинного навчання.
Apache Spark - система організації паралельної обробки даних, написана на Scala. На відміну від технології MapReduce дані обробляються в оперативній пам"яті.
H20 теж проводить обрахунки в оперативній пам"яті і оптимізований для проведення обчислень над даними, які зберігаються в розподіленій файлові системі HDFS.
Використання Apache Spark та H20 дозволяє значно пришвидшити виконання обчислень , а також використовувати, зокрема, deep learning.
Більше про H20
Більше про Apache Spark
Оригінал новини

Немає коментарів:

Дописати коментар