- є бібліотеки для роботи з часовими рядами
- широкі можливості для візуалізації
- безкоштовна
- працює під Linux
Яким би прикладним питанням статистики чи аналізу даних ви не займались, є дуже висока ймовірність, що існує R бібліотека, яка значно полегшить вам роботу.
Для прикладу:
- machine learning - e1071, randomForest, повний список тут
- прогнозування часових рядів - zoo, forecast
- інтерактивний дешборд - shiny, rHighcharts, ggplot2
- візуалізація даних - ggplot2, lattice
- трансформація даних - reshape2, plyr
- дослідження текстів (text mining) - tm
- отримання даних з Twitter - twitteR
- пошук оптимального інвестиційного портфеля - fPotfolio
Повний список доступних бібліотек можна переглянути тут.
Основний недолік R - всі дані зберігаються в оперативній пам'яті, тому обробка великих об'ємів даних дуже обмежена. Хоча зараз з'явилась підтримка паралельних обчислень та можливість зберігати частину даних на диску. Детальніше про це можна прочитати в книзі Parallel R.
З чого почати вивчення?Основний недолік R - всі дані зберігаються в оперативній пам'яті, тому обробка великих об'ємів даних дуже обмежена. Хоча зараз з'явилась підтримка паралельних обчислень та можливість зберігати частину даних на диску. Детальніше про це можна прочитати в книзі Parallel R.
Перш за все, підівчити англійську мову принаймі до рівня розуміння текстів, оскільки документація і більшість книг англійською.
Російськомовних ресурсів не так вже й багато:
Статті:
Статті на Habrahabr http://habrahabr.ru/hub/r/
Блоги:
Група у Вконтакті: http://vk.com/club8142131
Якщо рівень англійської дозволяє читати книги й дивитись відео, вивчати R значно простіше і цікавіше. Почати можна з уроків від Code School: http://tryr.codeschool.com/ або серії відео від Google Developers . Курси від Coursera не лише дозволять вивчити R, але й застосовувати для можливості цієї мови для вирішення проблем аналізу в різних сферах:
- Statistics One - курс зі статистики, починається 22 вересня 2013.
- Computing for Data Analysis - застосування R для обробки та візуалізації даних, починається 23 вересня 2013.
- Data Analysis - методи аналізу даних, починається 28 жовтня 2013.
- Introduction to Computational Finance and Financial Econometrics - вступ до фінансової економетрики та обчислювальних фінансів, починається 28 серпня 2013.
Ресурс http://www.r-bloggers.com/ - агрегатор блогів з R різними мовами, при бажанні можна додати свій.
Книг є величезна кількість, почати можна з серії UseR! від Springer і Beginner's Guide to R зокрема.
Також можна підписатись на RSS-потік питань на StackOverflow та CrossValidated і вчитись через допомогу іншим.