При аналізі даних цікавий імпорт даних з інших джерел, зокрема електронних таблиць (Excel, OpenOffice Spreadsheet) та баз даних. Якщо з електронними таблицями все взагалі просто, то з базами даних потрібно трошки тєлодвіжєній.
Встановлюємо ODBC та postgresql драйвер
sudo apt-get install unixODBC odbc-postgresql
Редагуємо 2 конфігураційні файли odbcinst.ini, який містить загальну інформацію та odbc.ini, який містить властивості підключення до конкретної бази. Файл odbcinst.ini може виглядати так:
Файл odbc.ini може виглядати так:
sudo apt-get install r-cran-rodbc - встановлюємо RODBC, також це можна зробити і з R
[PostgreSQL] Description = ODBC for PostgreSQL Driver = /usr/lib/odbc/psqlodbcw.so Setup = /usr/lib/odbc/libodbcpsqlS.so
Файл odbc.ini може виглядати так:
[ODBC Data Sources] mydb1= Database description[mydb1] Driver = /usr/lib/odbc/psqlodbcw.so Database = mydb1 Servername =host Username = username Password = password Port = port Protocol = 8.2.5 ReadOnly = 0 [ODBC] InstallDir = /usr/lib
sudo apt-get install r-cran-rodbc - встановлюємо RODBC, також це можна зробити і з R
$ sudo R
>install.packages("RODBC")
>q()
Доступ з R здійснюється так:>library(RODBC)
>chan <- odbcConnect("mydb1", case="postgresql", believeNRows=FALSE)
>sqlTables(chan) #Виводить всі таблиці БД
>mydata <- sqlFetch(chan, "some_table")#Повертає таблицю як датафрейм;
>odbcClose(chan)
Тепер для аналізу даних, які зберігаються в Postgres можемо використовувати функціонал R.
Немає коментарів:
Дописати коментар