Пример подключения к Impala в RStudio с помощью jdbc драйвера

Устанавливаем R на ubuntu:
sudo apt-get -y install r-base
sudo R CMD javareconf
Далее скачиваем и устанавливаем RStudio .
Также скачиваем и распаковываем архив jdbc драйвера для подключения к Impala .

После запуска RStudio указываем путь к jdbc драйверу и работаем с базой:
install.packages("RImpala")
library(RImpala)
rimpala.init(libs="/tmp/impala/jars/") 
rimpala.connect("192.168.10.1","21050") 

rimpala.invalidate()
rimpala.showdatabases()
rimpala.usedatabase("yourdatabase") 
rimpala.showtables()
rimpala.describe("yourtablename")

Полезные ссылки:
  • http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/
  • https://github.com/Mu-Sigma/RImpala

Коментарі

Популярні дописи з цього блогу

Минимальные требование для кластера Hadoop(with Spark)

Apache Spark Resource Management и модель приложений от YARN

Apache Spark - основные команды