HueでブラウザからHadoop操作 | Hadoop Advent Calendar 2016 #23

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、小澤です。 この記事はHadoop Advent Calendar 23日目のものとなります。

前回はHBaseについて書かせていただきました。
今回はブラウザからHadoop上のさまざな操作を行えるHueというものについて書かせていただきたいと思います。

Hueの導入

どんなものかを見てみるのであれば、ClouderaのVMを使うか、公式のデモサイトを見るのが簡単です。

どんな機能があるか

Hueの機能のいくつかを紹介していきます。

QueryEditors

メニューのQueryEditorsにあるものです。

HiveとImpalaはともに似たUIでクエリを実行できます。
右上のフォームにクエリを記述することができCtrl-Enterでそのまま実行できます。 また、この画面で実際にクエリを入力していただくとわかるかと思いますが、補完機能もあります。
右下の部分にはクエリの履歴や実行後の出力、などが表示されます。
実行したクエリはHDFS上に保存しておくこともできます。
左側はデータベースやテーブルの一覧が表示されます。テーブル名の右にあるグラフのようなアイコンをクリックするとテーブルの中身を見ることもできます。

スクリーンショット 2016-11-14 14.56.24

スクリーンショット 2016-11-14 15.03.16

Pigの実行もQueryEditorsから選択できます。
Pigの場合はテーブルという概念がないので、主な画面構成はエディタ部分や右メニューにある項目になります。
左側にはクリックすると各種操作などの命令を挿入することができる機能一覧があります。

スクリーンショット 2016-11-14 15.14.00

Data Browsers

Data BrowsersメニューではMetaStoreの情報などが確認できます。
他にもHBaseやSqoopに関する内容が存在しています。

スクリーンショット 2016-11-14 15.26.39

Workflows

WorkflowsメニューはOozieの管理を行います。
Oozieそのものについての詳細な説明は割愛しますが、Hadoop上で複数の処理を組み合わせてその流れを定義したいときや時間やファイル生成をトリガーとしてジョブの実行タイミングを制御したいときに使うものです。

このメニューでは実行したジョブの確認などが行えるDashBoardとグラフィカルにOozieジョブを組み立てるためのEditorがあります。

スクリーンショット 2016-11-14 15.38.30

スクリーンショット 2016-11-14 15.39.43

ホーム

次はメニューにある家のようなアイコンです。 ここからは過去にHue上から作成して保存しておいたものにアクセスできるようになっています。

スクリーンショット 2016-11-14 15.18.00

File Browser

次にメニュー右上のほうにあるファイルのようなアイコンの説明をします。
こちらはFile Browserとなっており、HDFSへのアクセスが可能です。
この画面からファイルやディレクトリの閲覧や操作は一通り行えます。

スクリーンショット 2016-11-14 15.45.35

その他の機能について

メニュー内にはHBaseなど他にいろいろな項目があります。 これらについてすべてを紹介はしませんが、気になるものがあれば使ってみるといいかと思います。

終わりに

今回はHueについて紹介しました。
すべての機能を紹介できるわけではないので、今回はいくつかを選択して紹介しましたが、メニューなどから他の項目でどのようなことができるかはある程度わかりやすいかと思います。
便利そうだと思った方は一度つかってみるといいかと思います。

明日は2016年のカンファレンスなどで耳にしたHadoop活用事例について書かせていただく予定です。 
ぜひ、お楽しみに!