第７回 Elasticsearch 入門 API の使い方をハンズオンで理解する〜前編〜

2016.06.03

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

第７回 Elasticsearch 入門 API の使い方をハンズオンで理解する〜前編〜

第１回〜第６回にわたって Elasticsearch の基本的なことを説明してきました。今回、「 API の使い方をハンズオンで理解する〜前編〜」では、Elasticsearch の起動・停止〜ドキュメントの管理（追加・登録・削除）を中心に説明します。

ハンズオンの内容

ハンズオンの内容は、以下の Elasticsearch 公式ドキュメントを参考にしています。

事前準備

Elasticsearch を動かすには、少なくとも Java 7 のバージョンが必要です。現時点では、Oracle JDK version 1.8.0_73. が推奨されています。使用する PC の Java のバージョンを確認して、もしバージョンが古い場合は、バージョンアップをしてください。各種 OS の Java のインストールドキュメントは Oracle website を参考にしてください。

java -version
echo $JAVA_HOME

Elasticsearch のインストール

Elasticsearch のパッケージは、yum などの各種ディストリビューション向けのパッケージも提供していますが、今回は tar.gz 形式のパッケージをダウンロードしてきてインストールしてください。

以下はそのインストール手順です。現在の最新バージョン v2.3.3 を使用します。

Elasticsearch のインストール

# 1. Elasticsearch インストール
curl -L -O https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.3.3/elasticsearch-2.3.3.tar.gz
tar -xvf elasticsearch-2.3.3.tar.gz

# 2. Kuromoji & ICU プラグインのインストール と Script の有効化
cd elasticsearch-2.3.3
./bin/plugin install analysis-kuromoji
./bin/plugin install analysis-icu
echo "script.inline: true" >> config/elasticsearch.yml

Sense (Kibana) のインストール

# 1. Kibana のインストール
curl -L -O https://download.elastic.co/kibana/kibana/kibana-4.5.1-darwin-x64.tar.gz
tar -xvf kibana-4.5.1-darwin-x64.tar.gz

# 2. Sense プラグインのインストール
cd kibana-4.5.1-darwin-x64
./bin/kibana plugin --install elastic/sense

以上で事前準備は完了です。

基本コンセプト

ハンズオンを始める前に、Elasticsearch の基本コンセプトを理解しておきましょう。

第６回 Elasticsearch 入門基本コンセプトを理解する

ハンズオン

それでは早速ハンズオンをはじめたいと思います。

練習１. 起動・停止とステータス確認
練習２. Cluster や Node 、Index の状態を確認する
練習３. ドキュメントの操作
練習４. バッチプロセッシング

練習１．起動・停止とステータス確認

Elasticsearch の起動・停止とステータスの確認方法です。ターミナルを開いてインストールディレクトリに移動して Elasticsearch 起動してみましょう。

Elasticsearch を起動するには以下の手順で実行します。

cd elasticsearch-2.3.3/bin
./elasticsearch

※ 実行した Elasticsearch はフォアグランドで実行されます。停止する場合は Ctrl+C で停止します。-d オプションをつけて実行することでバックグラウンドで起動することもできます。

起動すると以下のようなログがターミナルに表示されます。

./elasticsearch
[2016-04-20 12:33:16,186][INFO ][node                     ] [Riot Grrl] version[2.3.3], pid[2884], build[bd98092/2016-04-04T12:25:05Z]
[2016-04-20 12:33:16,186][INFO ][node                     ] [Riot Grrl] initializing ...
[2016-04-20 12:33:16,622][INFO ][plugins                  ] [Riot Grrl] modules [reindex, lang-expression, lang-groovy], plugins [], sites []
[2016-04-20 12:33:16,638][INFO ][env                      ] [Riot Grrl] using [1] data paths, mounts [[/ (/dev/disk1)]], net usable_space [177gb], net total_space [232.6gb], spins? [unknown], types [hfs]
[2016-04-20 12:33:16,640][INFO ][env                      ] [Riot Grrl] heap size [990.7mb], compressed ordinary object pointers [true]
[2016-04-20 12:33:16,640][WARN ][env                      ] [Riot Grrl] max file descriptors [10240] for elasticsearch process likely too low, consider increasing to at least [65536]
[2016-04-20 12:33:18,185][INFO ][node                     ] [Riot Grrl] initialized
[2016-04-20 12:33:18,186][INFO ][node                     ] [Riot Grrl] starting ...
[2016-04-20 12:33:18,262][INFO ][transport                ] [Riot Grrl] publish_address {127.0.0.1:9300}, bound_addresses {[fe80::1]:9300}, {[::1]:9300}, {127.0.0.1:9300}
[2016-04-20 12:33:18,266][INFO ][discovery                ] [Riot Grrl] elasticsearch/QRNNB3hFTyWWqYdcCaV1RA
[2016-04-20 12:33:21,304][INFO ][cluster.service          ] [Riot Grrl] new_master {Riot Grrl}{QRNNB3hFTyWWqYdcCaV1RA}{127.0.0.1}{127.0.0.1:9300}, reason: zen-disco-join(elected_as_master, [0] joins received)
[2016-04-20 12:33:21,315][INFO ][http                     ] [Riot Grrl] publish_address {127.0.0.1:9200}, bound_addresses {[fe80::1]:9200}, {[::1]:9200}, {127.0.0.1:9200}
[2016-04-20 12:33:21,315][INFO ][node                     ] [Riot Grrl] started
[2016-04-20 12:33:21,330][INFO ][gateway                  ] [Riot Grrl] recovered [0] indices into cluster_state

起動できましたか？ハンズオンでは、Rest API の実行に、Sense を使用しますので、Kibana も起動してきましょう。

cd kibana-4.5.1-darwin-x64/bin
./kibana

Node の名前はランダムに設定される

今起動した Elasticsearch は 1 Cluster 内に 1 Node という構成で起動している状態です。

表示されているログの中に、Riot Grrl という単語を見つけることができます。これが Node の名前です。

おそらく自身の端末に表示されている Node 名は別の名前が表示されているかもしれませんが問題ありません。Elasticsearch は起動時にランダムの Node 名を設定して起動するというのがデフォルトの動作です。 Cluster のデフォルトの名前は elasticsearch です。

Cluster や Node に任意の名前をつける

起動時に任意の Cluster 名や Node 名を指定することも可能です。（または config/elasticsearch.yml の設定ファイルを変更）

./elasticsearch --cluster.name classmethod --node.name node1

本番環境では、Node 名に稼働しているサーバのホスト名など、それぞれの Node で識別しやすい名前をつけましょう。

デフォルトポートは 9200

Elasticsearch は各種操作のための REST API を提供しています。その REST API を受け付けるポートとして、9200 にバインドされます。このポート番号は必要であれば変更することも可能です。

以下のコマンドでアクセスしてみましょう。

GET /

第７回 Elasticsearch 入門 API の使い方をハンズオンで理解する 〜前編〜

ハンズオンの内容

事前準備

Elasticsearch のインストール

基本コンセプト

ハンズオン

練習１．起動・停止とステータス確認

Node の名前はランダムに設定される

Cluster や Node に任意の名前をつける

デフォルトポートは 9200

練習２. Cluster や Node 、Index の状態を確認する

Cluster の状態確認

すべての Index の情報一覧を確認する

Index を作成する

Shards の状態を確認する

Replica Shards の数を変更する

練習３. ドキュメント管理

ドキュメントのインデックス

ドキュメントの取得

ドキュメントのインデックスと置き換え

id を自動的に生成してインデックスする

ドキュメントの更新

Script を使ったドキュメントの更新

ドキュメントの削除

Index の Close と Open

Index の削除

練習４. バッチプロセッシング

さいごに

関連記事

EVENTS

第７回 Elasticsearch 入門 API の使い方をハンズオンで理解する〜前編〜