[ブース紹介] データ仮想化・管理系ソリューション(Denodo, Okera, IO Tahoe) #reinvent

2019.12.05

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。DA部プリセールスエンジニアの兼本です。

AWS re:Invent 2019に参加しています。
毎日多くのセッションがあり、新しいサービスもどんどん紹介されていますが、re:Inventの魅力はそれだけではありません。
このエントリではベネチアンで開催されているエキスポのスポンサーブースの様子などをレポートします。

今回はデータの仮想化や管理を行うためのソリューションを3つご紹介します。

データ仮想化「Denodo」(BoothID #3910)

denodoは様々なデータソースを仮想的に結合して、利用者に新しいビューとして公開することのできる仮想データベースソリューションです。

すでに日本支社もあるので、ご存じの方もいらっしゃるかもしれません。
denodoのよいところは、元のデータベースにあるデータをコピーしたり、データベース自体のマイグレーションすることなく、仮想的に新しいデータベースを構築できるところにあります。
その際、ユーザやグループ単位でのアクセス権限管理も設定できるので、ガバナンスを考慮したデータ共有が可能です。
一度実行したクエリのデータはキャッシュされるため、オリジナルのデータベースへの負荷も抑えることができるようになっています。

データマネージメント「Okera」(BoothID #3329)

日本語だと虫みたいな名前なのですが、それを知っているのかどうかは確認できませんでした。
denodoと同様にデータの仮想化を実現するソリューションと理解しましたが、どちらかというとセキュリティやガバナンスを強く意識した製品という印象を受けました。
データプライバシー規制(GDPR、CCPAなど)への対応が必要なシーンで活用できるのかもしれません。

データディスカバリー「IO Tahoe」(BoothID #1707)

私の英語力では説明を理解しきれなかったのですが、AIを活用したデータディスカバリーとカタログ(タグ付け)を実現するソリューションということでした。 デモを見せてもらったのですが、タグ付けとかは結構手動でやってたような・・・。
データベーステーブルのカラムデータをチェックして、マッピングする機能やデータ分類(名前、電話番号、メールアドレス、住所)などを推測する機能や、ほかに似たようなデータを探して、関連付ける(このあたりでAIを活用)ことで、複数のデータソース間での関連性を見つけるスマートディスカバリーが特徴的な製品と理解しました。

まとめ

どの製品もRedshiftやRDSなどのデータベースやS3のようなファイルストレージにあるデータをソースとしてデータカタログや仮想データベースに分類されるソリューションですが、ブースでの短い説明を聞いても各社の思想の違いを感じることができました。

深いところを突っ込んで聞くには、私の英語力が足りないのですが、引き続きブースの紹介を続けていきたいと思います。 最後まで読んでいただきありがとうございました。

以上、データマネジメント関連3社のブースをご紹介いたしました。