Tableauで始めるBI(ビジネス・インテリジェンス):製品&対応データソース一覧
先日(と言っても2ヶ月程前ですが)Tableau社の製品『Tableau Desktop』とAWS製品(Redshift)に関するエントリを投下致しました。
当エントリはそのエントリ続編的な位置付けとなりますが、今回はTableau Desktop起動後に見える各種要素について『これは何なのか、どんな機能・用途があるのか』という視点で調査解説を加えて一覧化・まとめていく事で『Tableau( Desktop)ではどんな事が出来るのか』を理解して行ければと思っています。例によってボリューム多目ですが、ご了承頂ければと思います。m(_ _)m
目次
BIとは
昨今BIBIと業界を賑わしておりますね。ところでBIとは一体何でしょう。みんな大好きWikipediaさんに聞いてみましょう。
- ビジネスインテリジェンス - Wikipedia
- ビジネスインテリジェンス技術で使われる一般的な機能
- OLAP
- データ分析
- データマイニング
- プロセスマイニング
- テキストマイニング
- 複合イベント処理(CEP)
- ビジネス業績管理(BPM)
- ベンチマーキング
- 予測分析
- 規範分析
- ビジネスインテリジェンスの対象データに関する要素
- DWH(データウェアハウス:累積データを蓄積)
- データマート(特定目的に合わせて抜き出す)
- ETL(データウェアハウス・データマートを作成・更新する技術)
- 上位 10 の 2013 年ビジネス インテリジェンス トレンド | Tableau Software
(日本語版はこちらでダウンロード可能です。要会員登録&ログイン) - Self-service analysis:Tableauは動き始めました
- Big Data:Hadoop, Teradata and Verticaはちょうど始まったばかりです
- Mobile BI:答えはiPod,Android...モバイルにあり
- 多種多様なデータソースに対応
- 多彩な手法、ツールを使って分析が行える
- 取得データ、分析内容を高速に可視化
- 分析内容を視覚的に表示、直感的な使い易さを提供
- Tableau Serverに接続、Webベースにデータ分析が可能
- ダッシュボード機能による複数指標同時確認、閲覧が可能
- Webブラウザ上で分析結果を共有
- Tableau Desktopで作成した全てのファイルを取り扱い可能
- チャートの内容を自動最新化、リアルタイムデータを公開
- コンテンツ共有のためのセキュアなライブラリ
- チャートやグラフ、マップ、ダッシュボードや楽しいアプリケーションを数分で作成・共有
- 作成した要素をWeb上のどこにでも公開可能
- 無料で利用可能(Desktop/Server/Online版は製品版/トライアル版あり)。
- Tableauデータ抽出
- パフォーマンスを向上させるために、使用可能なデータソース全体の中からサブセットととして特定条件で"データの抽出"を行う事が出来ます。このデータソースはその抽出物を指し、過去保存したファイルを指定して接続する事が出来ます。(拡張子:*.tde)
- ワークブックからインポート
- Tableau Desktopでの作業内容を保存したもの=ワークブック(拡張子:*.twb)を開く際に用います。
- Tableau Server
- 接続可能なTableau Server環境が存在する場合、Desktopから接続する事が出来ます。所定のサーバー名、ユーザー、パスワードを設定してログイン。
- Microsoft Excel
- Microsoft社製品:表計算ソフトウェア。
- (対応Ver:Microsoft Excel 2003 or later)
- Microsoft Access
- Microsoft社製品:データベース ソフトウェアおよびアプリケーションソウトウェア。
- (対応Ver:Microsoft Access 2003 or later)
- テキストファイル
- カンマ区切りファイル(*.csv)、タブ区切りファイル(*.tsv)、テキストファイル(*.txt)に対応。
- MySQL
- オラクル社開発RDBMS。オープンソースで開発されており、GNU GPLと商用ライセンスのデュアルライセンスとなっている。
- AWSではAmazon RDS for MySQLとしてDBエンジンが対応している。
- (対応Ver:MySQL 4.0 or later)
- Oracle
- オラクル社開発RDBMS。世界初の商用RDBMSであり、メインフレームからパーソナルコンピュータまで、幅広いプラットフォームをサポートしている。
- AWSではAmazon RDS for Oracle DatabaseとしてDBエンジンが対応している。
- (対応Ver:Oracle Database 10.x or later)
- Microsoft SQL Server
- マイクロソフト社開発のリレーショナルデータベース管理システム(RDBMS)。
- AWSではAmazon RDS for Microsoft SQL ServerとしてDBエンジンが対応している。
- (対応Ver:Microsoft SQL Server 2000, 2005, 2008, 2008R2, or 2012)
- PostgreSQL
- BSDライセンスに類似するライセンスにより配布されているオープンソースのオブジェクト関係データベース管理システム(ORDBMS)。
- (対応Ver:PostgreSQL 8.3 or later)
- IBM DB2
- IBMのリレーショナルデータベース管理システム(RDBMS)製品。
- (対応Ver:IBM DB2 9.1 or later for Linux, UNIX, or Windows)
- Firebird
- InterBaseから派生したオープンソースのリレーショナルデータベース管理システム。
- (対応Ver:Firebird 2.0 or later)
- SAP Sybase ASE(Adaptive Server Enterprise)
- Sybase社の代表的RDBMS製品。2010年5月SAP社により買収される。
- (対応Ver:SAP Sybase ASE 15.5 or later)
- Actian Vectorwise
- カラムナ型、DWH等の分析処理向け高速DB。
- (対応Ver:Actian Vectorwise 1.5 or later)
- EMC Greenplum
- MPP/シェアードナッシングアーキテクチャをソフトウェアで実装するDWH用DB製品。
- (対応Ver:EMC Greenplum 4.x or later)
- HP Vertica
- DWH向けに特化したリアルタイム分析DBソフト。
- (対応Ver:HP Vertica 4.x or later)
- IBM Netezza
- DWH・分析アプライアンス。
- (対応Ver:IBM Netezza release 4.6 or later)
- Amazon Redshift
- クラウド上で高速、協力で、フルマネージドのペタバイト級のデータウェアハウスサービスを提供。
- (対応Ver:現在全て対応(バージョン指定無し))
- SAP HANA
- 大量データの高速分析をするために開発されたインメモリDWH。
- (対応Ver:SAP HANA 1.0035 or later)
- SAP Sybase IQ
- 超大規模データ分析を可能にするDWH。
- (対応Ver:SAP Sybase IQ 15 or later)
- TERADATA
- DWHに特化した超並列RDB。
- (対応Ver:Teradata 6 or later)
- Cloudera Hadoop
- Clouderaが提供する100%オープンソースのHadoopディストリビューション。エンタープライズレベルの高可用性と共に、バッチプロセス/インタラクティブSQL/インタラクティブ検索を実現。
- (対応Ver:Cloudera Hadoop Distribution via Hive (CDH3u1, which includes Hive .71, or later, with options for Beeswax server and Kerberos))
- HortonWorks Hadoop Hive
- 「Apache Hadoop」を土台とした企業向けのデータ管理プラットフォーム。大規模なデータの読み込みや処理、分析を行うためのデータ基盤技術で、必要な機能を統合し検証済みのプラットフォームとして提供。
- (対応Ver:Hortonworks Data Platform (HDP) 1.1 or later)
- MapR Hadoop Hive
- Apache HadoopをベースとしHDFSの代わりとなる独自の分散ストレージを備えたビッグデータツールキット。無償バージョンのM3と、有償バージョンのM5,M7がある。
- (対応Ver:MapR M5)
- DataStax Enterprise
- Cassandra, Apache Solr, Hadoopを統合したプラットフォーム。
- (対応Ver:DataStax Enterprise Edition 2.2 or later)
- Google Analytics
- Google社が無料で提供するWebページのアクセス解析サービス。
- (対応Ver:現在全て対応(バージョン指定無し))
- Google Big Query
- Google提供の企業向けビッグデータ分析サービス。
- (対応Ver:現在全て対応(バージョン指定無し))
- Microsoft Power Pivot
- Excel 2010内で直接利用出来る分析ツール。
- (対応Ver:Microsoft PowerPivot 2008 (whether or not published in SharePoint) or later)
- Oracle Essbase
- Oracle社製のオンライン分析処理(OLAP)サーバー。
- (対応Ver:xxx)
- Microsoft Analysis Service
- BI向けのオンライン分析処理(OLAP)機能とデータマイニング機能を用意。
- (対応Ver:?(関連ページに言及無し))
- SAP Netweaver Business Warehouse
- SAP社製品のOLAPサーバー。OLTP,SRM,レポーティング機能も担う。
- (対応Ver:SAP NetWeaver Business Warehouse 7.00 with SP20+ recommended; also requires SAP GUI for Windows 7.20 Client or later)
- ParAccel
- MPP(超高速並行処理)の高性能データ分析データベース。
- (対応Ver:ParAccel Analytic Database (PADB) version 3 or later)
- Aster Database
- RDBとMapReduce技術を統合した並列処理型のソフトウェア
- (対応Ver:Teradata Aster Data nCluster 4.5 or later)
- Progress OpenEdge
- ダイナミックな多言語アプリケーションを構築する開発プラットフォーム。
- (対応Ver:Progress OpenEdge 10.2B patch 4 or later)
- Salesforce
- CRM(顧客管理)とクラウドサービスをトータルにサポート。
- (対応Ver:Salesforce.com, Force.com, and Database.com)
- Windows Azure Marketplace DataMarket
- データベースのデータを売り買いする為の市場を提供するサービス。
- (対応Ver:現在全て対応(バージョン指定無し))
ビジネスインテリジェンス(英: Business Intelligence、BI)は、経営・会計・情報処理などの用語で、企業などの組織のデータを、収集・蓄積・分析・報告することで、経営上などの意思決定に役立てる手法や技術のこと。
また、続きを読んでみると、ざっくりBIとは以下の要素群で構成されているもののようです。
Tableauとは
では、このエントリでも言及している『Tableau』("タブロー"と読む)とは一体何なのでしょうか。これについては、公式HPの以下のページで詳しく解説しているようなので、ざっくり翻訳で内容を追ってみます。
ビジネスインテリジェンスの未来
Tableauは、誰でも数クリックでデータに接続、データを視覚化しインタラクティブなものに変え、更にそのデータをダッシュボードで共有可能なものにする事が出来るビジネス・インテリジェンス(BI)ソフトウェアです。
EXCELユーザーがこれらを学ぶ事は十分簡単な事ですが、非常に複雑な、分析的な問題を満たすのにはとても強力です。確実に他のユーザーとの知見を共有するには少しだけ時間が掛かります。
BIソフトウェアは、実際にそれらを必要とする人々への回答を提供する事が出来る、信頼出来るツールとなるでしょう。
BIツールは、あなたが前進するためにサポートします。
ビジネスは変化が早く、我々はその変化に適合していかなければなりません。ゆっくりと融通の利かないBIソフトウェアで、それらを解決すべきでしょうか?
Tableauは今日必要とされる機能、また今後欲しくなるであろう機能を先進的に備えています。2013年のBIトレンドTop10を参照するには、以下スライドをご参照ください。
ビジネス・インテリジェンスソフトウェアとITの調和
今日、組織では目標を達成するための効率的でスケーラブル且つ、簡単に展開出来るBIツールが必要とされています。
これまでは、しばしば新しいBIツールを展開する際には数週間・数ヶ月間、いや数年掛かるという事もありました。 そして保守期間では、お客様からの相次ぐ要望に対応し、高価なコンサルティング費用の支払いを強いられる事に。
タブローは異なるアプローチを採用しています。当社のソフトウェアは導入に数分程度しか掛かりません。最も大きな構成のTableau Serverでさえもです。インストール作業は簡単です。ビジネスユーザーが自分でソフトウェアやデータベースを管理する事も出来ます。タブローを既存のデータベースへ接続すればスクリプト作業をスキップする事も出来ます。スケーラビリティはどうでしょう?Tableau Serverには一度に数百万人のユーザーを処理出来る、Tableau Publicがあります。
結果としてBIを使うことで利用者は欲している答を得ることが出来、本来行いたいタスクに集中する事が出来るようになります。
業界アナリストの評価
以下のグラフは『Overall Product Score vs Ease of Use(製品全体のスコア vs 使い易さ)』はガートナーの『2011年に於けるBIプラットフォームのユーザー調査:BIプラットフォームの機能に関する顧客評価』の結果です。
ここではベンダーを2つの軸に基づき配置しています。X軸は顧客による製品機能の複合評価(13のBIに於ける能力・性能に基づくものです)、Y軸は使い易さです。
AWS Cloud Storage Day 取材レポート(1).[基調講演] AWS クラウドストレージサービスのご紹介 | Developers.IO
このガートナーの注目に値する分析洞察を元に、この点を強調する事にしました。『使い易さ』は現在、一番の要因です。 なぜなら、組織はBIプラットフォームを選択する理由としてこれまで伝統的に1番であった『機能性』を、『使い易さ』が遥かに凌駕しているからです。
我々にとって、これは驚く事ではありません。我々は、製品の機能が使えるものである事を確認する事に多くの時間を費やします - 結局、簡単に使えない機能をビルドしても、その機能を使う事はありません。この事は、グラフ内に於けるTableauの立場を表しています。
お客様の評価
Tableauの顧客は、業界の幅広い範囲から来ますが、彼らは全て特徴を持っています:何らかの答えに変わるであろうデータを持っているのです。
以下の動画では、Matt Krysiak(the National Motor Club(NMC)のCOO)がTableauを使う事どのようにデータを活用し、答えを見つけ出し、組織全体を通じて洞察を共有していったかを説明しています。
[swf]http://www.youtube.com/watch?v=NuqULNNWoPI,550,380[/swf]
数秒で答えを見つける
Tableau Desktopは、強力なデータ発見アプリケーションであり、質問に対して数秒で回答を得られる、パワフルなデータ探査アプリケーションです。以下のビデオでは、任意のデータを視覚化された異なるビューを操作し、さらに一緒に複数のデータベースを結合して、Tableauのドラッグアンドドロップ・インターフェースを使用する方法を示しています。
他のBI(ビジネス・インテリジェンス)ツールとは異なり、ウィザードや複雑なスクリプトを作成する必要はありません、ビジネス上の問題を理解して誰もが関連データの可視化に対処することが出来ます。分析が終了すると、他の人との共有をTableau Serverに対して簡単に行う事が出来ます。
[swf]http://www.youtube.com/watch?v=vh9v76e95GY,550,380[/swf]
共有ダッシュボードで探査を可能にする
Tableauは、データ分析に於いて力を発揮しますが、実は驚く程の洞察力を共有されることを意図されています。(…そして更に探索してもらう事も!)
Tableau Serverは、ネットワーク上において、一般的且つ安全な場所へあなたが作成したTableau Desktopの視覚化情報を公開する事が出来るBI(ビジネスインテリジェンス)ソフトウェアです。これにより、ダッシュボード上で自身の問いに対する回答を、お互い閲覧したりやり取りする事が誰にでも出来るようになります。
以下の『エグゼクティブダッシュボード』視覚化された情報(イメージ)は、ダッシュボードの一般的なスタイルを示しています。双方向性と探査の双方の力が情報に加わっています。円またはフィルタをクリックする事で、その視覚化された効果を体験する事が出来ます。(以下のダッシュボードはブラウザ上で操作出来ます!)
Tableau製品一覧
まずは現在Tableau社で展開されている関連製品の概要について。基本的にはデータ分析・閲覧と出来る事のベースは変わらず、様々な用途や状況で扱えるようなラインナップとなっています。
Tableau Desktop
迅速な分析、データ可視化のためのデスクトップアプリケーション。主に以下の様な機能・特徴があります。
Tableau Server
Webを経由したデータ分析、コラボレーションを展開Tableau Desktopのサーバー対応版。主に以下の様な機能・特徴があります。
Tableau Online
Tableau Public
データストーリーテリングアプリケーション。主に以下の様な機能・特徴があります。他製品とは違った位置付けで外部Webサイト等とも連携出来たりするので、近いうちこのプロダクトは別途エントリを書いてみたいところです。
Tableau Desktopが接続可能なデータソースについて
次いで、Tableau製品(ここではTableau Desktop)が接続可能なデータソースについて、ジャンル分けをしながらどのようなものがあるか見て行きましょう。Tableau Desktop起動時に表示される、接続可能なデータソースの一覧は以下。実に多彩なバリエーションとなっております。
Tableau固有のデータ形式
まずは他のものとはアイコンが異なる以下の3つについて。
ローカルファイル
次いでローカルファイル。RDBMSやこの後に出て来るDWH等が最近良くピックアップされていますが、この辺りのファイルデータ群も同列に扱えると言うのは嬉しいところですね。
RDBMS
データウェアハウス
直訳すると「データの倉庫」。利用者により定義範囲は異なるが、一般に時系列に整理された大量の統合業務データ、もしくはその管理システムを指す。(※Wikipediaより) 個人的には扱った事があるのはRedshiftのみですが、他にも様々なDWHに対応しています。
Hadoop
Hadoopは大規模データの分散処理を支えるフレームワークであり、アプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としています。TableauはそれらHadoop関連製品へ接続する事が出来ます。現在対応しているものは以下の通り。
分析・オンライン分析(OLAP)
オンライン分析(OLAP)に関する解説はWikipediaを参照。Google,Microsoft,Oracleとメジャー処が出している関連製品に対しても、Tableauは対応しています。
超高速並行処理(MPP)
MPP=Massively Parallel Processor。言葉の意味は以下用語辞典を参照。このカテゴリの製品に限らないですが、超高速且つDWHかつ...というように、BIに於ける主要機能、用途を満たしているものは多いようですね。
その他
上記以外の分類となる対応データソース。Salesforceが結果的にここにカテゴライズされてしまいましたが、Tableauはそこにも対応しているようです。
まとめ
以上、『BIとは何か』から『Tableauってどんな事が出来るんだろう?』という点について、ざっくり把握出来るような情報を整理し、まとめてみました。より実践的な『どういう機能があるのか』等にも触れたかったのですがエントリ文字数的にかなりてんこ盛りになってしまったので、今後のエントリで別途ご紹介して行きたいと思います。また、先日のエントリではTableauからAmazon Redshiftへの接続を試してみましたが、他の環境への接続についても色々試してみたいところです。