Alteryx Inspire 2017 [Day3] プロダクトキーノート #alteryx17
こんにちは、小澤です。
『Alteryx inspire 2017』が2017年6月5日(月)〜6月7日(水)、アメリカのラスベガス ARIA HOTELにて3日間開催されています。 当エントリでは、3日目の、「Product Keynote」をレポートしたいと思います。
目次
キーノートの概要
キーノートの登壇は以下の2人となります。
エンジニアリングのシニアバイスプレジデントとして、Jayは20年にわたる高度な技術経験をAlteryxにもたらします。 Alteryxに入社する前は、顧客エンゲージメントソリューション部門を率いて、Pitney Bowes Softwareのグループ技術責任者を務めました。 顧客データの品質管理およびデータ統合事業の副社長兼ゼネラルマネージャーを務めながら、同氏はこの市場におけるピットニー・ボウズの再建を担当し、10%の減少率で40%の成長率を達成しました。 また、さまざまな製品管理およびプロフェッショナルサービスの役割を担当しています。 民間セクターに先立ち、ワシントン大学、スタンフォード大学、コロラド州立大学で高等教育で数年間働いていました。 Jayは南メソジスト大学の応用数学でM.S.及びPh.Dを取得し、マーティンのテネシー大学でB.S.を取得しています。
Langleyは、2015年初めにAlteryxに入社し、激しい成長期に向けて準備を行い、同社をリードしました。 彼女は企業戦略と製品戦略の責任だけでなく、多くの業務上の役割を担ってきました。 Alteryxに入社する前は、ServiceNowの財務戦略担当VPであり、その前に、Morgan StanleyのMenlo Parkオフィスのエグゼクティブディレクターを務めていました。 Langleyはアナリストであり、彼女のキャリアを通して分析チームを率いています。 LangleyはOperation Homefrontのボランティアアドバイザーとしても働き、家族と一緒に過ごす時間を楽しんでいます。
Keynotesより引用
キーノートレポート
オープニング
登壇者2名の登壇でプロダクトキーノートが始まりました。 Alteryxを使ったデータブレンディング兼雑談のような内容としてHangover(二日酔い)というタイトルから始まります。
二日酔いで記憶が飛んでいる(という設定)で、前日どのようなことがあったのか知るために様々データを結びつけていくような内容になっています。
撮影した写真やコミュニティに上がっている記事を元した位置情報などを結びつけていきます。
クレジットカードの明細からどんな店に行ったかに関する情報も紐付けて、最終的な出力となります。
最後はあまり大きな声では言えないような店に行った履歴も出てきたようで、「ここまでにしておこう」となります。
Alteryxを利用するとこんなことも可能なようです。
データ分析活用の価値
続いてのゲストスピーカー、Damin Austin - Director, Solutions Consulting - Alteryxの登壇です。
データ分析を活用した、デジタル領域における企業のアドンテージは年々高まってきており、 データサイエンティストの数も今後増えていくとのことです。
オープニングキーノートでも出ていた図を利用して、 データ分析に関わるあらゆることが1つの画面でできるようになるととても便利ですという話をされていました。
Data Information Lab
ここでData Information Labという組織の解説がされました。
Data Information Labはロンドンのデータサイエンティストを育成する学校ということでした。
生徒に教えるときにAlteryxを利用しており、 どのようにデータが活用されるか実際に操作しながら目で見て、確認できるため、わかりやすく、取り入れやすいとのことです。
ろくろを回すのは世界共通のようです。
ビジネスにおけるデータ分析とAlteryxがカバーする領域
続いて、ビジネスにおけるデータ分析の話となりました。 企業におけるデータ分析の活用では、ビジネス課題からそれを価値につなげるまでの間に様々なプロセスがあります。
ここで挙げられているプロセスとして、ビジネス課題から始まり、
- 課題解決に利用可能なデータの評価
- アクセス制御
- SQLによるデータの取得
- データ内容の確認
- 前処理、ブレンディング
- 必要なパッケージのインストール
- 分析プロセスの実行と結果の共有
- 予測モデルの作成と結果の共有
- 分析内容に基づくプロダクトや業務の最適化
となり、最後に価値の発揮へと繋がっています。
この過程では、様々ツールが必要になります。 Alteryxは現在、データの前処理、ブレンディングの領域においてその価値を発揮しています。
Alteryxからは様々なデータに接続するためのコネクタが用意されています。
JC Ravenueau(Sr. Director of product management)より、 様々なデータソースやそれらのアクセスコントロールなどのメタデータ管理、ガバナンス機能を提供するためのツールとしてAlteryx Connectが利用できるようになる話がされました。
これによってAlteryxで実現可能な領域が広がります。
Alteryx Connectではデータソースと利用可能な、RDBのテーブル情報やリレーション情報が可視化されます。
データに対するコメントなどの情報を付加したり、アクセス権のリクエストも可能です。
これによって先のデータ分析におけるAlteryxがカバーする領域が広がります。
続いて、Kaite Haralson(Project Manager)より、ダッシュボード機能の追加が発表されました。
これによって、Alteryxが実現可能なプロセスが分析結果の共有の領域まで広がります。
続いて、データ分析やモデリングに関する話となります。
Alteryxでは、機械学習などのモデリングためにRを利用する機能が用意されています。
データモデリングのために利用する言語してとして、Pythonの利用者が大幅に伸びており最近ではRを上回りました。 また、Sparkを利用したビッグデータの分散処理の利用も年々の増加しています。
Gary Schwrtz(Team Lead, Emerging Capabilities)よりSpark, PythonをAlteryxから利用可能になるツールの発表ありました。
Sparkを扱うためのツールとして、Customr Spark Codeというツールが新たに登場するようです。
こちらのツールは、現在あるR Toolとインターフェースが似ており、 発表では、PySparkを使って機械学習やDeep Learningを扱うためのライブラリであるH2O Sparkling Waterを利用するためのものになっています。
入出力先をAlteryxのコネクタ経由で受け取り、次の処理の渡すといった流れもRツールと同様のようです。 続いて、Pythonを利用する様子となります。
こちらは、Pythonで書かれた処理を実行したのち、それをワードクラウドとして、Alteryxで出力するデモとなっていました。
機械学習などのデータモデリングで利用される主要な言語・フレームワークを直接利用かのにしたことで、Alteryx単体でデータモデリングの領域もカバーしました。
オープニングキーノートでも提携が発表されたyhatからGreg Lamp(CTO)がここで登場します。
ここで、先ほどのフローにおける、Alteryxが取り込んでいなかった最後の項目であるOperationalizeである、 データ分析システムの運用の話となります。
ここが、どのような提携を行うかというの話となるようです。 yhatのScienceopsと連携して、Alteryxからモデルをアップロードすることが可能になるようです。
はじめはあれだけ多くの項目があったフローですが、あらゆることがAlteryxのみで実現可能になりました。
多言語対応
続いてSteve Walden(Vice President of Product Manager)が登壇し、Alteryxの多言語対応の話となりました。
最新版ではUIがドイツ語とフランス語に対応するとのことこです。
今回のキーノートで発表されたのはこの2言語のみですが、将来的に日本語にも嬉しいですね。
AWS上でのAlteryx Server
最後の話題として、AWSのChirs Grusz(Global Head, Infrastructure, Data and DevOps Categories)が登壇し、 Alteryx Serverのライセンスをサブスクリプションの紹介となりました。
こちらは以前、弊社ブログでも紹介させていただいたものとなります。
データ分析においてもAWSなどのクラウド環境を利用することで、スケールメリットやハードウェアコストの問題が解消される点について解説されていました。
キーノート資料
本セッションの動画は以下になります。
終わりに
プロダクションキーノートでは、Alteyxでの様々な新機能が発表されました。 また、オープニングキーノートでも発表されたyhatとの連携についてもどのようなことが可能になるのかも明らかになり、 今後はますますAlteryxのみで実現可能な領域が広がっていくようです。
SparkやPythonが利用可能になるという発表においても技術者を中心に大変盛り上がっており、 分散処理環境が必要になるようなビッグデータを保有する環境でもAlteryxのみのワンストップで分析が可能になるのというのはすごいことですね。