【レポート】AI & Big Data Expo North America 2019 – Part 1

2020.01.09

はじめに

今回参加したイベントは、Tech Expo World Series の一環として11月にシリコンバレーの中心部にあるSanta Clara Convention Centerで行われたAI & Big Data Expoの北米版です。数年前にバンクーバーからサンノゼに直行便で行けるようになり、サンノゼ空港からは車で15分もかからない距離で、とてもアクセスしやすかったです。参加費について触れると、すべての展示会にアクセスできて、一部のキーノートに参加できる無料プランと、クローズドセッションに参加可能な、いくつかの有料プランの中から選べます。昨年度の同イベントと比べて、イベント規模が大きくなり、展示企業は倍増したそうです。

展示会およびセッション紹介

展示会は、大きく分けて、DataOps効率化プラットフォームとAIソリューションのセクションから成っており、大手のGoogleやIBMと並んで、学生たちが立ち上げたスタットアップのブースも紹介されていました。共通の動向として見られたのが、データラベリングなどのデータ前処理の効率化への取り組みおよびデーターオーケスレーションの多様化でした。セッションについては、大手事業法人によるAIへ取り組みに関するプレゼンテーションが中心となっており、連載ブログで紹介していきたいと思います。

DataOps

エンタープライズソリューション

より多くのエンタープライズアーキテクチャがハイブリッドおよびマルチクラウド環境に移行し、柔軟性とアジリティーが向上しますが、ストレージとコンピューティングを分離する必要があり、フレームワーク、クラウド、ストレージシステム間でデータ管理方法に新たな課題が生まれます。それらの課題解決に取り組んている、InfoworksAlluxio など、いくつかのデーターオーケストレーションプラットフォームが紹介されていました。 InfoworksのDataFonudryとはコードのない環境でデータ操作とオーケストレーションの自動化を提供するプラットフォームで、データインジェスチョン、データキャプチャー変更、データパイプライン、カタログ化、データリネージュ、オーケストレーションおよび監視をカパーする、総括的なシステムです。また、オンプレミス、クラウド、ハイブリッド、マルチクラウド環境が円滑にサポートされているのが特徴的です。

すべてのデータソースにすべてのBig Dataプラットフォームに対応可能

元々UC Berkeley's AMPLabで設立されたAlluxioは、MLに特化したオープンソースデータオーケストレーションプラットフォームで、Lenovo,Barklays,IBM, Microsoft, Wells Fargo, Alibaba Cloud, Oracleなどの世界のトップクラス企業はプロダクション環境を取り入れています。

Alluxioは、Spark、Presto、Hiveなどの分析ワークロード向けのデータキャッシングソリューションです。キャッシングに加えて、ユーザーはAWS S3データを希望の分析フレームワークに読み込み、ジョブ間でデータを共有できます。Alluxioはメタデータもキャッシュするため、メタデータ操作に強力な一貫性が提供されます。利用者によると、Alluxioは、S3上で実行されるHiveおよびSparkクエリの5〜10倍の速度を実現するとのことです。キーベネフィットとしてあげられるのは:

    • データローカリティ。S3からのデータをSpark、Presto、またはHiveキャッシュし、コンピューティングと同じインスタンスに配置できます。
    • データへのアクセス性。データがオンプレミスにあるか、クラウド上にあるか、HDFSまたはS3にあるかに関係なく、ファイルとオブジェクトにさまざまな方法でアクセスできるようになっています。
    • オンデマンドデータ。コンピューティングと同様に、データを弾力的にします。データが複数のクラウドプラットフォームに分散している場合でも、クラウドでのコンピューティングのためにデータを簡単にオーケストレーションできます。

      学生スタットアップから始まったDataforest

      マサチューセッツ工科大学のによるMIT Global Startup Labs企画に優勝したDataforestのCEOのZulfugar Verdiyev氏、アゼルバイジャン出身で、コンピュータサイエンス専攻の大学生です。高校時代にInfomatrixという、各国の子供たちが参加するコンピュータコンペティションに入賞した実績もあります。

      Dataforest のCEO, Zulfagar Verdiyev (左)と CTO, Rustam Quliev (右)

      ファウンダーのビジョンとは、

      DataforestがAI&Big Dataに関連するあらゆる需要に対するマーケットプレースになるほか、独自のプラットフォームにより、AIテクノロジーの急速な成長に貢献することを目指しています。また、ユーザーにデータのクリーニングとラベル付け、カスタムデータセットの要求、モデルのトレーニング、コミュニティ内でのSNS化などの機能を提供します。一方、ユーザーはこれらのデータセットリクエストとモデルにラベル付きデータを提供し、見返りに実際の収入を得ることができます。 Dataforest、AIコミュニティを共通の利益を図るための総合プラットフォームになると考えています。

      まだ開発中のプラットフォームですが、今後の成長が楽しみです。 ※Dataforestのプレゼンテーションをご覧になりたい場合、info@classmethod.caまでご連絡ください。

      AIプラットフォームやAIソリューション

      Google Cloud のPremier Partnerが提供するAIソリューション

      Pluto7はグローバル・ブレイクスルーパートナーのトップ5入りしたGoogle Cloud プレミアパートナーです。主にオムニチャンネルリテール業界、ヘルスケア業界のお客様向けにカスタムソリューションを提供しています。アプローチについてですが、多くの企業は、エンドツーエンドAI化ソリューションを探していることから、Google Cloudを活用しAIおよびMLビジネス変革プロセス全体を把握できるように設計されています。

      具体的に、マーケティングML、需要ML、セールスML、サプライMLおよび予防保全ML、それぞれによって、全体の業務効率化を進めます。以下スライドは成功事例の紹介になります。AB InBev社がビールろ過プロセスをはるかに高い精度で最適化できるようにしただけでなく、コスト削減と業務効率化が達成されました。 このソリューションは、TensorFlow、Cloud Machine Learning Engine、Cloud SQL、およびBigQueryを組み合わせたものです。

       

      ※Pluto7のプレゼンテーション資料をご覧になりたい場合、info@classmethod.caまでご連絡ください。

      AIテストサービスApplause

      Applauseのブーズの模様

      Ebay、Delta航空、Walmart、Facebook、Uber、Airbnbなどの多くの企業に、支払いテスト、オムニチャネルテスト、セキュリティテスト、アクセシビリティテスト、ユーザビリティテスト、音声テストなどの様々なテストサービスを提供しているApplauseは、AIに特化したサービスを紹介していました。一般エンドユーザーはAIに高い期待を抱いており、AIが期待通りの結果を出せない場合はがっかりします。話したことを理解できない音声対応デバイス、関係ないおすすめ情報を表示するレコメンデーションエンジン、またはジェネリックな回答しかできないチャットボットなど、標準以下のAI体験によって、ユーザーを喜ばせ引き付けるのではなく逆効果となります。ダイバーシティに満ちたApplauseのテスターコミュニティは、開発プロセス全体でAIを活用したユーザーエクスペリエンスをテストし、アルゴリズムが正確で人間並みで実に有用な結果を出していることを検証します。以下キーベネフィットとなります。

  • 優れたデバイスカバレッジ。IOTとウェアラブル、スマートホームと車載システムなど、AIが存在するすべてのデバイスでテストできること
  • エンドユーザーの視点からのテスト。実際のエンドユーザーの観点からの迅速なフィードバックを提供し、エンドユーザーが有用で魅力的なAIエクスペリエンスを確保できるようにすること。
  • バイアスのAI出力の検証。Applauseテスターコミュニティを活用して、さまざまなユーザーグループでバイアスのアルゴリズムをテストし、AIがあらゆる場所で機能することを確認できること。