モダンデータスタック カテゴリ紹介 #30 『Data Apps(データアプリケーション)』 – Modern Data Stack Categories Overview Advent Calendar 2023

2023.12.30

当エントリは『Modern Data Stack Categories Overview Advent Calendar 2023』 30日目のエントリです。

データ分析、データを扱う世界では昨今『モダンデータスタック(Modern Data Stack/MDS)』という考え方、サービス構成が大きな注目を浴びています。データの収集、処理、保存、分析に使用されるツールとクラウドデータサービスを集めたソリューションを指す言葉です。クラスメソッドとしてもこのモダンデータスタック(Modern Data Stack/MDS)を推しており、下記の内容でお客様にサービスとして提供しています。

このモダンデータスタックという考え方、現在では構成するサービス群のジャンルが非常に多岐に渡ってきています。このカテゴリ分けも正直企業や個人によって定義が分かれていたりするのですが、『Modern Data Stack - Everything that you need to know !』というサイトではこのカテゴリ分類がシンプルかつ分かりやすく展開されています。このアドベントカレンダー企画では、このサイトで展開されているカテゴリ毎について内容を理解することで見識を広め、今後のサービス展開・サービス選択を検討する足掛かりとして行きたいと思います。

当エントリでは、Modern Data Stack(MDS)におけるカテゴリ『Data Apps(データアプリケーション)』の内容について紹介します。

目次

 

モダンデータスタック(Modern Data Stack/MDS)における『データアプリケーション』とは

アドベントカレンダー企画の趣旨については1日目のエントリ内『当アドベントカレンダー企画について』をご参照ください。

データアプリケーションとは、データ利用者のために構築されたインタラクティブな製品です。データアプリケーションは主に以下の組み合わせで構築されます。

  • データの可視化
  • UIコンポーネント
  • ユーザー入力)
  • その他のカスタム機能

従来のダッシュボードとは異なり、データアプリは高度にカスタマイズされ、特定のユースケースやユーザーエクスペリエンスの目標に合わせて構築されます。

データアプリケーションに関する要点やポイントは以下の通り。

  • 企業はどのように分析アプリケーションを構築するのか
    • 従来、分析アプリケーションは、ソフトウェアエンジニアとデザイナーのチームによって、フロントエンドとバックエンドの開発を組み合わせて構築され、特注のデータ製品を作成していた
    • 最新のデータスタックが進化するにつれ、ツールはデータアプリケーションの構築をより簡単で信頼性の高いものになってきた
    • TopCoat、Streamlit、Plotly Dash、Cube、Shinyのようなツールは、これらのアプリケーションの構築と起動を容易にする
  • 従来のダッシュボードが不足するのはどのような場合か
    • バージョン管理やgitワークフローを使ったビルドが難しい
    • CI/CDパイプラインに統合できない
    • カスタマイズ、拡張、カスタム機能での構築ができない
    • 期待性能を下回る
  • データ・アプリのユースケースは、従来のダッシュボードでは達成できなかったユーザー・エクスペリエンス、カスタム・ブランディング、データ・インタラクティビティに対して非常に高いハードルを要求することが多い
  • データアプリのユースケース
    • データ共有、収益化、製品化のためのスタンドアロン型の顧客向けデータ・アプリケーション
    • 従来のソフトウェア開発ライフサイクルとエンジニアリングのベストプラクティスを必要とするデータ製品
    • 従来のダッシュボードには適していないが、主要な分析を公開する社内データ製品やポータル
    • 大規模なアプリケーションのコンテキストに組み込まれたデータアプリケーション

 

MDSにおける主なデータアプリケーション系サービス

ここではモダンデータスタックにおける『データアプリケーション』のカテゴリで主だったサービスについて幾つか言及していきたいと思います。(ここでの評価はユーザーによるサイト内でのLIKEの数が多いものを中心に見ていきます)

 

Streamlit

Streamlitは、機械学習やデータサイエンスのための美しいカスタムWebアプリを簡単に作成・共有できるオープンソースのPythonライブラリです。わずか数分で、パワフルなデータアプリケーションを構築し、デプロイすることができます。

その他Streamlitに関する基本的な情報は以下の通り。

また、DevelopersIOでも数本Streamlitに関するエントリが公開されています。

 

Plotly

Plotlyは、最もダウンロードされ、信頼されているML&データサイエンスWebアプリケーション構築のためのフレームワークです。Plotlyは、あらゆるプログラミング言語で、インタラクティブなウェブアプリ、グラフ、ビジュアライゼーションを簡単に作成、デプロイ、共有することができます。

その他Plotlyに関する基本的な情報は以下の通り。

また、DevelopersIOでも数本Plotlyに関するエントリが公開されています。

 

Rockset

Rocksetは、クラウド用に構築されたリアルタイム分析プラットフォームです。驚くべき効率でリアルタイムデータの高速分析を実現します。Rocksetは以下の特徴や機能を兼ね備えています。

  • あらゆるデータを大規模に検索、集計、結合できる、秒以下のSQL分析機能
  • コンバージドインデックス、ビルトインコネクタ、クラウドネイティブアーキテクチャにより、ユーザーはシンプルかつ効率的に拡張することができる
  • データの形状に関係なく、数ヶ月ではなく数週間でデータアプリケーションを構築することができる

その他Rocksetに関する基本的な情報は以下の通り。

 

まとめ

という訳で、『Modern Data Stack Categories Overview Advent Calendar 2023』30日目の記事、Data Apps(データアプリケーション)に関する紹介エントリでした。

30本目の当エントリにて、アドベントカレンダー企画『Modern Data Stack Categories Overview Advent Calendar 2023』のシリーズ投稿は完了となります。全30個のカテゴリをそれぞれ見てきて『今はこんなカテゴリが出来てるのか』『そしてこんなサービスが出てきてるのか』『これまでに使ったことのあるサービスがカテゴライズされているこの分野、こんな新しい/すごいサービスが出てたのか』といった発見や驚きが幾つもありました。今回の企画は『広く浅く』系の内容でしたが、今後は今回の企画を経て気になったジャンルのサービスを色々触ってみることにもチャレンジしてみたいと思います。それらの取り組みの結果、読者の皆さんの新しい発見や気付きにも何かしら貢献出来れば幸いです。