激熱!1日1製品!最強のデータ系SaaSはどれだ決定戦 アドベントカレンダー2021

時は2021年12月……。

日本での認知度の低さとは裏腹に……。

一際熱いSaaS業界がそこにはあった……!

本アドベントカレンダーの説明

「激熱!1日1製品!最強のデータ系SaaSはどれだ決定戦」アドベントカレンダーへようこそ!本企画は、今注目のデータ関連海外スタートアップのSaaS製品を1日1つ紹介していき、最終日に個人的に気に入った製品を5つピックアップする、DA事業本部春田による1人アドベントカレンダーです。

ここで言う「データ系SaaS」とは、「データ」に関係しているSaaS全般を指しています。一般的な用語がなさそうだったので、便宜上勝手に名付けました。一言で「データ系SaaS」と言っても、DWHやETL基盤、BIやリアルタイム分析、機械学習やマーケティングオートメーション、パイプラインやデータマネジメントといった、キリがないくらい様々な分野が存在しており、それを組み合わせて基盤をつくるモダンデータスタックという考え方が、データ基盤構築における最近のトレンドとなっています。つい先日、トレジャーデータ社@satoshihiroseさんの記事のバズりもあり、認知度が少し上がったように思えます。

さて、そんなモダンデータスタック界隈の中で、本アドベントカレンダーでは データマネジメント&ガバナンス に関するSaaSを集中的に取り扱っていく予定です。データマネジメント&ガバナンスという領域は、最近出てきた新しい概念というわけでもなく、DMBoK (Data Management Body of Knowledge)を筆頭に、2000年代から議論が重ねられてきた領域です。そして企業の扱うデータ量が膨張し、データ分析・利活用に関わる人数も増加している昨今の時代の流れから、データ基盤に対する管理と統制を重要視する企業が増えてきています。

ただし、その抽象度の高さや掴みどころのなさから、データマネジメント&ガバナンスのデファクトスタンダードは未だ定まっておらず、いわば未開の地となっています。だからこそ、多くのスタートアップが参入してくるわけですね。まさに群雄割拠、2020年代はデータ系SaaSの戦国時代です。

情報ソース

モダンデータスタック界隈の盛り上がり具合は、各所メディアやまとめサイトの多さからも伺えます。せっかくなので、本アドベントの情報ソースを掲載しておきます。興味がある方はこちらも見てみてください。

データ系SaaSの候補一覧

本アドベントカレンダーで取り扱うデータ系SaaSの候補を掲載します。ほぼ全て商用製品のため、スムーズにデモ環境が使えるかどうかが記事化の条件となってきます。23枠埋まり切らなかった場合は、クラウドベンダー製やOSSの製品でお茶を濁しておきますね。

  1. 5x | Convert your data into dollars
  2. Airbyte | Open-Source Data Integration Pipelines ELT
  3. Alation | Enterprise Data Catalog & Data Governance
  4. Alex Solutions | Enterprise Data Platform for workforce productivity
  5. Ataccama ONE | Turn your data into insights with free data profiling
  6. Atlan | Modern Data Workspace
  7. Bigeye | Data Observability
  8. Collibra | Helping Organizations Become United by Data
  9. Castor | Bring trust and visibility to your data
  10. ClicData | The Power of Your Data in Beautiful Dashboards
  11. Cyral | Governance and Protection - Secure your Data Mesh
  12. data.world | The Cloud-Native Data Catalog
  13. Datacoral | Maximize Data Pipeline Value, Minimize Data Engineering
  14. Dataedo | Single Source of Truth About Your Data
  15. Datafold | Data Reliability Platform
  16. Datakin | Data Lineage Solution
  17. DataGalaxy | The 360° Data Catalog for datagovernance
  18. Dreamdata | The Leading B2B Revenue Attribution Platform
  19. Egnyte | Mission Control for Critical Content
  20. erwin | Data Governance & Data Modeling
  21. Immuta | Universal Cloud Data Access Control
  22. Isima | 10x Data Engineer
  23. Iteratively | A single source of truth for your analytics
  24. Ketch | Programmatic Privacy Software
  25. Monte Carlo | Data Reliability Delivered
  26. Nexla | Unified Data Fabric for Modern Enterprises
  27. Ovaledge | A comprehensive data cataloging and governance solution
  28. Pinecone | Vector Database for Similarity Search
  29. Satori | Streamline data access and security with DataSecOps
  30. Secoda | Data discovery built for modern data teams
  31. Segment | #1 CDP to Manage Customer Data
  32. Select Star | Data discovery made easy
  33. Semarchy | Semarchy is the Intelligent Data Hub Company
  34. Soda Data Observability | Get ahead of silent data issues
  35. Stemma | Total Trust in Data
  36. strongDM | Connect Your Team to Anything
  37. TileDB | Data management made universal
  38. timbr SQL Knowledge Graph | Turning databases into knowledge graphs
  39. Tree Schema | The Human-Friendly Data Catalog
  40. Trifacta | Data Wrangling Software and Tools
  41. Upsolver | Continuous SQL Data Pipelines for Cloud Data Lakes

公開リスト

以下にブログのリンクを掲載しておきます。カテゴリは便宜上主観で分けています。

# 公開日 タイトルとリンク カテゴリ
1 12/01 激熱!1日1製品!最強のデータ系SaaSはどれだ決定戦
2 12/02 データカタログのユニコーン企業「Collibra」のデモ環境を試してみた Data Catalog
3 12/03 最先端のデータガバナンスを提供するSaaS「Satori」を通してRedshiftにアクセスしてみた Data Governance
4 12/04 気軽にData Observabilityを導入できる「Soda」のチュートリアルをやってみた Data Observability
5 12/05 ベクトル特化型データベースサービス「Pinecone」でセマンティック・キーワード検索をやってみた Database Engine
6 12/06 オープンなコミュニティ志向のデータカタログ「data.world」を試してみた Data Catalog
7 12/07 セキュアなデータメッシュを実現するSaaS「Cyral」を試してみた Data Governance
8 12/08 Google Dataprepの本家「Trifacta」がめっちゃ良い感じのETLツールだった ETL
9 12/09 安くマネージドなデータカタログを導入できる「Tree Schema」を触ってみた Data Catalog
10 12/10 データレイク上にETLパイプラインを構築するSaaS「Upsolver」を触ってみた ETL
11 12/11 とにかくシンプルなデータカタログが欲しい人におすすめな「Select Star」のご紹介 Data Catalog
12 12/12 自前でデータパイプラインをサクッと構築できる「Airbyte」を試してみた Data Pipeline
13 12/13 あらゆるリソースへのアクセスを一元管理するゲートウェイSaaS「strongDM」を触ってみた Data Governance
14 12/14 UI/UX重視のユーザーフレンドリーなデータカタログ「Secoda」を試してみた Data Catalog
15 12/15 豊富なメタデータを表ベースで整理するデータカタログ「OvalEdge」を触ってみた Data Catalog
16 12/16 Clouderaが買収したETLパイプラインの「Datacoral」でデータロードしてみた Data Pipeline
17 12/17 紙のポスター感覚でダッシュボードが作れるBIツール「ClicData」で遊んでみた BI
18 12/18 多次元配列に特化したユニバーサル・データエンジン「tileDB」でLiDARデータを3Dグラフ化してみた Database Engine
19 12/19 データの信頼性を向上させるためのプラットフォーム「Datafold」を触ってみた Data Observability
20 12/20 サービスの海外展開に重宝するレギュレーションプラットフォーム「Ketch」の紹介 Data Governance
21 12/21 日本発のデータ分析基盤SaaS「trocco」の機能を試してみた ETL
22 12/22 データマネジメント・ガバナンスの観点から見るAWS Glue Data Catalog Data Catalog
23 12/23 データマネジメント・ガバナンスの観点から見るGoogle Data Catalog Data Catalog
24 12/24 OSSデータカタログの決定版!?OpenMetadataがかなりイケてるので紹介したい Data Catalog
24 12/25 【まとめ】絶対にチェックしてほしい激熱なデータ系SaaSのBEST5

注意事項

つい煽り気味のタイトルをつけてしまいましたが、本企画では以下のことは実施しません。あくまでDevelopersIOらしい、いつも通りの「やってみた系」の記事を書いていきます。

  • 製品に対する批判やネガティブなポイントの指摘
  • スペックを表形式で比較するなど、製品どうしの直接的な比較

正直完走できるかどうかかなり不安ですが、乞うご期待ください!