
【セッションレポート】データメッシュで実現する 自動運転・ SDV におけるデータ駆動型開発 #AWSSummit
こんにちは!コンサルティング部のくろすけです!
2025/06/25,26 に開催された AWS Summit Japan 2025 のセッション「データメッシュで実現する 自動運転・ SDV におけるデータ駆動型開発(AWS-66)」に参加してきました。
機械学習を齧っていたことがあり、最近は機械学習およびデータ関連への興味が再燃してきているので参加してきました!
だいぶ遅くなってしまいましたが、記事にしようと思います。
セッションの概要
タイトル
データメッシュで実現する 自動運転・ SDV におけるデータ駆動型開発
概要
複数の自動車メーカー (OEM) 様で実証実験中である、データメッシュコンセプトに基づく自動車 IoT データ利活用サービスについて解説します。従来の Connected Vehicle ソリューションでは、各部門が個別かつ独自にデータを収集・活用することが多く、複数部門のデータを組み合わせた新サービスの創出が課題がありました。この課題に対応するため、複数のデータ取得・提供部門とデータ群の活用部門をメッシュ状に連携させ、データカタログを通じて、データ活用部門は複数のデータ提供部門から必要なデータのみを選択しサービスを構築できるプラットフォームを AWS は実現しました。このセッションを通じて、部門の壁を超えたデータ連携の実現方法、データカタログの効果的な運用手法、そして組織横断的なデータ活用がもたらす新たなビジネスチャンスについて学ぶことができます。自動車業界のデジタルトランスフォーメーションに関わる方々にとって、実践的な知見を得られる貴重な機会です。
セッションレベル
Level 300: 中級者向け
テーマ
Data
スピーカー
山田 遼太
アマゾン ウェブ サービス ジャパン合同会社
グローバルオートモーティブソリューションアーキテクト
セッション内容
本セッションの狙い
自動車産業における、データ駆動型開発の鍵となるデータメッシュアーキテクチャとその実現に向けたアプローチの紹介
アジェンダ
- 自動車産業におけるデータ駆動型開発の現状
- 自動車業界が抱えるデータ駆動型開発の課題
- データメッシュの導入
- AWS でのデータメッシュ
自動車産業におけるデータ駆動型開発の現状
CASE 以降の爆発的なデータ増加
自動車産業における CASE について、私は初めて聞いたので CASE の概要を貼っておきます。
CASE とは、「Connected(コネクテッド)」「Automated/Autonomous(自動運転)」「Shared & Service(シェアリング)」「Electrification(電動化)」というモビリティの変革を表す 4 つの領域の頭文字をつなげた造語です。2016 年のパリのモーターショーで提唱されて以来、CASE は自動車業界全体の未来像を語る概念として話題を集めています。
抜粋:CASEとは?
この CASE が提唱されて以降、データの利活用は爆発的に増加し、現状では自動運転車両に求められる 1 台/1 日 に処理するデータ量は、767TBとも試算されていると説明されました。
下記が自動車産業におけるデータの Workload として詳しく説明されていました。
データ駆動型開発の例
前述の多岐にわたるデータを車両の開発だけでなく、バリューチェーン全体で利活用することで、ビジネス上の利益を生み出していく全体像が示されました。
お客様のデータ駆動型開発事例
実際に AWS のお客様とパートナーが取り組んでいる、データ駆動型開発の事例として下記を挙げられていました。
- アフターサービスの顧客維持率とロイヤリティの向上
- コンバージョン率向上による売り上げ増加
- 顧客行動パターンの予測精度向上
- 生成 AI 搭載アフターセールスアシスタント
- 生産性の向上
- 最新のデジタル体験の提供
自動車業界が抱えるデータ駆動型開発の課題
セッションでは、例として下記のような問題が挙げられていました。
- データの管理部署はどこ?
- データの管理者は誰?
- データのアクセス申請方法は?
またより具体的には、下記のような例が取り上げられていました。
課題
セッションでは上記のような問題が起こってしまう背景として、下記のような課題があると言及されていました。
- サイロ化
- データのサイロ化
- コミュニケーションのサイロ化
- データレイクの乱立
サイロ化
下記により、データの統合・分析が困難になるという説明でした。
- データのサイロ化
- システムごとに複数の保存先が存在
- 様々なファイルフォーマットでの保存
- コミュニケーションのサイロ化
- 専門的な分業制のための多数の部門
- 部門間のデータ連携における調整コスト
私見ですが、特に分業制が成熟している自動車産業ひいては製造業については、よく起こりそうな問題かと思いました。
データレイクアーキテクチャの導入
上述のサイロ化への対策として、データレイクを紹介されていました。
要約するとデータレイクは、サイロ化に対して下記のようなソリューションを提供していると理解しています。
- データのサイロ化:生データの集約
- コミュニケーションのサイロ化:データ管理の集約
ただし!自動車業界では一筋縄では行かない...
ここで冒頭の話と繋がってきますが、データの量・種類だけでなく、データに関わる組織やサービスも爆発的に増えている背景により、データレイクの乱立が発生していると紹介されました。
統合データレイク
データレイクの乱立への解決策として、統合データレイクのお話が出ていました。
しかし、結論としては統合データレイクは一括集中管理故に困難な場合もあると述べられました。
具体的な問題点としては、下記について触れられていました。
- データ品質の管理
- データスキーマの管理
- 業務知識
- データ規制(データの共有範囲(国内限定)など)
データメッシュの導入
データメッシュの概要
データレイクを統合することが困難な場合のソリューションとして登場したのが、データメッシュとのことでした。
セッションを聞く中で、私はデータレイクとデータメッシュの主な違いは下記と理解しました。
- データレイク
- サイロ化解消のため、データを統合
- データを集中管理することで、データの連携をスムーズに
- データメッシュ
- サイロ化緩和のため、サイロを接続
- データは分散管理のまま、データの連携を強化
また、データレイクとデータメッシュは対立や上位下位の概念ではなく、データレイクでサイロ化を解決できなかった場合の別のアプローチであるとのことです。
データメッシュアーキテクチャ
データメッシュアーキテクチャとして、下記のような構成が紹介されました。
- データメッシュプラットフォーム部門:データに適用するガバナンスの管理
- 各部門:データの実体の管理
データメッシュの実現に必要な役割
データメッシュ実現には下記の役割が必要と説明されました。
- データオーナー
- データの所有者
- 自立的なデータの管理
- データエンジニア
- 分散型データガバナンスプラットフォームの開発
- データスチュワート
- 組織内データの品質・定義・一貫したルールの整備
- データコンシューマー
- データを活用して価値創出
自動車業界に当てはめると下記のイメージと紹介されていました。
また、コミュニケーションは下記のように変化すると紹介されました。
ただし、データスチュワートは業務理解とITスキル双方が求められるため、状況次第ではデータ提供部門もしくはプラットフォーム管理部門から選任するとのことでした。
AWS でのデータメッシュ
ここからは次世代の Amazon SageMaker 、特にデータガバナンスに関する機能に特化した Amazon SageMaker Catalog についての紹介でした。
次世代の Amazon SageMaker (Amazon SageMaker Unified Studio) 自体の説明については、下記のセッションレポートでも取り上げておりますので、割愛させていただきます。
最終的に自動車メーカーを例に下記のようなアーキテクチャをご紹介されていました。
まとめ
AWS Summit Japan 2025 の「データメッシュで実現する 自動運転・ SDV におけるデータ駆動型開発」セッションでは、自動車産業における現代のデータ活用課題と、それを解決するデータメッシュアーキテクチャについて学ぶことができました!
自動車産業の課題
自動車産業では爆発的なデータ増加が起こっており、下記のような問題があると説明されました。
- データの管理部署がどこかわからない
- データの管理者が誰かわからない
- データのアクセス申請方法がわからない
- データのサイロ化による統合・分析の困難化
- 部門間のコミュニケーション不足による調整コスト増大
- データレイクの乱立による管理の複雑化
データレイクアプローチの限界
- サイロ化の部分的解決: データレイクは生データの集約とデータ管理の集約により、サイロ化問題を部分的に解決できる
- データレイクの乱立: 自動車産業ではデータ量・種類・関わる組織やサービスが爆発的に増加し、結果的に複数のデータレイクが乱立
- 統合データレイクの困難さ: 一括集中管理による統合データレイクには以下の課題が存在
- データ品質の管理の複雑化
- データスキーマの管理の困難さ
- 業務知識の集約・維持の困難さ
- データ規制(データの共有範囲制限など)への対応の複雑さ
データメッシュの概要およびその価値
データメッシュは、データレイクでサイロ化を解決できなかった場合の別のアプローチです。
- 基本的な違い:
- データレイク:データを統合し集中管理
- データメッシュ:サイロを接続し分散管理を強化
- 組織への適合性: 各部門の専門性と自律性を保持しながら連携を強化
あとがき
自分の興味があるということもあるかもしれませんが、AI・データ領域については「次世代の Amazon SageMaker」推しを強く感じるこの頃です。
今後もAmazon SageMaker関連の情報について記事にしていこうと思います!
以上、くろすけでした!