[レポート][株式会社デジタルガレージ]データセキュリティ、およびデータプライバシーに関する取り組み – CODE BLUE 2022 #codeblue_jp

CODE BLUE 2022 のセッション「[株式会社デジタルガレージ]データセキュリティ、およびデータプライバシーに関する取り組み」のレポートです。
2022.10.28

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

CODE BLUE 2022 で行われた下記セッションのレポートです。

セッション概要

タイトル

[株式会社デジタルガレージ]データセキュリティ、およびデータプライバシーに関する取り組み

概要

データ利活用に注目が集まる中、セキュリティ・プライバシー技術の重要性が増してきています。本講演では、デジタルガレージが注目するデータセキュリティ、およびプライバシー技術をご紹介します。

Presented by

ギベス・ヴィンセント・ジョセフ(株式会社デジタルガレージ 執行役員)
田 智秀(株式会社デジタルガレージ 執行役員)

レポート

  • アジェンダ
    • デジタルガレージの紹介
    • デジタルガレージと情報セキュリティ
    • Today's Secrutiy Topics
      • Protecting IT infrastructure with BastionZero
      • Protecting sensitive information with InferenceQL
  • デジタルガレージ社の概要
    • 1995 年設立
    • 東京とサンフランシスコにオフィスがある
    • Purpose
      • サステナブルな社会と技術のために "Next Context" をデザインする
    • Mission & Value
      • Integrating Technology × ESG × Innovation with First Pengin Split

Protecting IT infrastructure with BastionZero

  • BastionZero 社について
    • ブロックチェーンのベンチャーから出発した会社
  • ビジョン
    • クラウドサービスとしてのリモートアクセス
    • シンプルであることを優先
    • よりよいゼロトラストセキュリティモデル
  • ユーザーアクセスのセキュア化はどれだけうまくやってもリスクは存在する
  • BastionZero のやったこと
    • 多要素認証は SSO プロバイダーに対するものであり、単一の ID プロバイダーに信頼を置いている
      • マルチルートとして、SSO プロバイダー以外に BastionZero が認証を行う
      • たとえ、SSO が侵害されたとしても侵入されない
    • すべての接続に対して、ひとつひとつ鍵を用意する
      • 一つの鍵で他のサービスにアクセスはできない
  • VPN モデルとの比較
    • VPN は長期的な有効期限の認証情報がある
    • 一方、BastionZero では、BastionZero から SSO に対してユーザーが接続する度に認証を要求する
      • BastionZero には外から入れるオープンポートはない(スキャン対象にならない)
      • ユーザーは BastionZero のクライアンを介してアクセスする
  • BastionZero はログを提供する
    • すべての接続に対してどの認証情報でどのような操作をしたのか記録できる
    • 侵害の調査や監査のために利用できる
    • ユーザー、セッションレベルで確認できる
  • 実装も簡単
    • エージェントは 15 分程度で導入できる
    • 自動的にターゲットを検出する機能があり、迅速に実装できる
    • Linux, k8s, AWS 等のクラウドサービスに対応している
  • 特定の時間だけアクセス可能にする、などの設定もできる

Protecting sensitive information with InferenceQL

  • 問題は、Data Accessibility
    • 最近はデータが増えている
    • 多くのデータに対する、コンプライアンスやガバナンスのポリシーが必要だが、難しい
  • どうすればデータを保護しながら、機械学習への利用や共有ができるか
  • ユーザーを守る 2 つのアプローチ
    • Trusted Computing
    • Synthetic data(合成データ)
  • Synthetic data によるプライバシー保護に対する取り組みが増えている
    • 特性だけ抜いて合成データにする
    • ユースケース
      • 機械学習の教師データに使う
      • ガードナーによると 2024 年には AI と分析に使うデータの 60%が合成データになるデータもある
  • どうやって Synthetic data を生成するか
    • ニューラルネットワークで生成
      • 少量のデータではできない
      • また、どうやってその答えに到達するわからない
    • そこで、確率的プログラミング(SPPL)による生成が役立つ
  • InferenceQL を支援している
    • 確率的プログラミングプラットフォーム
    • オープンソースプロジェクト
    • SQL に似ている言語を用いて Real data から Synthetic data を生成する
    • また一般公開されていない、リリースに向けて取り組んでいる
    • 簡単に扱えるようにしたい

さいごに

SSO を Single Point of Failure と見なす考え方は私にとっては新鮮な考えでした。ゼロトラストに関する知見が深めることができるセッションでした。