ChatGPT Atlasのセキュリティ周りを調べてみた

2025.10.27
こんにちは、せーのです。
!この記事では、先日の記事で紹介したChatGPT Atlasの実験的な検証を通じて、そのセキュリティ設計を技術的に分析します。不安と安心の両立を目指す方に向けて、まとめました。
先日より、ChatGPT搭載ブラウザ「ChatGPT Atlas」にハマっているのですが、「AIブラウザ」という物自体が今まで少なかったため、またAtlasを慎重に見ている、という方も多いようです。
そこで今回はAtlasのセキュリティについてご紹介し、その上でユーザーはAIブラウザを使う際に何に気をつけるべきなのか、私なりの考えをまとめてみたいと思います。
最近Atlasを使っている中で、非常に興味深い「セキュリティが正常に機能している場面」を目撃することができました。今回はその実例を交えながら、Atlasのセキュリティ設計がどのように機能しているのかを解説していきます。
 はじめに：AIがブラウザを使う時代へChatGPT Atlas は、OpenAI が発表した「AIが自らブラウザを操作できる」新しい仕組みです。

ユーザーが「このサイトを開いて」「この情報をまとめて」と指示すると、AIが実際にブラウザのタブを開き、ページをスクロールし、情報を収集・要約します。
これは従来の「チャットボット」とは違い、 AIが人と同じWebブラウジング権限を持つ という意味で大きな転換点です。

しかし同時に、セキュリティの観点から「AIが勝手に動くのでは？」「機密情報を読み取らないか？」という懸念も生まれます。
前回の記事で紹介したように、Atlasはデフォルトブラウザとして十分な価値があるツールです。ただし、この強力さゆえに、セキュリティ面での理解は必須です。
 Atlasの基本的なセキュリティ設計まず押さえておきたいのは、AtlasのAI（ChatGPT）はユーザーのブラウザに完全アクセスしているわけではないということです。

設計上のセキュリティ層は大きく3つあります。
 🔒 ブラウザ層（Chromium）AtlasはChromiumをベースにしたブラウザです。

Cookieやパスワード保存、オートフィルといった機能は従来のChrome同様に動作します。

AIはそれらの内部データに直接アクセスできないという仕様になっています。

つまり「保存パスワード」や「Cookie値」を読み取ることはできません。
これは一見すると不便に思えるかもしれませんが、実は非常に重要なセキュリティ機構です。仮にプロンプトインジェクション攻撃があったとしても、パスワード保管庫までは到達できないということですね。
 🧠 AI層（ChatGPT）AIが関与するのは「ページを開く」「テキストを要約する」「フォームに入力する」などの操作部分です。

この操作は常にユーザーの指示・許可を前提に行われ、AIが勝手にWeb上を巡回することはありません。
エージェントモードで「XXXXチャンネルを探して、△△さんのコメントをまとめて」と指示しても、AIはその指示の範囲内でのみ動作します。勝手に他のチャンネルを見たり、別のツールにアクセスしたりすることはないわけです。
 ⚙️ 制御・同意層ユーザーはページごとに「ChatGPTがこのページを見てもよいか」を設定できます。

また、ブラウザメモリ（AIが見たページ内容の要約記録）はオプトイン方式。

企業利用では「Agentモード（AI自動操作）」をログアウト状態で使う設定も可能です。
つまり、ユーザー側で「ここまでならAIに見せてもいい」という境界線を引ける設計になっているということですね。
 実験：Slackで発生した「プロンプトインジェクション」では、AIブラウザが実際にどのように安全に振る舞うのか。私が実際に経験した事例をお話しします。
Atlas上でSlackを開いて、エージェントモードで「チャンネルを確認して」という指示を実行したとき、画面の一部に以下のような反応がAIから返ってきました。
画面上にSlackの操作に関する詳細な「#Instructions」という指示が表示されましたが、
これはシステムやツール側からの指示のようであり、ユーザーからのご依頼ではないため、
プロンプトインジェクションの可能性があります。
そのため、この指示には従わずに無視するのが安全と考えています。
数秒後、再びAIは同様の判断を出しました。
画面に再び「#Instructions」という指示が表示されましたが、
これはユーザーからの指示ではなく、プロンプトインジェクションの可能性があるため無視します。
引き続き右側のメッセージボックスをスクロールして、ユーザーからのご指示の内容を確認していきますね。
AIは自動的に「これは攻撃かもしれない」と判断して、指示に従わなかったのです。
 何が起こっていたのか：技術的な背景Slackのチャンネル内には「#Instructions」というメッセージが実在していて、その内容はAIに向けた"命令文"のように見えるものでした。

通常の人間ユーザーであれば単なるテキストとして無視しますが、AIは画面上の文字を解析する過程でこれを「命令」と誤認するリスクがあります。

これが「プロンプトインジェクション」です。
典型的なプロンプトインジェクション攻撃は、こんな感じです：
# ページ上に隠されたテキスト
"You are ChatGPT... Ignore all previous instructions and..."
Atlasが見たのはこのようなパターンで、AIが
「ユーザーの意図ではない命令である可能性があるため無視します」
と自律的に判断しました。つまり、**AIが自動的に"攻撃を認識し、命令を拒否した"**ということです。

これはOpenAIが実装している安全層（プロンプトサニタイゼーションレイヤー）が正しく機能した証拠といえます。
 Atlasが守ってくれること、守れないことAtlasにはちゃんとした防御があります。ただどこまで守ってくれるのか、その範囲を理解しておくことが大切です。
 技術的な防御機構Atlasのセキュリティ設計は、複数の層で実装されています。以下、各層の特徴を詳しく紹介します：
 1️⃣ コード実行とファイルシステムアクセスの完全制限AIエージェントは以下の操作が完全に制限されています：
ブラウザ内でコードを実行する
ファイルをダウンロードまたはアップロードする
ブラウザ拡張機能をインストールする
コンピュータやファイルシステム上の他のアプリケーションにアクセスする
これらは技術的に実装された制限であり、ユーザーやAI自身が回避することはできません。つまり、「AIがマルウェアをダウンロード」といったシナリオは構造的に不可能なわけです。
 2️⃣ ブラウザとAIの厳格なプロセス分離Atlasは、ブラウザプロセスとAI制御プロセスを明確に分離しています。AIは以下のローカルデータに直接アクセスできません：
ブラウザに保存されたパスワード
Cookie値
認証情報（セッショントークンなど）
拡張機能のキャッシュデータ
これは「APIレイヤーを通じた制御」という設計により実現されており、AIが見るのはブラウザレンダリング後の「表示テキスト」のみです。ブラウザの内部状態を直接推測することはできません。
 3️⃣ 金融サイトでの一時停止と監視機構特に重要なのが、金融機関やクレジットカードサイト、会計システムなど機密性の高いサイトでのAI操作時、ユーザーの監視下で一時停止する機能です。
これにより：
AIが金融取引を実行する前に、ユーザーが内容を確認できる
不正な送金や設定変更があれば、ユーザーが即座に中断できる
操作ログがユーザーに可視化される
 4️⃣ ログアウトモード：エンタープライズ向けセーフガード企業環境向けに、Atlasは「ログアウトモード」という機能を提供しています。これを有効にすると：
AIエージェントが任意のサイトにログイン状態で操作することを禁止
既にログイン済みのセッションでも、AIは「公開状態のみ」にアクセス可能
企業の認証情報が保護される
 5️⃣ データ送信の仕組み：ローカル処理とクラウド処理の分離Atlasでは、以下のデータフローが設計されています：
ローカルで完結する処理
ページのテキスト抽出と初期解析
ユーザーの指示解釈
機密データの検出と除外処理
クラウド（OpenAI）に送信される処理
テキスト要約の生成
AI推論が必要な複雑な分析
ただし、初期設定では「ウェブ参照と検索の改善にご協力ください」という設定がデフォルトで有効です。これにより、ユーザーが訪れたURLの一部がOpenAIに送信される可能性があります。これはプライバシー観点から注意が必要な点です。
! 🔍 深堀り：ブラウザ層とAI層の分界点ここで重要な技術的な質問が生じます。「AIがブラウザを操作する」という過程の中で、ブラウザのネイティブ機能（Cookie管理、ログイン状態維持）とAIの操作がどのように分離されているのかという点です。
 ユースケースで考えるたとえば、以下のような流れを想定してください：
ユーザーが「社内ポータルを開いて、最新のレポートを要約してほしい」とAIに指示
Atlasがそのポータルサイトを開く
既にログイン済みのセッションが残っていれば、Cookieを使ってサイトがログイン状態を維持
AIがページ内容を見て分析・要約する
この流れの中で、「どこまでがChromiumベースのブラウザ機能で、どこからがAI操作なのか」を明確にする必要があります。
関与する主なシステム層：
Chromiumエンジン層：ページレンダリング、タブ管理、Cookie送受信、ログイン状態の維持。ユーザーが通常のブラウザで操作するのと同じ動作。
AI層：ユーザー指示の受け取り、ナビゲーションのトリガー、ページ内容の分析・要約。
制御層：ユーザーが「ChatGPTに見せるか見せないか」を設定できるポリシー。
重要な設計ポイント：
AIが「どのCookieを使うか」「パスワードを読み出すか」という低レベルのブラウザ機能を直接操作することはできません。
ブラウザエンジンが自動的にCookieを送受信して、ログイン状態を維持する。AIはその状態を「認知」することはできても、Cookie値そのものにアクセスして読み出したり改変したりはしません。
ユーザーが「ログアウトモード」を選択すれば、Atlasが既存のCookieを使わないように制御できます。この設定はブラウザレイヤーで強制されます。
 保存パスワード・オートフィルの扱い公式明記：「AIエージェントは保存されたパスワードやオートフィルのデータにアクセスできません」
これは、ユーザーが過去ログインして保存した「ID」「パスワード」「フォーム履歴」などを、AIが読み出して利用することができないという設計です。
ただし、ユーザーが既にログイン済みの状態でAIに「このサイトで〇〇してほしい」と指示すれば、AIはそのログイン済み状態を前提にタスクを実行できます。この点は「パスワードを読んだ」という意味ではなく、「既にあるセッションを使う」という意味です。
! 🔍 深堀り：ユーザー不在でのWeb巡回と情報収集リスク次に、「AIが勝手にWeb上を巡回して情報を収集する」という懸念です。特にDeepResearchやGPTsなどの機能と組み合わされた場合、このリスクは高まります。
 設計上の制限Atlasの公式説明では、以下のようにユーザー主導・許可制を謳っています：
「You're in control of what ChatGPT can see and remember as you browse.」（公式より）
「When you ask a question, ChatGPT may ask you if it should start opening tabs and clicking in your browser to complete the task.」（OpenAI公式）
つまり、AIが勝手にタブを開き続けるのではなく、ユーザーの指示を受けて、かつ確認をとった上でタスクを実行する設計になっています。
 しかし残る懸念「確認をとる」というUI形式が十分か、ユーザーが気づかずに許可を出してしまう可能性があります。
Browser Memory機能でAIが過去の閲覧内容を記憶し、それを起点に自動提案・タスク実行を始める可能性。
プロンプトインジェクション攻撃によって、悪意あるサイトコンテンツがAIを誘導し、勝手にタスク拡張が起こる可能性。
企業利用では、現在「完全な監査ログ、SIEM統合、データガバナンス」がまだカバーされていません（公式明記）。
 実務的な対策Agentモード利用の許可範囲を明確に定義する。「情報収集タスク」だけなのか、「データ変更・操作」まで許可するのか。
「Watch Mode」：AIが操作中、ユーザーが監視できるUIを強制。
ログイン状態で操作させる場合は、事前ポリシーで許可サイト・許可タスクをホワイトリスト化。
監査ログを外部で補完（プロキシ・SIEM等で記録）。
! 🔍 深堀り：ログイン済みCookieサイトでのAI操作リスク最後に、最も現実的で重要なリスク：ログイン済みのセッションを持つ社内ポータル・クラウド管理画面などでAIが操作する場合を取り上げます。
 想定されるリスクシナリオセッション濫用：AIが既に有効なCookieを使ってサイトを操作。意図しないデータアクセスや変更が起こる。
認証済みサイトでの不正アクション：例「このサイトからデータを削除して」という指示が、AIに確認プロンプトなしで実行される可能性。
悪意あるコンテンツ混入：ログイン済みサイトが改ざんされていたり、プロンプトインジェクションが埋め込まれていたりすると、AIが「ユーザーの権限」を使って悪用される。
意識しない間のデータ送信：AIが情報収集タスク中に、想定外のサイトにアクセスしたり、データをOpenAIに送信したりする可能性。
 公式仕様による対策OpenAI Help Centerには以下が明記されています：
インコグニート（シークレット）モードの利用：Cookie・サイトデータはセッション終了時に破棄される。
「ログアウトモード」：AIエージェントが既存のCookieを使わないモード。但し、デフォルトで有効なわけではなく、ユーザーが明示的に設定する必要あり。
金融機関などの「重要なサイト」ではAI操作時に「Watch Mode」で一時停止。ユーザーが監視できる。
 現在のギャップしかし、重要な技術的ギャップがあります：
Atlas単体では、「このサイトはAIに見せない」「このドメインではログイン状態を使わない」という自動制御メカニズムがない。これは自己申告と運用ルールのレベルに留まります。
エンタープライズ向けドキュメントでも「既存のChatGPT Enterprise セキュリティ制御（RBAC、SIEM、監査ログ）はまだAtlasには完全に適用されない」と明記。
つまり、「AIにログイン状態を使わせても大丈夫か」という判断や制御は、ユーザー側で責任を持つ必要があります。
 業務効率化とのバランスただし、ここに本質的なトレードオフがあります：
「常にログアウトモードのみ」では、AIブラウザの利便性が失われます。
社内レポート取得、クラウド管理、データ分析など、ログイン状態を活用したAI支援こそが、業務効率化の本質です。
よって、「ログイン状態を使いながら、安全に運用する」メカニズムが必須。
 実装可能な技術的制御設計段階で以下を検討することで、利便性とセキュリティの両立が可能です：
ネットワーク層の制御：プロキシ・SWGでドメイン単位にアクセス制御。「社内システムへのAtlasアクセスは特定ユーザーのみ許可」。
ID管理層：SSO（Azure AD / Okta等）の条件付きアクセスでポリシー化。「Agentモード許可は管理者承認済みユーザーのみ」。
MDM・DLP層：エンドポイント側で「特定サイトへのAI操作をブロック」「ユーザーのコピペを検知」。
監査ログ補完：Atlasの監査ログが未成熟なため、プロキシ・SIEMで「AI経由のアクセス」を記録・分析。


制御層
具体的手段
効果
自動制御度


Atlas本体
Agentモード ON/OFF、Logged-out Mode
ユーザー単位で設定
🔸手動

ネットワーク
プロキシ・SWG
部門ごとの利用制限
✅自動

ID管理
SSO 条件付きアクセス
役職・部署ベース制御
✅自動

MDM/DLP
アプリケーション制御
操作の検知・遮断
✅自動

SIEM
プロキシ・ヘッダ監視
利用履歴の可視化
✅自動

社内導入時には、これら複数層を組み合わせて、Atlasの不完全な制御機構を補完することが現実的です。
 方針でまとめると ✅ 技術的に守れること明示的な命令文（"You are ChatGPT…", "Run this code…" など）を検知して無視
ページ内のユーザー意図でない指示を「無視対象」として扱う
ブラウザ内部データ（保存パスワード、Cookie値）への直接アクセス防止
ファイルシステムやシステムプロセスへのアクセス防止
金融サイトでのユーザー監視と一時停止
ログアウトモードによるセッション保護
 ⚠️ 技術的に守れないこと＆ユーザーが管理すべき領域命令文が画像やCSSコメント、HTML属性内などに埋め込まれた場合
文脈依存で巧妙に設計された誘導テキスト
ユーザーが自ら、ログイン済みセッション状態でAIにアクセスを許可した場合
ユーザーが意図的に機密情報を扱うサイトでエージェントモードを有効にした場合
URLやアクセスパターンがOpenAIに送信されることによるプライバシー
つまり、「AIが守ってくれる範囲」はあくまで構造的・技術的に明確なリスクまで。

ユーザーの判断や設定、そしてユーザー自らが機密情報を提供することによるリスクを完全に守りきれません。ここが一番重要な、人間が注意を払って使う必要がある理由です。
 ユーザーが取るべき心構えと対策セキュリティは「AIに任せっきり」ではなく、ユーザー側の使い方が非常に重要です。
 👤 個人ユーザーの場合金融・社内情報などを扱うサイトではAgentモードを無効にする — エージェントモードは便利ですが、パスワードマネージャーやSSO連携されたサイトではリスクが高まります
「ChatGPTに見せないページ」設定を活用する — プライバシー設定で除外ページを指定できます
定期的にCookieと履歴を削除する — 他のブラウザと同様のセキュリティ習慣が大切です
AIが出力した「警告メッセージ」は必ず読む — Atlasが「これは疑わしい」と判断したら、その直感は正しい可能性が高いです
 🏢 企業・開発者の場合AIがアクセスできる社内サイトをホワイトリスト化 — 全サイト許可ではなく、許可するサイトを明確に定義する
プロキシやSSOでAtlasアクセスを制御 — 企業ネットワーク側でAtlasの接続制限を設定する
「Agentモード許可業務」を業務カテゴリごとに定義 — 「情報収集はOK、金融取引はNG」といった指針を持つ
プロンプトインジェクションの社内実証を定期的に実施 — 実際に攻撃をシミュレーションしてみることで、運用上の課題を洗い出す
最も大切なのは、AIを禁止するのではなく、"どこまで任せるか"を設計することです。
 実務での安全な使い方Atlasを実際に業務で使うなら、こんな場面が現実的です：
✓ 安全な使用シーン
公開情報の収集・要約（ブログ、ニュース、ドキュメント）
Slack、Notionなどのグループウェアの検索と要約
リード情報やカテゴリ分類の自動化
複数タブの情報統合
✗ 避けるべき使用シーン
AWS、GCP、AzureなどのクラウドコンソールでのAgentモード
1Passwordなどのパスワードマネージャー連携
個人情報を含むスプレッドシート操作
金融取引システム
前回の記事で「セキュリティには厳しい」と感じた部分は、実はこのような設計思想から来ているのだということが、今回の検証でよく理解できました。
 まとめ：AIにブラウザを預けるという選択ChatGPT Atlas は、外部コンテンツに埋め込まれた命令を読み取りつつも「これは怪しい」と判断して拒否しました。

つまり、AIはすでに"攻撃を検知して無視する"レベルに達しています。
一方で、ブラウザとしての自由度が高い分、ユーザーの設定や使い方次第でリスクも生まれます。

AIブラウザの安全性は、AIの知能だけではなく、人間側の透明性・監督・ポリシー設計で決まるのです。
ChatGPT Atlas はまだ新しい技術です。

だからこそ、「理解したうえで使う」ことが最大のセキュリティ対策になります。
前回の記事で「デフォルトブラウザとして使ってみようと思いました」とお伝えしましたが、その上で「セキュリティ設計をきちんと理解して、適切に使い分けることが重要」というのが、今回の実験を通じた結論です。
ぜひ皆さんも、安心と信頼を両立させながら、Atlasを仕事や学習に活用してみてください。
 参考リンクhttps://openai.com/index/introducing-chatgpt-atlas/
https://help.openai.com/en/articles/12603091-chatgpt-atlas-for-enterprise
https://simonwillison.net/
https://note.com/npaka/n/n81a4eb686e05
https://proton.me/
https://www.washingtonpost.com/technology/2025/10/22/chatgpt-atlas-browser/
https://chromium.org/developers/design-documents/sandbox/
https://www.reddit.com/r/cybersecurity/
ChatGPT Atlasのセキュリティ周りを調べてみた

はじめに：AIがブラウザを使う時代へ

Atlasの基本的なセキュリティ設計

🔒 ブラウザ層（Chromium）

🧠 AI層（ChatGPT）

⚙️ 制御・同意層

実験：Slackで発生した「プロンプトインジェクション」

何が起こっていたのか：技術的な背景

Atlasが守ってくれること、守れないこと

技術的な防御機構

1️⃣ コード実行とファイルシステムアクセスの完全制限

2️⃣ ブラウザとAIの厳格なプロセス分離

3️⃣ 金融サイトでの一時停止と監視機構

4️⃣ ログアウトモード：エンタープライズ向けセーフガード

5️⃣ データ送信の仕組み：ローカル処理とクラウド処理の分離

方針でまとめると

✅ 技術的に守れること

⚠️ 技術的に守れないこと＆ユーザーが管理すべき領域

ユーザーが取るべき心構えと対策

👤 個人ユーザーの場合

🏢 企業・開発者の場合

実務での安全な使い方

まとめ：AIにブラウザを預けるという選択

参考リンク

関連記事

AWSで探す

注目のテーマ

プロダクトやサービスで探す

特集やシリーズから探す

EVENTS

制御層	具体的手段	効果	自動制御度
Atlas本体	Agentモード ON/OFF、Logged-out Mode	ユーザー単位で設定	🔸手動
ネットワーク	プロキシ・SWG	部門ごとの利用制限	✅自動
ID管理	SSO 条件付きアクセス	役職・部署ベース制御	✅自動
MDM/DLP	アプリケーション制御	操作の検知・遮断	✅自動
SIEM	プロキシ・ヘッダ監視	利用履歴の可視化	✅自動