[レポート]みなさん体験可能なクラウド運用をインテリジェントに自動化する「SUP402-R | Intelligently automating cloud operations」に参加しました #AWSreInvent #SUP402
re:Invent2024に参加している。たかやまです。
現在開催中のre:Invent2024で行われたWorkshop「SUP402-R | Intelligently automating cloud operations」のレポートをお伝えします。
セッション概要
タイトル : SUP402-R | Intelligently automating cloud operations
このワークショップに参加すると、AWS Health、AWS Trusted Advisor、AWSのジェネレーティブAIと機械学習サービスを使用して、クラウド運用をインテリジェントに自動化する方法を学ぶことができます。 また、Amazon EventBridgeとAWS Lambdaを使用して、組織がクラウドインフラストラクチャを最適化し、効率を向上させ、運用コストを削減するために使用できる自動化を作成する方法を学びます。 このワークショップは、クラウド管理者、DevOpsエンジニア、サイト信頼性エンジニア、およびクラウドオペレーションの管理と最適化を担当するITプロフェッショナルを対象としています。 参加にはノートパソコンが必要です。
スピーカー :
・Francesco Penta, Principal Cloud Support Engineer, Amazon Web Services
・Milan Karalic, Principal SysDev, Amazon Web Servicesセッションレベル : 400
Workshopをやってみた
はじめに、このWorkshopはこちらで公開されているのでせひやってみてください!!
では、やろうかなと気になっている方向けに。
全体のシナリオ構成としてオプションを含めて以下の5つの構成に分けられており、それぞれの構成で独立しているので気になる箇所から進めていただいて問題ありません。
- AWS Health Abuse Events
- Automatic Code Rollback
- Automated troubleshooting and remediation at scale
- Summarize operational insights using Amazon Q Business
- (Bonus) Al Ops for serverless
私は今回 AWS Health Abuse Events
/ Automated troubleshooting and remediation at scale
の2つを進めてみたのでそちらの内容をお伝えします。
他のシナリオも導入の内容を載せておくので気になるものがあれば、ぜひためしてみてください。
AWS Health Abuse Events
こちら内容の導入は以下の通りです。
AWS Health Abuse Events - Introduction
個人的にこのシナリオで面白かった部分は、Lambda関数の作成にAmazon Q Developerを活用するところです。
IDEでAmazon Qを利用できるのは知っていましたが、Lambdaのコンソール上でもAmazon Qを活用したコーディングができるのは知りませんでした。
(現時点でバージニア北部のみ対応)
シナリオの中ではプロンプトをコード内のコメントとして渡して、その下にAmazon Q Developerにコードを作成させるという流れでした。
結果的にLambda関数の内容はAmazon Q Developerに作成させるかたちになりますが、最後のソリューションテストの時に無事に通ったときは おぉ! となりました。
非常に便利な機能なので東京リージョンでも早く対応してほしいですね。
Automated troubleshooting and remediation at scale
2つ目にやった内容の導入は以下の通りです。
Automated troubleshooting and remediation at scale - Introduction
個人的にこのシナリオで学びになった部分は、AWS Support Automation Workflows (AWS SAW)の存在を知れたことです。
SAWとは、お客様の問題を解決して得たベストプラクティスを基に、AWSサポートエンジニアリングによって作成されているランブックです。
今回使ったのはSAWのAWSSupport-TroubleshootSSH
で、応答しないインスタンスの問題修復などを解決してくれるものになります。
インスタンスに応答/接続できない場合、基本的に停止させてのボリュームデタッチ/アタッチなどの対応が必要になりますが、このSAWを使うことで停止させることなく状況を解決できるようになります。
その他同時実行数の制御の部分も学びになりました。
Automatic Code Rollback
Automatic Code Rollback - Introduction
Summarize operational insights using Amazon Q Business
Summarize operational insights using Amazon Q Business - Introduction
Al Ops for serverless
(Bonus) Al Ops for serverless - Introduction
最後に
このWorkshopを通して普段触れていなかった運用に役立ちそうな機能をキャッチアップすることができました。
当日やれたWorkshopの内容を後日もできるように公開されているのは嬉しいですね!
今回やった2つのシナリオは両方面白かったので、ぜひ他のシナリオもやってみたいと思います。
この記事が誰かのお役に立てれば幸いです。
以上、たかやま(@nyan_kotaroo)でした。