(レポート) ARC308: The Serverless Company Using AWS Lambda #reinvent

AWS re:Invent 2015

せーの

2015.10.09

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、せーの@ラスベガスです。Re:Invent2015現地よりセッション「The Serverless Company Using AWS Lambda」をレポート致します。

(ARC308) The Serverless Company: Using AWS Lambda from Amazon Web Services

このセッションの目標

このセッションは「どうすればLambdaを使ってリアルタイムアプリケーションを作れるのか」について学びます。

最初はインフラから始まった

最初はサーバーにインスタンスを立てるスタイルでした。アプリケーションの管理、スケールはdeveloperが管理する必要がありました。

コンテナを最初にデプロイすることで早く簡単にスピンアップ、ダウンが出来るようになりました。

そのうちみんなが気にしているのはアプリケーションコードだけで他のことは気にしたくない、ということに気が付きました。そこでサーバーレスの登場です。

lambdaとは

Lambdaの特徴

イベント・ドリブンでサーバーレス
新しいイベントが走るとキャパシティのプロビジョニングはAWSがする。
1秒以下の課金ができる。イベントが走らない間は課金はされない。

labmdaは沢山の言語をサポートしたいと思っています。現在はnode.js、 java、 scalaをサポートしています。

ユーザーが気にすべきこと

メモリだけ管理する必要がある。
起動パス、同期、非同期関わらず
IAMによるきめ細かい権限調整
lambdaはstateless。共有することがないので素早いスケールが可能になる

データプロセスアーキテクチャ

サーバーを使った場合

ソースデータ - 様々なものがある
サーバーのフリート群にキュー形式でリクエストし、内部で更に後ろにリクエストを行う
オートスケールを管理する

サーバーレスになったら

Lambdaにリクエストをなげるだけ

事例紹介 - PlayOn!

PlayOn!とは高校生にスポーツのストリーミングを使ってもらうためのサービスです。例えば金曜の夜300名の高校生があるサッカーの中継を配信し、2万人が見る、というようなことを簡単に可能にします。

従来のアーキテクチャ

RTMPからHLSに変換
オンデマンドではディスクを沢山使う
ライブ配信なのでエラーは許されない

課題

RTMPでは難しいのでHLSのストリームが好ましい
ビデオをWebで見る時にデバイスにあったビットレート変換が必要
スタートアップなのでコストを削減する必要がある

新しいアーキテクチャはLambdaベース

10秒のかたまりの動画を管理する
Lambdaは「今ない機能」をすぐに付け足す事ができる。新しい機能が必要になったらこの下に新たなLambdaをつけるだけ

感想

Lambdaは使いやすい。時間はほとんどかからなかった。
小さなストリームでしか使っていない。大きなストリーム、複数のストリームの場合はどうなるのか、Lambdaが終わらなかった場合はどうなるのかはわからない。
S3よりSNSを使ったほうが効率が良かった
コストは一桁くらい違う

リアルタイムデータプロセッシングワークフロー

ここからはリアルタイムにデータを動かす方法を色々と考えていきます。

サンプル

S3からイベント通知でLambdaをキックします。その後は何をしたいかみなさん次第です。加工をしてS3に戻しても良いですし、DynamoDBにデータ形式を整えて保存しても良いのです。サムネイル、crop, watermark、他のビデオチャネルを作ることもできます。ログデータであれば圧縮することもできます。全てのファイルのインデックスを作り、つまりS3からmetadataをlambdaで取ってファイルの重複の検知、圧縮を行ったりします。 S3のデータが動画ならLambdaを使って加工することができます。その場合Tipsとしてファイルをローカルディスクに一時的に書きます。なぜならffmpegを使うのにはローカルでしかできないからです。

ストリームのデータプロセッシング

KinesisのストリームからLambdaをキックします。リアルタイムデータを加工してRedShiftに流したり、エラーとなっているデータをSNSで通知したりもできます。

DBデータをトリガーにしたワークフロー

DynamoDB StreamsからLambdaをキックします。データの移行記録が書かれているのでそれから色んなアプリをアンロックすることができます。データをDynamoDBにクロスリージョンでレプリケートしたり、分析用にRedshiftに流したりします。

メッセージデータをハンドリングする

SNSからlambdaをキックすることによりトピックごとにユーザーごとにカスタマイズします。全てのデータをkinesisに流します。またLambdaを使って分類、フィルタリングして重要なものだけをKinesisに流すこともできます。

CRUDのバックエンドシステム

スロットリング、認証、キャッシングを行ってLambdaに引き渡します。データストアはファイルベースでもDBでも、両方でも構いません。モバイルのバックエンドのソリューションとしても使えます。 S3をstaticなwebサイトとして公開し、Webサイトにアクセスした時だけ課金されるような仕組みが作れます。

このようにLambdaは色々なアクションから起動することができます。

Lambdaを使ったTips & Tricks

監査をかける

例えばこのユーザーはこの時間に読む権限がある、IAMのcredentialsを書き換える等AWSへのアクセスデータを見ながら柔軟に権限を変更することが出来ます。

インフラを自動管理する

特定のインスタンスの様子をCloudWatchで監視し、それによりLambdaが別のコンテナを開始することでECSサービスをオートスケーリングさせたり、様々なAPIをコールすることができます。

外部サービスのエンドポイントをコールする

AWS環境の監視状況によりLambdaをキックし、そこからIFTTTのMaker channelが使えます。これによりIFTTTを通じてオンプレ環境に何かを返すこともできます。

新たなLambdaをデプロイする

Github repoからのcommitをフックして新しいLambda functionをデプロイできます。また自身をアップデートすることも可能です。

他にも

Lambdaの中で任意のバイナリを組み込む
コンテナ環境に押し出しECSを作成

など、様々な方法でLambdaを使用することができます。

まとめ

いかがでしたでしょうか。Lambdaの様々な活用事例を見て新たなアイデアが膨らみそうですね。