「オンライン決済の裏側を支えるオブザーバビリティの取り組み」 – New Relic Meetup #3 で GMO ペイメントゲートウェイさんの事例を聞いてきた #NewRelicMeetup

オンライン決済というクリティカルなサービスを提供する中で APM がどう使われているのか。先日開催された New Relic Meetup #3 にて、多岐にわたるオンライン決済手段を提供する GMO ペイメントゲートウェイに所属する橋本氏のプレゼンテーションが行われたのでレポートします。
2020.01.31

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

過日 1/29(水)に、New Relic 社のコミュニティイベントである New Relic Meetup が開催されました。3 回目である今回は目黒の AWSJ 社オフィスにての開催です。

懇親会に軸足を置いている当 Meetup ですので、セッションは 3 つと少なめですが、その分濃い内容の話を聞くことが出来ました。今回は事例として、オンライン決済代行を生業とする GMO ペイメントゲートウェイ社の話を聞くことができましたのでレポートします!

なお、当日のスケジュールはこのようになっていました。

  • 17:00 恒例 第 3 回 New Relic クイズで学ぶ New Relic (景品強化編)
    • 松本 大樹 氏、CTO - New Relic K.K.
  • 17:20 オンライン決済の裏側を支えるオブザーバビリティの取り組み
    • 橋本 玄基 氏, サービスインフラ部 - GMO ペイメントゲートウェイ
  • 17:50 AWS re:Invent 2019 で発表されたイノベーション
    • 矢ヶ崎 哲宏 氏, Partner Solution Architect - Amazon Web Service Japan K.K.
  • 18:10 SUSHI TIME(懇親会)

なお、記事執筆時点で資料は公開されていないようでした。

オンライン決済の裏側を支えるオブザーバビリティの取り組み

  • スピーカー
    • 橋本 玄基 (Hashimoto Genki) 氏
    • 現職には新卒入社
    • サービス運用グループ
    • 珍しい名前なので、ググると学生時代の情報まででてくる
  • アジェンダ
    • GMO ペイメントゲートウェイの紹介
    • 現状
    • New Relic のいいところ(導入にフォーカス)
    • 入れて良かったところ
    • 現在の悩み
  • GMO ペイメントゲートウェイ
  • PCI DSS をはじめとした高いセキュリティ・内部統制要件
    • リリースフローの要件が厳しい
    • 判定会議のエビデンスを残す必要がある
    • 障害発生 -> 加盟店の売上げに直結 -> 賠償発生

増え続けるトランザクションと API

  • ひとつの決済手段で発生したトラブルで全部止まる
    • -> モノリシックだったものを決算手段毎に分けた
    • -> 監視対象が増加
  • 自力のモニタリングは限界を迎えていた
    • 専門家ではない -> ノウハウがない
    • 工数はプロダクトに使いたい
    • 今すぐモニタリングしたい
  • -> New Relic(SaaS 提供)を選定
  • いまはまだ「手札を増やす」フェーズ
    • 何ができるか? 何が見れるか?
  • 今後の予定
    • 体系作り:何を見るべきか、アラートの基準
    • 全員が使う環境作り(どうやって広めれば良いか)

New Relic のいいところ

  • 導入のハードルが低い (Java で)
    • アプリケーションから分離してカスタマイズ可能
    • (前述の) 内部統制要件上とてもありがたい
      • 本番コードにいきなり修正を加えたりすることはハードルが高かった
    • 無停止&コンソール画面から設定変更可能なものも
    • XML による Custom Instruments -> 再利用性高い、構築ハードル低
  • ダッシュボードの手軽さ
    • Insights Dashboards API でダッシュボード作成可能
    • JSON 形式
    • テンプレートエンジンなどを利用するとさらに便利

New Relic をいれて変わったこと

  • パフォーマンス改善が爆速に
    • ex) スループットのボトルネック調査
    • Thread Profiler で解析:外部接続処理の部分を全て
    • 送信前の Connection Manager が原因だった(設定ミス)
    • 無駄なデバッグログ出力・調査とかしなくて済んだ
  • 異常時の対応速度が爆速に
    • ex) DB の処理遅延
    • Transaction top5 -> 特定トランザクションの breakdown
    • -> おかしいクエリを発見、テーブル名からピンとくる
    • 3 分で原因特定
    • これまで:数時間〜1 日かかっていた(DB 担当者に調査を依頼など)

今悩んでいること

おまけ Synthetics(外形監視)

  • Meetup でこれまであまり話がでなかったので
  • モニタータイプ:Ping/Simple Browser/Scripted Browser/API Test
    • GMO ペイメントゲートウェイでは API Test を使用
  • モニター用スクリプトを記述
    • JavaScript ベース
    • 1 スクリプトで複数 URL を確認
    • ※課金は URL 数ではなくスクリプト実行回数

We are hiring!!

Q&A

  • Q セキュリティ要件のために SaaS 導入できないような話はなかったか?
  • A お客さんの情報を送らないので ok もらえた。その意味では New Relic Logs は難しい

所感

オンライン決済代行というミッションクリティカルな環境で、どのように可観測性が生かされているかという、大変興味深い事例紹介でした。
グラフのダッシュボードを眺めてにやにやする、という気持ちはすごく分かりますw でもそれで終わらず、ちゃんと先に進めているのはさすがです。

Synthetics のTIPSも、実際に使われている方にとっては参考になったのではないでしょうか。

他のセッションについて

GMO ペイメントゲートウェイさま以外のセッションについても、簡単ですがレポートします。

恒例 第 3 回 New Relic クイズで学ぶ New Relic (景品強化編)

  • スピーカー : 松本 大樹 氏、CTO - New Relic K.K.
  • New Tech Member
    • 瀬戸島 敏宏氏
  • New Relic 日本語ブログ
  • メーリングリスト Nerd Life 開始
  • ハンズオントレーニング
    • 2/6, 2/25, 3/3, 3/17

New Relic の最新が学べるクイズ

  • Q1: New Relic Agent の送信間隔
    • 60 秒 -> 5 秒間隔に短縮された
    • Real Time Streaming
    • SINCE 5 minutes ago 句を追加する必要あり
  • TIPS
    • ダッシュボードに TV Mode が追加されている
    • グラフ表示に特化した画面モード
    • 右上の TV モニタのようなアイコンをクリック
  • Q2: 最近リリースされた、New Relic Alerts に対応した AWS サービスは?
    • Amazon EventBridge

  • Q3: New Relic は AWS Marketplace で売上げランキング何位か
    • 世界 2 位

ロードマップ(既出のものは除く)

  • Q1 2020
    • New Relic AI
    • New Relic Logs Infrastructure in context
    • テレメトリ Exporter
    • メトリクスのイベント
    • React Native Mobile エージェント
    • AWS Fargate モニタリング
    • ワークロード
  • Q2 2020
    • トレースサンプリングの改善
    • などなど・・・

AWS re:Invent 2019 で発表されたイノベーション

  • スピーカー : 矢ヶ崎 哲宏 氏, Partner Solution Architect - Amazon Web Service Japan K.K.
  • re:Invent 2015 -> 2019
    • 参加者 18,000+ -> 65,000+
    • 日本から 500+ -> 1,700+
    • セッション数 250+ -> 3,000+

発表されたイノベーションの一部

  • AWS DeepRacer のアップデート
  • Amazon Braket (量子コンピューティング)
  • AWS Compute Optimizer
  • AWS Local Zones
  • AWS Wavelength
  • AWS Outposts
  • Transit Gateway Network Manager
  • Amazon Kendra
    • 自然言語による検索サービス
  • Amazon Fraud Detector
    • 不正利用検知
  • Amazon CodeGuru
    • コードレビューの自動化と性能改善のためのガイド
  • AWS Detective
    • 潜在セキュリティ問題の迅速な分析・調査を容易に
  • Contact Lens for Amazon Connect
  • Amazon Builder's Library
  • AWS DeepComposer
  • Amazon EventBridge Schema Registry
  • AWS SaaS Portal

SUSHI TIME(懇親会)

定番の SUSHI TIME は、なんと SUSHI TIME なのにスシが出ないという異常な事態となっておりました!(別の料理はありましたw)
New Relic 社のエンジニアの方々も参加されていて、非常に濃い時間を過ごすことができました。

まとめ

New Relic Meetup #3 の様子をレポートしました。
こういったツールは「どう使っていくか」がケースバイケースになりがちなので、逆に事例の共有や、コミュニティで話が出来る環境はとても重要だと思っています。その点 New Relic さんのとりくみは素晴らしいなと感じています。

本ミートアップは、Observability Meetup 時代から数えて 3 回目となり、イベントとしては形式もこなれてきた感がありました。一方でセッション数や時間など、まだまだ参加者の意見を聞きつつ模索しているところとのことです。

個人的にはコミュニティ系の勉強会に参加する機会が多いため、1 回に 4〜5 本のセッションがあるのが当たり前になってしまっているのですが、本 Meetup の場合は企業系とのハイブリッドで、セッションは短めにして懇親会を長くとるスタイルの比重が高いようです。そういったところにも、コミュニティの性質や姿勢が現れていて面白いですね。

これからどうなっていくかも含め興味深く見守りつつ、今後も参加していきたいと思います!

今回は各テーブルに New Relic 仕様のポテトチップスが置いてありました。
data nerd ステッカーの復活ってないんですかね。お待ちしています!