[レポート]初音ミクが拓いたUGCを支えるITインフラのお話 #dbts2015 #be_crazy_about_db_tech

2015.09.10

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

はじめに

こんにちわ、川原です。

今日(9/10)、明日(9/11)の日程で db tech showcase Sapporo 2015 が札幌で開催されています。 db tech showcase とは、ということで公式サイトの引用が以下です。

db tech showcase は、世界中からトップ技術者が集まり、”データベース技術のオモテもウラも語る” をテーマに、最先端テクノロジー、現場で得たノウハウ、活用事例を共有するテクノロジーカンファレンスであり、データベースに携わるすべての技術者に「学び」「気づき」「変化」を提供する場です。

公式サイトのセッション一覧を見て頂けるとわかると思いますが、DB関連の興味深いセッションがたくさんあります。札幌でこのレベルのセミナーはあまり開催されません。 ということで行ってきましたので、聞いたセッションのうちクリプトンさんのものをレポートしたいと思います。

セッション情報

タイトル:初音ミクが拓いたUGCを支えるITインフラのお話 講話者:クリプトン・フューチャー・メディア株式会社 林 禎康 さん

UGCとは

User Generate Contentの略 例えば、食べログの口コミ情報やYoutubeにアップロードされる動画など。

会社紹介

音で発想するチーム

という方針の元、以下のチームがあります。

  • Sonicwireチーム SONICWIRE(後述)を担当
  • モバイルコンテンツチーム 携帯コンテンツを担当
  • CGMチーム CGMに関わる業務を担当
  • Vocaloidチーム 初音ミクの音声データベースを担当

システム開発の歴史(抜粋)

2002: 北海道大学と協同で音のあいまい検索エンジンの開発(PicoLisp) 2004: 初のVocaloid「MEIKO」 2007: Vocaloid「初音ミク」 2011: Twitterサイネージ表示システム「nasita」 2015: スマホ向け「初音ミク ぐらふぃコレクション」

SONICWIRE

  • 世界最大規模のサウンド配信サイト
  • 100万件以上の音の「素材」
  • クリエイター向け

当初のシステム構成

  • Webサーバー
  • DBサーバー(MySQL)
  • ストレージ
  • ネットワーク(100Mbps)

→サービスが普及してきて回線状況が逼迫するようになってきた →1Gbpsに回線増強

AWSの導入

  • S3とCloudFrontを導入して、オンプレ + AWSなハイブリッド構成に
  • なぜ全てAWSに移行しなかったか? →保有コンテンツ量が多かった(数十TB)。その場合、S3の費用負担が重い →素材にはよく売れるものと、あまり売れないもの、という遍在性がある →売れる素材(よくダウンロードされるもの)はAWSに配置
  • AWS移行については、クラスメソッド社のメンバーズに加入することで下記メリットあり
  • CloudFront費用に関するAWSリセラー割引
  • AWS全般に関する技術的サポート

PIAPRO

  • コンテンツ投稿サービス
  • 著作権の保護に関して
  • 初音ミクと創作の連鎖
  • 色々なメディアとの連携
  • その様子がGoogle chromeのCM放送に
  • 初音ミクの派生キャラが誕生

システム構成

  • WEBサーバー
  • DBサーバー(MySQL)
  • memcachedサーバー
  • レコメンデーションエンジン(Cicindela) →ブックマーク情報などを元にレコメンドしている
  • CDNサービス →IIJ社のCDNサービスを使用

初音ミク ぐらふぃコレクション(グラコレ)

  • スマホゲーム(WEB⇔Unity)

システム構成

  • lvs load balancer
  • WEBサーバー
  • DBサーバー(MySQL)
  • Memcache
  • さくらクラウドを使用

サービスとしては、アーキテクチャよりアプリレベルの改善(データ構造、SQLのスロークエリ)を頑張った MySQLのレプリカサーバー使ってKPI分析(マスタに負荷をかけずに分析)

SONOCA

  • スマホ用音楽カード(音楽配信サービス)
  • Android、iOSに対応

システム構成

  • さくらクラウドを使用
  • オンプレ、クラウドのハイブリッド構成 →新しいサービスであり、サーバ負荷の度合いが見えていなかった →通常はオンプレ側だけを使用。新コンテンツがでる等、負荷が高くなる時だけクラウドのサーバーを稼働させている →その場合、DNSで向き先をオンプレからクラウド側にを変える

所感

オンプレ、クラウドの特徴を理解して両者をうまく活用されているな、という印象を持ちました。 自社システムにクラウドサービスを組込んでいくということ自体は、一般的になってきたと思っており、今後もその傾向は続くと考えています。 が、単純なディスク単価などの面ではオンプレの方が有利な点もあり、適材適所でオンプレは残っていくんだろうな、と感じました。