【レポート】技術でメディアを拓く:AI と日経の記事・動画・文化事業 #AWSSummit

はじめに

清水です。千葉は幕張メッセで行われていますAWS Summit Tokyo 2019、2日目に行われたセッション「技術でメディアを拓く:AI と日経の記事・動画・文化事業」についてレポートします。

スピーカーは株式会社日本経済新聞社 日経イノベーション・ラボ 上席研究員 東京大学 共同研究員 博士(理学)中島 寛人さんです。

セッション情報は下記となります。

深層学習に代表される最近の人工知能関連技術は、記事の生成・校正、動画の加工・編集、文化・教育への利用など、様々な形で日本経済新聞社の業務・サービスの高度化・効率化に適用されています。当セッションでは、それらの事例、および人工知能のモデル構築・システム運用における AWS の利用を紹介します。

レポート

アジェンダ

  1. 日経の研究開発活動
  2. AIと記事編集
  3. AIと音声、動画生成
  4. AIと文化事業 科学実験
  5. AIと文化事業 教育サイト

1. 日経の研究開発活動

  • ラボの紹介
    • 日経の組織図。社長直下の日経イノベーションラボ
    • 2017年4月に設立、社長直轄
    • テクノロジーメディアへの飛躍を目標
    • AI、VR/AR、5Gなどの調査・研究・開発
    • 日経グループ各社との共同開発・技術提供
    • 映像コンテンツ、金融サービスへのAI活用
    • 国内外のIT・メディア関連のイベントなどで発表、出展
  • 事例: 完全自動「決算サマリー」
    • 決算情報のサマリーを完全自動で作成できる
    • ILUや東大と共同研究
    • 決算短信などから自動生成
  • 事例: 日経電子番Pro 記事自動翻訳機能
    • 日経の記事がワンクリックで英文に
    • 固有名詞などの翻訳精度を重点的に強化
  • 事例: 日経AR
    • これまでの日本新聞にはない、新しい体験、情報、感動を
    • スマホ用無料アプリ
    • 紙の新聞にスマホをかざす
  • AWSと日経ラボ
    • サービス開発、プロダクト開発ではない
    • 研究開発のための計算リソースに利用
    • AIの研究開発に最適/不可欠
      • 用途にあわせて性能を選べる
      • 複数インタンスで並列処理できる
      • 実験条件を揃えやすい

2. AIと記事編集

  • 記事の例(意図的に誤りを付加) ⇒ AIを使って1msぐらいで誤り検知できる
    • 例: 転じた、転んじた
    • うち間違え、ら抜き言葉などをAIで検知
    • AIで日経マーケットのルールを学習
      • 値上がり、値上り、「が」が必須
      • 三菱商事 ⇒ 三菱商 と書くのがルール
  • 記事の例(オリジナル文章) ⇒ 日経のルールにあわせてAIが警告を表示
    • 新聞社のローカルルール、学習するのが大変だが、その点に注力している
  • 校正業務におけるニーズ
    • 新聞社が記事を出すときに、表記など誤りがあると困る
    • 校閲記者と自前の校正システムjの二段構えでチェック
    • しかし、新しい言葉の対応や日本語ルール、新聞のローカルルール対応などがあって容易ではない
  • AI設計の基本的な発想
    • 実用性、即効性
    • 単純さ、わかりやすさ
    • 現実的な外的制約
  • AIの実装と実験環境
    • Python, Tensorflow, Keras
    • p2.16xlarge
    • 実行時間 1時間 120万トレーニング、30-50回学習する

3. AIと音声、動画生成

  • 日経経済新聞 電子版のAlexaスキル
    • 自動化したいが、事前言語処理、音声合成が必要
  • Echo Show含めて、高速通信(5G)の普及、スマホの性能向上、若年層の動画志向
    • 動画の自動化には何が必要か、検討を進めているところ

4. AIと文化事業 科学実験

  • 国立科学博物館との共同実験 AIx霧箱
  • 霧箱とは
    • 19世紀からある実験装置
    • 宇宙線を霧として可視化する
    • 国内&国外の多数の博物館、科学館が設置
  • 実験の概要
    • 宇宙線の種類をAI使ってリアルタイム判別
      • 霧の画像学習
    • なれていない観察者にも判断可能に
  • AWSのユースケース
    • データ作成
      • Amazon SageMaker Ground Truthを使用
      • 写真のどこに霧がある?霧はどの種類の宇宙線?の2種のラベル付に使用
    • モデル訓練
    • インスタンス p2.xlarge
    • 複数モデルを並行して訓練

5. AIと文化事業 教育サイト

  • サイト概要
    • 画像判別デーアセットを額酒、判別
    • cifar-100を学習、判別(画像セット)
    • GUIベースで学習
    • パラメータを変更して性能の変化を確認できる
    • 手持ちの画像もテスト可能
  • AWSのユースケース
    • モデル訓練
      • 画像判別の深層学習としては単純な構成のCNNを利用
      • 並列処理で高速化
  • CNN Playground

感想

日経さんでの様々なAI、ならびにAWSの活用内容の事例を聞くことができました!記事に対する校正に加え自動生成、そして音声、動画の生成などAIの活用範囲は広がっていきますね。またAWSを活用すすることでモデル訓練など従来では時間がかかっていた処理も高速に実行できると思います。これからもますますAIのメディアへの活用事例は増えていくのではないでしょうか。