[セッションレポート]教育データ利活用と教育ダッシュボードの構築(AWS-52) #AWSSummit

2023.05.01

はじめてAWS Summit Tokyo 2023に参加しました。
2日目に参加しました「教育データ利活用と教育ダッシュボードの構築(AWS-52)」についてセッションレポートを投稿します。

セッション概要

国が策定した教育データ利活用ロードマップでは、誰もが自分らしく学べる社会というビジョンと共に、教育データの蓄積と流通のイメージや、学習履歴・校務情報に関する国際データ標準の活用が提示されています。本セッションでは AWS サービスを利用して標準規格の教育データを蓄積・共有・分析し、ダッシュボードで可視化することにより、データに基づいた学びの状況把握を実現するための方法についてご紹介します。

スピーカー

アマゾン ウェブ サービス ジャパン合同会社
パブリックセクター技術統括本部
シニアソリューションアーキテクト
松井 佑馬 氏

セッション視聴

5/22からAWS Summit Tokyoの登録を行うことでオンデマンドで視聴がいただけます
(現地参加された方は改めての登録は不要です)
https://aws.amazon.com/jp/summits/tokyo/

登録済みの場合、以下から直接遷移できます
https://jpsummit.awsevents.com/public/session/view/571

セッションの対象とゴール

対象

 ■教育現場でのデータ利活用に取り組まれる方
 ■校務・学習システムの開発やインテグレーションに携わる方
 ■教育におけるデータ利活用一般に今日にのある方

ゴール:持ち帰りいただきたいこと

 ■教育データ利活用とは何か
 ■データ利活用を小さく始めて高速に回すための基盤
 ■教育ダッシュボードの考え方

アジェンダ

  1. 教育データ利活用の背景
  2. データ利活用基盤としてのデータレイク
  3. データレイクの活用例:スタディログ分析
  4. 教育ダッシュボードの構築
  5. AI サービスの応用例
  6. まとめ

セッションレポート

1.教育データ利活用の背景

教育データ利活用の目的 日本の教育デジタル化のビジョン
「誰もが、いつでもどこからでも、誰とでも、自分らしく学べる社会」
(デジタル庁・総務省・文部科学省・経済産業省「教育データ利活用ロードマップ」より)
 ・教育データを利活用し学習者主体になっていく

学習者にとっての教育データ利活用のイメージ
”誰でも” ”データがたまる・データがつながる” そして ”自分らしい学び(特性・興味関心)”
または ”個に応じた支援(状況把握)” ができる
 ・実現のためには、どのようなデータが必要で、どのような仕組みデータをためて、どの
  ような分析が必要なのかが重要になる

教育データとは
 主体情報  学校、教育機関、教員、学習者等
 内容情報  教材、学習指導要領コード等
 活動情報  学習履歴(スタディログ)、生活記録、指導記録等

教育データ連携の取り組み
(例)デジタル庁:2022-2023年
「教育関連データのデータ連携の実現に向けた実証調査研究」
国際標準規格に基づいた校務支援システムや学校管理システム間のデータ連携に関する実証調査研究を公募

教育データ連携・利活用のためのデータ標準の重要性
・データ連携活用するためには標準が重要になる

教育データの国際標準規格
 クラス名簿:OneRoster
  ●学習者やクラスの情報をCSVファイルやREST APIで提供

 スタディログ:xAPI(Experience API)
  ●Actor(誰が)・Object(何を)・Verb(どうした)をJSONで記述
  ●Result(結果)・Timestamp(時刻)をふかして学習履歴を汎用表現

教育データ利活用のアーキテクチャ
 ■校務システム、学習支援システムで得たデータをデータ基盤に入れ、可視化・分析を通して
  課題発見や学びや支援の改善アクションに繋げることで、結果、自分らしく学べることができ
  るようになる。

2.データ利活用基盤としてのデータレイク

教育データを管理・分析する際の課題
 データ管理
  ●データを様々な場所からコピーしていると「正」のデータが不明になってくる
  ●データには長期的な価値があるが、分析手法はその都度変わり得る
  →データレイクの導入
   ○データを蓄積する「正」のデータ置き場をデータレイクとして明確化
   ○データ処理・可視化・AI 応用とった多様な利活用部分は取り換え可能

システム構築
  ●データの蓄積・分析・可視化といった機能を手間なく用意したい
  ●システムには高い可能性・性能・セキュリティが必要だが管理負担を減らしたい
  →AWS マネージドサービスの活用
   〇データレイク構築・活用に適したマネージドサービスを組み合わせる
   〇管理の手間を減らしながら高い可用性・性能・セキュリティを確保する
・データをためる部分と使う部分を分けることで取り換え可能にする

データレイク基盤(蓄積・カタログ)
 ■高い耐久性を持つデータ蓄積用オブジェクトストレージ → Amazon S3
 ■データスキーマを把握してカタログを作成 → AWS Glue(Crawler / Date Catalog)

データ処理系・可視化
 ■データレイク上のデータにクエリ実行 → Amazon Athena / Amason RedShift
 ■データを可視化して分析するダッシュボード → Amazon QuickSight

AI サービスの応用
 ■AI サービスで非構造化データ(画像、音声、テキスト等)を分析しデータ抽出
 → Amazon Rekognition / Amazon Transcribe / Amazon Comprehend

外部とのデータ連携
 ■外部Saas(現在学校で使用しているサービス) からのデータ取り込み
→ Amason AppFlow
 ■外部に対してデータをSFTP や HTTP API で公開して共有・連携
 → AWS Transfer Family / Amazon API Gateway

データレイクのセキュリティ
 ■文部科学省「教育データの利活用に関わる留意事項」
  ●個人情報の取り扱い、プライバシー保護、セキュリティ対策の重要性
 ■データレイクでも各マネージドサービスでセキュリティ対策を実施
  ●認証・認可、アクセス制御、データ暗号化、監視・モニタリング
 ■大規模データを効率的かつセキュアに圧会うための AWS サービスも活用
  ●Amazon S3 Object Lock(Write Once Read Many の実現)
  ●Amazon GuarDuty S3 Protection(データ管理の育成検知)

3.データレイクの活用例:スタディログ分析

シナリオ
 ■教育データ管理・分析用のデータレイクを小さく始める例
 ■スタディログを分析してテストの得点文武や間違いやすい問題を知りたい

想定ユースケース
 ■CBT(コンピュータベースのテスト)のスタディログが存在(データ蓄積・カタログ)
 ■分析者はデータ標準(xAPI)に関する知識はないが SQL は使用可(データ集計)
 ■データを人間が直感的に把握して分析したい(データ可視化)

アーキテクチャ概要
 ■xAPI 形式のスタディログ(テストの回答履歴)をAmazon S3 に保存
 ■AWS Glue でスタディログのスキーマ自動解析してカタログを作成
 ■Amazon Athena のクエリでスタディログから得点・解答データを集計
 ■Amazon QuickSight で得点・解答データを可視化

小さく始めるデータレイク
 ■AWS マネージドサービスでデータの蓄積・カタログ化・集計・可視化を実現
 ■教育データ利活用のビジョン実現に向けてスモールスタート
  ●まずは学習者が日常的に端末を使い発生するデータを集めて可視化・分析
  ●その先に課題発見とアクションから個別最適な学びやプッシュ型の支援を実現

4.教育ダッシュボードの構築

教育ダッシュボードの役割
データへの洞察に基づいて課題を発見しアクションを起こせること

課題発見の例
 ■学習者:自分の学習状況や成績の推移を振り返る
 ■教師:クラス全体の状況を把握して指導に反映させる
 ■運営者:学校全体の状況を把握して施策の検討や比較を行う

教育ダッシュボードの機能(前処理、分析、活用)
 ■前処理:データの結合
  教育ダッシュボードのデータソースは多様
  〇複数教材のスタディログ・クラス名簿・生活記録・指導記録
  〇学習者の ID をキーとしてこれからのデータを突合

 ■分析:多様なデータ可視化
 分析には「指標」と「軸」の組み合わせが必要
  〇「指標」 小テスト得点、実力テスト得点、出席回数、学習端末利用時間など
  〇「軸」  時間、学校・クラス、学習者の属性(指標同士の相関)など
   ■分析:データ可視化の形式
 一意の値、時系列の推移、比較、相関、分布
 ・形式は選ぶ必要がある

 ■分析:データ可視化と分析シナリオ
  ●指標と軸および適切な可視化形式を選ぶことでダッシュボードを構築
  ●アクションにつながるダッシュボード実現には分析シナリオの整理が重要
  ・誰が何をみて何のアクションをするのか(分析シナリオ整理)をし、本当にアクションに
   つながるか(データ可視化)を繰り返す
  ・ダッシュボードはいろいろ出すことができるので便利である。

 ■分析:教育ダッシュボードの例
  ●クラスや学校単位での学習理解度の分布
  ●クラスや学校間での学習理解度の比較
  ●個人・クラス・学校単位での学習理解度の推移
  ●学習理解度と生活記録や指導記録との相関

 ■活用:ダッシュボードの埋め込み
  ●教育ダッシュボードを外部ウェブサイトに埋め込んで活用
 (例)ポータルサイト、校務支援や学習管理の SaaS ウェブサイト等
  ●Amazon QuickSight では埋め込みを簡単に実現する仕組みを用意
  →埋め込み用 JavaScript ライブラリや HTML スニペット
 

5. AI サービスの応用例

シナリオ
 AI サービスを活用して校務の非構造化データを分析する例

想定ユースケース
 ■様々な校務に関わる非構造化データが存在
  ●学校での活動に関する写真といった画像データ
   ・写真から感情を数値化することができる
  ●授業や会議に関する音声データ
  ●授業や学校に関する日誌・アンケート等のテキストデータ
 ■データ分析に独自の機械学習モデル開発リソースはない AI サービスの応用

AI サービスによる顔認証(Amazon Rekognition)
ユースケース
 日誌・アンケートや音声書き起こしから生活。指導記録を抽出
   〇固有名詞やキーフレーズの抽出
   〇テキストの感情分析(ポジティブなのかネガティブなのかを判定できる)

非構造化データの活用
 ■AI サービス活用で生活記録や指導記録といった構造化データを抽出
 ■抽出したデータはデータレイクに格納し教育ダッシュボードで分析

6.まとめ

  1. 教育データ利活用の背景:学習者主体の教育へ・データ標準規格
  2. データ利活用基盤としてのデータレイクで多様な分析に対応
  3. データレイク活用はスタディログ分析例のようにスモールスタート
  4. 教育ダッシュボーの役割と機能:前処理・分析・活用
  5. AI サービスの活用で非構造化データからさらなる教育データ利活用

 教育データを集めて分析・課題発見からアクション・ビジョン実現へ

所感

自分が学校に通っていた頃と比較すると、教育現場でのITの活用は進んでいることを実感した。
また、スモールスタートしトライ&エラーを繰り返して必要な教育ダッシュボードを作成することを学んだ。
特に興味深かったのはAI サービスを活用した非構造データを分析することだった。
校務の写真の分析や授業のテキスト化からの分析は、今までの違った視点で教育現場を分析できるように感じた。