[レポート] Amazon Transcribe Medical:AIを用いたヘルスケア現場の改革 #AIM210 #reinvent
医療現場におけるボイスデータ解析の課題
医療現場では、年間約15億時間ものボイスデータが生成されています。 しかし、いままでこのボイスデータを精密に解析できるツールが存在しなかったため、重要な情報は文章化されることなくボイスデータの中に閉じ込められていました。
この膨大なボイスデータの90%はクリニックなどの民間医療機関で生成されたもので、 アーカイブされたものを含めると存在しえるボイスデータの量はさらに大きなものになると予想されますが、そのほとんどがオーディオ形式に止まっているため データの分析が困難な状況でした。
現在利用されている主な方法は以下の3つですが、それぞれに価格や正確性、プライバシー問題など大きな課題がありました。
- 動画を書き起こす:高価で時間がかかってしまう
- 医者と患者の他にもう一人メモをとる人を用意する:第三者がいることによるプライバシーへの懸念、患者に違和感を与え、スケールしづらい
- 自動音声認識ソフトウェア:不自然なテキスト、医療従事者が使い方を覚える必要がある、柔軟性のない価格設定
Amazon Transcribe Medicalでできること
Amazon Transcribe Medicalは医療に特化した音声文字起こしサービスです。 開発者は簡単に独自のアプリケーションにAmazon Transcribe Medicalを採用することが可能です。
音声データ解析の手順は、まず音声データをテキストへ置き換え、次にテキストデータを分析する2ステップに分けられます。 テキストへの文字起こし部分がAmazon Transcribe Medicalの主な役割です。
Amazon Transcribe Medicalはまず自動音声認識(Automatic Speech Recognition(ASR))を使って音声データをテキストへ変換、 自然言語処理を用いて変換したテキストデータを解析します。
このサービスの主な強みは以下の三つです。
- 医療専門用語を含む音声データの精密な文字起こしが可能
- 操作が簡単ですぐに使い始められる
- 低価格
現在、このサービスはUS Englishにのみ対応しており、産婦人科、内科、総合医療、小児科の 医師の説明のみに限らず会話も正確に書き起こします。
料金は利用した分のみチャージされるPay-As-You-Go形態で利用料は1分あたりUS7.5セントです。
Amazon Comprehend Medicalとの併用
Amazon Transcribe MedicalはAmazon Comprehend Medicalと組み合わせて音声データの文字起こしとデータの解析を行います。Amazon Transcribe Medicalが書き起こした音声データをAmazon Comprehend Medicalが解析します。
Amazon Comprehend Medicalは、機械学習を利用した医療情報の抽出に特化した自動言語処理サービスです。医師の記録、臨床試験報告書、患者の健康記録などの決まったフォーマットでない様々な形式のテキストから病状、投薬、投薬量、効力、頻度などの情報をすばやく正確に集めることができます。また、HIPAA eligibleのサービスであるため個人情報を含むデータを安全に処理、維持、送信するアプリケーションの作成にも使用できます。
考えられるユースケース
主な想定されたユースケースはこの4つです。
- カルテの自動化
- クリニックへの問い合わせ内容の解析
- 文字化することによるリモート環境における医者と患者間のコミュニケーションの円滑化
- コールセンタへの問い合わせ内容の文書化
利用方法
Amazon Transcribe MedicalはAPIを通じて音声データをリアルタイムで読み込みテキストJSON Blob形式で返します。自然言語処理を利用しているため会話内の句読点やCapitalizationも自然に解釈できますし、精密なタイムスタンプが含まれるので動画の字幕などタイムスタンプが正確に要求されるケースにも対応ができます。また、会話内の数字やパーセンテージが何を示しているのか詳細を表示させることができより精密な内容を取得することも可能です。他にも、患者の症状、医療専門用語、投薬情報、などをハイライトすることができます。
セッション動画
セッションでは実際の利用事例も紹介されていました。
AWS re:Invent 2019: [NEW LAUNCH!] Amazon Transcribe Medical: Transforming Healthcare w/ AI (AIM210)