サウンドレコーダーで保存したM4Aファイルを無理やりAmazon Transcribeで文字起こし #AWSreInvent

2023.11.30

ゲームソリューション部の えがわ です。

はじめに

re:Inventに参加中ですが、英語に絶賛苦戦中です。

セッション中はスライドがあり、ニュアンスはわかるのですが、
質疑応答議論となると、まったくついていけません。

その際はWindows11に標準で搭載されているサウンドレコーダーで録音をするのですが、
デフォルトの設定ではAACとなっており、録音を行うとM4Aファイルが作成されます。


私はそのまま録音してしまったので、Amazon Transcribeを使用するため、対応済みの形式に変換する必要がありました。

Amazon Transcribe対応形式
MP3、MP4、WAV、FLAC、AMR、OGG、WebM

変換するには?

MP3やWAVならサクッと変換できるかなと思ったのですが、
フリーソフト:会社PCにインストールはしたくない
外部サイト:外部サイトにアップロードはしたくない
Pythonで変換:モジュールのインストール、FFmpegの設定がめんどう
と英語の許容量を超えて、考えることを放棄した私にはとても大きな障害がありました。

変換から変更へ

ここでもしかして拡張子だけ変更すれば読み込めるんじゃない?と思い変更してみたところ、
無事に読み込むことができ、文字に起こすこともできました。

需要はないと思いますが、拡張子を変換ではなく変更する怠惰なスクリプトも置いておきます。

import os
import shutil

input_dir = './'
output_dir = './converted_files/'

if not os.path.exists(output_dir):
    os.makedirs(output_dir)

for filename in os.listdir(input_dir):
    if not filename.endswith('.m4a'):
        continue

    base_name = os.path.splitext(filename)[0]
    new_name = base_name + '.mp3'
    new_path = os.path.join(output_dir, new_name)

    # コピー&リネーム
    shutil.copy(os.path.join(input_dir, filename), new_path)

print("Completed!")

最後に

Amazon Transcribeを使用する予定がある方はサウンドレコーダーのデフォルトの保存形式を変更しておきましょう。
また、時間に余裕があるときは変更ではなく変換を行いましょう!
誰かの参考になれば幸いです。