produced by Classmethod

# 音声認識の記事一覧

ちょっと話題の記事

OpenAIにおける文字起こし（音声認識）の現在地

2025.04.15

【Kotlin】Androidで連続して音声認識がしたい

2024.11.29

日本語音声認識に特化したWhisperである kotoba-whisper-v1.0を早速試してみた

2024.04.17

音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた

2024.02.21

Google Cloud上でGoogleの次世代のASR（自動音声認識）モデル「Chirp」を使ってみた

2023.12.02

Whisperなどの前段処理に使えるかも!? PythonのWebRTC VADを使って音声分割を検討してみた

2023.11.26

OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた

2023.11.07

OpenAIのWhisper APIの25MB制限に合うような調整を検討する

2023.03.05

OpenAIからChatGPTとWhisperに関するAPIがリリースされたのでドキュメントを読み解いてみた

2023.03.02

日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた

2023.01.31

Hugging FaceでOpenAIの音声認識”Whisper”をFine Tuningする方法が公開されました

2022.11.09

OpenAIリリースのWhisperで文字起こし後にテキスト読み上げした話

2022.10.11

音声認識モデル”Whisper”をストリーミング処理対応させる方法

2022.10.09

OpenAIリリースのWhisperをCPUだけで動かすために色々試した話

2022.10.05

OpenAIがリリースした音声認識モデル”Whisper”の使い方をまとめてみた

2022.09.29

OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた

2022.09.23

Developers.IO 2017 WORLD in 仙台でVoice User Interfaceについて話してきた #cmdevio2017

2017.11.13

[iOS 11] Siriとアプリをつなげる！SiriKitを使ったVoice User Interface開発のまとめ

2017.09.20