日本語音声認識に特化したWhisperである kotoba-whisper-v1.0を早速試してみた
音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた
Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた
Whisperなどの前段処理に使えるかも!? PythonのWebRTC VADを使って 音声分割を検討してみた
OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた
OpenAIのWhisper APIの25MB制限に合うような調整を検討する
OpenAIからChatGPTとWhisperに関するAPIがリリースされたのでドキュメントを読み解いてみた
日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた
Hugging FaceでOpenAIの音声認識”Whisper”をFine Tuningする方法が公開されました
OpenAIリリースのWhisperで文字起こし後にテキスト読み上げした話
音声認識モデル”Whisper”をストリーミング処理対応させる方法
OpenAIリリースのWhisperをCPUだけで動かすために色々試した話
OpenAIがリリースした音声認識モデル”Whisper”の使い方をまとめてみた
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた
Developers.IO 2017 WORLD in 仙台でVoice User Interfaceについて話してきた #cmdevio2017
[iOS 11] Siriとアプリをつなげる!SiriKitを使ったVoice User Interface開発のまとめ
© Classmethod, Inc. All rights reserved.