音声認識の記事一覧

音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた

平井裕二

2024.02.21

Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた

nokomoro3

2023.12.02

Whisperなどの前段処理に使えるかも!? PythonのWebRTC VADを使って 音声分割を検討してみた

nokomoro3

2023.11.26

OpenAI DevDayで発表された様々な機能について、公式ドキュメントを見ながら少しだけ詳細を確認してみた

nokomoro3

2023.11.07

OpenAIのWhisper APIの25MB制限に合うような調整を検討する

nokomoro3

2023.03.05

OpenAIからChatGPTとWhisperに関するAPIがリリースされたのでドキュメントを読み解いてみた

nokomoro3

2023.03.02

日本語に特化した高精度な音声認識 ReazonSpeech を使って、会議音声を書き起こししてみた

nokomoro3

2023.01.31

Hugging FaceでOpenAIの音声認識”Whisper”をFine Tuningする方法が公開されました

nokomoro3

2022.11.09

ちょっと話題の記事

OpenAIリリースのWhisperで文字起こし後にテキスト読み上げした話

クルトン

2022.10.11

音声認識モデル”Whisper”をストリーミング処理対応させる方法

nokomoro3

2022.10.09

OpenAIリリースのWhisperをCPUだけで動かすために色々試した話

クルトン

2022.10.05

OpenAIがリリースした音声認識モデル”Whisper”の使い方をまとめてみた

nokomoro3

2022.09.29

OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた

nokomoro3

2022.09.23

注目の記事

Developers.IO 2017 WORLD in 仙台でVoice User Interfaceについて話してきた #cmdevio2017

諏訪 悠紀

2017.11.13

[iOS 11] Siriとアプリをつなげる!SiriKitを使ったVoice User Interface開発のまとめ

諏訪 悠紀

2017.09.20