「音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day」
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tidyモデルの結果 baseモデルの結果 smallモデル…
コンテンツ文字数:0 文字
見出し数(H2/H3タグ):0 個
閲覧数:92 件
2022-10-13 17:01:38