「OpenAIが新しい音声モデルをリリース。文字起こし・音声合成・リアルタイム処理の全機能まとめ|ChatGPT研究所」
2025年3月21日、OpenAIはライブストリーミングにて音声モデルに関する開発者向け大規模アップデートを発表しました。 今回の発表では、リアルタイム音声処理や高精度の文字起こし・自然な音声合成など、多岐にわたる改良がなされています。以下、主要なポイントをまとめます。 OpenAI ① Audio / Speech機能アップデートの概要 まず、音声関連のAPIが一斉に強化・拡充されました。 具体的には以下がポイントとなります: 新モデル: gpt-4o-transcribe(高精度な文字起こし)、gpt-4o-mini-tts(リアルタイム音声合成) ストリーミング対
コンテンツ文字数:0 文字
見出し数(H2/H3タグ):0 個
閲覧数:3 件
2025-03-24 20:08:12