「GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に|りんか | AI情報発信 /ビジネス/研究」
今回はGoogleが発表した次世代大規模言語モデル「Gemini」に搭載された新機能、Multimodal Live APIについてご紹介したいと思います。最近Githubでスターターキットが公開され、「え?これgit cloneで誰でも使えるの!?」とAI好きとしては衝撃を受けています。 誰でもGeminiのマルチモーダルAPIでアプリつくれちゃうのやばいなhttps://t.co/iJWjqE9h0N これgit cloneしたらこれ立ち上げられて、デフォルトで音声、カメラ、画面共有、検索などのツール使用もできる。しかもソースコードいじり放題だから好きなように改造できる。いろん
コンテンツ文字数:0 文字
見出し数(H2/H3タグ):0 個
閲覧数:2 件
2025-01-26 17:01:46