「Metaが進める「AIによる読唇術」その方法とは(1) | BRIDGE(ブリッジ)テクノロジー&スタートアップ情報」

人は音声を聞き取ることと、話し手の唇の動きを見ることの両方によって音声を認識する。実際、言語学習において視覚的な手がかりが重要な役割を担っているという研究結果もある。一方、AIの音声認識システムはほとんど、あるいは完全に音声に基づいて構築されている。そのため、学習には数万時間にも及ぶ膨大なデータが必要だ。

人は音声を聞き取ることと、話し手の唇の動きを見ることの両方によって音声を認識する。実際、言語学習において視覚的な手がかりが重要な役割を担っているという研究結果もある。一方、AIの音声認識システムはほとんど、あるいは完全に音声に基づいて構築されている。そのため、学習には数万時間にも及ぶ膨大なデータが必要だ。

thebridge.jp

Webページ

コンテンツ文字数:0 文字

見出し数(H2/H3タグ):0 個

閲覧数:87 件

2022-01-10 11:08:20

オリジナルページを開く