2023 年 11 月 10 日、DeNA はスマートフォンを使用して誰でも簡単に自分の声を別の声にリアルタイム変換できる AI を活用した新技術を披露し、各方面の業界に向けて提携企業の募集を開始しました。
DeNA のリアルタイム音声変換 AI は次のデモ動画のように自分の声を正確且つ瞬時に別人に変換する技術で、色んな場面での需要が見込まれますが、その中でも特に配信業界を席巻しそうな気がします。
男性なのに萌えキャラの声で話していますよね。このような音声変換を誰でもスマホだけで可能になるのが今回 DeNA が開発した「リアルタイム音声変換 AI」です。
vTuber 活動やゲーム実況、ポッドキャストなどの配信分野で声は非常に重要な要素で、その点では女性側に圧倒的なアドバンテージがありますが、リアルタイム音声変換 AI の登場により、男性でも自然な女性ボイスを出せますし、またその逆も然り。リアルタイム音声変換 AI ではボイスの種類も選べ、一人で何役もこなせるなど、用途や目的に合わせて出力音声を最適化するのに役立ちます。
リアルタイム音声変換 AI は出力音声を最適化する以外にも、声を別人にすればその人のプライバシーを保護できますし、例えば、スマートドアベル製品で採用した場合には女性の一人暮らしを隠せたりと、生活の様々な場面にも活用できます。
リアルタイム音声変換 AI は、スマホでも低遅延かつ高品質な音声変換を可能にする技術で、実際には各種アプリのプラグインとして機能するため、エンターテインメントの分野から商業利用まで幅広いニーズに対応できます。GPU に頼らない設計なので PC 不要で安定的に動作し、オフライン対応なのでネット接続がなくても利用できるとされています。
Source : DeNA