MIDAS──AIがリアルタイムで人間のように喋る時代:2025/08/28
- 晋次 宮田
- 8月28日
- 読了時間: 2分

私はAIと音声会話を良く利用します。今はとりあえず音声だけですが、今後は目の前に本物の人間みたいな相手が画面上に出てくるんだろうなぁと考えたりします。
今回はそんな未来をグッと近づける研究成果がを紹介します。
中国の動画プラットフォーム「快手(Kuaishou)」の研究チームが開発した MIDAS という仕組みは、カメラに映る人のように リアルタイムで喋り、表情を変え、体を動かすデジタルヒューマン を作り出せます。
MIDASのすごいところ
🎤 声に合わせて自然に動く
声を入力すると、口の動きや表情をピッタリ合わせて動かしてくれます。まるでビデオ通話の相手と話しているようなリアルさ。
💃 表情や動きも自在
声だけじゃなく、文章や体の動きを入力することもできます。たとえば「笑いながら話して」と指定すれば、ちゃんと笑顔で喋る映像が生成されます。
🕒 長時間でも破綻しない
AI動画は時間が長くなると「変な顔」になりがちですが、MIDASは長時間の会話や歌でも安定した映像を維持できます。
実際のデモが すごい
研究チームはデモ動画を公開しています。
2人のアバターが自然に会話するシーン
英語・中国語・日本語で歌うシーン
ゲーム「Minecraft」の世界をリアルタイムで動かすシーン
どれも「すご!」と思わせるクオリティです。
これからの未来
MIDASのような技術が広がれば
学校の授業を、バーチャルの先生がリアルタイムでしてくれる
ゲームやメタバースで、本当に生きているみたいなキャラクターと会話できる
芸能人や有名人の「デジタル分身」が、世界中の人といろんな言語で話してくれる
しかし進化が早いです。


