2月28日,阿里发布了生成式AI模型EMO。仅需一张人物照片和一段音频,就能让照片中的人按内容要求开口唱歌或说话,而且口型、表情和姿态都非常自然。除了能让张颂文以罗翔的口吻说话、让张国荣唱出陈奕迅的歌外,让蒙娜丽莎张嘴说话、蔡徐坤唱rap也是小菜一碟。
EMO的工作过程简单来说就是,让AI先看照片,然后跟着声音画出视频每一帧图像。不过,效果越逼真,人类越害怕。虽然目前EMO仅用于学术研究和效果演示,但是不得不令人担忧,是否会成为不法之人的犯罪工具。