5月23日消息,据外媒Zdnet报道,位于莫斯科的三星AI中心的研究人员开发了一个新系统,可以将静止的面部图像转换为说话状态下人脸面部的视频序列。
该系统通过将目标面部的面部地标应用到源面(如静止照片)上来创建逼真的虚拟对话头像,目标面可以控制源面的移动方式。三星表示这项技术具有远程呈现的实际应用,包括视频会议和多人游戏,以及特效行业。
据三星公司称,该系统具有大型数据库,这些数据库对应着具有不同外观的不同扬声器,通过这个数据库,再结合源面的面部标志,系统能够创建各种逼真的面部模型。之后,系统会使用生成对抗网络,将各种人脸模型相互比较,以确定哪个模型最“真实”。通过过滤创建的各种模型,最后选择能够用于视频序列的最终模型。
三星的新系统不需要使用3D建模,只需要一张照片就能创建一个面部模型。三星表示,如果系统能够使用32个图像来创建模型,系统创建出来的模型将更具真实感、更加个性化。