aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

脑机接口与混合智能-新闻-《深度合成十大趋势报告(2022)》探索深度合成技术

作为人工智能领域的新领域之一,近几年来,运用深度学习、虚拟现实等算法制作应用于各个方面的图像、语音、视频、虚拟人物等信息的深度合成技术,已在多个领域大量应用。而其中,对与人脸方面的应用需求也与日俱增,这使得人脸方面的深度合成内容的关注度呈现大爆发态势。但是人脸的应用是一把双刃剑,除了给人们生活带来科技化和便捷化之外,也有很多不法分子恶意运用深度合成技术,造成了从个人到企业的声誉和财产方面的损失,这使得社会人心惶惶,对国家安全维护造成了威胁。

其中,深度合成技术指的是用合成类算法中具有代表性的深度学习和虚拟现实来制作文本、虚拟场景、图像、音、视频等信息的技术。

图1 AI合成技术生成的人脸

技术的不断变革在造福社会的同时,也必然会对安全造成影响。为了能够给该方向提出正向指引,瑞莱智慧与多个研究中心发表了《深度合成十大趋势报告(2022)》。考虑到要综合各个方面的影响,该报告主要选用了在国内外的10家平台对深度合成技术进行调查,这10家平台分别是爱奇艺、腾讯视频、优酷、哔哩哔哩、抖音、快手、微博、YouTube、Twitter、 TikTok。

图2 互联网中深度合成视频的发布数量变化趋势

图3 不同类型内容深度合成视频数量排序

在对多个领域的调研中发现,深度合成在数量上呈现大爆发。具体体现在图2和图3的图形化数据的对比,可以看出深度合成技术在影视、广告、社交等各个商业领域多元化发展。例如芒果卫视推出的AI数字主持人小漾、字节与乐华娱乐联合推出的人气虚拟偶像团体A-Soul、AI有声小说配音和AI电视剧演员换脸等。可以看出视频、语音和文本形式的深度合成技术应用最为普遍。

对上述现象,瑞莱智慧CEO田天解释为,技术不断成熟是深度合成内容迎来爆发式增长的重要原因。这正是由科研人员对于深度合成技术的不断深入的研究,极大的推动了深度合成技术领域的方法提升,这也爆发式的提升了深度合成内容的质量。

深度合成技术为生活提供巨大便利的同时,其大量的开源代码也使得不少心怀不轨的人动歪脑筋。虽然技术是在不断更新与进步,但是目前深度合成技术主要依赖于人工智能模型以及训练数据。故而复杂的网络环境和易获取、易操作的技术,使得不法分子能够轻易伪造音频、视频,构成诸多违法行为。

图4 卡内基梅隆大学研究人员利用人工智能操纵的“深度伪造”视频

因此,当前必须对深度合成技术进行一定的约束,一方面是关于对抗性技术的发展,另一方面是明确对深度合成技术的处罚。这就意味着不仅需要在学术界还是产业界都加大力度力求尽快提升深度伪造技术,而且还需要与时俱进提出解决措施并落实相关法律法规。


参考链接

https://xw.qq.com/cmsid/20220221A0786X00?f=newdc


原文链接

https://www.scholat.com/teamwork/showPostMessage.html?id=11444