短视频造假术，你值得拥有

文 | 颜璇

来源 | 智能相对论（aixdlun）

从古至今，“欺骗”和“造假”这两个词可谓是贯穿了人类的历史。到了现代社会，面对着互联网上那些似是而非的庞杂信息，“有图有真相”开始成为网友们的诉求。

可以看出，绝大多数人都是认同一点的——只有拿出坚实的证据，才能证明你说的就是真相。将这些证据的说服力排一个序，大概是文本＞照片＞音频＞视频。

然而，随着PS的兴起，“照骗”渐渐失去了人们的信任，音频和视频已经被视为更可靠的证据来源，但是，在AI入军短视频制作后，事情正在发生着改变。在未来，人们可能需要处理更多真假难辨的音视频。

AI在视频造假上的进阶之路

在寻常人看来，短视频造假的方式无非就是一些“断章取义”的剪辑罢了。然而，AI可没那么简单，在短视频“造假”上，它不止要以假乱真，更要无中生有。通常来说，AI在短视频上造假的方式有以下三种：

1. 初级阶段：移花接木

在短视频“造假术”里，最重要的不是图像的拼接，而是音频的连续性。想一想，即使你将奥巴马和特朗普两个人的视频剪辑在一起，想要告诉大家他们“同台演出”了，没有他们讲话的声音，其效果大概就等于N张静态照片叠加而已。

利用AI系统，用户可以任意编辑人类语音，Adobe曾表示它可以像 Photoshop 编辑图片一样用于调整视频中的发音和对话。我们现在可以创建政治家、名人、演说家的视频片段，并且不论内容如何。

2. 中级阶段：改头换面

这一技术属于动作捕捉技术中的一个分支，叫面部捕捉。这些脸上的黄点，就是人脸表情变化中的关键点，通过面部追踪，计算机只需要这些信息就能合成表情。

视频里化妆都是小儿科了，AI还能在视频里给你换脸呢。在电影《星球大战外传：侠盗一号》中，技术人员通过捕捉一位现代演员盖·亨利的表情，合成了另外一位已经逝世的演员彼得·库欣，使其再次出现在了大荧幕上。

3. 高级阶段：无中生有

合成声音尚能理解，合成动作你敢相信吗？近日，在MIT(麻省理工学院）的论文Synthesizing Images of Humans in Unseen Poses中，研究人员提出了一种模块化的生成神经网络，用从人类运动视频中提取的成对图像和姿势训练之后，它能够为一个人合成出没做过的新姿势。而且，这个模型在没有经过刻意训练的情况下，能够生成一段连续的视频。

3. 高级阶段：无中生有

次是举行完葬礼代表你社会位置的消失；第三次是当世界上没人再记得你的时候，真正意义上的死亡。

当你的亲人即将离开这个世界的时候，你是否想过用科技的方式，将亲人的音容笑貌化为情感寄托，换一种形式陪伴在你身边呢？也许这样，也能让亲人的“第三次死亡”来得更慢一点。

目前，就已经有人通过语音合成技术记录下了自己的声音，将自己的声音载入了一个智能音箱，以此来确保即使在自己去世后，亲人也能与自己进行语音交互。

而如果能通过一张照片就换来亲人“栩栩如生”的动态，未尝不是人们一解相思之苦的办法。

AI造假短视频应该是一个不断提升价值的过程，而不是被宵小们所利用。一方面，AI可以建立丰富的数据库，依赖于深度学习来进行更多应用场景的选择，使得这些在视频里被“复活”的人们，能够在不同的场景里出现，满足人们的更多情感需求。另一方面，将造假变成造回忆，收集某个人的图像和音频素材，为用户个性化建模，实现一对一的记忆归属。

结论：

其实，我们完全不用把AI造假想得那么坏。技术不是目的，只是手段，找对了用途，“造假术”也是有情怀的。

【完】

价值中国

新知识 - 新思想 - 新经济实名制-专业主义-权益激励

短视频造假术，你值得拥有

您还没有登录，请您登录后发表评论。