人工智能让你成为艺术家

2016-12-01 17:27

柏丞编译

今年7月，图片社交软件Prisma迅速走红，它可以把普通照片转化成毕加索、莫奈等名家的画作风格。

今年7月，图片社交软件Prisma迅速走红，它可以把普通照片转化成毕加索、莫奈等名家的画作风格，比如让一张吃了一半的汉堡照片演化为抽象主义画作，或者将一个拥挤的候车站的影像变成一幅印象派油画。

最近，很多人又发现了一个Prisma的“升级版”。在一个名为Ostagram的网站上，上传一张目标图片，再在其数据库中选择一幅“风格图片”—它们大多是一些名画、漫画，这款软件就会为你自动将目标图片“画”成与风格图片画风相同的新图片，而图片上部的分享和点赞标识，让这个平台具备了简单的社交功能。

Prisma和Ostagram都来自俄罗斯，两款软件使用的也都是人工智能技术中的深度机器学习模型“卷积神经网络”（CNN）。

“这个技术在图像识别、人脸识别、物体识别和等领域中都有应用。”中国人工智能学会模式识别专委会秘书长孙哲南对《第一财经周刊》说。卷积神经网络的核心是用一个有很多层数、很多参数的神经网络去模拟样本特征建模的过程，通过大量的样本学习，对样本特征形成复杂的映射关系。在Prisma和Ostagram中，各种名画和其画风就形成了映射。

ostagram生成的艺术效果

人们更熟悉的图片社交软件，是Instagram或者美图秀秀上的各种图像滤镜，它们是通过对像素点的逐个计算和蒙版覆盖实现图片美化的。去年，Google公布了图像处理程序Deep Dream，它使用的是一种名为Inception的卷积神经网络，这个词来源于电影《盗梦空间》的英文原名。通过DeepDream制作的图片也和电影《盗梦空间》一样玄幻，这样的艺术风格被命名为“Inceptionism”。

Google随后对其代码开源，促使这一领域的研究进一步发展。与此同时，德国的科学家也在尝试将艺术作品与类似的技术结合，并发表了相关论文。终于，今年夏天，Prisma在全球范围的走红，让所有人都开始认识到了用卷积神经网络处理图片的神奇效果。

不仅是图片，人工智能技术也应用在视频领域。比如Snapchat就推出了在视频中使用的动态滤镜，它结合了增强现实（AR）和人工智能中的人脸识别技术。今年10月初，Prisma同样推出了视频功能，可以制作不同画风的短视频，但这对技术提出一个更大的考验。

视频是由一帧帧的图片构成的，处理1秒的视频相当于处理24张图片。目前，Prisma的视频功能只支持iOS10以上的版本，暂不支持安卓操作系统。制作一支15秒左右的视频，大概需要一分钟。谭峰认为，这样的计算能力，尚不能支持卷积神经网络技术在视频中的普及。

由于基础技术比较完善，图像领域目前算是人工智能技术应用得相对成熟的一个领域。“一般情况下，一个良好运作的神经网络，至少需要上百万张图片，才能把神经网络训练出来。大家比的是能不能收集到更好的数据，设计出更好的用户体验。”微软亚洲互联网工程院开发总监周力对《第一财经周刊》说。

虽然同样使用深度机器学习技术，但作为一款App，使用Prisma“修图”，正常情况下只需要几秒。Prisma对算法做了优化，让机器学习更简单的画风，以此来提升速度，但牺牲的则是图片的质量。

只有网页版的Ostagram，目前合成图像也需要很长的时间。但它对画面触笔的粗细（stylescale）和重力（styleweight）分别有12个和10个调节梯度，用户可以选择付费调节图片分辨率和迭代次数，从而获得质量更高的图片。

不论Prisma还是Ostagram，或是Google的Deep Dream，基本都需要通过互联网在线生成图片。“在Prisma中，虽然有的画风是不需要网络的，但复杂度较高的画风仍需要将图片上传至服务器处理后再下发给用户。”供职于技术公司的互联网工程师谭峰对《第一财经周刊》说。Prisma曾遇到过服务器瘫痪的窘境，许多Ostagram的用户也抱怨，免费在网站上生成一张图片需要排队等待长达一两天。

Deep Dream生成的图片

除了用户体验的问题，图片社交软件即便使用了一些有趣的新技术，也常常逃不出“红不过3个月”的命运。今年里约奥运会前很多人都在玩的Prisma，现在就已在朋友圈中基本消失。类似的还有去年5月成为朋友圈“爆款”，却很快又销声匿迹的微软颜龄软件HowOld，这款软件同样使用的是人工智能技术，通过和样本特征匹配（对人脸和年龄形成映射关系），它能估算出照片中人物的年龄。

所以，光有炫酷的人工智能技术还不足以保证用户的黏性。“人工智能不能只‘秀肌肉’，显示‘我很聪明’不是人工智能对用户的价值。”周力说，“目前来讲，人工智能在感官、对话上还无法跟人类相比。如果要让用户喜欢它，它一定要对用户产生一些额外的价值，而不仅仅是很酷的玩具。”

微软在这方面的探索是智能助手“小冰”，其内部嵌入了多种识图功能，这些功能不仅仅局限于识别图片内容，机器还能猜测或评价图片内部的人物关系、人物衣着（当然还有之前已开发的颜龄预测）等等。周力认为，因为人类本身都不能为这些内容提供一个标准答案，机器所提供的评价可能会持续激发用户的兴趣，让用户不断对产品做出反馈。人工智能产品需要通晓人性，才能提供更好的用户体验。

其实，人工智能中的神经网络技术在图片上的应用潜力还有很多。比如美国康奈尔和德州大学奥斯汀分校的研究者今年就成功用深度学习的方法，高度还原了带有马赛克的图片。他们让系统学习了加上马赛克和不加马赛克的图片之间对应的关系，经过大量的样本训练，系统看到一张带有马赛克或者做过模糊处理的新图片后，就有可能估计出低分辨率区域的真实图像。

一旦这种技术识别的准确率不断提高，它就可以用到公共安全等领域，当然，相应的，普通人的隐私也可能由此受到越来越大的威胁。

孙哲南认为，人工智能图像识别技术比较有价值的应用领域是社交网络的广告投放，通过用户上传的图片了解用户的性格和喜好，并据此向用户推送广告。

2010年Instagram发布，新颖的滤镜功能和图片社交方式迅速吸引了用户的注意，借助社交网站上升期的红利，它迅速成为全球最大的图片社交平台。而名字与Instagram只有细微差别的Ostagram或许也怀有这样的野心。不过目前，因为用户体验以及技术发展的限制，“更智能的Instagram”还未出现。

本文转载自2016年第44期《第一财经周刊》

作者：卿胜蓝

观后感

已有3人参与