为了不被Prisma和Artisto这样的应用程序超越,谷歌今天宣布了一项新的研究,使应用程序能够将一种艺术风格应用到视频中,然后根据需要切换到不同的艺术风格。这项工作涉及到一种被称为深度学习的人工智能,这表明谷歌在受到应用的启发后,希望提高这项技术的水平。这些应用超越了你在Instagram上看到的那些简单的照片滤镜。
在这本书出版的前一天,脸书演示了如何将风格应用到实时视频中。
与脸书的情况一样,谷歌尚未发布应用程序,但这家搜索公司表示,它将很快开放代码的源代码,以便人们可以在谷歌的TensorFlow深度学习框架中尝试这项技术。
为了做到这一点,谷歌正在将人工神经网络3354深度学习的关键元素应用于一种称为风格转移的方法,这种方法在谷歌和其他公司越来越多的产品中使用。
“与以前的快速风格转移方法相比,我们认为这种方法是一种令人兴奋的新方法,可以让用户同时模拟多种风格并打开车门。它不仅允许用户自由创建基于其他混合物的新样式,还需要实时性,”谷歌高级研究科学家乔恩施伦斯、谷歌软件工程师Xi库德鲁尔和前谷歌大脑实习生文森特杜穆林在博客中写道。
的初始实现非常慢。上传一张照片3354甚至一段视频3354你“在结果出来之前,还有足够的时间去喝杯咖啡”,Shlens,Kudlur和Dumoulin写道。当然,他们改进了系统。
这项工作基于谷歌去年开始流行的DeepDream系统。Prisma今年确实经历了一波流行,谷歌的新技术3354只要能在相对较短的时间内投入使用,也可能会出现类似的情况,而Prisma的想法还在人们的脑海中记忆犹新。
这可能会给谷歌带来短期利益,但从长期来看,其影响可能更为显著。三个人在一篇论文中解释说:
我们认为这是一个重要的问题,如果这个问题得到解决,它将具有重要的科学和实际意义。首先,风格转移已经在移动应用中得到应用。对于移动应用程序,设备上的处理取决于模型是否具有合理的内存占用。更广泛地说,为每种风格建立一个单独的[网络]忽略了一个事实,即各个绘画有许多共同的视觉元素,一个真正捕捉到艺术风格的模型将能够利用和借鉴这一规则。此外,艺术风格模型在绘画风格中的普及程度将直接衡量我们构建能够以经济的方式捕捉照片和图像的更高层次特征和统计的系统的能力。奥尔森豪森,2001年).
请阅读全文。
11月1日更新:谷歌现在已经开放源代码,为一张图片添加多种风格。可以在GitHub上找到。为视频添加多种风格的代码将在后面给出。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!