中国智能化产业与产品网讯:据国外媒体报道,谷歌最新研发的系统DeepStereo能够通过人工智能技术将一系列照片无缝组合成为视频。
利用DeepStereo制作的视频片段
据悉,DeepStereo能够“猜测”出图像缺少的部分,并且在空白的地方创造出原图没有的新内容。与传统动画利用视觉暂停的原理不同,DeepSteoreo可以“想象出”两幅静止图像之间的画面。
谷歌工程师约翰·弗林表示:“这项技术与之前的产品截然不同,我们尝试采用新型深度架构直接合成新图像,不需要预先设置景深、焦距等训练数据。”
据了解,DeepStereo在工作时会采用两套独立的网络架构。其中之一会根据已有的2D数据预测各个像素的景深。另外一个则会对色彩作出预测。两者共同以2D图像的形式完成对景深和色彩的预测,最终合成视频。
DeepStereo的不足之处在于视频角落的画面仍显示较为模糊,而这些角落无法被覆盖,也不能使用像素填充。
尽管这一系统生成的最终产品与通过图像简单合成的动画没有太大区别,但该技术仍然能够为谷歌的街景技术加不少分。
版权声明