导读 在移动设备上观看视频时,您看到视频被严重裁剪的次数有多少?这是非常令人沮丧和讨厌的,在大多数情况下,你对此无能为力。为了解决这个问
在移动设备上观看视频时,您看到视频被严重裁剪的次数有多少?这是非常令人沮丧和讨厌的,在大多数情况下,你对此无能为力。
为了解决这个问题,谷歌的人工智能团队开发了一个开源解决方案自动滑动,可以重新组合适合目标设备或大小(风景、广场、人像等)的视频。).
自动翻转可以分为三个阶段:镜头(场景)检测、视频内容分析和重新合成。第一部分是场景检测,其中机器学习模型需要在从一个场景剪切或跳转到另一个场景之前检测点。因此,它将一帧与前一帧进行比较,以检测颜色和元素的变化。
一旦模型确定了镜头,它将继续分析视频内容,以确定场景中的重要对象。它使用深度学习神经网络不仅识别人或动物,还识别广告中的移动球和标志。
对于最后一个阶段,艾模型决定是对单个空间中的场景使用固定模式,还是在感兴趣的对象不断移动时使用跟踪模式。基于此,以及要显示的视频的目标大小,"自动翻转"将裁剪帧,同时减少抖动并保留有趣的内容。
谷歌研究人员表示,使用自动滑动可以轻松地将视频转换为多种格式和屏幕。对于下一阶段,该团队希望改进采访和动画电影中的对象跟踪。它希望使用文本检测和图像恢复技术来更好地将前景对象和背景对象放置在一个帧中。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!