全民视频时代已经来临,互联网用户的注意力已经从传统的文字、图片向视频转移。在线视频的爆发使得提高视频效果和提升编辑效率成为自然需求。人工智能和视频分析技术从而被各大在线视频平台和视频解决方案科技公司广泛应用于视频编辑的各种场景中。从优化视频呈现效果,剪辑制作,广告和互动应用植入到弹幕生成和视频合成,人工智能的研究和应用已经较为丰富。同时人工智能视频编辑带来的负面影响的隐患将需要社会进行更多的讨论来促进监管的跟进。
作者
言青佳、田辰
一、在线视频市场规模
我国有着巨大的在线视频的市场。根据CNNIC数据显示,截至年6月,在线视频用户达到6.09亿人,其中手机视频用户高达5.78亿。同时用户规模高速增长,据比达咨询估计,年在线视频市场规模高达.8亿元,同比大涨60%。其中,用户付费市场规模达到.8亿元,同比增长16.7%。年9月,在线长视频移动端总使用时长达到.75亿小时,占全部移动互联网使用时长的9.0%;短视频则以8.8%的占有率紧随其后,使用时长达到.79亿小时。中国在线视频领域呈现BAT三足鼎立的局面——年9月,以长视频为主的爱奇艺(百度)、腾讯视频(腾讯)、优酷视频(阿里)三家在线视频平台月度活跃用户(MAU)遥遥领先,均超过5亿人。
在线视频市场规模
二、智能视频编辑的主要技术
AI视频超分辨率:超分辨率(Super-Resolution)通过硬件或软件方法提高原有图像的分辨率,可以通过深度学习将低分辨率视频重建成高分辨率视频模糊图像、视频瞬间变高清。
视频指纹:通过识别、提取、压缩视频产生的唯一的“指纹”来代表一个视频文件。视频指纹分析提取并存储视频流中的关键帧序列分析,色彩和运动的变化等特征,从而可以通过比较提取的视频指纹来识别视频内容。
多模态学习:模态是指人接受信息的特定方式。多模态学习是通过机器学习的方法实现处理和理解多源模态信息。视频中往往会同时存在视觉信息、文字信息和听觉信息,多模态学习因此成为视频内容分析与理解的主要手段。
计算机视觉:包括人脸/表情/情感/动作/手势识别,语音/声纹识别以及场景/镜头等识别。通过有监督机器学习识别视频中的各项特征,从而为视频打标签,以备下游任务如拆分、剪辑、入库和添加字幕等用。
生成式对抗网络模型:受博弈论思想启发,该模型由生成器神经网络和判别器神经网络所组成,前者试图产生更接近真实的数据,相应地,后者试图更完美地分辨真实数据与生成数据。在视频合成中,两个网络在对抗和进步中得到最终的合成视频。
三、人工智能技术视频编辑的应用分布
其他周边场景:由于本报告主要
转载请注明:http://www.twoac.com/wyzl/12336.html