人大人科创
张江-硅谷创新创业平台

人工智能领域简报 2018年第32期  AI正成为娱乐行业的“水电煤”

随着中国视频产业发展至今,内容的丰富度已经显著提升,“技术”发展带来的新空间备受期待。

在近期举行的第六届中国网络视听大会上,在官方话语层面对技术创新的鼓励与关注下,企业层面对内容生产升级与技术革新驱动的增量空间探索,亦在影视行业阶段性“遇冷”的当下形成行业共识。

大会期间发布的《2018中国网络视听发展研究报告》进一步指出,未来AI和算法可能会最先渗透进入内容审核、分发营销与IP评估。AI和算法嵌入视听产品制播流程,网络视听内容机制将持续优化,网络视听行业因科技升级。

从全球范围来看,AI已经成为娱乐产业的驱动力之一,在营销与广告、个性化服务、搜索与分类、体验创新等四大主要方面体现得最为显著。而包括IBM、谷歌和英特尔等在内的科技巨头在这些领域的前瞻布局和众多AI领域的创新公司的协同推进,让AI对娱乐产业的改进已经在事实上发生。其中亦不乏来自中国的今日头条、爱奇艺等公司的探索。

在此基础上,我们梳理了作为娱乐产业重要分支的视频产业的AI应用。希望能从海外对标、技术框架完善等角度,给到国内视听产业技术创新路径探索一定的启发和参考。

爱奇艺最新研发的AI手语主播

全球娱乐行业的AI应用趋势

从全球范围来看,随着互联网等新兴技术对于全球的娱乐与媒体行业的重塑,基于内容和分销这两个维度的竞争和差异化已经不足以构建充分的壁垒,而必须更加专注于第三个方面:用户体验,而AI则是有望为这一努力做出积极贡献的领先新兴技术之一。

综合国内外的AI趋势来看,我们梳理发现,目前AI在娱乐和媒体(E&M)行业的应用主要在如下四个方面:

1.市场营销和广告

该领域包括视觉设计、电影推广和广告。利用文本、视频片段等数据进行训练的机器学习算法,可以从训练资源中提取语言、对象和概念,提出营销和广告解决方案,提高效率。这样的系统可以作为一个助手,甚至是一个内容创建者。

IBM用他们的AI系统Watson帮助20世纪福克斯制作的恐怖电影《摩根》的预告片,是将AI技术运用于电影预告片开发的首次尝试。研究小组对AI系统进行了训练,对来自100部恐怖电影的视觉、听觉等构成元素的输入“瞬间”(input “moments”)进行分析和分类,以了解在标准的恐怖电影预告片中应该出现什么样的“瞬间”。Watson只用了24小时就制作出了一个六分钟的电影预告片,而如果由人类专业人士来做,可能要花上数周的时间。

国内的视频平台爱奇艺用AI技术智能识别明星、剧情、行为、动作、情感、台词等多种类别海量场景,让广告自动契合视频内容,实现广告投放效果和用户体验的双重提升。一个被爱奇艺创始人、CEO龚宇经常引用的例子是,在影视镜头出现亲吻镜头的时候,旁边可以挂一个钻戒广告,“这种机器识别的效果,是人力难以达到的。显然,靠AI,靠深度算法来达到,这是增加货币化能力。”

2.个性化的服务

随着娱乐行业越来越关注用户体验的个性化,众多公司都在利用AI为数十亿用户创造个性化服务。例如,当用户浏览视频网站或在线购物时,推荐适合用户个人口味的内容。

IRIS.TV就是这样一家由机器学习驱动的、提供B2B服务的公司。该公司开发的一个基于云计算的个性化视频编程系统,允许发布者和内容所有者生成更多的视频窗口(video view),并在所有设备上与用户互动。其媒体客户包括赫斯特数字媒体(Hearst Digital Media)、哥伦比亚广播公司(CBS)和《好莱坞报道》(The Hollywood Reporter)等。

而目前估值已达到750亿美元的国内科技独角兽今日头条,早在2016年便成立了AI实验室,专注于AI领域的前沿技术研究,几乎将AI贯穿到了内容创作、分发、筛选等各个环节。其中,个性化的推荐算法是今日头条的特色,即基于用户的喜好去智能分发内容。也正是基于这样的核心算法,今日头条才能在短期内累计数亿用户。

3.搜索和分类

随着互联网上的媒体作品越来越多,人们越来越难以在网上找到他们真正想要的东西。AI正在帮助优化搜索结果的准确性。与此同时,计算机视觉技术也使内容制作者能够更好地管理视觉内容,加快媒体制作过程。

谷歌利用机器学习技术的进步,以多种方式提升自己的搜索引擎。其中一个应用是图像搜索,即用户不需要输入关键字来搜索图像,而是可以上传一个示例图片到谷歌图像(Google Image),后者使用图像识别技术识别图像特征,搜索相似的图像。另一个应用是选择性的链接构建,即谷歌利用AI进行恰当地广告投放,例如,猫粮广告出现在与宠物相关的网站上,而培根芝士汉堡广告不会出现在素食者的网站上。

4.体验创新

在过去,报纸和书籍是文字和图像的主要媒介,电影和电视的出现把我们带入了一个动态的新世界。现在,AI正预示着一个视觉内容的沉浸式体验的新时代的到来。这种技术包括虚拟现实(VR)和增强现实(AR)。借助机器学习算法和计算机视觉技术,开发人员可以在一副眼镜内构建复杂的全息场景,这开辟了一个全新的市场。

英特尔正在进入沉浸式体验行业。随着深度学习和计算机视觉技术的应用,英特尔已经成为一家注重虚拟现实内容的视觉内容提供商。在AI算法的支持下,Intel True VR技术可以实现三维像素场景的每一个片段。通过这项技术,球迷还可以在全息视图中观看体育比赛。英特尔(Intel)在2018年美国橄榄球联盟(NFL)超级碗(Super Bowl) 及2018年冬季奥运会的直播和转播中都使用了这一技术。

海外“AI+视频”:

Netflix对AI技术的关键应用

而在细分的视频领域,以拥有全球最大用户群的流媒体平台Netflix为例,今年高达80亿美元的内容支出、《怪奇物语》《王冠》等节目的大火、全球范围内的1.37亿用户(截至2018年第三季度),这些成绩与AI驱动的个性化的关注是不可分的。

据Netflix估计,公司通过AI技术的算法增强了用户粘性,每年可以节省超过10亿美元。

早在2013年,Netflix就宣称“有3300万个不同版本的Netflix应用”(当时该公司拥有3300万用户)。正如Netflix首席内容官Ted Sarandos所说,“没有所谓的‘Netflix节目’。我们的品牌是个性化的。”

在算法上,Netflix根据每个用户的需求调整整个用户体验,包括主页、标题、每部电影的视觉效果、其他电影的推荐等等。Netflix把这种个性化的过程定义为“消费者科学”(consumer science)。

以内容推荐为例,预测哪些节目会吸引用户的兴趣是Netflix模式的关键组成部分。Netflix的高级数据科学家Mohammad Sabah在2014年曾表示,“75%的用户根据公司的推荐选择电影,Netflix希望这个数字能更高。”

2016年5月,Netflix曾推出了一个智能工作流管理和调度应用程序Meson,这个AI系统自动管理提供视频推荐的各种机器学习管道。此后,Netflix的内容推荐得到了很大提升。根据Netflix 2016年年报,全球有9300万用户每天在该平台上观看超过1.25亿小时的电视剧和电影。