AI剪辑师已上岗,来和它一起剪个片子吧!(下)丨IBM超in播-2018年第13期

2018-07-23 09:50:56 8.6万
声音简介

上集说到对于计算机视觉来说,篮球运动分析是所有体育赛事中最难最复杂的。

一个资深体育编辑也需要几个小时才能剪出几分钟的精彩时刻

但对于IBM“AI Vision视觉大脑”仅仅需要20秒钟处理,即可输出1分钟成片

世界杯期间,IBM 美国联手福克斯体育,借助人工智能还为球迷量身制作了世界杯精彩集锦。



AI剪辑师已经如此厉害,人工智能视频分析还能实现哪些我们想象不到的场景?

比如这个场景:

教练:来,先做50个俯卧撑热热身。

好的,做完了。

教练:你刚才第25个动作时胸部离地面太高了,从第30个动作起手臂都没有再次伸直。重新做!

教练,你刚才不是出去了吗?你怎么知道我动作没到位?

教练:我有人工智能视频分析来帮忙,有了人工智能视频分析系统,我再也不用担心学员们偷懒了。

 

服了吧?看来人工智能视频分析除了在体育赛事剪辑,还在很多行业和领域可以大有作为啊



嘉宾介绍:

杨林

腾讯体育产品技术副总监,腾讯高级开发工程师。

2008年加入腾讯,2014年加入体育团队, 主要负责腾讯体育APP的产品开发,运营采编系统开发,以及直转播的技术保障。


林咏华

IBM杰出工程师(Distinguish Engineer), IBM研究院AI系统全球研究负责人, IBM全球技术研究院院士。

她在IBM研究院从事了15年的系统架构、云计算、AI系统计算机视觉等领域的研究。相关技术已经被使用到IBM 人工智能的相关平台,如IBM Waston,PowerAI帮助IBM持续引领着AI认知系统的技术潮流。


本期干货:


360度到512个信息点

对于AI来说,识别二维数据和有时间顺序的三维数据难度提升相当大,如一个扣篮动作就标记了上千个个数据,且一场比赛通常有20个机位,不同机位拍到的扣篮动作都不一样,全景和近景的动作也不一样。在机器学习时要首先标记出时间片段,告诉机器哪几个片段的时间维度是扣篮。其次要告诉机器画面上哪个区域发生的动作是扣篮。

在教机器如何识别出球员时,IBM采取了三种技术混合:人脸识别、球衣号码、把人分为512个维度特征进行标记。


AI视觉大脑自动挖掘

值得注意的是,前面提到的将人分为512个特征点是IBM AI视觉大脑自动挖掘,自动告诉机器的。经过一个半月的学习过程,AI剪辑师已经掌握多模态识别、连续动作识别、多人场景中单人动作识别等技巧。

 

人机协作让你心潮澎湃

AI剪辑师完成的FMVP视频故事性强,串联有逻辑性,音乐配合到位。扣篮、三分、受伤摔倒,高潮迭起,令人心潮澎湃。

如果说AI剪辑师对比人类剪辑师,优势在于海量数据分析和极快的速度。人机协作就是让视频具有艺术性和故事性的秘密武器。由一位资深编辑,提前选好配乐,制定好整个故事线和艺术框架,比如第几秒第几帧放什么内容等,AI剪辑师在设定的框架下进行具体操作,充分还原创作者意图。

 

IBM AI Vision视觉大脑”有“过人之处”

1、网球、高尔夫,IBM积累了很多体育赛事经验与模型。这是竞争对手所不具备的。

2、IBM AI Vision视觉大脑”有很强的自我学习能力,不管给它什么数据,它都会构建一个最适合学习的网络,一键开始训练。

 

人工智能视频分析未来在哪里?

中国在线视频市场规模将在2018年达到1130亿元,2019年达到1460亿元,视频网站和电视台的视频剪辑需求不可小觑。

零售业应用,根据顾客对门店和商品喜好实现更精准的营销。在无人零售商店,监控顾客是否将每一件物品都扫码缴费。

生产制造领域应用,可以用于生产线动作规范,督促员工遵循动作规范。



最后冯爷呼吁大家踊跃留言,如果你有IBM“AI Vision视觉大脑”还能在哪些行业实现价值的好点子,欢迎在本期节目下留言。

用户评论

表情0/300
喵,没有找到相关结果~
暂时没有评论,下载喜马拉雅与主播互动