视频识别理解

目前人工智能领域的繁荣,在一定程度上是由于成功地教会AI识别静态图像的内容,如今,对视频进行解读的AI系统,包括自动驾驶汽车系统,往往依赖

于在静态框架中识别物体,而不是解读动作。

目前全球的下一个技术方向为:让机器不仅能理解视频的内容,还能了解视频中发生了什么。

123.png

23.png

国内以旷视、商汤、衣+、海康威视等计算机视觉安防巨头为代表的企业,已经在视频数据的获取、处理、应用领域取得了骄人的成绩,在诸多领域已经处于行业领先地位。

33.png

我国是视频理解(处理)和感知技术应用的需求大国,然而目前的大多数技术应用仍处于单纯视频数据分析、理解层面,配有主动视觉的机器人中的实时视频理解、环境交互等高阶交互问题探索较少。

目前研究院在机器人视频理解方面有着国际领先的突出优势,提出了新的全景视频描述生成框架和快速且精准的选帧和选句策略,对视频中的动态和静态信息可以同步融合分析,生成具有多样性的句子。

 

44.png

研究目标:

  • 实现多移动机器人视频理解