计算机对人的行为理解可应用于智能视觉监控领域,在维护国家安全问题上起到了不可忽略的作用。但针对复杂背景和多人拥挤的情况,目标的相互重叠以及在行为交互过程中人体轮廓无规则的形变,制约了这项新技术更为广泛的应用。
传统的单摄像机单一视角的监控系统已不能满足对有效信息获取的需要,为了克服单摄像机存在的目标重叠和轮廓形变的缺点,加利福利亚大学Park和Trivedi提出了一套新的多视角交互行为理解的系统框架,应用分布式多视角视觉系统,将行为理解分为目标跟踪和运动分析两阶段来实现,并且加强了两阶段之间的协作和集成。实现过程中,针对目标重叠的问题,研究人员提出了上下文相关的视角切换处理机制,并且通过条件假设证明了自上而下的反馈能发掘多人交互行为中所固有的时空约束。
新的视觉系统框架在实验中取得了较为理想的效果,具有易扩展性,根据实际需求还可以应用多线程处理来实现多样化视角选取。相关论文发表在爱思唯尔期刊《计算机视觉与图像理解》(
Computer Vision and Image Understanding)上。(科学新闻杂志 张叶银/编译)
(《计算机视觉与图像理解》(
Computer Vision and Image Understanding),Sangho Park,Mohan M. Trivedi)