公司动态

让您第一时间了解千视通动态

为“跨镜追踪”而生,千视通CTO胡博士谈Re-ID

2018-12-03 15:44:16    未知

近日,一篇有关人工智能计算机视觉公司千视通刷新Re-ID世界纪录的新闻报道传播开来,为此我们特地采访了千视通首席科学家为我们介绍这项技术的刷新给行业带来的推动。


胡大鹏,千视通联合创始人兼CTO,香港科技大学计算机科学博士。历任微软亚研院博士后研究员、香港中文大学研究员、香港科技大学助理教授。曾任ASTRI(香港应用科学研究院) 首席研究员,在机器视觉技术产业转化和应用开发方面有着丰富经验。


千视通胡博士


Re-ID全称为Re-identification,即行人再识别(跨镜追踪)技术,是近年来计算机视觉领域的一个重点研究方向。作为人脸识别技术的重要补充,其发展内核便是在不同镜头中且无法获取清晰人脸特征信息前提下,利用深度学习技术,通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性,从而画出目标的行动轨迹。


跨镜追踪(Re-ID) 本身是一个非常难的问题,不同视频的光照条件、目标区域的分辨率、捕捉角度的不同、遮挡普遍发生、穿着相近衣服的人等等,都会造成识别的困难。由于最早期完全依赖于传统计算机视觉或机器学习的技术,所以很长时间没有明显的突破。


不同于大家已熟知的人脸识别技术,与人脸特征信息的唯一性相比,Re-ID技术在运行过程中遇到的难题与人脸识别技术可以说根本不在一个层级。目前人脸识别技术在安防行业落地较多,同时也的确是发展所向,但在很多实际场景中,人脸识别技术作用并不突出。受限于视频监控探头的安装高度及密度,在实际运行过程中,它们更多拍到的是行人的头顶、后脑勺或者侧脸。其次,即便拍到人脸,摄像头拍摄的像素可能不高,尤其是远景摄像头里面人脸截出来很可能都没有32x32的像素。所以人脸识别在实际的重识别应用中很可能有限,无法看清。所以可通过Re-ID来达到目的。


Re-ID技术的应用落地,要从视频结构化技术发展说起。结构化其实并不是一件新事物,在几十年前,计算机视觉学者就有了这样的愿景:他们希望透过计算机视觉学的技术,把图片/视频内的东西完全分析并利用人工智能来理解场景内容。当目标检测、分类、跟踪等技术都达到一定水平之后,大量整段的视频被结构化了起来,当我们面对庞大的结构化数据,新的问题就产生了。


首先,数据量本身已经太大,而重复量更大,资料之间即使有关连性,也无法自动配上。其次,当需要查找资料时,发现根本无从着手。要解决这些问题,其中一个有效的方法就是Re-ID,而跨镜头追踪的全新需求也开始出现,对Re-ID 的发展产生了最为重要的推动作用。


面对技术突破的重重困难,胡大鹏博士表示,“Re-ID是AI技术在安防行业纵横发展中必过的一道槛,不能因为难所以让其停滞不前。”凭借这份坚持,胡博士带领千视通AI团队在自己最懂的行业中做最擅长的事,终于将包括Re-ID在内的AI技术拔高到一个行业新水平。


AI通过机器学习输出的结构化信息,其实本质上是建立了一个多维向量模型。这时候,机器可以给每一个模型一个编号,做跨镜头的人形追踪。装载“人形追踪”技术的监控摄像头可以将一个人的行为轨迹还原;之后,只要出现在任何一台可以识别人脸的摄像头中,就可以被轻易锁定,不会出现“断片”现象。和单点监控相比,Re-ID方案通过多组摄像机的轨迹还原及人员比对让安防工作变得更为立体,方便办案民警对目标嫌疑人的行为轨迹、出行规律进行分析,进而为案情线索和实施灵活布控打击提供依据。


千视通所用的方法,概念上相近,都是尽可能考虑最重要的部分进行特征提取及比对。然而,我们提出基于注意力架构模型的深度神经网络方案来实现行人ReID。与传统的全局表征或设定好的局部分割不同,我们设计的主躯干网络不要求躯干位置的标注,模型能够从浅层视觉到高层语义的不同空间内自动捕捉关键区域,挖掘多尺度的注意力特征,自动实现行人肢体(如面部,上身及下身)的特征融合,对于姿态改变以及空间变化有着很好的鲁棒性,有效的完成行人搜索工作。胡大鹏博士判断,“现阶段大家都在展示视频结构化,其实更难的是基于跨摄像头的人形追踪。Re-ID的发展对于安防行业来说也具颠覆性作用。”


我们希望,透过行为分析,把理解这一块开一个窗口,使得结构化数据能再向前推进,令系统更有智慧。未来,并不单是人类去操作系统,而是系统有了理解能力之后,跟人类协作,为人类谋方便和幸福。


  • 上一篇:中国·长沙丨网络安全&智能制
  • 下一篇:卡视联动:千视通Re-ID+人脸识别助