基本原理
视频运动目标的检测与跟踪是机器视觉中研究热点之一,是目标识别、行为分析等后续应用的基础,在社会安全、航空航天等领域中有广泛的应用前景。目标跟踪在学术界经过了数十年的研究,发展出了许多算法,目前较为有效的算法是基于检测的跟踪算法。其基本思想是,在跟踪开始时对目标建立一个初始模板,以记录目标的外观;为了确定目标在下一个时刻的位置,利用当前的目标模板,在前一时刻目标位置附近处搜索与目标模板相似的区域,选择相似度最大的区域作为这一时刻目标的真实位置;跟踪过程中,由于目标的外观受到各种因素的影响(目标变形、姿态变化、光照、遮挡等)而发生变化,目标模板也进行相应的更新,使其能体现出目标当前的变化。
基于这种跟踪框架的算法都面临着以下几个重要的问题。目标模板要有较强的表达能力,即目标外观特征表示要强健;该特征应具有较高的判别能力以区分目标与背景的差别;同时该特征对于各种影响目标外观的因素有较好的鲁棒性,以解决目标在跟踪过程中的外观变化问题,保证跟踪的稳定性。目标模板与候选区域的相似度计算要具有较高的准确性,在目标与背景较为相似的情况下,要能够体现出真实目标与背景的差别,不能把相似的背景判定为目标。目标模板要能自适应地更新,当目标的外观发生变化,模板也要进行更新,这种更新是自我学习的过程,要保留目标稳定、不变形的特征,去除姿态、光照、遮挡等带来的干扰因素。针对这些问题,平博·(pinnacle)体育平台官方网站提出了基于受限自适应层次化稀疏表示的多目标跟踪算法,该算法的框架图如下:
图 1:算法框架图
该算法利用稀疏表示的能力,结合分层表达思想,将层次化和稀疏表示(特征)相结合,有效提高了目标的模板的表达能力。在建立模板时,不仅对目标建立模板,对背景也建立建模,在判断候选区域是否为目标时,可以结合两个相似度进行判定,分类结果更准确。在跟踪过程中,不断更新模板时,对目标和背景建立模板池,收集一段时间内的目标和背景特征分布,使得模板池的鲁棒性更强。为了保证算法的实时性,有选择性地对模板进行更新,对当前的新目标进行判断,如果和模板池差别很小,则不更新模板;差别非常大说明跟踪失败,也不更新;只有在合适的时机才更新模板,即保持模板的稳定性,又能减少运算,达到实时性。为了更准确地度量目标和背景之间差异,采用自适应权重调整方法,将目标模板和背景之间不相似的特征赋予较大的权值,相似的特征赋予较小的权值,增强目标与背景之间的区分度。通过建立目标的时序特征模型,保证目标模板的时序连贯性与完整性。
算法的主要流程:算法对视频中多目标的状态采样后,结合时间约束、空间约束对多层稀疏表示特征进行加权,并通过目标基、背景基的更新机制,在标准对冲跟踪框架判断后得到目标的状态(包括大小、方向、位置等);在目标丢失后,结合稀疏分类器网格粗略检出目标后再次判断,从而实现复杂场景下实时的目标跟踪。