杭州电子科技大学博士生郑锦凯通过可迁移邻域发现算法,提升了跨域场景下的步态识别精度。相关研究成果在日前召开的美国电气和电子工程师协会(IEEE )电路与系统国际研讨会上公布,作为第一作者郑锦凯还在IEEE 多媒体系统与应用技术专委会(IEEE MSA-TC)年度会议上作口头报告,论文获2021年度IEEE MSA-TC最佳论文提名奖。该论文通讯作者是杭州电子科技大学教授张继勇。
近年来,随着人工智能技术的发展,步态识别开始应用在公共场域身份识别中。步态识别,俗称“走姿”识身份,不同人的“走姿”是不一样的,走姿是人的“另一种身份”。另外,人在不同场域的步态也是不一样的,比如在超市里购物步伐偏慢,而在火车站赶车步伐急促,所以跨域步态识别为“走姿”识身份增加了难度。
据了解,目前普遍使用的深度学习算法依赖数据标注,换言之,通过步态识别谁是谁,首先得在数据库里知道具体的步态是怎样的。这意味着,标注的准确性和数量直接影响着最终的识别精度。在实际应用中,人们往往受限于这种既昂贵又费时费力的数据标注上。如果数据库里没有具体人的标注数据,那怎么办?
为此,郑锦凯提出可迁移邻域发现算法,首先找出高置信度样本,并通过最近邻算法找出这些样本的领域样本,之后通过损失函数拉近高置信度样本与其领域样本在特征空间中的距离,采用从易到难、循序渐进的方式更新深度学习模型。整个过程由近到远、由易到难、由已知到未知,逐渐识别“哪些步态是谁的”,从而锁定目标人物。
什么是可迁移邻域发现算法?郑锦凯打了个比方:“如果想让一个小孩识别国内的动物种类,你会给他一些动物图片和对应的动物名字。通过学习,小孩能认出许多动物。你可能觉得还不够,希望小孩能识别国外的动物,于是给小孩一些国外动物的图片,让他把属于同一物种的图片都放到一起进行分类。”
郑锦凯进一步解释道,由于小孩之前学习了很多国内的动物,一开始会比较顺利,能够挑选出一张或者几张长得最像老虎的放一组、像狮子的放一组,等等。接着,小孩可能会继续寻找那些还长得比较像老虎、狮子等的图片,直到他再也找不到自己学过的图片之后,他发现剩余那些之前没见过的图片里,有好几张长得很类似,于是猜测它们属于一个新物种。小孩可能同时发现好几个新物种,把它们分别放一组,接着继续寻找和这些新物种长得很像的图片。
“可迁移邻域发现算法模拟了上述一过程,直到所有图片都被找完为止。”郑锦凯告诉《中国科学报》,“可迁移邻域发现算法与传统聚类赋伪标签识别不一样,有望在步态识别领域拓展新的应用。