第四范式两次刷新PASCAL VOC物体检测世界纪录

 

2019.7.1

 

近日,在国际顶级赛事PASCAL VOC 2012 挑战赛通用物体检测 Competition 4 任务中,第四范式分别采用多模型融合与单模型两种方案,两天内两次刷新该任务检测成绩,占据总排名前两位。在该项目的20项细分物体检测任务中,第四范式在其中12项取得最好成绩。

 

第四范式本次采用的两种竞赛方案,其中排名第一位的方案引入多层次深度迁移学习技术的多模型融合方案提升了识别精准度、鲁棒性;排名第二位的自适应候选框提取方法的单模型方案,具备高效、快速、更适合实际部署与应用等优势。

 

第四范式基于不同方案占据该项目竞赛前两位

 

PASCAL VOC 挑战赛以质量高、场景复杂、目标多样、检测难度大著称,以快速检验算法有效性,吸引了国内外AI公司、高校、研究机构竞相展开激烈竞争。目前,PASCAL VOC数据集囊括人、动物、交通工具、室内物体等20个类别。在PASCAL VOC 众多赛事中,2012 挑战赛因数据量最大、覆盖真实场景多且复杂,成为衡量技术实力的标尺。

 

在图片检测中,由于图片中的物体往往尺寸大小差异极大,参赛者往往采用多个尺度(一般4到6个)的测试策略(multi-scale test),即用放大版图片检测小物体,用缩小版图片检测大物体。虽然多尺度的检测方式对于提升准确率非常有效,但该方式存在占用计算资源大、反馈延迟等缺陷,严重影响了实际的应用效果。

 

第四范式基于第四范式AutoCV的简单、好用原则,设计了“自适应候选框提取方法”,可解决图片中不同物体尺度差距大的问题,只需单个尺度的图像输入就能达到甚至超过多尺度的效果,节省资源的同时,可保证准实时的物体检测。