科学视点

中科院软件所发布迄今全球最大零售场景智能消费数据集

16日从中国科学院软件研究所(科院软件所)获悉,该所智能软件研究中心通过近2年的广泛收集及测试研究,近日发布迄今全球最大的、可用于智能化消费的零售场景目标检测计数联合任务数据集——商超定位计数数据集(Locount),共包含190多万个商品实例标注信息,涵盖140种商品类别。

Locount数据集填补了真实生活场景中检测和计数联合任务问题的空白,并定义了新的检测计数任务及新的评价指标,为解决目标检测领域严重遮挡问题提供重要基础,其在日常生活场景中具有广阔的应用前景,将带来智能货架管理、无人自助结算等智能化消费方式的变革。

该数据集中每个标注框均包含同类商品实例及其数量,与目前已有商品类型数据集相比,具有明显优势。同时,它也可以为现实场景中长尾分布、少样本学习等多个潜在的研究方向提供基础支持。

科院软件所智能软件研究中心介绍说,实现智能化消费方式的核心难点在于解决目标检测计数联合任务领域中的遮挡问题。针对传统目标检测数据集的遮挡比例较少,尤其缺少多个目标之间严重遮挡的情况(例如多个目标重叠比例超过90%),研究团队提出一种同时进行对象定位和计数的新任务。此外,为评估不同算法在该任务上的性能,研究团队还设计出一种新的评价标准,以反映算法出现目标丢失、对同一实例的重复检测、错误检测、错误计数等情况。

研究团队表示,当前传统方法和常见的深度学习网络还无法很好地解决Locount提出的新挑战,为了能更好研究复杂和密集场景下,尤其是目标高度重叠时的检测和计数问题,他们希望更多科研人员能够借助Locount数据集,探索出更准确、高效的任务解决思路和方法。


微信图片_20180628014711.jpg

  官方微信