简介
现有的用于组合零样本识别的基准数据集都是单属性标注,即每张图像仅提供一个属性标注。在现实世界中,只有一个属性不足以很好地描述一个自然对象。单属性注释是片面的,在推理过程中容易造成歧义(例如,一个fresh sliced apple被识别为fresh apple,但它的标签是sliced apple)。同时,单属性注释很难描述属性的共现模式,例如,对car 来说old 和rusty通常一起出现。此外,现有的基准数据集还存在标签稀疏性、噪声标签和数据不足等问题。
因此,我们建立了一个多属性数据集(Multi-Attribute Dataset, MAD),用于真实地反映物体的多属性性质,从而适用于测试组合零样本识别模型在多属性设置下的性能。MAD数据集是基于ImageNet数据集创建的,包含158个属性、309个物体和8030个属性-物体组合,共计116,099张图像。此外,我们还提出了新的用于评价模型在多属性设置下的性能度量指标——Hard和Soft,详情请参见已发表论文。
MAD数据集示例如下:
如何获取MAD
多属性图像数据集MAD仅供学术和研究使用,通过如下操作可以免费获得MAD。
1. 向管理员email一份扫描版的数据集申请书。申请书应使用申请人所属机构的正式信纸(或写明所属机构的完整名称、地址、联系信息);应盖有所属机构的印章(或申请人的手写签名)。如果你在中国大陆,请用中文申请。
2. 下载 协议书,认真填写并将扫描版email给管理员。注意协议注明必须是全职工作人员签名(也就是说,学生签名无效)。如果你在中国大陆,请用中文签名。
3. 我们在收到完整的上面两份扫描文件后,将审核你的申请。审核通过后,将通过email方式告知您下载方式及密码信息。
4. 依托此数据集所发表的学术论文或相关技术文档,请引用下述文章:H. Chen, J. Jiang and N. Zheng, "Learning to Infer Unseen Single-/Multi-Attribute-Object Compositions With Graph Networks," in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3273712. 如需申请下载本数据集,请联系管理员,管理员邮箱地址:chenhui0622@stu.xjtu.edu.cn。