10月21日,依托国家数据标注基地(保定)建设,保定市对外发布人工智能高质量评测数据集。
此次数据集成果共计500套,经过严格清洗、标注、校验等数据处理流程,确保数据在格式、质量、一致性等方面完全符合相关技术要求与标准;以文本、图像、音频、视频等多模态形式呈现,可直接用于人工智能模型测试及性能评估。其中包含标注类、生成类、隐私类、公开类等评测数据,数据集成果涉及大模型、自动驾驶、智能语音、智能制造、生物认证及智能安防等多个领域,规模达110万公里自动驾驶数据、1200万张智能制造图像数据、75个语种120万小时的语音识别和语音合成数据、45万小时智能安防视频数据、1500万张遥感影像数据等。
“人工智能高质量评测数据集成果的发布,标志着保定国家数据标注基地具有开展对人工智能模型全生命周期的全方位、多维度、体系化的评估能力,可承接省内乃至全国的人工智能模型及大模型评测业务。”保定市数据局局长张闯表示,未来,随着保定国家数据标注基地人工智能评测能力不断发展,保定将会不定期发布行业人工智能模型及大模型评测结果,成为用户遴选人工智能产品和服务的重要依据,为人工智能企业提供技术改进方向和参考,从而提高产品质量和竞争力。