10月21日,在“场景驱动 数字赋能”数字保定建设推进大会上,河北数云堂智能科技有限公司联合北京数据堂、北京大学共同发布了国内首个覆盖领域最广、数据类型最多、数据质量最高的人工智能评测数据集。
评测数据集是衡量算法性能、模型精度及实际应用效果的重要基准,直接决定了评测结果的准确性和可靠性。
据介绍,此次数据集成果共计500套,经过严格的清洗、标注、校验等数据处理流程,确保数据在格式、质量、一致性等方面完全符合相关技术要求与标准,可直接用于人工智能模型的测试及性能评估。包含标注类、生成类、隐私类、公开类等评测数据,数据集成果涉及大模型、自动驾驶、智能语音、智能制造、生物认证及智能安防等多个领域,规模达110万公里自动驾驶数据、1200万张智能制造图像数据、75个语种120万小时的语音识别和语音合成数据、45万小时智能安防视频数据、1500万张遥感影像数据等。
未来,随着保定国家数据标注基地人工智能评测能力的不断发展,还将会不定期发布行业人工智能模型及大模型评测结果,为更多人工智能企业提供技术改进方向和参考,赋能千行百业数智化转型升级。