全国首个人工智能数据集质量评估体系发布
近日,中国信息通信研究院(中国信通院)在保定正式发布我国首个人工智能数据集质量评估体系,该评估体系的发布将为我国数据产业、人工智能产业高质量发展提供重要支撑。评估体系还具备“两项标准+一项发明专利+一套指标体系+一套系统平台”的“2+1+1+1”基础能力,有效融合了传统数据质量要求(如ISO 8000)与当前AI模型训练的实际需求,为数据管理和AI模型训练提供了强有力的技术支持和保障。
随着DeepSeek热度升温,人工智能、大模型的发展更加备受关注。当前人工智能发展面临数据质量核心挑战:58%的AI项目因数据质量差而失败,政府、央国企及数据服务商亟需科学、公正的评估基准以推动高质量数据集建设与采购。2025年被视为“数据集建设元年”,各方需求聚焦于解决数据完整性、可信性、多样性等问题,构建数据质量评级与定价参考体系。
近日,中国信息通信研究院(中国信通院)在保定正式发布我国首个人工智能数据集质量评估体系,该评估体系的发布将为我国数据产业、人工智能产业高质量发展提供重要支撑。
此次发布的评估体系基于“可用+好用+落地”的核心理念,创新性提出“CRISP-DECODE”质量评估框架,涵盖12类一级指标,包括完整性、规范性、准确性和多样性等关键要素,并进一步细化为36类二级指标,形成了一个系统、科学、全面的质量评估体系。评估体系还具备“两项标准+一项发明专利+一套指标体系+一套系统平台”的“2+1+1+1”基础能力,有效融合了传统数据质量要求(如ISO 8000)与当前AI模型训练的实际需求,为数据管理和AI模型训练提供了强有力的技术支持和保障。
据悉保定市自国家数据标注基地建设以来,始终聚焦各方需求,正在与中国信通院共建人工智能数据处理和质量评测中心,打造全国首个行业高质量数据集评测平台。本次评估体系的发布,标志着保定市在数据集质量评估领域迈出了重要一步。未来,该体系有望在多个行业和领域得到广泛应用,推动数据科学和人工智能技术的持续进步。(韩宝军)
编辑:刘润榕
声明:新华财经为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115














