近日,江苏省数据局正式公布2026年江苏省高质量数据集建设先行先试项目名单,江苏有线(600959)数据公司收获亮眼成果:牵头申报的“江苏省视听共享节目高质量数据集建设应用”项目,联合江苏省地震局共同申报的“江苏地震监测预警多源融合数据集建设与服务”项目双双入选。
高质量数据集特指为人工智能(885728)服务的一类数据产品。这类数据集合经由采集、清洗、加工与标注等标准化数据处理流程后,可直接用于开发和训练人工智能(885728)模型,并能有效提升模型性能、保障模型泛化能力,是赋能大模型、智能体与终端落地的核心资源,也是AI核心“战力”的关键构成。依托高质量数据集与智能化治理构建新型基建,正加速各行各业数字化转型升级。
从“大模型”到“优质数据”
再顶尖的大模型,没有高质量数据打底,如同学霸拿着错误教材学习,最终难以产出靠谱成果。高质量数据集是制约AI落地、决定技术上限的核心瓶颈,未来全球AI产业竞争,本质是优质数据资源的争夺战。
作为数据大省,江苏紧扣数据要素(886041)市场化改革与数字江苏建设,加快建设标杆级高质量数据集工程,现已在医疗、交通、工业、能源(850101)、文旅等重点领域形成高质量数据集521个、总规模超95PB。本次数据公司双项目入选由省数据局择优遴选,配套省级政策扶持、资源协同、试点落地等多项保障支持,公司正全力做好本次入选的高质量数据集建设工作,赋能AI+行业落地与场景化应用。
从“数据筑基”到“全链赋智”
数据公司在人工智能(885728)行业应用领域积极布局,上月刚入选江苏省“人工智能(885728)+制造” 诊断服务商(第一批)名单,此次又入选江苏省高质量数据集建设先行先试项目名单。高质量数据集是“核心燃料”与“基石”,人工智能(885728)+制造是“场景牵引”与“价值出口”,只有精准锚定场景中关键环节的真实需求,才能为高质量数据集的建设指明方向,确保数据“生于场景、用于场景”。
数据公司凭借自主研发的“网云算数安”一体化技术底座,搭建起文科创新复合型专业团队,在文化数字化、可信数据空间、智能制造数字化咨询等方面具备全链条落地实力。公司将抓实高质量数据集建设落地,深化AI+文化、AI+应急等场景赋能,充分发挥“文化+科技”融合及“网云算数安”核心能力底座优势,围绕文旅教育、应急气象、工业制造、医疗康养、基层治理等领域,按需提供多模态高质量数据集建设与智能化升级服务,盘活用好数据要素(886041)赋能千行百业,为数字江苏高质量建设增效赋能。
