近日,由DataFun主办的DACon 2026数据智能技术大会在上海举行,邀请了腾讯、复旦大学、上海银行(601229)、光大银行(601818)、普元信息(688118)等30家机构的近60位专家,围绕AI Agent、数据工程与智能体基础设施等核心议题展开深度研讨,吸引了超过800位技术开发者、技术管理者和行业技术专家踊跃交流。
普元信息(688118)AI科学家王仕亿博士,结合AI新语境及新趋势分析数据资产架构痛点,将一个越来越普遍的“价值卡点”收敛为可操作的架构命题:在国家“数据要素(886041)×”与“人工智能(885728)+”持续深化的背景下,企业不缺数据总量,缺的是让数据在可信治理下持续高质量流转的“组织方式”。
存量数据难转化为生产力的痛点症结:传统数据架构的结构性短板
王仕亿博士指出,随着国家“数据要素(886041)×”行动推进、“模数共振”式的高质量数据建设提速,企业数据系统面临的压力已经发生质变——数据不再只服务于人的报表和复盘,还要服务于模型的训练、推理和智能体的高频调用。这一转变直接暴露了传统数据资产架构的几类深层摩擦。
数据孤岛严重:系统间壁垒深、口径分散,致使数据资产盘点不清并且难以互通,跨域共享效率低下。
ETL模式笨重,链路长:传统数据抽取、转换和加载等处理流程繁琐,时效性差,难以满足实时业务需求。
开发与运维复杂,迭代慢:治理逻辑、业务规则、调度实现不统一且分散在单体或碎片化管道里,致使开发与运维越来越复杂,系统难以敏捷迭代去适应快速变化的业务需求。
数据质量与治理薄弱:缺乏系统化治理能力,质量校验、血缘梳理、合规追溯等大量在链路末端补救,而非随数据进入平台即参与执行,导致治理摩擦随数据规模同步放大。
难以支撑AI、实时分析等新场景:现有架构仍以“人”为中心,并没有面向“人与Agent并存”进行有效适配智能化应用需求的变革,限制了数据在实时分析等新兴业务领域的价值挖掘。
这些结构性短板并非否定数据资产本身,而是体现了存量数据资产的价值转化,正被旧有的组织方式与工程结构所拖慢。
下一代架构的方向判断:以"数据+知识"为核心,突破传统局限
在趋势研判部分,王仕亿博士提出:数据架构正在从以人为核心的旧范式,转向以数据(资产化、可治理、可服务化)与知识(语义、关系、约束)为双核心的新型架构。
普元AI科学家王仕亿博士分享未来以数据和知识为核心的数据架构
让“数据在哪里、意味着什么、能被怎样用、必须在什么边界内用”成为平台级的一级要务,而不再只是业务系统外的附加说明。这也意味着:未来架构不仅要解决连通性,更要解决可信性——数据要能被人理解、被系统解释、被智能体安全调用,且在合规视线内全程可追溯。
融合“驾驭工程”实现范式升级:设计数据资产工作台
当前行业常见的提示词工程、上下文工程两条路线都存在天花板:
提示词工程的核心是“把话说明白”,但难以突破跨系统孤岛与可信执行等问题;
上下文工程的核心是“把信息给对”,但当链路变长、数据源变杂、执行动作变多时,仅靠上下文拼接仍会遭遇漂移、幻觉与失控风险。
王仕亿博士指出,要从“让模型更会说”升级到“让执行更可靠”——也就是驾驭工程(Harness Engineering)思路:用工程化框架为智能体的执行加上约束、验证与反馈闭环,提升可靠性、实现规模化、降低维护成本、明确责任边界,使AI从演示级走向生产级。
落实到平台侧,这一思路对应的不是一个单点功能,而是一个数据资产工作台的设计原则:把“治理”从隐式流程里提出来,变成可被编排、可调度、可观测、可回溯的平台能力,让人在工作台里做决策、让Agent在工作台的规则与协议内做执行,二者共用同一套血缘、质量门禁、权限与成本归因——治理不是额外负担,而是工作台的内置轨道。
架构升级落地:以“高质量数据集”为核心帮助企业挖掘可交付的实战价值
王仕亿博士在演讲最后把讨论收束到一条可检验的落地主线:驾驭工程不是空框架,它的基座是高质量数据集;而高质量不是一句口号,而是要可拆解、可建设、可度量。
深度治理的数据集:经过清洗、去噪、去重、对齐和增强,确保模型训练和推理的基础数据准确、无偏见,是保障模型性能上限的根本前提。
精确标注的标注集:包含丰富的业务元数据和任务标签,为监督学习提供可靠的“标准答案”,是引导模型学习特征、提升特定任务能力的关键。
模型调用的解释集:包含模型决策依据、特征重要性排序、典型错误案例分析等深度信息,显著增强模型的可解释性与透明度,便于工程师调试优化,是构建数据反馈闭环的依据。
普元以“高质量数据集”为核心帮助企业挖掘可交付的实战价值
由此推导出的实战价值也就非常直接:当“高质量数据集”可规模化供给,AI与智能体才能真正从POC走向生产,数据要素(886041)的乘数效应才有工程抓手,并支撑企业级AI能力中台构建,赋能企业级智能体演进。
本届DACon大会的议题设置本身已释放出明确信号:从“AI驱动的数据开发与分析一体化”、“数据治理智能化升级”到“Agent Ready数据架构”,大会讨论重心从“人如何更高效取数”转向“数据如何在治理边界内被规模化、自动化地供给”——这也正是王仕亿博士演讲所回应的核心命题。
王仕亿博士的分享价值不在于给出一个流行断言,而在于把"数据要素(886041)×AI落地"的共性卡点翻译成了可执行的企业架构语言:以数据+知识为双核、以驾驭工程保障执行确定性、以数据资产工作台把治理能力变成平台级可编排服务,最终落到高质量数据集这一可度量的底座上。让存量数据不只“在”,而且“可信、可流动、可转化为业务生产力”——这正是普元信息(688118)在数据智能与治理方向上持续投入的方向。
演讲人信息:王仕亿博士
普元信息(688118)AI科学家,负责AI(智能体)架构团队,承接上海大数据中心公共数据治理,工商联智能体等项目负责人。擅长集群系统强化学习,AI智能体(886099)架构设计。参与多项国际IEEE、国家AI、可信数据集、数据空间等相关标准制定工作,并在集群系统、强化学习、数据治理方面的重要期刊与顶级会议发表多篇论文。
