企业每天都会产生大量合同、财务报表、行业研报、技术文档等非结构化数据。随着大模型和AI Agent逐步进入企业业务场景,如何让AI准确理解复杂文档中的结构与内容,成为影响应用效果的重要环节。
优刻得(688158)与EasyLink(容易链科技)达成战略合作,优刻得(688158)AstraFlow星图平台正式上线EasyLink旗下新一代视觉语义大模型EasyDoc系列,首批涵盖多模态文档解析、文档信息抽取及医疗数据脱敏三个模型。
双方此次合作,将AstraFlow星图的企业级AI开发平台能力,与EasyLink的多模态数据处理能力相结合,为企业提供从调用到集成的一站式文档智能处理方案,构建高质量AI-Ready数据底座。
文档理解:AI应用落地的重要基础能力
企业的核心知识资产大量沉淀在文档、PPT、图片、扫描件等多模态数据中,是知识库构建、智能问答、合同审核、报告分析等场景的重要数据来源。
然而,传统OCR方案主要解决的是文字识别问题,对于复杂文档中的版面结构、内容关联和上下文逻辑理解能力有限。当文档存在多栏排版、复杂表格、扫描件或图文混排时,解析结果往往难以满足后续AI应用需求。
随着Agent和RAG等技术的发展,企业对于高质量文档数据的需求持续增长,文档解析能力正在成为连接基础模型与业务应用的重要环节。
EasyLink视觉语义大模型:面向复杂文档场景的理解能力
针对复杂文档处理需求,EasyLink推出了全新的视觉语义大模型EasyDoc,通过视觉感知与语义理解相结合的方式,对文档内容进行更加完整的结构化解析。
更准确的文档结构理解能力
基于多模态视觉语义模型,系统能够同时识别文本内容、版面结构以及元素之间的关联关系,对标题层级、段落组织和复杂表格进行统一解析,为后续AI应用提供更完整的数据基础。
相比传统OCR方案,视觉语义模型不仅关注“识别了什么”,也关注“内容之间如何关联”,从而提升整体解析质量。经企业实测,Easydoc模型在跨页表格、图文混排、低分辨率等复杂场景下的解析准确率高达99.23%。
面向多类型文档的适配能力
Easydoc模型支持PDF、PPT等超过30种文档格式和超过100种语言,满足企业的多样化需求。
模型可以精准解析扫描件、多栏排版、图文混排等多种文档形式,无需针对特定行业进行大量定制训练,即可适配法律、金融、制造、科研等领域的常见文档场景。
无论是合同条款、财务数据还是技术资料,都能够通过统一方式完成结构化处理。
支持面向AI应用的数据输出
在完成文档解析后,系统可输出JSON、Markdown等标准化格式,便于接入知识库、RAG系统以及Agent工作流。同时,通过来源定位与结果溯源机制,帮助用户快速定位答案对应的原始内容,提高结果的可验证性和可追溯性。
AstraFlow星图×EasyLink:从模型能力到应用落地
作为企业级AI开发与应用平台,AstraFlow星图为企业提供模型调用、Agent开发、权限管理、安全运行和应用部署等能力,帮助企业更便捷地将模型能力应用到实际业务场景中。(优刻得(688158)发布AstraFlow星图:企业专属一站式AI开发平台)此次星图平台与EasyLink大模型的结合,可广泛应用于文档处理需求较高的行业场景。
金融研报解析:对于证券、基金等机构而言,每天需要处理大量研究报告和行业资料。通过视觉语义解析能力,可实现文档内容自动结构化提取,快速输出标准化数据,并对接后续分析流程,提高信息处理效率。
合同审核与风险分析:在法律和企业法务场景中,系统能够识别合同结构、条款层级以及关键内容,并结合大模型能力开展合同对比、风险提示等工作,辅助审核流程。
企业知识库建设:针对历史积累的大量技术文档、产品资料和内部知识资产,企业可以通过文档解析与结构化处理能力,快速构建知识库体系,为RAG和Agent应用提供数据基础。
随着Agent应用不断深入企业场景,文档理解能力正逐渐成为AI基础设施的重要组成部分。优刻得(688158)AstraFlow星图与EasyLink的合作,为企业构建文档智能处理流程提供了新的选择。双方将持续探索文档理解、大模型应用与智能工作流的融合实践,推动AI能力更高效地服务实际业务场景。
关于EasyLink
上海容易链智能科技有限公司(简称“EasyLink”)是一家人工智能(885728)原生企业,创立于2023年。公司致力于数据基础设施研发与大模型创新应用构建,解决大模型技术在企业落地最后一公里问题。基于自主研发的视觉语义大模型,可帮助企业实现文档、图像、视频等数据资源的深度理解与智能化应用。
