腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
IT之家 12 月 26 日消息,腾讯研究院最新推出了 DRT-o1 系列模型,主要通过长思维链(long chain-of-thought,简称 CoT),更能理解比喻和隐喻等,从而提高文学作品的翻译质量。
项目背景
IT之家注:神经机器翻译(NMT)在处理日常文本翻译方面已取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临巨大挑战。
这些表达通常蕴含深厚的文化和语境含义,简单的直译往往无法准确传达其内涵,而腾讯开发的 DRT-o1 系统,为解决这一难题提供了新的思路。
项目介绍
研究人员从古腾堡(Project Gutenberg)计划中选取 400 本公共领域英文书籍,提取 577600 个句子,并筛选出 63000 个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。
DRT-o1 采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供修改建议,评估员则根据预设指标对翻译质量进行评分,通过反复迭代,不断提升翻译质量。
工作流程包括三个主要步骤:
关键词翻译:翻译者首先识别句子中的关键词,并提供它们的翻译。
初步翻译:然后,翻译者根据源句子和关键词的双语对应关系提供一个初步的翻译。
翻译精炼循环:在精炼循环中,顾问评估前一步的翻译并提供反馈,评估者根据预定义的评分标准给出整体评分。翻译者根据反馈和评分提供新的翻译。当评分达到预定义的阈值或迭代次数达到最大值时,循环停止。
最终的翻译结果会由 GPT-4o 进行润色,确保流畅性和可读性,最终数据集包含 22264 个经过深度思考的机器翻译样本。
开发者提到了一个例子,原文是:
The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.
这句话中的“struck her all of a heap”是一个成语,表示某事对她产生了强烈的影响。DRT-o1 模型通过长链思考过程,最终将其翻译为:
母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。
这个翻译不仅传达了原文的意思,还保留了原文的情感色彩。
性能
DRT-o1 系列共有 DRT-o1-7B 和 DRT-o1-14B 两个规模版本。
实验结果表明,与 Qwen2.5-7B-Instruct 相比,DRT-o1-7B 的 BLEU 分数提高了 8.26 分,CometScore 提高了 3.36 分;与 Qwen2.5-14B-Instruct 相比,DRT-o1-14B 的 BLEU 提高了 7.33,CometScore 提高了 1.66。
DRT-o1-7B 的性能甚至超过了更大的模型 QwQ-32B,BLEU 分数高出 7.82 分,CometScore 高出 1.46 分,展现了其在处理复杂语言结构方面的强大能力。
0人
- 每日推荐
- 股票频道
- 要闻频道
- 港股频道
- 地方政府专项债券管理机制优化完善
- 证监会:立案!影响超8万股民,涉嫌信息披露违法违规被立案
- 6连板!实益达、来伊份等大牛股回应“微信小店”情况
- 拓展产业链 光启技术拟在四川乐山建设先进无人机基地项目
- 新规后首家!*ST卓朗被实施强制退市
- NBD年度新闻榜 · 2024汽车十大新闻丨新能源汽车年产量首次突破1000万辆,自主品牌乘用车市占率首次突破70%……
- A股年终策划之新股首日表现PK:红四方1917.42%夺冠,仅一股破发
- 上交所发布!这只A股拔得头筹
- 12月26日晚间公告集锦:南京公用拟购买宇谷科技约68%股权 股票停牌