腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

Ai资讯1个月前 时间煮雨
10,355 00
腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译‘信达雅’”。这篇文章介绍了腾讯研究院最新推出的DRT-o1系列AI模型,这些模型通过长思维链(CoT)技术,能够更好地理解和翻译文学作品中的比喻和隐喻等修辞手法,从而提高翻译质量。

以下是文章的主要内容:

项目背景

神经机器翻译(NMT)在处理日常文本翻译方面取得了显著进展,但在翻译文学作品时,尤其是隐喻和明喻等修辞手法时,仍面临挑战。这些表达通常蕴含深厚的文化和语境含义,简单的直译无法准确传达其内涵。腾讯开发的DRT-o1系统为解决这一难题提供了新的思路。

项目介绍

研究人员从古腾堡计划中选取400本公共领域英文书籍,提取577600个句子,并筛选出63000个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。DRT-o1采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色,通过反复迭代不断提升翻译质量。

工作流程包括三个主要步骤:

  1. 关键词翻译:翻译者识别句子中的关键词,并提供它们的翻译。
  2. 初步翻译:翻译者根据源句子和关键词的双语对应关系提供一个初步的翻译。
  3. 翻译精炼循环:顾问评估前一步的翻译并提供反馈,评估者根据预定义的评分标准给出整体评分。翻译者根据反馈和评分提供新的翻译。当评分达到预定义的阈值或迭代次数达到最大值时,循环停止。

最终的翻译结果会由GPT-4o进行润色,确保流畅性和可读性。

性能

DRT-o1系列共有DRT-o1-7B和DRT-o1-14B两个规模版本。实验结果表明,与Qwen2.5-7B-Instruct相比,DRT-o1-7B的BLEU分数提高了8.26分,CometScore提高了3.36分;与Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU提高了7.33,CometScore提高了1.66。DRT-o1-7B的性能甚至超过了更大的模型QwQ-32B,BLEU分数高出7.82分,CometScore高出1.46分,展现了其在处理复杂语言结构方面的强大能力。

© 版权声明

相关文章

暂无评论

none
暂无评论...