摘要: 3月11日消息,网易有道在公众号推文宣布,已完成翻译底层技术迭代,基于自主研发的子曰翻译大模型2.0,翻译质量在与国内外通用大模型的对比测试中展
3月11日消息,网易有道在公众号推文宣布,已完成翻译底层技术迭代,基于自主研发的子曰翻译大模型2.0,翻译质量在与国内外通用大模型的对比测试中展现了不错的成绩。
此次的突破,也标志着网易有道子曰大模型在专业领域取得实质性进展,通过数据、算法等技术创新,使得小参数垂类模型实现性能大幅提升。
据了解,搭载全新大模型的翻译已在有道词典、有道翻译及有道翻译官内上线,提供标准模型、高级模型两种不同参数选择,用户可免费使用全新的AI翻译功能。
同时,有道词典笔X7系列也已升级为最新的翻译大模型,其余型号将陆续更新。
据官方介绍,经历了10个月的技术更迭,子曰翻译大模型2.0从数据、算法、评估三个层面进行技术突破,最终以14B小参数垂类模型实现高水准的翻译性能。
这也体现出有道在教育大模型发展上的垂直专业能力,验证了“场景+数据”的护城河。
其中:
在数据层面,有道收集并严格清洗了高质量的翻译语料数据,由英语专八认证人员及职业译员进行精细化人工标注,使得模型拥有优质数据资源库,增强其在多样化翻译场景的应对能力。
在算法层面,有道以子曰大模型为基础,进行二次预训练,进一步优化更具专业性与针对性的翻译基座大模型,结合大模型蒸馏技术、大模型融合技术、Online DPO技术等多项手段,有效避免了大模型的灾难性遗忘问题,并在运行效率、准确性、流畅性等翻译性能上进行大幅提升。
在评估层面,借助翻译数据沉淀,有道自主研发了翻译评估模型Reward Model,为子曰翻译大模型的性能评估提供可靠的量化依据及完善的人工评估方案,多维度对模型的翻译结果进行评估和分析。
“通用大模型比的是参数大、算力强,但翻译这件事,参数堆不出专业度;当通用大模型竞逐参数规模时,我们还是更相信垂类模型的未来价值——用专业的垂直应用真正解决专业场景的痛点,这也正是我们持续努力和进化的方向。”网易有道相关负责人表示。