发布日期:2026-01-02 06:06 点击次数:165

DoNews12月30日音问,腾讯混元本日告示开源翻译模子 1.5 版块开云(中国)kaiyun网页版登录入口,共包含两个模子:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,维持 33 个语种互译以及 5 种民汉 / 方言,除了汉文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。
当今两个模子均已在腾讯混元官网上线,在 Github 和 Huggingface 等开源社区也可平直下载使用。

HY-MT1.5-1.8B 主要面向手机等花费级诞生场景,经过量化,维持端侧平直部署和离线及时翻译,仅需 1GB 内存即可畅达启动,况兼声称在参数目极小的前提下,成果进步了大部分商用翻译 API。
同期,与主流商用翻译模子 API 对比,HY-MT1.5-1.8B 推理速率更快,惩办 50 个 tokens 的平均耗时只消 0.18 秒,其他模子的时间在 0.4 秒傍边。
HY-MT1.5-7B 模子成果比较前一版块成果有较大晋升,是此前取得 WMT25 比赛 30 个语种翻译冠军模子的升级版,要点晋升了翻译准确率,大幅减少了译文中夹带夺目和语种羼杂的情况,实用性进一步增多。
在部分用户骨子使用场景下,混元翻译 1.8B 和 7B 两个尺寸模子同期使用,不错终了端侧和云侧模子的协同部署,晋升模子的成果的一致性和褂讪性。
在常用的中外互译和英外互译测试集 Flores200、WMT25 以及民汉道话的测试集会,Tencent-HY-MT1.5-1.8B 全面超过中等尺寸开源模子和主流商用翻译 API,达到 Gemini-3.0-Pro 这种超大尺寸闭源模子的 90 分位水平。在 WMT25 和民汉翻译测试集上,其成果仅稍稍差于 Gemini-3.0-Pro,远超其他模子。

HY-MT1.5-1.8B 模子在 FLORES-200 质料评估中取得了约 78% 的分数,同期平均反馈时间 0.18 秒,超过主流商用翻译 API,适用于即时通信、智能客服、移动翻译欺诈等高详尽、及时翻译场景。
此外,针对各样场景,两个模子均终昭彰对术语库、长对话、带才智文本(举例网页)的翻译维持,愈加全面:
当先是术语,腾讯混元翻译模子 1.5 具备术语库自界说能力,用户可针对不同业业与专考场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保要津术语在翻译中保握高度一致与准确性。
用户可通过肤浅成立导入术语库,模子将在翻译经过中优先剿袭用户界说的圭臬术语,从而晋升专科文档、工夫手册、公约文本等内容翻译的可靠性与泰斗性。
其次是高下文翻译。混元翻译模子具备长文本与对话高下文联接能力,可基于前文语境握续优化后续翻译按捺,晋升长对话、多轮问答、连气儿段落等场景下的翻译连贯性与一致性。
不管是会议记载、访道内容、演义章节如故工夫文档的长篇翻译,模子均能捕捉并保握高下文逻辑关联,幸免出现指代不清、语义断裂或立场不和洽的问题。
第三是带才智翻译能力,通过领导谨守能力,混元翻译模子得以保握翻译前后的才智信息不变,让翻译按捺愈加准照实用。
为了直不雅展示混元 Tencent-HY-MT1.5-1.8B 的翻译成果,官方展示了与苹果手机自带离线翻译的按捺对比:
工夫方面,HY-MT1.5-1.8B 粗略用小尺寸终了大尺寸模子的成果,获利于 On-Policy Distillation(大尺寸模子蒸馏)战术的引入,让 HY-MT1.5-7B 行动 Teacher,及时相同 1.8B 的 Student 模子,让其幸免死记硬背圭臬谜底,通过更变在展望序列踱步时的偏移,让小模子从诞妄中学习,晋升能力。
腾讯混元翻译模子此前不仅在海外机器翻译比赛拿下 30 个第 1 名,也在初度开源一周内便登上了 HuggingFace 模子趋势榜第一位。混元翻译模子还是在腾讯里面多个业务场景落地欺诈,包括腾讯会议、企业微信、QQ 浏览器、客服翻译等。
为了便于开荒者使用,本次开源的模子还是在 Github 和 Huggingface 等开源社区上线开云(中国)kaiyun网页版登录入口,Arm、高通、Intel、沐曦等多个平台均维持部署。