Skip to content

模型索引

各基准模型的评测结果按 试题版本 → 基准模型 归档。不同版本使用不同试题集与裁判模型, 结果仅供查阅,不作横向排名

试题版本

版本基准模型数exam.mdprompt.md入口
v2.0.02exam.mdprompt.md查看
v1.0.04exam.mdprompt.md查看

v2.0.0

exam.md · prompt.md

基准模型裁判模型输出结果
hy-mt2-1.8b@q8_0gemini-3.1-pro-preview输出结果
hy-mt2-7bgemini-3.1-pro-preview输出结果

v1.0.0

exam.md · prompt.md

基准模型裁判模型输出结果
google-tranlategoogle-tranlate-gemini-3-think
hy-mt1.5-1.8bhy-mt1.5-1.8b-gemini-3-think
hy-mt1.5-7bhy-mt1.5-7b-gemini-3-think
MTranServerMTranServer-gemini-3-think

MIT Licensed