模型索引
各基准模型的评测结果按 试题版本 → 基准模型 归档。不同版本使用不同试题集与裁判模型, 结果仅供查阅,不作横向排名。
试题版本
| 版本 | 基准模型数 | exam.md | prompt.md | 入口 |
|---|---|---|---|---|
| v2.0.0 | 2 | exam.md | prompt.md | 查看 |
| v1.0.0 | 4 | exam.md | prompt.md | 查看 |
v2.0.0
| 基准模型 | 裁判模型 | 输出结果 |
|---|---|---|
| hy-mt2-1.8b@q8_0 | gemini-3.1-pro-preview | 输出结果 |
| hy-mt2-7b | gemini-3.1-pro-preview | 输出结果 |
v1.0.0
| 基准模型 | 裁判模型 | 输出结果 |
|---|---|---|
| google-tranlate | google-tranlate-gemini-3-think | — |
| hy-mt1.5-1.8b | hy-mt1.5-1.8b-gemini-3-think | — |
| hy-mt1.5-7b | hy-mt1.5-7b-gemini-3-think | — |
| MTranServer | MTranServer-gemini-3-think | — |