Skip to content

指南

TransBench 是一套用于评估大模型中英互译能力的基准测试工具。本指南涵盖环境配置、运行方式与评分标准。

文档导航

工作流程

mermaid
flowchart LR
  A[准备 exam.txt] --> B[配置 .env]
  B --> C[运行翻译测试]
  C --> D[输出 CSV 结果]
  D --> E[裁判模型评分]
  E --> F[归档至文档]

MIT Licensed