Cookbook
Cookbook
MinT Cookbook 是一个独立仓库,存放较长的 recipe 风格的端到端实验 —— 每一个都是一个可跑的目录,包含 pyproject.toml、train.py、autoresearch.sh,以及一份说明实验意图的 README。
Available experiments
当前 maintained 的实验,全部运行在 Qwen/Qwen3-4B-Instruct-2507 上:
| 实验 | 实验是干什么的 | 算法 | Primary metric |
|---|---|---|---|
| chat-dpo | 成对 chat 偏好 DPO,配 held-out 偏好 eval | DPO | eval_pair_accuracy |
| dapo-aime | 在 DAPO-Math-17k 上跑 direct GRPO,AIME 2024 可上报 benchmark | direct GRPO | eval_accuracy |
| fingpt | FinGPT 风格金融 instruction tuning,Fineval anchor + sentiment SFT | LoRA SFT | eval_accuracy |
| lawbench | 全 20 任务 LawBench benchmark,配 LoRA SFT baseline | LoRA SFT | eval_lawbench_avg |
何时用 Cookbook
- 你需要完整可跑的实验,而不是片段代码。
- 你在找 baseline 或者一个已发布的配置来 fork。
- 你需要超出 Customize 四段算法页范围的模式(长时训练、评估 harness、多阶段流水线)。
与其它文档的关系
| 资源 | 受众 | 长度 |
|---|---|---|
| Get Started → Human Quickstart | 首次跑通的用户 | 7 步线性流程 |
| Customize | 选算法的开发者 | 每个算法/概念一页 |
| mint-quickstart | 首次跑通的可复现脚本 | 每个话题一个脚本 |
| mint-cookbook | 跑完整实验的研究者 | 每个 recipe 一个目录 |
贡献。 Cookbook 接受社区贡献。在 mint-cookbook 上提 PR,加一个新的 recipe 目录和一份说明实验、数据集、预期指标的 README。