Mind Lab Toolkit (MinT)
Customize

Customize

本区段是一份"MinT 训练任务里能配置的全部内容"的参考。它按 算法(SFT / DPO / RL / VLA)组织,加上贯穿多个算法的 概念recipe。每个叶子页声明 3 种固定模板之一,所以右侧 TOC 在整个区段里读起来一致。

从哪开始

全部参数(按算法)

每个算法的完整参数表在它自己页面的 ## All Parameters 段。直达链接:

概念索引

跨多个算法都会出现的基础话题:

话题页面
渲染 / 分词Rendering
损失函数目录Loss Functions
Completers(TokenCompleter、MessageCompleter、LLM-as-judge)Completers
权重 / checkpoints / TTLWeights
Evaluations(自定义、NLL、Inspect AI)Evaluations
异步模式 / num_samplesAsync Patterns

Recipe 索引

把多个原语组合起来的端到端 recipe,以及部署路径:

Recipe页面
RLHF 三阶段流水线RLHF Pipeline
多轮 RLMulti-turn
多智能体 RLMulti-agent
Prompt 蒸馏Distillation
自定义环境Custom Environment
导出到 HFExport to HF
LoRA AdapterLoRA Adapter
发布到 HubPublish to Hub

Tinker 兼容。 MinT 客户端 SDK 与 Tinker API 兼容(pip install 来自 mindlab-toolkit)。Tinker 上能跑的代码模式 MinT 也能跑 —— 把 endpoint 换成 mint.macaron.xinmint-cn.macaron.xin,把 key 换成 MINT_API_KEY 即可。完整迁移见 Human Quickstart → 从 Tinker 迁移

本页目录