Mind Lab Toolkit (MinT)

FAQ

这里集中回答首次使用 MinT 时最常见的问题:SFT vs RL、域名选择和 API key 获取方式。

我应该做 SFT 还是 RL?

如果你已经知道目标输出,并且有标注样本,使用 SFT

如果你没有唯一标准答案,但能用 reward、verifier、测试或环境反馈给模型行为打分,使用 RL

如果两者都有,可以组合使用。常见做法是用 SFT 建立基础行为,再用 RL 做目标优化,但这不是所有任务都必须遵守的固定顺序。

MinT 支持 SFT 吗?

支持。MinT 直接支持 SFT。

标准 SFT 路径就是:

  • forward_backward(..., loss_fn="cross_entropy")
  • optim_step(...)

应该用境外还是境内域名?

按你的网络路径来选:

  • 境内 -> https://mint-cn.macaron.xin/
  • 境外 -> https://mint.macaron.xin/

如果不确定,先用与你所在区域一致的域名。最实际的判断标准是延迟更低、连接更稳定。

MINT_API_KEY 从哪里获取?

MINT_API_KEY 目前由 Mind Lab 团队发放。

申请方式:

  • 访问 https://macaron.im/mindlab
  • 使用 Schedule a Demo
  • 或发邮件到 contact@mindlab.ltd

本页目录