Mind Lab Toolkit (MinT)

文档导航

文档分为两部分:

基础概念

核心概念和基本操作:

  • 安装
  • Training 与 Sampling
  • Loss 函数
  • 保存与加载
  • 异步操作
  • 模型列表

MinT Cookbook

实战示例:

  • 监督学习(SFT)
  • 强化学习(RL)
  • 偏好学习(DPO/RLHF)
  • 评估
  • LoRA 入门
  • 开发技巧

基础概念提供构建模块,Cookbook 提供可直接运行的完整示例。

本页目录