Mind Lab Toolkit (MinT)
API 参考

参数和类型

MinT API 中使用的核心数据类型

AdamParams

Adam optimizer 配置。

字段

字段类型默认值说明
learning_ratefloat0.0001参数更新步长
beta1float0.9一阶矩估计的指数衰减率
beta2float0.95二阶矩估计的指数衰减率
epsfloat1e-12数值稳定性常数

示例

from mint import types

training_client.optim_step(
    types.AdamParams(learning_rate=1e-4, beta1=0.9, beta2=0.95)
).result()

ModelInput

表示 tokenize 后的模型输入。

方法

  • from_ints(tokens):从 token ID 列表创建
  • to_ints():转换为 token ID 列表
  • context_length():获取总 token 数
  • append_tokens(tokens):末尾添加 token
  • append_chunks(chunks):添加文本 chunk

支持

  • 纯文本(token ID 列表)

SamplingParams

控制文本生成行为。

字段

字段类型默认值说明
max_tokensint必填最大生成 token 数
temperaturefloat1.0随机性(0.0 = 确定性,越高越随机)
top_kint-1仅考虑 top-k 个 token(-1 = 禁用)
top_pfloat1.0nucleus sampling 阈值
seedintNone随机种子,用于可复现
stoplistNone停止序列(字符串或 token ID)
stop_token_idslistNone停止生成的 token ID

示例

from mint import types

result = sampling_client.sample(
    prompt=types.ModelInput.from_ints(tokens),
    num_samples=4,
    sampling_params=types.SamplingParams(
        max_tokens=100,
        temperature=0.8,
        top_p=0.95,
        stop_token_ids=[tokenizer.eos_token_id]
    )
).result()

LoraConfig

LoRA 配置。

字段

字段类型默认值说明
rankint32低秩矩阵的 rank 维度(最大: 64)
seedintNone初始化种子
train_unembedbooltrue训练 unembedding 层
train_mlpbooltrue训练 MLP 层
train_attnbooltrue训练 attention 层

示例

training_client = service_client.create_lora_training_client(
    base_model="Qwen/Qwen3-0.6B",
    rank=16,
    train_mlp=True,
    train_attn=True,
    train_unembed=True
)

Checkpoint

表示已保存的模型 checkpoint。

字段

  • id:唯一标识符
  • type:"training" 或 "sampler"
  • timestamp:创建时间
  • size:文件大小(字节)
  • public:是否公开

TensorData

带转换工具的 tensor 数据包装器。

方法

  • to_numpy():转换为 NumPy 数组
  • to_torch():转换为 PyTorch tensor
  • shape:获取 tensor 维度

TrainingRun

Training session 的元数据。

字段

  • id:唯一标识符
  • base_model:使用的基座模型
  • owner:创建者
  • corrupted:是否遇到错误
  • checkpoints:已保存的 checkpoint 列表
  • created_at:时间戳

本页目录