Unsloth-建站之家

Unsloth
Unsloth 是一个高效的开源工具，专注于加速大语言模型（LLMs）的微调和训练过程。它通过创新的技术显著减少了内存占用并提高了训练速度，使得开发者能够在更短的时间内完成模型的微调。以下是 Unsloth 的主要特点、功能和使用方法：

Unsloth 的主要特点

高效微调
- 支持 Llama、Mistral、Phi、Gemma 等主流模型，微调速度比传统方法快 2-5 倍，内存使用减少 50-80%。
- 支持动态 4-bit 量化，显著降低显存占用，同时保持模型精度。
低显存需求
- 仅需 7GB 显存即可训练 1.5B 参数的模型，15GB 显存可支持高达 15B 参数的模型。
- 通过优化内存管理，Unsloth 在消费级 GPU 上也能高效运行。
广泛的模型兼容性
- 支持多种模型格式（如 GGUF、Ollama、vLLM）和量化方法（如 QLoRA、LoRA）。
- 支持长上下文窗口，例如 Llama 3.3 (70B) 的 89K 上下文窗口。
开源与免费
- 提供免费的 Colab Notebook，用户只需添加数据集并运行代码即可获得微调模型。

Unsloth 的核心功能

GRPO（Group Relative Policy Optimization）
- 基于 DeepSeek 的 R1 研究，GRPO 使模型能够自主学习分配更多思考时间，无需人工反馈。
- 适用于生成推理过程，例如从输入输出数据中自动创建思维链。
vLLM 集成
- 吞吐量提高 20 倍，显存节省 50%，支持同时进行微调和推理。
- 动态 4-bit 量化进一步优化了模型性能和内存使用。
LoRA 和 QLoRA 支持
- 支持低秩适应（LoRA）和量化低秩适应（QLoRA），显著减少训练资源需求。
长上下文和视觉模型支持
- 支持 Llama 3.2 Vision (11B)、Qwen 2.5 VL (7B) 等视觉模型。

Unsloth 的安装与使用

安装方法

通过 pip 安装：

pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"

通过 conda 安装：

conda create --name unsloth_env python=3.11
conda activate unsloth_env
conda install pytorch-cuda=12.1 pytorch cudatoolkit xformers -c pytorch -c nvidia -c xformers
pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"

使用教程

加载预训练模型：

from unsloth import FastLanguageModel
model, tokenizer = FastLanguageModel.from_pretrained(
 model_name="unsloth/Llama-3.2-3B-Instruct",
 max_seq_length=2048,
 load_in_4bit=True,
)

微调模型：

from trl import SFTTrainer
trainer = SFTTrainer(
 model=model,
 train_dataset=dataset,
 dataset_text_field="text",
 max_seq_length=2048,
 tokenizer=tokenizer,
 args=TrainingArguments(...),
)
trainer.train()