SFT (监督微调)

什么是微调？

监督微调 (Supervised Fine-Tuning, SFT) 是在你特定的数据上训练现有的预训练模型，使其适应你的领域或任务的过程。它调整模型的参数以专门针对你的用例。

核心思想: 采用通用 LLM → 在你的数据上训练 → 获得专用模型

为什么微调:

前端工程师建议

实施建议：雇佣 ML 工程师

作为一名前端开发者，除非使用像 OpenAI 的微调 API 这样的托管服务，否则你通常不应该自己实施 SFT。这通常是机器学习工程师的领域。

方面	提示工程	RAG	微调 (SFT)
成本	非常低 (免费)	低 (推理 + 检索)	非常高 (GPU 训练)
设置时间	分钟	数小时到数天	数天到数周
所需数据	无 (只需提示词)	文档用于检索	100s-1000s 标注示例
速度	快	中 (检索开销)	快 (训练后)
更新	即时	即时 (更新知识库)	需要重新训练
最适合	通用任务	动态知识	专业领域

如果你决定必须进行 SFT，这些平台提供托管的微调服务，无需管理 GPU 基础设施：