模型训练 / 微调方案

Pain Point

要解决的问题

不知道该选微调、RAG 还是提示词工程；数据清洗、评测、部署和成本监控链路复杂。

Workflow

执行流程

先判断是否真的需要训练
清洗训练集、知识库和评测集
选择微调、RAG 或混合方案
上线后记录命中率、成本和失败样本

Stack

怎么判断工具是否适合

来源可追溯

优先选择能返回原文引用、段落来源和更新时间的方案，避免答案无法核验。

权限边界

上线前按部门、角色和文档密级测试，确认敏感资料不会被无权限用户检索到。

未命中闭环

记录没有答上来的问题，每周补充文档、同义词和标准答案，知识库才会越用越准。

接入位置

先接入飞书、企业微信、网页客服或内部系统中最常被提问的位置，减少用户切换。

Rollout

7 天落地节奏

第 1 天：跑通样例

选择 1 个真实任务样本，按本页流程跑通从输入、生成、人工修正到最终交付的完整链路。

第 2-3 天：沉淀模板

把提示词、素材规格、工具组合、命名规则和检查清单固定下来，形成可复用的模型训练 / 微调方案模板。

第 4-7 天：小范围复用

让 2-3 个真实项目复用模板，记录耗时、返工点、质量问题和工具卡点。

第 2 周：决定投入

根据效率提升、质量稳定性、成本和团队接受度，决定继续扩大、换工具或只保留部分流程。

Review

复盘指标与站内搜索词

复盘指标

命中率：用户问题能从知识库找到可靠答案的比例。
引用率：答案能够给出原文来源和可追溯引用的比例。
未命中问题：每天新增且需要补库的真实问题数量。
人工节省：客服、售前或内部支持减少的重复答复时间。

可继续搜索

模型训练 / 微调方案模型训练 AI 工具推荐模型训练工作流模型训练提示词模板模型训练开源方案模型训练落地方案模型训练成本与选型微调工具 RAG 工具

Delivery

交付物与检查点

交付物

训练路线判断表
清洗后数据集
评测集
灰度上线记录
成本报表

上线检查

能用 RAG 解决的不要先微调
训练数据要去重、脱敏和标注来源
上线前必须做反例评测

Open Source

开源参考

GitHub LLaMA-Factory

常用的大模型微调框架，适合 LoRA、QLoRA 和多模型训练实验。

用于企业内部模型微调和训练流程验证 GitHub Unsloth

强调高效微调的开源项目，适合节省显存和训练成本。

用于中小团队低成本微调开源模型 GitHub Axolotl

面向多种大模型训练配置的开源工具链。

用于更工程化的微调配置和批量实验