微调概述
什么是微调?
微调(Fine-tuning)是在预训练模型基础上,使用特定任务数据继续训练的迁移学习方法,通过少量数据实现针对性优化。
为什么需要微调?
- 通用模型知识面广但不够准确(如无法准确回答公司政策)
- 提示工程无法满足深度定制需求(如特定领域术语)
- 某些任务需引导模型行为(如限制回答风格、安全策略)
Link to original
- 详细介绍参见 大模型微调方法论
微调概述
什么是微调?
微调(Fine-tuning)是在预训练模型基础上,使用特定任务数据继续训练的迁移学习方法,通过少量数据实现针对性优化。
为什么需要微调?
- 通用模型知识面广但不够准确(如无法准确回答公司政策)
- 提示工程无法满足深度定制需求(如特定领域术语)
- 某些任务需引导模型行为(如限制回答风格、安全策略)
Link to original