【多模态微调】15分钟学会微调Qwen2.5-VL,从数据集准备到大模型训练完整流程,清晰易懂!环境配置+模型微调+效果展示!草履虫都能学会~_哔哩哔哩_bilibili
准备数据
up 主选择从国内一个网站上找的水稻虫害相关的图像数据集
首先, 查看一下数据集里的图像基本信息
调整图片
这个图像像素, 空间都非常大, 对于微调来说很麻烦, 甚至都超出了微调模型的像素大小限制
因此需要对图像做一些简单的处理, 可以使用 python
up这里把图像变小, 变成统一尺寸, 方便训练(不过并不是必需的)
标注图片
up 选择使用 Label Studio 对图片进行标注
标注完后, 选择导出标注数据
根据微调要求的数据格式, 对标注数据进行重新构造, 整理格式
up 也是用了一个 python 文件进行处理, 构造成指定格式的标注文件
训练模型
up 选择使用 LLaMA factory 微调模型
llama factory 是一个可视化的面板, 里面可以选择模型目录, 数据集目录, 以及微调的各种方法, 参数等等, 看着挺方便的
在训练完之后, 还可以直接预览模型查看微调后的效果