背景:基于市面上开源的代码大模型做一款AI代码插件。
问题:相同的模型、相同的prompt、相同的参数设置,发现官网模型demo的输出效果会比自己部署的输出效果好
目标:如何将自部署的模型和官网demo的输出对齐,如何对模型进行微调,需要具备哪些技术
我想到的有以下几点:
1.选择开源的代码支持能力较好的大模型,例如CodeGeeX2-6B、codellama
2.尝试不同的参数设置,划分一个合理的参数区间
3.调整prompt模板
在上述方法都尝试过后发现还是需要对模型本身进行微调,但是很迷茫,不知道如何去具体开展这个工作。直接去阅读模型源代码,然后去修改源代码?,好多模型都是直接封装好的调用方法