一种基于大语言模型的多任务处理方法及系统
Abstract:
本发明公开了一种基于大语言模型的多任务处理方法及系统,构建大语言模型,大语言模型包括分类模块和生成模块,分类模块包括用于任务分类的分类线性层Classify_Head和基础模型,生成模块包括基础模型,采用不同权重矩阵的LoRA模块对基础模型中的线性层进行LoRA低秩方法微调;获取若干任务文本;通过分词器对任务文本进行转化,得到大语言模型的输入文本;将输入文本输入大语言模型,分类模块的线性层Classify_Head对输入文本进行任务分类,生成模块根据分类结果加载对应任务的LoRA模块对输入文本进行处理。进行用户问题分类和多任务并行查询,采用同一个基础模型进行微调,对应不同任务类型加载不同微调后的LoRA模块,能节省大量显存资源和时间资源。
Patent Agency Ranking
0/0