一种两阶段的基于提示学习的评分推荐方法

    公开(公告)号:CN118246506A

    公开(公告)日:2024-06-25

    申请号:CN202410287078.X

    申请日:2024-03-13

    摘要: 本发明公开了一种两阶段的基于提示学习的评分推荐方法,包括获取用户网上购物的评价数据记录,并构建可学习的语义软提示、数值表示软提示、以及用户语义表示和物品语义表示,在语义提示微调阶段和数值提示微调阶段分别更新两种输入序列和网络的参数,最后利用训练好的模型进行推理,得到用户对所推荐物品的预测分数。本发明的方法利用语义评论和数字评级作为两个不同阶段的监督信号,个性化地将用户表示和用户所购买的物品表示分别分解为语义和数字视角。通过该方法,引导冻结的大语言模型最初推断用户对项目的隐式偏好,然后使用这些有价值的信息生成明确的推荐。

    基于端云协同的多模态在线试题推荐方法、系统及介质

    公开(公告)号:CN118708803A

    公开(公告)日:2024-09-27

    申请号:CN202410697866.6

    申请日:2024-05-31

    摘要: 本发明公开了一种基于端云协同的多模态在线试题推荐方法、系统及介质。该方法通过在设备端获取用户的做题记录、题目属性、以及作答过程中的表情信息,在设备端进行认知诊断以获得用户知识雷达图诊断结果,根据诊断结果实现自适应试题推荐。为解决设备端推荐题库的限制,设计了云端选题策略和设备端选题策略,可以根据用户需求从题目类型和质量的角度选择多样性的题目,由云端将这些题目下发至用户,并移除设备端中的冗余题目。本发明的方法实现了端云协同下的自适应考试,通过融合用户表情信息进行精准诊断,并依据诊断结果实现个性化试题推荐,解决了传统方法无法适用于大规模题库的问题,具有推荐效果好、诊断精准等优点。

    一种社交网络标签预测方法、系统、介质及设备

    公开(公告)号:CN118313509A

    公开(公告)日:2024-07-09

    申请号:CN202410421820.1

    申请日:2024-04-09

    摘要: 本发明公开了一种社交网络标签预测方法、系统、介质及设备,包括如下步骤:1)将输入的社交网络数据构建为社交网络图;2)表征学习,使用图神经网络(如图卷积神经网络)对社交网络图信息进行特征提取得到表征;3)在学习到的表征空间中加入随机的扰动或者是基于生成器网络生成的对抗扰动得到新的表征,然后将新的表征输入到图神经网络的下一层进行图特征信息的提取;4)在加入扰动后的表征的图上和图中已有的社交信息标签监督下进行一轮参数优化;5)重复迭代,完成图神经网络的训练并用于预测。本发明对训练集的社交网络数据具有较强的鲁棒性和准确率,可以有效的帮助图神经网络抵抗图结构的扰动和对抗攻击,从而更准确预测用户标签。

    跨领域无源域数据的知识蒸馏方法、系统、介质及设备

    公开(公告)号:CN118298279A

    公开(公告)日:2024-07-05

    申请号:CN202410468579.8

    申请日:2024-04-18

    摘要: 本发明公开了一种跨领域无源域数据的知识蒸馏方法、系统、介质及设备,包括:利用经过预训练教师模型先训练图像生成器再训练图像编码器同时预热学生模型,并利用各自的损失函数单独进行参数更新;利用图像生成器、图像编码器以及教师模型在学生域训练数据集上训练遮罩网络,再在学生域训练数据集上训练学生模型,通过阶段因子调节域特定信息损失和跨域知识蒸馏损失的权重;将待预测图像输入到训练好的学生模型中,得到待预测图像的分类标签。本发明通过无数据知识蒸馏网络、遮罩学习网络、课程学习网络,解决了在仅有目标域(学生域)数据而缺少源域(教师域)数据且源域和目标域存在较大偏移情况下,迁移教师模型知识的问题。

    基于序列对比和信息瓶颈原则的知识追踪方法

    公开(公告)号:CN117521798A

    公开(公告)日:2024-02-06

    申请号:CN202311570941.4

    申请日:2023-11-22

    申请人: 浙江大学

    摘要: 本发明公开了一种基于序列对比和信息瓶颈原则的知识追踪方法,包括如下步骤:采集学生历史答题序列,将学生历史答题序列输入到经过训练的无偏知识状态抽取器模块进行预测,得到预测无偏知识状态概率向量,由激活函数选择概率最大的类作为下一时刻的学生答题预测结果序列数据,从而实现知识追踪。本发明以深度学习思想为核心,引入序列数据增强模块以捕获交互数据的动态特性,引入Transformer编码器对学生知识状态进行编码,引入信息瓶颈原则以构建第二损失,并通过早停策略强化对有偏关系的提取,并通过序列对比学习和信息瓶颈原则得到无偏的学生认知表示,当数据集中存在学生抄袭、猜测等时,本发明的无偏知识状态抽取器模块的性能更为稳定。

    基于大语言模型做数据增强的医学术语归一化方法

    公开(公告)号:CN118228734A

    公开(公告)日:2024-06-21

    申请号:CN202410266524.9

    申请日:2024-03-08

    申请人: 浙江大学

    摘要: 本发明公开了一种基于大语言模型做数据增强的医学术语归一化方法。1)将中文医学术语归一化数据集中的数据经过数据清洗得到标准化的原始数据;2)基于步骤1)得到的标准化的原始数据采用大语言模型做数据增强,得到增强数据:3)构建Med‑Term‑Norm神经网络模型;4)训练步骤3)的神经网络模型;5)使用训练好的神经网络模型对输入的提及进行预测,将提及归一化为与之最接近的术语。本发明将大量的先验知识通过大语言模型和预训练模型BERT的形式引入到Med‑Term‑Norm神经网络模型中,解决了词汇缺乏上下文语境的问题;此外,本发明可以利用训练好的神经网络模型对输入的提及进行归一化术语的预测。

    一种基于大语言模型的通用个性化生成方法

    公开(公告)号:CN118708708A

    公开(公告)日:2024-09-27

    申请号:CN202410722875.6

    申请日:2024-06-05

    申请人: 浙江大学

    摘要: 本发明公开了一种基于大语言模型的通用个性化生成方法。1)将需要学习的个性化文本数据输入大语言模型的嵌入层得到文本嵌入;2)基于步骤1)的文本嵌入与一组可学习个性化表示与进行拼接得到个性化嵌入;3)基于大语言模型LLM构建个性化生成模型结构,个性化生成模型结构包括LLM层和基于风格适配器的输出层;4)对个性化生成模型进行训练;5)使用步骤4)训练好的个性化生成模型,基于输入文本,续写生成与训练数据风格一致的个性化文本。本发明提供了一种基于大语言模型的通用个性化生成方法。本发明的目的在于设计了一种利用可学习个性化表示的风格适配器,与原有大语言模型的输出层协作,输出与训练数据风格一致的个性化文本。

    基于原型学习的自监督实例自适应的医学图像分割方法

    公开(公告)号:CN118212183A

    公开(公告)日:2024-06-18

    申请号:CN202410266525.3

    申请日:2024-03-08

    申请人: 浙江大学

    摘要: 本发明公开了一种基于原型学习的自监督实例自适应的医学图像分割方法。1)将公开的三维医学图像分割数据集中的图像经预处理得到标准化的图像;2)将标准化图像输入3Dbackbone;3)通过构建自适应的原型学习模块生成最终的分割预测结果,并通过计算分割损失监督模型;4)通过构建自监督的掩码生成模块生成伪标签;5)构建自监督过滤机制,并引入辅助损失;6)基于分割损失和辅助损失计算整体的目标损失;7)基于步骤6)的损失函数训练模型。本发明引入SMG模块,可以更好地建模类内多样性,设计了自监督过滤机制来对随机初始化的目标查询进行监督;此外,本发明可以还利用IPL模块来针对不同的输入做适应性调整。

    一种基于残差学习的个性化代码生成系统及方法

    公开(公告)号:CN118733045A

    公开(公告)日:2024-10-01

    申请号:CN202410722876.0

    申请日:2024-06-05

    申请人: 浙江大学

    IPC分类号: G06F8/41 G06F18/214

    摘要: 本发明公开了一种基于残差学习的个性化代码生成系统及方法。1)收集编程语言的代码片段数据集,通过代码检测工具收集得到对应代码片段的风格序列;2)基于步骤1)的代码与其对应的风格序列设置残差项,生成用于残差学习的训练数据;3)为每个代码风格规范设置一个可学习的向量表示;4)通过LLM构建残差学习框架;5)通过步骤4)的残差学习框架进行残差学习得到每个代码风格规范的向量表示;6)通过代码检测工具得到待生成代码的风格序列,使用训练好的代码风格规范的向量表示,生成与历史代码风格一致的个性化代码。本发明通过残差学习到的代码特征进行组合形成开发者的代码风格,并通过代码风格特征指导大语言模型生成个性化代码。