检索增强的代码生成方法、装置、电子设备及存储介质

    公开(公告)号:CN118778941A

    公开(公告)日:2024-10-15

    申请号:CN202411261230.3

    申请日:2024-09-10

    发明人: 黄笛 熊唯 黄飞

    摘要: 本发明提供一种检索增强的代码生成方法、装置、电子设备及存储介质,涉及计算机技术领域,其中方法包括:将问题文本数据输入词嵌入模型,得到问题文本数据的问题词向量;基于余弦相似度,对第一数据库中的词向量以及第二数据库中的词向量进行筛选,确定与问题词向量相似的预设数量个检索内容;对预设数量个检索内容进行文本组合,得到输入文本,并将输入文本输入代码生成大语言模型,得到输出代码片段。通过对第一数据库中的词向量以及第二数据库中的词向量进行筛选,确定与问题词向量相似的预设数量个检索内容,实现了对问题文本数据的检索增强,减少了人工标注数据的成本,提升了生成的代码准确度,使得生成的代码更加符合用户的编程偏好。

    分布式模型训练方法、装置、设备、介质及产品

    公开(公告)号:CN118643921A

    公开(公告)日:2024-09-13

    申请号:CN202411111948.4

    申请日:2024-08-14

    摘要: 本发明涉及人工智能技术领域,提供一种分布式模型训练方法、装置、设备、介质及产品,方法包括:将第一多维环境数据输入至数据生成模型,得到输出的第二多维环境数据;基于第一多维环境数据和第二多维环境数据进行时序预测,得到未来预设时间段内的发电量预测值;基于未来预设时间段内的发电量预测值,调整分布式模型训练过程中启动的训练进程数量,以对分布式模型进行训练。本发明提供的分布式模型训练方法,通过较为全面的环境数据进行时序预测,精准预测出未来预设时间段内的发电量预测值,进一步基于精准的发电量预测值,可以动态调整模型训练时启动的训练进程数量,实现在电力供应波动的状态下训练分布式模型,并优化分布式模型训练的效率。

    时序预测集成模型的训练方法、装置、电子设备及介质

    公开(公告)号:CN118897985A

    公开(公告)日:2024-11-05

    申请号:CN202410968219.4

    申请日:2024-07-18

    摘要: 本发明提供一种时序预测集成模型的训练方法、装置、电子设备及介质,包括:基于第一随机数和选择概率从集成模型中确定参与训练的子模型集合;将样本时序数据输入至子模型集合的各子模型中,得到各子模型的输出结果;基于第二随机数和融合概率确定各子模型的输出结果的融合权重;基于融合权重对各子模型的输出结果进行融合得到融合结果,融合结果作为集成模型对于样本时序数据的输出结果用于集成模型的训练。采用上述技术方案,解决了现有技术中在训练集成模型时需要先训练单个的子模型再训练集成模型,导致集成模型的训练过程较为繁琐的问题。

    表召回方法、装置、电子设备及介质

    公开(公告)号:CN118312524B

    公开(公告)日:2024-09-27

    申请号:CN202410733522.6

    申请日:2024-06-07

    发明人: 陈坤鹏 彭鑫 黄飞

    摘要: 本发明提供一种表召回方法、装置、电子设备及介质,涉及人工智能领域。该方法包括:根据表格的表头为数据库的所有表格构建第一向量库;根据表格的字段分别为每张表的所有字段格构建第二向量库;从所述第一向量库中查询与待查询语句相似的多张目标表格;从与每张目标表格对应的所述第二向量库中查询与待查询语句相似的至少一个目标字段;使用所述目标字段对对应的所述目标表格进行字段过滤得到与每张目标表格对应的过滤表格;利用大模型和多张过滤表格对多张目标表格进行排序得到表召回结果。本发明的方案能够显著提升表召回精度,同时能够解决调用大模型召回表格时上下文过长所带来的困扰。

    影视推荐方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118797168A

    公开(公告)日:2024-10-18

    申请号:CN202411269099.5

    申请日:2024-09-11

    发明人: 张天佑 熊唯 黄飞

    摘要: 本发明提供一种影视推荐方法、装置、设备、存储介质及程序产品,应用于影视推荐技术领域。该方法包括:接收通过对话形式得到的第一用户交互信息,并根据所述第一用户交互信息生成词嵌入向量;基于所述词嵌入向量进行本地用户画像库匹配,以确定目标用户画像;将所述目标用户画像与所述词嵌入向量进行融合处理,得到用户偏好向量;基于所述用户偏好向量在影视数据库中进行相似度查询,得到至少一个影视信息;其中,所述本地用户画像库用于存储至少一个用户的用户画像,所述至少一个用户的用户画像采用向量矩阵的形式进行存储。

    表召回方法、装置、电子设备及介质

    公开(公告)号:CN118312524A

    公开(公告)日:2024-07-09

    申请号:CN202410733522.6

    申请日:2024-06-07

    发明人: 陈坤鹏 彭鑫 黄飞

    摘要: 本发明提供一种表召回方法、装置、电子设备及介质,涉及人工智能领域。该方法包括:根据表格的表头为数据库的所有表格构建第一向量库;根据表格的字段分别为每张表的所有字段格构建第二向量库;从所述第一向量库中查询与待查询语句相似的多张目标表格;从与每张目标表格对应的所述第二向量库中查询与待查询语句相似的至少一个目标字段;使用所述目标字段对对应的所述目标表格进行字段过滤得到与每张目标表格对应的过滤表格;利用大模型和多张过滤表格对多张目标表格进行排序得到表召回结果。本发明的方案能够显著提升表召回精度,同时能够解决调用大模型召回表格时上下文过长所带来的困扰。