-
公开(公告)号:CN117216417A
公开(公告)日:2023-12-12
申请号:CN202311468633.0
申请日:2023-11-07
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F16/9536 , G06N5/022 , G06F16/36 , G06F18/25
摘要: 本发明涉及一种融合知识信息和协同信息的推荐方法、装置、设备及介质,属于推荐技术领域,解决了现有技术中推荐方法存在的信息融合不足导致推荐结果准度低的问题。本发明技术方案主要包括:通过图神经网络对交互图进行编码以获得第一对象协作信息表示和第二对象协作信息表示;通过图神经网络对知识图谱进行编码以获得第一对象知识信息表示和第二对象知识信息表示;通过注意力机制将协作信息表示和知识信息表示融合为信息表示;构建训练样本集,基于第一对象信息表示和第二对象信息表示对训练样本集中的样本对进行推荐评估,根据交互集和未交互集各自的样本推荐评估差异确定损失值,基于损失值进行模型训练;通过训练后模型推荐预测分数。
-
公开(公告)号:CN116644338A
公开(公告)日:2023-08-25
申请号:CN202310638201.3
申请日:2023-06-01
申请人: 北京智谱华章科技有限公司
摘要: 本申请涉及一种基于混合相似度的文献主题分类方法、装置、设备及介质,属于大数据技术领域,解决了现有技术中对于文献集合内容的主题类别划分存在忽略文献内容关联和作者关联等因素而导致精度较低的问题。本申请技术方案主要包括:获取文献实体异构网络集合,所述文献实体异构网络集合至少包括文献文本、文献作者以及文献间的引文网络信息;根据所述文献文本、所述文献作者以及所述引文网络信息进行指标评价,并进行融合以生成混合相似度指标;根据所述混合相似度指标对所述文献实体异构网络集合中的文献进行聚类分析以获得若干文献簇;依据各所述文献簇中文献的特征向量和所述文献文本进行关键词提取,以获得各所述文献簇的主题标签。
-
公开(公告)号:CN117216417B
公开(公告)日:2024-02-20
申请号:CN202311468633.0
申请日:2023-11-07
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F16/9536 , G06N5/022 , G06F16/36 , G06F18/25
摘要: 本发明涉及一种融合知识信息和协同信息的推荐方法、装置、设备及介质,属于推荐技术领域,解决了现有技术中推荐方法存在的信息融合不足导致推荐结果准度低的问题。本发明技术方案主要包括:通过图神经网络对交互图进行编码以获得第一对象协作信息表示和第二对象协作信息表示;通过图神经网络对知识图谱进行编码以获得第一对象知识信息表示和第二对象知识信息表示;通过注意力机制将协作信息表示和知识信息表示融合为信息表示;构建训练样本集,基于第一对象信息表示和第二对象信息表示对训练样本集中的样本对进行推荐评估,根据交互集和未交互集各自的样本推荐评估差异确定损失值,基于损失值进行模型训练;通过训练后模型推荐预测分数。
-
公开(公告)号:CN117932149B
公开(公告)日:2024-07-09
申请号:CN202410092155.6
申请日:2024-01-23
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F16/9535 , G06F16/242 , G06F16/2457 , G06Q30/0601 , G06F40/30 , G06N3/0455 , G06N3/0895
摘要: 本发明属于人工智能技术领域,涉及一种基于大模型语义的对比学习推荐方法、设备及存储介质,所述方法包括:1)、构建prompt模板,让大模型根据物品的文本信息为用户交互过的物品进行打分;2)、将打分结果引入到对齐算法中,获得基于大模型语义信息的对齐算法;3)、设计出均匀性正则化算法;4)、确定目标损失函数;5)、基于目标损失函数,对对比学习推荐模型进行参数优化;6)、利用参数优化后的对比学习推荐模型计算用户采用物品的可能性,最终截取可能性高的前K个物品推荐给该用户。其缓解了对齐信号不足的问题,能够让模型均匀性平稳地增加,从而达到更好的均匀性,最终,取得了更好的推荐效果。
-
公开(公告)号:CN118277794A
公开(公告)日:2024-07-02
申请号:CN202410518786.X
申请日:2024-04-28
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F18/214 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/08 , G06F16/9535
摘要: 本发明涉及一种难负样本的混合生成方法及推荐方法、装置、设备及介质,属于推荐技术领域,解决了现有技术中推荐方法存在的负样本难度较低或者伪负样本的问题。本发明技术方案主要包括:将各待选负样本编码表示进行维度最大混合以生成所述难负样本维度最大混合包括:S21、获取各待选负样本编码表示各自的同一维度的元素形成待选元素集;S22、自所述待选元素集选取一个目标元素作为所述难负样本表示的对应维度的值,使得所述目标元素相较所述待选元素集的其他元素,与所述第一对象的对应维度元素的乘积最大;S23、重复步骤S2‑S3,直到遍历所有维度,以生成所述难负样本的表示。
-
公开(公告)号:CN117932149A
公开(公告)日:2024-04-26
申请号:CN202410092155.6
申请日:2024-01-23
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F16/9535 , G06F16/242 , G06F16/2457 , G06Q30/0601 , G06F40/30 , G06N3/0455 , G06N3/0895
摘要: 本发明属于人工智能技术领域,涉及一种基于大模型语义的对比学习推荐方法、设备及存储介质,所述方法包括:1)、构建prompt模板,让大模型根据物品的文本信息为用户交互过的物品进行打分;2)、将打分结果引入到对齐算法中,获得基于大模型语义信息的对齐算法;3)、设计出均匀性正则化算法;4)、确定目标损失函数;5)、基于目标损失函数,对对比学习推荐模型进行参数优化;6)、利用参数优化后的对比学习推荐模型计算用户采用物品的可能性,最终截取可能性高的前K个物品推荐给该用户。其缓解了对齐信号不足的问题,能够让模型均匀性平稳地增加,从而达到更好的均匀性,最终,取得了更好的推荐效果。
-
公开(公告)号:CN116561605A
公开(公告)日:2023-08-08
申请号:CN202310638200.9
申请日:2023-06-01
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F18/23 , G06F18/214 , G06F18/22 , G06F17/16 , G06F17/18
摘要: 本申请涉及一种文献完成者研究兴趣图聚类方法、装置、设备及介质,属于大数据技术领域,解决了现有主题挖掘不精准、学者兴趣描述模糊的问题。本申请技术方案主要包括:获取目标完成者的信息,根据所述信息获取所述目标学者的文献数据集;根据所述文献数据集构建文献网络图,所述文献网络图的包括所述文献数据集中,由各文献之间的文本相似度和文献引用数据融合得到的文献关系指标;对所述文献网络图进行图聚类分析,以获得若干研究兴趣簇;依据各所述研究兴趣簇各自的文献对各所述研究兴趣簇进行主题短语提取,以获得所述目标完成者的研究兴趣画像。
-
公开(公告)号:CN116644338B
公开(公告)日:2024-01-30
申请号:CN202310638201.3
申请日:2023-06-01
申请人: 北京智谱华章科技有限公司
摘要: 本申请涉及一种基于混合相似度的文献主题分类方法、装置、设备及介质,属于大数据技术领域,解决了现有技术中对于文献集合内容的主题类别划分存在忽略文献内容关联和作者关联等因素而导致精度较低的问题。本申请技术方案主要包括:获取文献实体异构网络集合,所述文献实体异构网络集合至少包括文献文本、文献作者以及文献间的引文网络信息;根据所述文献文本、所述文献作者以及所述引文网络信息进行指标评价,并进行融合以生成混合相似度指标;根据所述混合相似度指标对所述文献实体异构网络集合中的文献进行聚类分析以获得若干文献簇;依据各所述文献簇中文献的特征向量和所述(56)对比文件褚晓泉 等.基于智能情报挖掘的技术甄别发展现状及趋势预测研究《.工程管理科技前沿》.2022,第41卷(第3期),7-14.席崇俊 等. 基于异构信息网络的科技文献主题识别研究《.文献与数据学报》.2022,第4卷(第3期),66-78.Cezar Sas et al..Using Structural andSemantic Information to Identify SoftwareComponents《.2021 IEEE InternationalConference on Software Analysis,Evolution and Reengineering (SANER)》.2021,546-550.Meysam Asgari-Chenaghlu etal..TopicBERT: A cognitive approach fortopic detection from multimodal poststream using BERT and memory–graph.《Chaos, Solitons and Fractals》.2021,1-13.
-
公开(公告)号:CN116561605B
公开(公告)日:2023-10-24
申请号:CN202310638200.9
申请日:2023-06-01
申请人: 北京智谱华章科技有限公司
IPC分类号: G06F18/23 , G06F18/214 , G06F18/22 , G06F17/16 , G06F17/18
摘要: 本申请涉及一种文献完成者研究兴趣图聚类方法、装置、设备及介质,属于大数据技术领域,解决了现有主题挖掘不精准、学者兴趣描述模糊的问题。本申请技术方案主要包括:获取目标完成者的信息,根据所述信息获取所述目标学者的文献数据集;根据所述文献数据集构建文献网络图,所述文献网络图的包括所述文献数据集中,由各文献之间的文本相似度和文献引用数据融合得到的文献关系指标;对所述文献网络图进行图聚类分析,以获得若干研究兴趣簇;依据各所述研究兴趣簇各自的文献对各所述研究兴趣簇进行主题短语提取,以获得所述目标完成者的研究兴趣画像。
-
-
-
-
-
-
-
-