立场识别方法、装置、设备及介质

    公开(公告)号:CN114218381B

    公开(公告)日:2022-08-30

    申请号:CN202111493451.X

    申请日:2021-12-08

    Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。

    一种基于知识图谱的智能推荐方法

    公开(公告)号:CN114265982B

    公开(公告)日:2022-08-26

    申请号:CN202111583634.0

    申请日:2021-12-22

    Abstract: 本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。

    立场识别方法、装置、设备及介质

    公开(公告)号:CN114218381A

    公开(公告)日:2022-03-22

    申请号:CN202111493451.X

    申请日:2021-12-08

    Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。

    知识融合方法、装置、设备、系统及介质

    公开(公告)号:CN114139547A

    公开(公告)日:2022-03-04

    申请号:CN202111416144.1

    申请日:2021-11-25

    Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。

    公共卫生安全事件检测及事件集合构建方法及系统

    公开(公告)号:CN113449101A

    公开(公告)日:2021-09-28

    申请号:CN202010226687.6

    申请日:2020-03-26

    Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统,方法包括:确定多个第一文本数据对应的多个主题信息,以及每个主题信息对应的至少一个第一文本数据;对每个主题信息对应的至少一个第一文本数据进行事件检测,确定每个主题信息对应的至少一个目标事件;将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合;从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据;基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新,基于静态文本数据构建的事件集合可以实现对动态文本数据的检测,进而提高互联网新闻流数据的检测效率,形成特定主题下相关舆情分析数据。

    大语言模型训练、信息处理方法、装置、设备及介质

    公开(公告)号:CN120046687A

    公开(公告)日:2025-05-27

    申请号:CN202510117975.0

    申请日:2025-01-24

    Abstract: 本公开涉及一种大语言模型训练、信息处理方法、装置、设备及介质。其中,大语言模型训练方法包括:获取第一训练文本,基于待训练大语言模型计算第一训练文本中各个token分别对应的期望梯度值;对各个token分别对应的期望梯度值进行融合处理,得到正则化项;基于正则化项对待训练大语言模型进行无监督预训练,得到第一大语言模型;获取第二训练文本,基于第二训练文本对应的目标正则化项对第一大语言模型进行有监督指令微调,得到第二大语言模型,将第二大语言模型确定为训练完成的大语言模型,由此,能够将大语言模型的解释结果融入大语言模型的训练过程中,提高了训练完成的大语言模型的性能。

Patent Agency Ranking