-
公开(公告)号:CN117290611B
公开(公告)日:2024-02-23
申请号:CN202311577580.6
申请日:2023-11-24
申请人: 北京信立方科技发展股份有限公司 , 清华大学
IPC分类号: G06F16/9535 , G06F16/36 , G06F18/25 , G06F18/23 , G06N3/0464 , G06N3/09
摘要: 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置,涉及仪器推荐技术领域,方法包括:获取目标用户的仪器使用数据,目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息;根据仪器使用信息,得到仪器知识图谱,以及根据目标用户与仪器的交互信息,得到仪器交互二部图;将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中,得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据,还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系,以及其在特定应用领域的重要性,从而显著提升推荐系统对用户需求的理解,以为用户提供更加合适、有针(56)对比文件唐浩 等.基于协同知识图谱特征学习的论文推荐方法.计算机工程.2020,第46卷(第09期),306-312.唐浩;刘柏嵩;刘晓玲;黄伟明.基于协同知识图谱特征学习的论文推荐方法.计算机工程.(第09期),
-
公开(公告)号:CN117290611A
公开(公告)日:2023-12-26
申请号:CN202311577580.6
申请日:2023-11-24
申请人: 北京信立方科技发展股份有限公司 , 清华大学
IPC分类号: G06F16/9535 , G06F16/36 , G06F18/25 , G06F18/23 , G06N3/0464 , G06N3/09
摘要: 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置,涉及仪器推荐技术领域,方法包括:获取目标用户的仪器使用数据,目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息;根据仪器使用信息,得到仪器知识图谱,以及根据目标用户与仪器的交互信息,得到仪器交互二部图;将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中,得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据,还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系,以及其在特定应用领域的重要性,从而显著提升推荐系统对用户需求的理解,以为用户提供更加合适、有针对性的推荐。
-
公开(公告)号:CN114153949B
公开(公告)日:2022-12-13
申请号:CN202111512996.0
申请日:2021-12-11
申请人: 北京信立方科技发展股份有限公司
IPC分类号: G06F16/33
摘要: 本申请提供一种分词检索方法及系统。所述方法包括:接收用户输入的检索词;对所述检索词进行单字分词;分别计算每一语料文档的单字相关度;将单字相关度进行叠加生成语料文档的相关度得分;依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中,通过单字分词的方式将检索词进行拆分,再计算每一语料文档的单字相关度,通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索,不需要再耗费人工梳理语义模板,降低了单领域信息检索平台的维护成本,同时也实现了单领域信息检索平台的检索功能。
-
公开(公告)号:CN115544258B
公开(公告)日:2023-04-07
申请号:CN202211487421.2
申请日:2022-11-25
申请人: 北京信立方科技发展股份有限公司
IPC分类号: G06F16/35 , G06F18/214 , G06F18/2431
摘要: 本发明涉及文本处理技术领域,提供一种文本分类模型的样本构建方法及装置、文本分类方法,所述样本构建方法包括:获取初始样本数据;所述初始样本数据包括多个初始文档,以及各所述初始文档的标签数据;所述多个初始文档的标签数据对应多个目标分类;确定任一所述目标分类中的各目标词语对所述目标分类的贡献值;所述目标词语为所述目标分类下的初始文档中的任一词语;根据所述贡献值对所述目标分类下的初始文档进行样本重组,得到目标样本数据。本发明提供的样本构建方法通过计算词语对分类的贡献值,对样本数据进行样本重组,可以平衡各分类下的文本长度、改变不同分类下的样本数据量,从而均衡样本数据的分布,解决样本不均衡的问题。
-
公开(公告)号:CN115544258A
公开(公告)日:2022-12-30
申请号:CN202211487421.2
申请日:2022-11-25
申请人: 北京信立方科技发展股份有限公司
摘要: 本发明涉及文本处理技术领域,提供一种文本分类模型的样本构建方法及装置、文本分类方法,所述样本构建方法包括:获取初始样本数据;所述初始样本数据包括多个初始文档,以及各所述初始文档的标签数据;所述多个初始文档的标签数据对应多个目标分类;确定任一所述目标分类中的各目标词语对所述目标分类的贡献值;所述目标词语为所述目标分类下的初始文档中的任一词语;根据所述贡献值对所述目标分类下的初始文档进行样本重组,得到目标样本数据。本发明提供的样本构建方法通过计算词语对分类的贡献值,对样本数据进行样本重组,可以平衡各分类下的文本长度、改变不同分类下的样本数据量,从而均衡样本数据的分布,解决样本不均衡的问题。
-
公开(公告)号:CN114153949A
公开(公告)日:2022-03-08
申请号:CN202111512996.0
申请日:2021-12-11
申请人: 北京信立方科技发展股份有限公司
IPC分类号: G06F16/33
摘要: 本申请提供一种分词检索方法及系统。所述方法包括:接收用户输入的检索词;对所述检索词进行单字分词;分别计算每一语料文档的单字相关度;将单字相关度进行叠加生成语料文档的相关度得分;依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中,通过单字分词的方式将检索词进行拆分,再计算每一语料文档的单字相关度,通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索,不需要再耗费人工梳理语义模板,降低了单领域信息检索平台的维护成本,同时也实现了单领域信息检索平台的检索功能。
-
-
-
-
-