基于多层次知识图谱的仪器推荐方法及装置

    公开(公告)号:CN117290611A

    公开(公告)日:2023-12-26

    申请号:CN202311577580.6

    申请日:2023-11-24

    摘要: 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置,涉及仪器推荐技术领域,方法包括:获取目标用户的仪器使用数据,目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息;根据仪器使用信息,得到仪器知识图谱,以及根据目标用户与仪器的交互信息,得到仪器交互二部图;将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中,得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据,还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系,以及其在特定应用领域的重要性,从而显著提升推荐系统对用户需求的理解,以为用户提供更加合适、有针对性的推荐。

    基于多层次知识图谱的仪器推荐方法及装置

    公开(公告)号:CN117290611B

    公开(公告)日:2024-02-23

    申请号:CN202311577580.6

    申请日:2023-11-24

    摘要: 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置,涉及仪器推荐技术领域,方法包括:获取目标用户的仪器使用数据,目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息;根据仪器使用信息,得到仪器知识图谱,以及根据目标用户与仪器的交互信息,得到仪器交互二部图;将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中,得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据,还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系,以及其在特定应用领域的重要性,从而显著提升推荐系统对用户需求的理解,以为用户提供更加合适、有针(56)对比文件唐浩 等.基于协同知识图谱特征学习的论文推荐方法.计算机工程.2020,第46卷(第09期),306-312.唐浩;刘柏嵩;刘晓玲;黄伟明.基于协同知识图谱特征学习的论文推荐方法.计算机工程.(第09期),

    一种分词检索方法及系统

    公开(公告)号:CN114153949B

    公开(公告)日:2022-12-13

    申请号:CN202111512996.0

    申请日:2021-12-11

    IPC分类号: G06F16/33

    摘要: 本申请提供一种分词检索方法及系统。所述方法包括:接收用户输入的检索词;对所述检索词进行单字分词;分别计算每一语料文档的单字相关度;将单字相关度进行叠加生成语料文档的相关度得分;依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中,通过单字分词的方式将检索词进行拆分,再计算每一语料文档的单字相关度,通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索,不需要再耗费人工梳理语义模板,降低了单领域信息检索平台的维护成本,同时也实现了单领域信息检索平台的检索功能。

    网页中标数据结构化方法及装置

    公开(公告)号:CN115203309A

    公开(公告)日:2022-10-18

    申请号:CN202211118991.4

    申请日:2022-09-15

    摘要: 本发明提供一种网页中标数据结构化方法及装置,方法包括:获取网页中标数据;循环读取网页中标数据,并基于预先建立的解析预测模型和结构化映射模板,确定选择表格解析模型或键值解析模型,以对网页中标数据进行解析,并将解析结果存储至关系型数据库中。本发明通过解析预测模型判断采用表格解析模型或键值解析模型对获取的网页中标数据中进行解析,以提高解析效率;另外,结合结构化映射模板,进行解析,以基于较高的准确率和召回率将网页非结构化形式的中标数据转化为结构化数据,从而将最小单元结构化数据存储至关系型数据库中,实现非结构化网页的结构化,提高数据的可读性,节省人工整理成本,便于后期快速对数据进行分析和统计。

    网页中标数据结构化方法及装置

    公开(公告)号:CN115203309B

    公开(公告)日:2022-11-29

    申请号:CN202211118991.4

    申请日:2022-09-15

    摘要: 本发明提供一种网页中标数据结构化方法及装置,方法包括:获取网页中标数据;循环读取网页中标数据,并基于预先建立的解析预测模型和结构化映射模板,确定选择表格解析模型或键值解析模型,以对网页中标数据进行解析,并将解析结果存储至关系型数据库中。本发明通过解析预测模型判断采用表格解析模型或键值解析模型对获取的网页中标数据中进行解析,以提高解析效率;另外,结合结构化映射模板,进行解析,以基于较高的准确率和召回率将网页非结构化形式的中标数据转化为结构化数据,从而将最小单元结构化数据存储至关系型数据库中,实现非结构化网页的结构化,提高数据的可读性,节省人工整理成本,便于后期快速对数据进行分析和统计。

    仪器识别方法、装置、电子设备及存储介质

    公开(公告)号:CN109255377A

    公开(公告)日:2019-01-22

    申请号:CN201811001670.X

    申请日:2018-08-30

    IPC分类号: G06K9/62 G06N3/08 G06F16/58

    摘要: 本申请提供了一种仪器识别方法、装置、电子设备及存储介质,其中,识别方法包括:利用至少一类仪器的样本图像对初始分类模型进行模型训练,得到最终分类模型;将待识别仪器的仪器图像输入至最终分类模型,确定待识别仪器的仪器类别和仪器图像对应的第一特征向量;根据待识别仪器的仪器类别和第一特征向量,在预先建立的特征数据库中查找待识别仪器的仪器名称。本申请实施例通过将待识别仪器的仪器图像输入至最终分类模型,能够得到待识别仪器的仪器名称,达到了对仪器进行识别的目的。

    文本分类模型的样本构建方法及装置、文本分类方法

    公开(公告)号:CN115544258B

    公开(公告)日:2023-04-07

    申请号:CN202211487421.2

    申请日:2022-11-25

    摘要: 本发明涉及文本处理技术领域,提供一种文本分类模型的样本构建方法及装置、文本分类方法,所述样本构建方法包括:获取初始样本数据;所述初始样本数据包括多个初始文档,以及各所述初始文档的标签数据;所述多个初始文档的标签数据对应多个目标分类;确定任一所述目标分类中的各目标词语对所述目标分类的贡献值;所述目标词语为所述目标分类下的初始文档中的任一词语;根据所述贡献值对所述目标分类下的初始文档进行样本重组,得到目标样本数据。本发明提供的样本构建方法通过计算词语对分类的贡献值,对样本数据进行样本重组,可以平衡各分类下的文本长度、改变不同分类下的样本数据量,从而均衡样本数据的分布,解决样本不均衡的问题。

    基于视频的图文网页生成方法及装置

    公开(公告)号:CN117194818B

    公开(公告)日:2024-01-16

    申请号:CN202311475166.4

    申请日:2023-11-08

    摘要: 本发明提供一种基于视频的图文网页生成方法及装置,涉及互联网技术领域,方法包括:获取包括至少一组视频帧组的视频帧序列,以及获取各视频帧组对应的语音数据;对各语音数据进行语音识别;对各视频帧组进行OCR文字识别;针对每组视频帧组,基于对应语音识别得到的预测文本和对应文字识别得到的识别文本,结合结巴分词和拼音相似度,确定预测文本中存在待纠正词,并结合三元语言模型,利用对应识别文本对待纠正词进行替换;针对每组视频帧组,将替换后的文本或预测文本存放至区隔标记DIV标签中,以及将对应视频帧存放至与DIV标签关联的图片标签中,得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性,又便于用户阅(56)对比文件闫建鹏;封化民;刘嘉琦.一种基于多模态特征的新闻视频语义提取框架.计算机应用研究.2012,(第07期),第2725-2729页.