- 专利标题: 一种基于多标签驱动的专题数据构建方法及系统
-
申请号: CN202310814079.0申请日: 2023-07-05
-
公开(公告)号: CN116541480A公开(公告)日: 2023-08-04
- 发明人: 钱力 , 张彧 , 谢靖 , 王颖 , 贾海清 , 徐浩亮 , 张茹敏 , 常志军 , 霍诗漫 , 许丽媛
- 申请人: 中国科学院文献情报中心
- 申请人地址: 北京市海淀区中关村北四环西路33号
- 专利权人: 中国科学院文献情报中心
- 当前专利权人: 中国科学院文献情报中心
- 当前专利权人地址: 北京市海淀区中关村北四环西路33号
- 代理机构: 北京众达德权知识产权代理有限公司
- 代理商 田灵菲
- 主分类号: G06F16/30
- IPC分类号: G06F16/30 ; G06F16/31 ; G06F16/35 ; G06N5/02
摘要:
本发明公开了一种基于多标签驱动的专题数据构建方法及系统,属于知识工程领域,所述方法包括:基于初始专题集,构建专题知识结构树;当满足预设更新周期,根据专题数据自动遴选规则,遍历专题知识结构树进行专题数据遴选,采集专题数据集;对专题数据集进行多标签配置,生成多标签标识结果;根据多标签标识结果和专题数据集对初始专题数据集进行更新,生成专题数据库。本申请解决了现有技术中构建专题数据库效率低、效果差、实时性差的技术问题,实现了专题数据库构建的自动化和智能化,达到了自动智能地获取、分类、标注、添加、更新数据,从而高效、精准、动态地构建专题数据库的技术效果。
公开/授权文献
- CN116541480B 一种基于多标签驱动的专题数据构建方法及系统 公开/授权日:2023-09-01