-
公开(公告)号:CN112633011B
公开(公告)日:2022-09-16
申请号:CN202011610820.4
申请日:2020-12-30
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
IPC分类号: G06F40/30 , G06F40/284 , G06F40/253
摘要: 本发明属于数据挖掘与利用技术领域,公开了一种融合词语义与词共现信息的研究前沿识别方法及设备。该方法包括:对论文数据进行时间切片;从单一时间切片的论文数据中提取技术关键词;统计技术关键词的共现频率构建词共现网络;根据技术关键词的相似度形成语义相似度网络;融合词共现网络和语义相似度网络来构建语义共现网络,并将技术关键词聚类成多个簇团;对所有时间切片的语义共现网络都进行聚类;对相邻时间切片的簇团进行相似度计算形成主题演化脉络图;同时满足主题年龄短、主题发展率高、主题热度高的研究主题即为前沿主题,前沿主题中的热门技术即为研究前沿。本发明能够更加客观、准确地进行研究前沿的识别。
-
公开(公告)号:CN112633011A
公开(公告)日:2021-04-09
申请号:CN202011610820.4
申请日:2020-12-30
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
IPC分类号: G06F40/30 , G06F40/284 , G06F40/253
摘要: 本发明属于数据挖掘与利用技术领域,公开了一种融合词语义与词共现信息的研究前沿识别方法及设备。该方法包括:对论文数据进行时间切片;从单一时间切片的论文数据中提取技术关键词;统计技术关键词的共现频率构建词共现网络;根据技术关键词的相似度形成语义相似度网络;融合词共现网络和语义相似度网络来构建语义共现网络,并将技术关键词聚类成多个簇团;对所有时间切片的语义共现网络都进行聚类;对相邻时间切片的簇团进行相似度计算形成主题演化脉络图;同时满足主题年龄短、主题发展率高、主题热度高的研究主题即为前沿主题,前沿主题中的热门技术即为研究前沿。本发明能够更加客观、准确地进行研究前沿的识别。
-
公开(公告)号:CN112069314A
公开(公告)日:2020-12-11
申请号:CN202010866432.6
申请日:2020-08-25
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
摘要: 本发明属于特定领域发展态势分析领域,并具体公开了一种基于科技文献数据的特定领域态势分析系统,其包括数据获取模块、任务管理模块、态势分析引擎模块、可视化输出模块、数据资源库,其中:数据获取模块用于接收用户提供的关键词并生成检索式,根据检索式从数据资源库或外部平台资源库中检索得到相关科技文献数据;任务管理模块用于选择所需的态势分析任务类型及分析维度;态势分析引擎模块用于根据选择的态势分析任务类型及分析维度,对相关科技文献数据进行分析;可视化输出模块用于对分析结果进行可视化展示并生成态势分析报告。本发明利用科技文献数据分析特定领域当前整体态势,解决了传统的仅依靠专家知识对特定领域态势分析的弊端。
-
公开(公告)号:CN112069314B
公开(公告)日:2022-05-24
申请号:CN202010866432.6
申请日:2020-08-25
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
摘要: 本发明属于特定领域发展态势分析领域,并具体公开了一种基于科技文献数据的特定领域态势分析系统,其包括数据获取模块、任务管理模块、态势分析引擎模块、可视化输出模块、数据资源库,其中:数据获取模块用于接收用户提供的关键词并生成检索式,根据检索式从数据资源库或外部平台资源库中检索得到相关科技文献数据;任务管理模块用于选择所需的态势分析任务类型及分析维度;态势分析引擎模块用于根据选择的态势分析任务类型及分析维度,对相关科技文献数据进行分析;可视化输出模块用于对分析结果进行可视化展示并生成态势分析报告。本发明利用科技文献数据分析特定领域当前整体态势,解决了传统的仅依靠专家知识对特定领域态势分析的弊端。
-
-
-