-
公开(公告)号:CN114492308B
公开(公告)日:2023-11-24
申请号:CN202111637062.X
申请日:2021-12-29
申请人: 北京航天智造科技发展有限公司
IPC分类号: G06F40/117 , G06F40/216 , G06F40/295 , G06F16/31 , G06F16/35
摘要: 本发明涉及一种结合知识发现与文本挖掘的产业信息标引方法和系统。该方法的步骤包括:定义基础产业版块分类体系,并赋予基础产业版块分类体系中各个领域的产业版块词汇;通过知识发现对所述基础产业版块分类体系中的各个领域补充新兴产业词汇;将产业信息和企业信息汇总成文本,通过文本挖掘对文本标注分类词,进而将产业信息和企业信息划分到所述基础科技分类体系中,将企业和产业版块进行关联,从而实现产业信息标引。本发明结合知识发现与文本挖掘实现了产业信息标引,利于进一步实现面向产业链图谱、产业地图绘制等各应用板块所涉及的业务数据的采集、预处理、分析和可视化展示。
-
公开(公告)号:CN114492402A
公开(公告)日:2022-05-13
申请号:CN202111624012.8
申请日:2021-12-28
申请人: 北京航天智造科技发展有限公司 , 科技部科技评估中心
IPC分类号: G06F40/279 , G06F40/216 , G06F16/35
摘要: 本发明实施例公开了一种科技新词识别方法和装置,通过爬取论文中的重点词汇信息,基于时间序列对重点词汇出现的频率变化趋势进行统计,按照预设阈值对重点词汇进行筛选,获取到科技新词,从而对科技动态和研究方向进行全面把握。本发明提供的方法和装置能够准确、高效获取科技新词,有效解决以往新词词库获取难的问题,同时减少大量人力和物力耗费,降低获取周期,为科技新词的获取提供新思路。
-
公开(公告)号:CN114492308A
公开(公告)日:2022-05-13
申请号:CN202111637062.X
申请日:2021-12-29
申请人: 北京航天智造科技发展有限公司
IPC分类号: G06F40/117 , G06F40/216 , G06F40/295 , G06F16/31 , G06F16/35
摘要: 本发明涉及一种结合知识发现与文本挖掘的产业信息标引方法和系统。该方法的步骤包括:定义基础产业版块分类体系,并赋予基础产业版块分类体系中各个领域的产业版块词汇;通过知识发现对所述基础产业版块分类体系中的各个领域补充新兴产业词汇;将产业信息和企业信息汇总成文本,通过文本挖掘对文本标注分类词,进而将产业信息和企业信息划分到所述基础科技分类体系中,将企业和产业版块进行关联,从而实现产业信息标引。本发明结合知识发现与文本挖掘实现了产业信息标引,利于进一步实现面向产业链图谱、产业地图绘制等各应用板块所涉及的业务数据的采集、预处理、分析和可视化展示。
-
-