-
公开(公告)号:CN113535988A
公开(公告)日:2021-10-22
申请号:CN202110718363.9
申请日:2021-06-28
IPC分类号: G06F16/38
摘要: 本发明公开了一种文献多层引用网络关联分析方法,包括(1)获取论文文献数据及其引用关系数据、专利文献数据及其引用关系数据;(2)采用社区检测算法将文献数据进行社区划分获得多个文献簇团;(3)获取其相应文献数据,并使用LDA主题模型进行主题提取,得到每个文献簇团的主题集合;(4)使用词向量模型计算论文文献簇团和专利文献簇团之间的相似性矩阵,即获得文献数据多层引用网络关联关系。本发明提供的一种多层引用网络关联的可视化分析方法及系统,通过社区检测算法处理论文和专利的引用网络,并划分为多个社区,利用LDA主题模型结合词向量的主题关联方法实现论文和专利的簇团关联。
-
公开(公告)号:CN112069314A
公开(公告)日:2020-12-11
申请号:CN202010866432.6
申请日:2020-08-25
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
摘要: 本发明属于特定领域发展态势分析领域,并具体公开了一种基于科技文献数据的特定领域态势分析系统,其包括数据获取模块、任务管理模块、态势分析引擎模块、可视化输出模块、数据资源库,其中:数据获取模块用于接收用户提供的关键词并生成检索式,根据检索式从数据资源库或外部平台资源库中检索得到相关科技文献数据;任务管理模块用于选择所需的态势分析任务类型及分析维度;态势分析引擎模块用于根据选择的态势分析任务类型及分析维度,对相关科技文献数据进行分析;可视化输出模块用于对分析结果进行可视化展示并生成态势分析报告。本发明利用科技文献数据分析特定领域当前整体态势,解决了传统的仅依靠专家知识对特定领域态势分析的弊端。
-
公开(公告)号:CN113535988B
公开(公告)日:2024-09-13
申请号:CN202110718363.9
申请日:2021-06-28
IPC分类号: G06F16/38
摘要: 本发明公开了一种文献多层引用网络关联分析方法,包括(1)获取论文文献数据及其引用关系数据、专利文献数据及其引用关系数据;(2)采用社区检测算法将文献数据进行社区划分获得多个文献簇团;(3)获取其相应文献数据,并使用LDA主题模型进行主题提取,得到每个文献簇团的主题集合;(4)使用词向量模型计算论文文献簇团和专利文献簇团之间的相似性矩阵,即获得文献数据多层引用网络关联关系。本发明提供的一种多层引用网络关联的可视化分析方法及系统,通过社区检测算法处理论文和专利的引用网络,并划分为多个社区,利用LDA主题模型结合词向量的主题关联方法实现论文和专利的簇团关联。
-
公开(公告)号:CN114861935A
公开(公告)日:2022-08-05
申请号:CN202210486649.3
申请日:2022-05-06
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
摘要: 本发明公开了一种用于获取最优深度学习模型的方法,包括:获取科研人员输入的参数,包括任务、与该任务对应的深度学习模型名称NameModel、实现该深度学习模型对应的深度学习框架名称NameFramework、以及该深度学习模型的结构参数,获取科研人员输入的、与参数相关的数据,对该数据进行预处理,以得到预处理后的数据,对深度学习模型名称NameModel深度学习框架名称NameFramework进行处理,以建立所需的深度学习模型,将预处理后的数据输入建立的深度学习模型中进行训练,以得到最终的最优深度学习模型。本发明能够解决现有深度学习在数控机床领域的应用过程中,深度学习算法代码实现、算法环境配置、模型调试过程费时费力,且成本高昂的技术问题。
-
公开(公告)号:CN114817472A
公开(公告)日:2022-07-29
申请号:CN202210474138.X
申请日:2022-04-29
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
IPC分类号: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/216 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种基于知识图谱的技术清单生成方法,包括:获取专利数据,将专利数据输入预先构建的知识图谱嵌入神经网络模型中,以得到专利数据的嵌入结果,即专利数据的嵌入向量;使用Canopy聚类算法对专利数据的嵌入向量进行处理,以得到K个聚类中心点,以K个聚类中心点为初始中心点,使用K‑means算法对实体嵌入向量进行聚类处理,以得到K个聚类结果作为K个技术领域,对于K个技术领域中的每一个技术领域而言,从专利数据库中获取每一个技术领域中的所有专利文本。本发明能够解决现有技术清单生成方法存在的涉及专家多、耗时长、需要消耗大量精力、严重依赖专家的知识和经验、缺少定量分析和数据支持的技术问题。
-
公开(公告)号:CN114780140A
公开(公告)日:2022-07-22
申请号:CN202210486646.X
申请日:2022-05-06
申请人: 中国工程院战略咨询中心 , 华中科技大学 , 清华大学
摘要: 本发明涉及数控机床领域和智能制造领域,具体涉及一种数控系统中基于深度学习模型的Docker容器部署方法,包括如下步骤:将深度学习模型的训练代码和环境依赖打包,创建Docker镜像文件;将Docker镜像文件传输至数控系统云平台,然后将其实例化为Docker容器;将数控机床的加工数据远程传输至数控系统云平台,载入Docker容器;基于云平台提供的算力资源基础和数控机床提供的加工数据基础,在Docker容器中进行深度学习模型的训练,将训练完成的深度学习模型保存为序列化格式;通过云平台将序列化格式的深度学习模型远程传输至智能数控系统。该方法结合迁移学习的思想,能够简单有效地完成深度学习模型的训练与部署,以提高数控机床的加工精度、加工速度和可靠性。
-
公开(公告)号:CN107729378A
公开(公告)日:2018-02-23
申请号:CN201710828902.8
申请日:2017-09-14
IPC分类号: G06F17/30
CPC分类号: G06F17/30539
摘要: 本发明提供一种数据标注方法,包括:数据标注任务分配步骤,根据待标注数据的数据标识码和标注者标识码,将待标注的数据标注任务与标注者进行匹配,并依据匹配结果将所述待标注的数据标注任务分配给所述标注者;数据标注步骤,依据所要求的标注形式对所述待标注数据进行标注;结果收集和整合步骤,在所述待标注的数据标注任务的标注结果都提交之后,根据所述标注者的标注积分以及所述标注结果,整合所述标注结果,推测出正确标签。
-
公开(公告)号:CN114780617A
公开(公告)日:2022-07-22
申请号:CN202210483086.2
申请日:2022-05-05
申请人: 中国工程院战略咨询中心 , 华中科技大学 , 清华大学
IPC分类号: G06F16/2458 , G06F16/26 , G06F16/35
摘要: 本发明公开了一种基于多源数据和主题模型的技术清单生成方法,包括:获取与某个技术领域对应的多个科技文献,对该科技文献进行数据处理,并将处理后的多个科技文献存储在科技文献数据库中,将科技文献数据库中的所有科技文献输入训练好的支持向量机模型SVM中进行技术类别划分,并将技术类别划分结果存储在科技文献数据库中,将科技文献数据库中属于同一技术类别的科技文献合并为一个文档,所有文档形成文档库,对文档库先后进行停用词去除和低频词去除处理,以得到更新后的文档库,使用主题建模算法LDA对更新后的文档库进行主题聚类,以得到所有主题对应的单词分布矩阵。本发明能解决基于专家研判的方法存在的主观性强、成本较大的技术问题。
-
公开(公告)号:CN112633011A
公开(公告)日:2021-04-09
申请号:CN202011610820.4
申请日:2020-12-30
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
IPC分类号: G06F40/30 , G06F40/284 , G06F40/253
摘要: 本发明属于数据挖掘与利用技术领域,公开了一种融合词语义与词共现信息的研究前沿识别方法及设备。该方法包括:对论文数据进行时间切片;从单一时间切片的论文数据中提取技术关键词;统计技术关键词的共现频率构建词共现网络;根据技术关键词的相似度形成语义相似度网络;融合词共现网络和语义相似度网络来构建语义共现网络,并将技术关键词聚类成多个簇团;对所有时间切片的语义共现网络都进行聚类;对相邻时间切片的簇团进行相似度计算形成主题演化脉络图;同时满足主题年龄短、主题发展率高、主题热度高的研究主题即为前沿主题,前沿主题中的热门技术即为研究前沿。本发明能够更加客观、准确地进行研究前沿的识别。
-
公开(公告)号:CN112633011B
公开(公告)日:2022-09-16
申请号:CN202011610820.4
申请日:2020-12-30
申请人: 清华大学 , 华中科技大学 , 中国工程院战略咨询中心
IPC分类号: G06F40/30 , G06F40/284 , G06F40/253
摘要: 本发明属于数据挖掘与利用技术领域,公开了一种融合词语义与词共现信息的研究前沿识别方法及设备。该方法包括:对论文数据进行时间切片;从单一时间切片的论文数据中提取技术关键词;统计技术关键词的共现频率构建词共现网络;根据技术关键词的相似度形成语义相似度网络;融合词共现网络和语义相似度网络来构建语义共现网络,并将技术关键词聚类成多个簇团;对所有时间切片的语义共现网络都进行聚类;对相邻时间切片的簇团进行相似度计算形成主题演化脉络图;同时满足主题年龄短、主题发展率高、主题热度高的研究主题即为前沿主题,前沿主题中的热门技术即为研究前沿。本发明能够更加客观、准确地进行研究前沿的识别。
-
-
-
-
-
-
-
-
-