一种基于多源信息融合技术的专家推荐方法

    公开(公告)号:CN112269909B

    公开(公告)日:2022-06-03

    申请号:CN202010964492.1

    申请日:2020-09-15

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于多源信息融合技术的专家推荐方法,包括:爬取技术专家科技论文、发明专利、基金项目信息和Web网页信息构建知识库,并根据知识库关键词字段构建关键词词典keywords;抽取知识库作者字段进行词频共现分析,构建专家合作关系子网;分别使用正则表达式和命名实体识别算法抽取Web页面专家研究方向与个人信息构建Web子网;分别通过lda算法对知识库摘要字段提取文档‑主题和主题‑关键词,TF‑IDF算法提取摘要字段权重最大的5个词共同构建主题子网;以专家姓名‑机构为约束条件结合三种子网构建并计算专家信息网络中专家中心度值,对专家中心度值排序并推荐排名前5的专家作为推荐结果。

    一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法

    公开(公告)号:CN111813950B

    公开(公告)日:2024-02-27

    申请号:CN202010429933.8

    申请日:2020-05-20

    申请人: 淮阴工学院

    摘要: 比传统人工设定更有效构建建筑领域知识图谱。发明公开了一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法,首先采集建筑领域实体、实体属性及语料,然后进行预处理,得到建筑实体识别模型标注数据集EntityData;利用数据集EntityData训练基于BERT‑BiLSTM‑CRF的自适应实体识别模型,得到建筑领域实体识别模型EntityModel;对建筑领域关系数据集预处理得到数据集RelationData;利用RelationData训练基于GRU的自适应关系抽取模型,得到建筑领域关系抽取模型RelationModel;最后分别通过EntityModel和RelationModel抽取出建筑领域文本数据集中的实体和属性,构建建筑领域知识图谱;用户通过Web平台输入施工(56)对比文件穆磊 等.基于BIM和知识图谱的消防智能审图研究.消防科学与技术.2019,第38卷(第12期),1765-1768.王磊 等.基于关系触发词与单层GRU模型的关系抽取方法.吉林大学学报(理学版).2020,第58卷(第01期),95-103.

    一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法

    公开(公告)号:CN111813950A

    公开(公告)日:2020-10-23

    申请号:CN202010429933.8

    申请日:2020-05-20

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法,首先采集建筑领域实体、实体属性及语料,然后进行预处理,得到建筑实体识别模型标注数据集EntityData;利用数据集EntityData训练基于BERT-BiLSTM-CRF的自适应实体识别模型,得到建筑领域实体识别模型EntityModel;对建筑领域关系数据集预处理得到数据集RelationData;利用RelationData训练基于GRU的自适应关系抽取模型,得到建筑领域关系抽取模型RelationModel;最后分别通过EntityModel和RelationModel抽取出建筑领域文本数据集中的实体和属性,构建建筑领域知识图谱;用户通过Web平台输入施工图审查点,根据用户输入的施工图审查点挖掘知识库中的隐藏关系,并将挖掘出的专家意见信息Recom返回Web平台。本发明采用自适应调参,相比传统人工设定更有效构建建筑领域知识图谱。

    基于企业污染舆情抽取的智能辅助决策方法及装置

    公开(公告)号:CN114386422A

    公开(公告)日:2022-04-22

    申请号:CN202210043218.X

    申请日:2022-01-14

    摘要: 本发明公开了一种基于企业污染舆情抽取的智能辅助决策方法及装置,首先,面向易污染型企业集散地,针对多媒体实时采集舆情信息,提出基于污染关键词的分布式爬虫;接着,对采集的舆情信息使用BERT‑BiLSTM‑CRF模型抽取主题词信息,获取存在污染信息的关键词;然后,通过抽取生态环境检测标准文本数据集分析对应污染情况所采取的措施;最后,根据企业污染情况提出预警并推送决策建议。本发明将自然语言处理和数据挖掘方法应用于企业污染舆情分析,通过基于污染关键词的分布式爬虫提高对多源异构网页解析的效率,使用信息抽取方法对舆情信息进行识别,并对污染信息做出决策,提高决策者对污染的判定和治理效率。

    基于国家基金课题挖掘的科技前沿研究热点分析方法及装置

    公开(公告)号:CN113761313A

    公开(公告)日:2021-12-07

    申请号:CN202110952382.8

    申请日:2021-08-19

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于国家基金课题挖掘的科技前沿研究热点分析方法及装置,首先采集并处理数据,得到数据集Raw_Data;其次分别使用TextRank、TF‑IDF、LDA模型抽取关键词,根据关键词集Keywords构建图模型生成关键词数据项,得到数据集New_Data;然后将处理后的数据New_Data输入ERNIE模型处理并将输出作为改进的自适应卷积神经网络模型的输入,训练得到文本分类模型Model;接着根据数据集New_Data建立知识三元组,构建国家基金知识图谱;最后开放科技前沿研究热点分析使用接口,根据用户输入的国家基项目信息挖掘领域内的研究热点并通过Web返回给用户。本发明构建多层次特征提取方法更深层次挖掘研究热点及隐藏关系,利用基金知识图谱全面客观地展示研究前沿,能有效对科技前沿研究热点进行分析。

    一种基于多源信息融合技术的专家推荐方法

    公开(公告)号:CN112269909A

    公开(公告)日:2021-01-26

    申请号:CN202010964492.1

    申请日:2020-09-15

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于多源信息融合技术的专家推荐方法,包括:爬取技术专家科技论文、发明专利、基金项目信息和Web网页信息构建知识库,并根据知识库关键词字段构建关键词词典keywords;抽取知识库作者字段进行词频共现分析,构建专家合作关系子网;分别使用正则表达式和命名实体识别算法抽取Web页面专家研究方向与个人信息构建Web子网;分别通过lda算法对知识库摘要字段提取文档‑主题和主题‑关键词,TF‑IDF算法提取摘要字段权重最大的5个词共同构建主题子网;以专家姓名‑机构为约束条件结合三种子网构建并计算专家信息网络中专家中心度值,对专家中心度值排序并推荐排名前5的专家作为推荐结果。