一种电力行业科研知识抽取方法及系统

    公开(公告)号:CN117933380B

    公开(公告)日:2024-10-29

    申请号:CN202410140232.0

    申请日:2024-01-31

    Abstract: 本发明公开了一种电力行业科研知识抽取方法及系统,该方法包括以下步骤:S1收集电力科研文献信息,并对收集到的文献信息进行预处理;S2构建电力科研领域关键词词典,通过机器标注的方式得到命名实体识别标注的语料库,从而得到训练集;S3采用改进的BiLSTM‑CNN‑CRF网络对训练集进行训练,完成电力科研知识的关键词抽取;S4将所述预测输出层得到的电力科研知识关键词与电力科研文献信息一起存入到图数据库Neo4j中。本发明将预处理后的电力科研文献信息经过所述嵌入层后转换为字符嵌入向量,采用的字符嵌入向量计算方法为将电力行业中的每个字符向量化,比直接使用相关模型进行特征提取进而得到相关的字符嵌入向量更加齐整,也即减少了很多冗余无效数据信息,从而提高抽取的准确率也相应的提高了抽取速度。

    基于语义标注的知识图谱查询优化方法

    公开(公告)号:CN118820398A

    公开(公告)日:2024-10-22

    申请号:CN202410874893.6

    申请日:2024-07-02

    Abstract: 本发明公开了基于语义标注的知识图谱查询优化方法,涉及数据处理技术领域,该方法包括:对目标知识图谱在历史查询窗口内的查询信息进行采集,获得历史查询数据集;获得Q个查询数据集合;获得Q个查询项目的Q个语义理解复杂度;生成Q个项目关键词向量集;对目标知识图谱中的Q个查询项目进行语义标注,获得语义标注结果;获得第一查询系数;获取目标查询用户在当前时刻的查询信息,与Q个查询项目进行匹配,并结合第一查询系数,获得目标查询结果。本发明解决了现有技术中进行知识图谱查询时数据量大,查询响应速度慢的技术问题,达到了利用语义标注对知识图谱查询进行优化,提升查询准确度和查询效率的技术效果。

Patent Agency Ranking