发明公开
- 专利标题: 一种基于BGE模型的电力科研知识关联性构建方法及系统
-
申请号: CN202410306464.9申请日: 2024-03-18
-
公开(公告)号: CN117910460A公开(公告)日: 2024-04-19
- 发明人: 徐晓轶 , 吕晓祥 , 毛艳芳
- 申请人: 国网江苏省电力有限公司南通供电分公司
- 申请人地址: 江苏省南通市崇川区青年中路52号
- 专利权人: 国网江苏省电力有限公司南通供电分公司
- 当前专利权人: 国网江苏省电力有限公司南通供电分公司
- 当前专利权人地址: 江苏省南通市崇川区青年中路52号
- 代理机构: 镇江至睿专利代理事务所
- 代理商 刘静
- 主分类号: G06F40/242
- IPC分类号: G06F40/242 ; G06F40/30 ; G06F40/216 ; G06F16/901 ; G06Q50/06
摘要:
本发明公开了一种基于BGE模型的电力科研知识关联性构建方法及系统,该方法包括以下步骤:收集电力科研文献信息,并对收集到的文献信息进行预处理,得到电力领域关键词词库;获取电力领域关键词的释义,构建电力领域关键词词典;利用融合词典信息BGE模型对每个电力领域关键词的释义向量化,将所得电力领域关键词词库的释义全部向量化;根据所得的全部电力领域关键词的释义向量化计算电力领域关键词之间的语义相关性和语境相关性。本发明将构建的电力领域关键词释义经过RetroMAE预训练和嵌入层,分别处理后进行向量的拼接,得到多维度的释义向量表示,从两个方向聚合对象语义信息,可得到每个层面的最终表征,保证了语义信息不被削弱,提高了语义表征的能力。
公开/授权文献
- CN117910460B 一种基于BGE模型的电力科研知识关联性构建方法及系统 公开/授权日:2024-06-07