发明公开
- 专利标题: 一种多场景的异构数据处理方法
-
申请号: CN202310416643.3申请日: 2023-04-19
-
公开(公告)号: CN116150405A公开(公告)日: 2023-05-23
- 发明人: 曹扬 , 李响 , 仲恺 , 谢红韬 , 汪榕 , 支婷 , 祁纲 , 程建润 , 周伟 , 黄铁淳
- 申请人: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
- 申请人地址: 贵州省贵阳市观山湖区长岭南路160号高科一号C栋30层;
- 专利权人: 中电科大数据研究院有限公司,太极计算机股份有限公司
- 当前专利权人: 中电科大数据研究院有限公司,太极计算机股份有限公司
- 当前专利权人地址: 贵州省贵阳市观山湖区长岭南路160号高科一号C栋30层;
- 代理机构: 北京智桥联合知识产权代理事务所
- 代理商 金光恩
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06F40/30 ; G06F18/25 ; G06F18/22 ; G06N3/0464 ; G06N3/045 ; G06N3/09 ; G06N3/084
摘要:
本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
公开/授权文献
- CN116150405B 一种多场景的异构数据处理方法 公开/授权日:2023-06-27