发明公开
- 专利标题: 一种基于信息同源特征的互联网中信息实体同源判断方法
-
申请号: CN202211034383.5申请日: 2022-08-26
-
公开(公告)号: CN115828908A公开(公告)日: 2023-03-21
- 发明人: 李攀攀 , 谢正霞
- 申请人: 嘉兴学院
- 申请人地址: 浙江省嘉兴市秀洲区康和路1288号光伏科创园2号楼
- 专利权人: 嘉兴学院
- 当前专利权人: 嘉兴学院
- 当前专利权人地址: 浙江省嘉兴市秀洲区康和路1288号光伏科创园2号楼
- 代理机构: 郑州睿途知识产权代理事务所
- 代理商 李伊宁
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/216 ; G06F40/151 ; G06F40/30 ; G06F16/33 ; G06F16/31 ; G06Q50/00
摘要:
本发明公开了一种基于信息同源特征的互联网中信息实体同源判断方法,包括以下步骤:A:获取互联网上所传播的信息实体的特征集;B:对步骤A中得到的特征集进行预处理;C:获取多维关键特征构建信息实体的多维关键特征集;D:获取信息实体的经规则化处理后的多维关键特征集;E:得到信息实体的平行语料增强关键特征集;F:抽取信息实体的语义信息;G:通过LSH哈希函数计算出信息实体的标识符并得到信息实体的信息同源特征;H:对待判定是否同源的信息实体A和B进行判定。本发明能够基于信息同源特征进行信息实体的同源判断,有效地解决了开放互联网中的信息内容传播和演化追溯问题,实现了信息内容的可追溯。