发明授权
- 专利标题: 文本相似度分析方法、装置和存储介质
-
申请号: CN201911394188.1申请日: 2019-12-30
-
公开(公告)号: CN111144112B公开(公告)日: 2023-07-14
- 发明人: 卢达沛 , 罗乐滔 , 陈惠芳 , 胡志乐 , 黄娇燕
- 申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
- 申请人地址: 广东省广州市广州高新技术产业开发区科学城科林路9号研究院办公楼;
- 专利权人: 广州广电运通信息科技有限公司,广州广电运通金融电子股份有限公司
- 当前专利权人: 广州广电运通信息科技有限公司
- 当前专利权人地址: 510663 广东省广州市黄埔区科学城科林路11号701房
- 代理机构: 广州嘉权专利商标事务所有限公司
- 代理商 黎扬鹏
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/205 ; G06F18/22
摘要:
本发明公开了文本相似度分析方法、装置和存储介质,方法包括以下步骤:获取第一文本和第二文本;根据第一文本、第二文本分别获取第一主题关键词集合和第二主题关键词集合;根据第一文本和第二文本,获取第一文本相对第二文本相似的第三句子的第一数量,以及获取第二文本相对第一文本相似的第四句子的第二数量;获取第一文本与第二文本的相似度分析结果,相似度分析结果包括主题关联度、内容相似度、第一文本相对第二文本的相似度、第二文本相对第一文本的相似度的至少两种。通过本发明使得相似度分析结果准确,即使是长文本和短文本的比对也能获得准确的相似度分析结果,适用性强。本发明可广泛应用于数据处理领域。
公开/授权文献
- CN111144112A 文本相似度分析方法、装置和存储介质 公开/授权日:2020-05-12