- 专利标题: 基于无监督学习的文本相似度计算方法、系统、设备及介质
- 专利标题(英): Text similarity calculation method, system and equipment based on unsupervised learning and medium
-
申请号: CN201910211396.7申请日: 2019-03-20
-
公开(公告)号: CN109977194A公开(公告)日: 2019-07-05
- 发明人: 庄浩杰 , 王聪 , 孙庆华
- 申请人: 华南理工大学
- 申请人地址: 广东省广州市天河区五山路381号
- 专利权人: 华南理工大学
- 当前专利权人: 华南理工大学
- 当前专利权人地址: 广东省广州市天河区五山路381号
- 代理机构: 广州市华学知识产权代理有限公司
- 代理商 李君
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/34
摘要:
本发明公开了一种基于无监督学习的文本相似度计算方法、系统、设备及介质,所述方法包括:获取训练集,将训练集中的每篇文本作为摘要生成网络的输入,得到每篇文本对应的摘要,构成文本集合与摘要集合;搭建相似度计算网络;采用文本集合和摘要集合对相似度计算网络进行训练;将待处理的两篇文本输入训练后的相似度计算网络,输出这两篇文本的相似度。本发明无需人工标记的配对数据就可以进行训练与学习,大大降低了数据获取的成本。
公开/授权文献
- CN109977194B 基于无监督学习的文本相似度计算方法、系统、设备及介质 公开/授权日:2021-08-10