- 专利标题: 一种基于prompt的文本相似度计算方法及系统
-
申请号: CN202211134323.0申请日: 2022-09-19
-
公开(公告)号: CN115204143A公开(公告)日: 2022-10-18
- 发明人: 张玮 , 李婕 , 郭欣 , 解锦明 , 董陵 , 李电祥 , 葛丽丽
- 申请人: 江苏移动信息系统集成有限公司
- 申请人地址: 江苏省南京市虎踞路59号
- 专利权人: 江苏移动信息系统集成有限公司
- 当前专利权人: 江苏移动信息系统集成有限公司
- 当前专利权人地址: 江苏省南京市虎踞路59号
- 代理机构: 南京泰普专利代理事务所
- 代理商 方晓雯
- 主分类号: G06F40/205
- IPC分类号: G06F40/205 ; G06F40/216 ; G06F40/242 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本发明提出了一种基于prompt的文本相似度计算方法及系统,属于自然语言处理的技术领域。其中方法包括以下步骤:首先读取源数据,并对源数据进行预处理分析;其次,将处理后的数据进行prompt化处理;再次,对prompt化后的数据进行向量化表示,并进行自动特征抽取;从次,采用注意力机制对向量化后的数据进行高价值信息的特征提取;最后,对提取到的特征数据进行相似度比对,获取文本之间的相似度大小。本发明针对文本相似度分析,引入prompt模块的新模式,优化了分析模型,在小样本或零样本场景下,可以有效提高模型效果,使得预训练语言模型提取的特征更自然地用于下游任务,特征质量高。
公开/授权文献
- CN115204143B 一种基于prompt的文本相似度计算方法及系统 公开/授权日:2022-12-20