专利检索 ap:("江苏移动信息系统集成有限公司") AND inv:"郭欣" 第 1 页

1.

发明公开
一种基于prompt的文本相似度计算方法及系统有权

公开(公告)号：CN115204143A

公开(公告)日：2022-10-18

申请号：CN202211134323.0

申请日：2022-09-19

申请人： 江苏移动信息系统集成有限公司

发明人： 张玮 , 李婕 , 郭欣 , 解锦明 , 董陵 , 李电祥 , 葛丽丽

IPC分类号： G06F40/205 , G06F40/216 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08

摘要： 本发明提出了一种基于prompt的文本相似度计算方法及系统，属于自然语言处理的技术领域。其中方法包括以下步骤：首先读取源数据，并对源数据进行预处理分析；其次，将处理后的数据进行prompt化处理；再次，对prompt化后的数据进行向量化表示，并进行自动特征抽取；从次，采用注意力机制对向量化后的数据进行高价值信息的特征提取；最后，对提取到的特征数据进行相似度比对，获取文本之间的相似度大小。本发明针对文本相似度分析，引入prompt模块的新模式，优化了分析模型，在小样本或零样本场景下，可以有效提高模型效果，使得预训练语言模型提取的特征更自然地用于下游任务，特征质量高。

2.

发明授权
一种基于prompt的文本相似度计算方法及系统有权

公开(公告)号：CN115204143B

公开(公告)日：2022-12-20

申请号：CN202211134323.0

申请日：2022-09-19

申请人： 江苏移动信息系统集成有限公司

发明人： 张玮 , 李婕 , 郭欣 , 解锦明 , 董陵 , 李电祥 , 葛丽丽

IPC分类号： G06F40/205 , G06F40/216 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08

摘要： 本发明提出了一种基于prompt的文本相似度计算方法及系统，属于自然语言处理的技术领域。其中方法包括以下步骤：首先读取源数据，并对源数据进行预处理分析；其次，将处理后的数据进行prompt化处理；再次，对prompt化后的数据进行向量化表示，并进行自动特征抽取；从次，采用注意力机制对向量化后的数据进行高价值信息的特征提取；最后，对提取到的特征数据进行相似度比对，获取文本之间的相似度大小。本发明针对文本相似度分析，引入prompt模块的新模式，优化了分析模型，在小样本或零样本场景下，可以有效提高模型效果，使得预训练语言模型提取的特征更自然地用于下游任务，特征质量高。