-
公开(公告)号:CN115204143A
公开(公告)日:2022-10-18
申请号:CN202211134323.0
申请日:2022-09-19
申请人: 江苏移动信息系统集成有限公司
IPC分类号: G06F40/205 , G06F40/216 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提出了一种基于prompt的文本相似度计算方法及系统,属于自然语言处理的技术领域。其中方法包括以下步骤:首先读取源数据,并对源数据进行预处理分析;其次,将处理后的数据进行prompt化处理;再次,对prompt化后的数据进行向量化表示,并进行自动特征抽取;从次,采用注意力机制对向量化后的数据进行高价值信息的特征提取;最后,对提取到的特征数据进行相似度比对,获取文本之间的相似度大小。本发明针对文本相似度分析,引入prompt模块的新模式,优化了分析模型,在小样本或零样本场景下,可以有效提高模型效果,使得预训练语言模型提取的特征更自然地用于下游任务,特征质量高。
-
公开(公告)号:CN115204143B
公开(公告)日:2022-12-20
申请号:CN202211134323.0
申请日:2022-09-19
申请人: 江苏移动信息系统集成有限公司
IPC分类号: G06F40/205 , G06F40/216 , G06F40/242 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明提出了一种基于prompt的文本相似度计算方法及系统,属于自然语言处理的技术领域。其中方法包括以下步骤:首先读取源数据,并对源数据进行预处理分析;其次,将处理后的数据进行prompt化处理;再次,对prompt化后的数据进行向量化表示,并进行自动特征抽取;从次,采用注意力机制对向量化后的数据进行高价值信息的特征提取;最后,对提取到的特征数据进行相似度比对,获取文本之间的相似度大小。本发明针对文本相似度分析,引入prompt模块的新模式,优化了分析模型,在小样本或零样本场景下,可以有效提高模型效果,使得预训练语言模型提取的特征更自然地用于下游任务,特征质量高。
-