一种基于prompt的文本相似度计算方法及系统

    公开(公告)号:CN115204143A

    公开(公告)日:2022-10-18

    申请号:CN202211134323.0

    申请日:2022-09-19

    摘要: 本发明提出了一种基于prompt的文本相似度计算方法及系统,属于自然语言处理的技术领域。其中方法包括以下步骤:首先读取源数据,并对源数据进行预处理分析;其次,将处理后的数据进行prompt化处理;再次,对prompt化后的数据进行向量化表示,并进行自动特征抽取;从次,采用注意力机制对向量化后的数据进行高价值信息的特征提取;最后,对提取到的特征数据进行相似度比对,获取文本之间的相似度大小。本发明针对文本相似度分析,引入prompt模块的新模式,优化了分析模型,在小样本或零样本场景下,可以有效提高模型效果,使得预训练语言模型提取的特征更自然地用于下游任务,特征质量高。

    一种基于prompt的文本相似度计算方法及系统

    公开(公告)号:CN115204143B

    公开(公告)日:2022-12-20

    申请号:CN202211134323.0

    申请日:2022-09-19

    摘要: 本发明提出了一种基于prompt的文本相似度计算方法及系统,属于自然语言处理的技术领域。其中方法包括以下步骤:首先读取源数据,并对源数据进行预处理分析;其次,将处理后的数据进行prompt化处理;再次,对prompt化后的数据进行向量化表示,并进行自动特征抽取;从次,采用注意力机制对向量化后的数据进行高价值信息的特征提取;最后,对提取到的特征数据进行相似度比对,获取文本之间的相似度大小。本发明针对文本相似度分析,引入prompt模块的新模式,优化了分析模型,在小样本或零样本场景下,可以有效提高模型效果,使得预训练语言模型提取的特征更自然地用于下游任务,特征质量高。