一种基于两层语义模型的文本相似度计算方法与装置

    公开(公告)号:CN115859993A

    公开(公告)日:2023-03-28

    申请号:CN202211393075.1

    申请日:2022-11-08

    Abstract: 本发明公开了一种基于两层语义模型的文本相似度计算方法与装置,统计第一文本和第二文本的句子数量,将数量较小的记为第一文本句子集,另一记为第二文本句子集,计算文本长度对比度;通过第一语义模型分别对第一文本句子集与第二文本句子集进行向量转化,得到第一文本句子向量集与第二文本句子向量集;计算每个句子向量的距离相似度,以在第二文本句子集中寻找第一文本句子集每个句子对应的最相似句子;将最相似的句子组合得到第三文本句子向量集;第一文本句子向量集和第三文本句子向量集通过第二语义模型编码得到第一文本向量和第三文本向量,计算第一文本向量和第三文本向量的相似度;向量相似度与文本长度对比度相乘,得到文本相似度。

    一种可信问答方法、系统、电子设备、介质

    公开(公告)号:CN117194623A

    公开(公告)日:2023-12-08

    申请号:CN202311032221.2

    申请日:2023-08-16

    Abstract: 本发明公开了一种可信问答方法、系统、电子设备、介质,包括:基于本地文档库构建向量数据库;获取问询内容以及备询文档范围;将问询内容输入至内容安全检测模型中进行检测,当识别到问询内容包含违规,则输出警告信号,重新获取问询内容;将问询内容进行向量化,得到用户问询向量;根据用户问询向量、备询文档范围对向量数据库进行检索,得到查询结果文本;将问询内容以及查询结果文本输入至标准prompt模板,再输入至自然语言大模型,获得返回答案;将返回答案输入至内容安全检测模型中进行检测,当识别到返回答案包含违规,则将问询内容、查询结果文本、返回答案以及分类结果输入至异常处理prompt模板,再输入至自然语言大模型中,获得返回答案。

    一种基于特征离散系数和注意力机制的智能人岗匹配方法

    公开(公告)号:CN115795150A

    公开(公告)日:2023-03-14

    申请号:CN202211484581.1

    申请日:2022-11-24

    Abstract: 本发明公开了一种基于特征离散系数和注意力机制的智能人岗匹配方法,所述方法包括获取简历/岗位文本语料对预训练语义抽取模型进行模型精调;根据各个字段的描述类型将简历/岗位文本语料划分为文本特征、数值型特征、等级型特征;根据不同特征类型分析简历/岗位文本语料以提取特征,并存储于向量数据库中;取应聘者在客户端最近的前N条浏览记录,在向量数据库中查找浏览记录对应的各特征值,以计算应聘者的兴趣画像和各特征对应的兴趣度;对于每一个候选岗位推荐项,根据岗位的各个特征值与对应特征的兴趣画像之间的相似度与该特征的兴趣度得到匹配度;对各候选项的匹配度进行排序,得到推荐结果。

    一种用于自然语言处理的深度学习模型的同态加密方法

    公开(公告)号:CN115987479A

    公开(公告)日:2023-04-18

    申请号:CN202211501496.1

    申请日:2022-11-28

    Abstract: 本发明公开一种用于自然语言处理的深度学习模型的同态加密方法,首先根据需要加密的数据或者需要使用的深度学习模型获得原始符号表;根据原始符号表生成一份不包含重复符号且大小不小于原始符号表的随机符号表,原始符号表中的符号与随机符号表中的符号形成一对一或一对多的映射关系;随机符号表作为密钥K;通过分词算法将深度学习模型对应的一份明文数据分成符号串;将符号串中的符号按照密钥K,映射成新符号,并串联,生成利用密钥K加密后的密文m。采用本发明的方法进行加密,产出的密文在深度学习中可以保持计算同态,也就是说深度学习模型可以基于密文训练和预测,不影响训练的计算效率,也不改变预测结果,不改变准确率和召回率效果。

Patent Agency Ranking