基于个性化大语言模型的数字助理服务方法及系统

    公开(公告)号:CN116662508A

    公开(公告)日:2023-08-29

    申请号:CN202310681185.6

    申请日:2023-06-09

    发明人: 朱太和 晏士康

    摘要: 本发明提供了数字助理服务方法及系统,方法包括获得初始的通用大模型;对初始的通用大模型进行修饰;对修饰后的通用大模型进行微调,以得到微调后的通用大模型;使用私有数据对微调后的通用大模型进行云边联合训练,以得到个性化模型;将微调后的通用大模型部署在云端,将个性化模型部署在本地;接收用户的服务请求,利用部署的通用大模型和个性化模型对服务请求进行数字服务处理。该方法使得大语言模型中对私有数据安全性要求较高的专有化部分和个性化部分运行在本地,通用部分运行在云端,这样非专业用户不需要请专家或花费大量费用建立本地训练环境,从而降低本地训练环境建立的门槛,同时还保障了私有数据的隐私和安全性。

    一种处方用药审核方法、装置、设备及存储介质

    公开(公告)号:CN116631573A

    公开(公告)日:2023-08-22

    申请号:CN202310918210.8

    申请日:2023-07-25

    摘要: 本申请公开了一种处方用药审核方法、装置、设备及存储介质,本申请预先配置了药品知识库用于存储医学领域药品相关知识信息,对于待审核的病例‑处方数据,在知识库中检索相关的药品知识集合,进而调用第一生成式语言模型对药品知识集合进行处理,得到处理后药品知识集合,之后调用第二生成式语言模型,基于该病例‑处方数据及处理后药品知识集合,生成处方用药审核结果。本申请可以充分借助生成式语言模型的文本生成和推理能力,实现对药品知识集合的精简及整合,之后可以基于整合后药品知识集合推理病例‑处方数据中的用药合理性。审核结果可以提供给医生供参考,提高了用药审核速度及质量,同时节省了专业医生的人力、降低了专业医生的负担。

    一种去负样本的无监督句子表征学习方法

    公开(公告)号:CN116596031A

    公开(公告)日:2023-08-15

    申请号:CN202310581403.9

    申请日:2023-05-23

    发明人: 孙玉灵 陈少斌

    摘要: 本发明公开了一种去负样本的无监督句子表征学习方法,其特点是采用预测任务过滤预训练数据集中的冗余信息的方法,提升SiamCSE模型性能,将句子中随机挑选的单词进行重复,然后将其传入编码器,得到既不损失句子中的语义信息,同时在长度上也不尽相同的正样本,实现去负样本的句子表征学习,具体包括:设置多层感知机的映射层、目标函数约束中间隐藏向量的相似性、预测任务去除冗余信息、互相关矩阵及去相关矩阵的生成和模型训练等步骤。本发明与现有技术相比具有在句子表征学习任务上表现性能优异,填补了目前句子表征模型的不足,完善了去负样本句子表征学习模型的评估方案,帮助推动去负样本句子表征学习模型在现实中的普适性应用。

    装置及相关联的方法
    95.
    发明授权

    公开(公告)号:CN109643413B

    公开(公告)日:2023-08-15

    申请号:CN201780050832.6

    申请日:2017-08-15

    摘要: 一种装置,被配置为:关于包括视频影像的虚拟现实内容,该视频影像被配置为提供虚拟现实空间,其中呈现给用户的虚拟现实视图提供对VR空间的观看;基于由评论用户做出的评论以及评论用户在评论被做出时在虚拟现实空间中的虚拟位置;提供对虚拟现实空间中的兴趣点的确定,兴趣点至少基于以下被标识:评论用户在评论被做出时的虚拟位置以及用以标识该评论所涉及的在虚拟位置周围的兴趣点的对评论的语义分析,兴趣点与评论相关联,从而使得评论能够覆盖在视频影像的虚拟现实视图上。

    MT5语言模型优化方法及装置、介质、设备

    公开(公告)号:CN116579385A

    公开(公告)日:2023-08-11

    申请号:CN202310437983.4

    申请日:2023-04-19

    摘要: 本发明提供一种MT5语言模型优化方法及装置、介质、设备。方法包括:在MT5语言模型的编码器中增加至少一个卷积层,以使所述编码器通过所述至少一个卷积层提取文本特征;其中,上一个卷积层的输出信息为下一层卷积层的输入信息,且最后一层卷积层的输出信息为所述MT5语言模型的解码器的输入信息;利用数据集对所述MT5语言模型进行训练,得到优化后的MT5语言模型,以使优化后的MT5语言模型用于摘要生成技术中。本发明通过增加编码器的卷积层,来提高编码器的特征提取能力,从而更好地为解码器生成摘要提供信息。

    网络设备管理方法、装置及电子设备

    公开(公告)号:CN116541118A

    公开(公告)日:2023-08-04

    申请号:CN202310787799.2

    申请日:2023-06-29

    摘要: 本申请提供了网络设备管理方法、装置及电子设备。通过在网络设备部署NL CLI组件,由NL CLI组件提供支持自然语言的NL CLI,实现外部可以在NL CLI中以自然语言输入自然语言指令,使用自然语言可以更加直观地表达用户的需求和意图,用户不需要通过记忆复杂的命令和参数来操作设备,也可简化用户的操作步骤和输入内容,用户不需要输入冗长的命令和参数,并且,这种自然语言的输入方式可以让非专业人士也能轻松地操作设备,降低设备管理门槛,也屏蔽不同传统CLI的具体命令行差异,降低学习成本,实现了在满足网络设备的CLI所要求的命令的风格和格式的前提下避免CLI学习成本高,管理复杂的问题。

    一种对话处理方法及装置
    98.
    发明授权

    公开(公告)号:CN112735407B

    公开(公告)日:2023-07-21

    申请号:CN202011551191.2

    申请日:2020-12-24

    摘要: 本说明书公开了一种对话处理方法及装置,可先接收用户的待处理语音数据。其次,根据当前会话过程中已交流的语音数据,确定第一会话特征。并根据该待处理语音数据、已采用的会话策略以及该用户的画像信息,确定聚合特征。之后,将该第一会话特征与该聚合特征输入策略选择模型,确定目标策略。再将该第一会话特征、该聚合特征以及该目标策略对应的若干回复语句输入语句选择模型,确定目标语句。最后将该目标语句对应的回复语音数据发送至该终端。基于第一会话特征以及融合用户画像的聚合特征,通过策略选择模型确定采用的目标策略,并进一步通过语句选择模型确定回复的目标语句,使得回复的目标语句更符合用户需要,达到更好的服务效果。

    一种搜索方法
    99.
    发明公开
    一种搜索方法 审中-实审

    公开(公告)号:CN116361533A

    公开(公告)日:2023-06-30

    申请号:CN202310288116.9

    申请日:2023-03-16

    发明人: 张玉君

    摘要: 本发明实施例公开了一种搜索方法,包括:获取当前用户输入的至少一个当前搜索词及当前用户的出口企业信息,确定每个当前搜索词对应的至少一个目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度,然后基于至少一个当前搜索词及每个当前搜索词对应的至少一个目标扩展词进行搜索得到多个候选搜索结果,将每个候选搜索结果中的采购企业信息和出口企业信息输入至预设深度学习模型中,得到每个候选搜索结果与出口企业信息之间的关联度,接着根据相似度和关联度计算每个候选搜索结果的搜索得分,最后根据搜索得分对多个候选搜索结果进行排序得到目标搜索结果,可以使得用户快速、准确的搜索到合适的采购商进行贸易。

    一种文本分类方法、装置、处理设备和票据分类系统

    公开(公告)号:CN111538766B

    公开(公告)日:2023-06-30

    申请号:CN202010423351.9

    申请日:2020-05-19

    发明人: 张洪

    摘要: 本说明书提供一种文本分类方法、装置、处理设备和票据分类系统。一个方法实施例中,可以利用一个或多个模型算法对文本数据进行调优,增加文本覆盖度,增加文本质量,从而整体提升分类准确性。本说明书实施例方案可以快速构建轻量级文本分类方案,并将多个模型的分类结果合并后作为输出,不但处理文本的质量得到提升,输出结果更加可靠,而且整体模型简单、复杂度低,能够快速迭代产生分类结果,提高了分类模型构建效率和文本分类处理效率。