医疗健康对话中的实体识别方法、装置、设备及介质

    公开(公告)号:CN117709346A

    公开(公告)日:2024-03-15

    申请号:CN202311728849.6

    申请日:2023-12-14

    发明人: 董哲 李响

    IPC分类号: G06F40/295 G06F40/237

    摘要: 本发明公开了一种医疗健康对话中的实体识别方法、装置、设备及介质。该方法包括:将对话中用户的待识别问句输入生成式模型的编码器,得到所述待识别问句的目标向量矩阵;将所述目标向量矩阵和所述对话中的历史标准实体输入所述生成式模型的自回归解码器,得到所述待识别问句中各词的实体概率;根据所述各词的实体概率,确定所述待识别问句中的目标待对齐实体;基于所述待识别问句的前置信息从至少两个候选字典树中确定目标字典树,并在所述目标字典树中确定所述目标待对齐实体的目标标准实体。本发明实施例可以提高实体识别的效率和准确性。

    一种用户对话意图预测方法、装置、设备及存储介质

    公开(公告)号:CN118098610A

    公开(公告)日:2024-05-28

    申请号:CN202211497110.4

    申请日:2022-11-25

    发明人: 李响

    摘要: 本发明公开了一种用户对话意图预测方法、装置、设备及存储介质。方法包括:获取客服与用户的对话文本,并对对话文本进行编码,得到第一编码矩阵,获取用户的标签信息,并对标签信息进行编码,得到第二编码矩阵,从对话文本和标签信息中提取预设的实体,确定与实体关联的知识图谱,从知识图谱中查找与实体关联度大于阈值的目标实体,并对目标实体进行编码,得到第三编码矩阵,融合第一编码矩阵、第二编码矩阵和第三编码矩阵,得到融合矩阵,并基于融合矩阵预测所述用户的意图,充分利用对话文本、用户的标签信息和知识图谱进行三级融合,提高了预测准确率,极大提升了医疗资源的使用效率和线上问诊的智能化水平。

    应用于健康领域的分类模型训练方法和分类识别方法

    公开(公告)号:CN117807524A

    公开(公告)日:2024-04-02

    申请号:CN202311848491.0

    申请日:2023-12-28

    发明人: 章宇超 李响

    摘要: 本发明公开了一种应用于健康领域的分类模型训练方法和分类识别方法,涉及人工智能技术领域,包括:获取待训练数据;将待训练数据输入预设分类模型中第一子网络,生成编码向量,并对编码向量进行降维处理得到目标向量,且根据目标向量确定目标权重,根据目标权重对待训练数据进行加权池化处理得到加权池化向量;将待训练数据输入预设分类模型中第二子网络进行平均池化处理得到平均池化向量;确定平均池化向量和加权池化向量之间的融合向量,并采用融合向量进行预测,得到预测类型;根据平均池化向量和加权池化向量确定信息瓶颈损失;根据待训练数据的标注类型和预测类型和信息瓶颈损失,训练预设分类模型。提高了分类模型的鲁棒性和分类准确性。

    问答模型的训练、答案确定方法、装置、设备及介质

    公开(公告)号:CN117610666A

    公开(公告)日:2024-02-27

    申请号:CN202311786658.5

    申请日:2023-12-22

    发明人: 龚江波 李响

    IPC分类号: G06N5/04 G06Q30/015

    摘要: 本发明公开了一种问答模型的训练、答案确定方法、装置、设备及介质,涉及人工智能技术领域。包括:对用户信息、场景信息、目标轮次问答和样本问答事件中的历史轮次问答进行融合,得到样本文本;通过初始问答模型中预先训练的第一自然语言处理模型,对样本文本进行嵌入处理,得到文本嵌入向量;通过初始问答模型中初始答案评估模型,关联信息向量和文本嵌入向量,确定样本问答事件中目标轮次问答的预测匹配程度;根据预测匹配程度和标注匹配程度,对自然语言处理模型和初始答案评估模型进行训练,得到目标问答模型。本技术方案,通过关联信息向量和文本嵌入向量确定目标轮次问答的匹配程度,进而对模型进行训练,提高了模型提供答案的准确率。

    一种健康问答模型的训练、健康问答方法及相关装置

    公开(公告)号:CN115714025A

    公开(公告)日:2023-02-24

    申请号:CN202211512382.7

    申请日:2022-11-29

    发明人: 章宇超 李响

    摘要: 本发明公开了一种健康问答模型的训练、健康问答方法及相关装置,该方法包括:采集多个样本;将健康问题信息与健康答案信息输入基于孪生句向量变换器的双向编码器中初步编码,得到中间层输出的问题中间向量与答案中间向量;将问题中间向量转换为受问题关键词控制的问题关键向量;将答案中间向量转换为受答案关键词控制的答案关键向量;将问题关键向量与答案关键向量输入基于孪生句向量变换器的双向编码器中继续完成编码,得到问题目标向量与答案目标向量;根据问题目标向量与答案目标向量将基于孪生句向量变换器的双向编码器训练为健康问答模型。注意力集中到包含健康实体词的关键词上,提高了在健康领域的适应性,提高答案召回的准确率。

    医疗文本意图识别方法、装置、电子设备和存储介质

    公开(公告)号:CN117786075A

    公开(公告)日:2024-03-29

    申请号:CN202311815716.2

    申请日:2023-12-27

    摘要: 本发明公开了一种医疗文本意图识别方法、装置、电子设备和存储介质,包括:将待识别医疗文本输入语言模型中,在语言模型输出当前时间步的多个候选词元时,通过调用接口调用集束搜索算法搜索出在医疗字典树中的候选词元构成当前时间步的、概率排序在前的N个候选词元序列,从最后一个时间步的N个候选词元序列中确定出概率最高的候选词元序列,将概率最高的候选词元序列所构成的语句确定为待识别医疗文本的意图语句,实现了通过医疗字典树指导语言模型输出符合医疗领域的意图语句,且通过集束搜索算法从多个候选词元序列中筛选出概率最高的序列生成意图语句,提高了意图语句所表达意图的准确性和专业性,通过意图可以准确响应医疗场景的咨询业务。

    一种健康建议的生成方法、装置、设备及存储介质

    公开(公告)号:CN116010586A

    公开(公告)日:2023-04-25

    申请号:CN202310088768.8

    申请日:2023-02-06

    摘要: 本发明公开了一种健康建议的生成方法、装置、设备及存储介质。方法包括:获取用户咨询文本、用户画像标签,以及与用户画像标签关联的调节人体机能产品,对用户咨询文本、用户画像标签,以及调节人体机能产品进行融合编码,得到融合编码向量,将融合编码向量输入预先训练的多决策树分类模型中进行处理,预测用户的疾病类型,针对疾病类型生成健康建议,并推送给用户。本方案可以有效改进现有量表机械问询的方式,根据用户信息的逐渐丰富进行预诊断,并结合多决策树模型遍历系统中经典的递归回溯算法,模拟专家在咨询路径中可回顾判断逻辑的思路,提高了健康建议的灵活性和科学性。

    一种健康语料的分类方法、装置、设备及存储介质

    公开(公告)号:CN117473092A

    公开(公告)日:2024-01-30

    申请号:CN202311561297.4

    申请日:2023-11-22

    发明人: 张仁杰 李响

    摘要: 本发明公开了一种健康语料的分类方法、装置、设备及存储介质,该方法包括:依据第一原始健康语料和/或第二原始健康语料训练第一分类器,第一原始健康语料已划分类别、第二原始健康语料未划分类别;将第二原始健康语料输入第一分类器中划分类别;对第二原始健康语料进行数据增强;若完成数据增强,则筛选类别相同、且语义相似的第一原始健康语料与第二原始健康语料,作为健康语料对;筛选出部分可训练优于第一分类器的第二分类器的健康语料对,作为目标语料对;依据目标语料对训练第三分类器;依据第三分类器对目标语料对滤除噪音,得到目标健康语料。本实施例实现了半监督学习地标注标签,整体上提升了对健康领域的语料标注标签的效率。