问答处理方法、装置、系统、计算设备及计算机存储介质

    公开(公告)号:CN116860949B

    公开(公告)日:2024-04-05

    申请号:CN202311056160.3

    申请日:2023-08-21

    摘要: 本发明公开了一种问答处理方法、装置、系统、计算设备及计算机存储介质,该方法包括:获取用户端发送的问题查询语句;根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将答复结果返回至用户端。通过上述方式,本发明能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。

    基于预训练知识嵌入的大语言模型文本纠错方法及装置

    公开(公告)号:CN117787266A

    公开(公告)日:2024-03-29

    申请号:CN202311810975.6

    申请日:2023-12-26

    摘要: 本发明实施例公开了一种基于预训练知识嵌入的大语言模型文本纠错方法及装置,方法包括:将待纠错文本输入至预训练得到的知识库模型,将文本纠错任务信息输入至任务编码器,经由任务适配器将知识库模型的输出与任务编码器的输出进行连接,得到知识嵌入特征向量;将待纠错文本以及知识嵌入特征向量输入至预训练得到的预设纠错大模型,得到纠错后的文本。通过任务适配器和知识库模型,将知识库中专业的知识融入纠错大模型中,使得纠错大模型可以更准确地处理文本纠错任务,提升纠错精度和效率。

    标志检测方法、装置、计算设备及存储介质

    公开(公告)号:CN116884015A

    公开(公告)日:2023-10-13

    申请号:CN202310913401.5

    申请日:2023-07-24

    摘要: 本发明公开了一种标志检测方法、装置、计算设备及存储介质,涉及计算机技术领域,方法包括:对标志数据集中的各个训练样本图像进行预分类处理,得到各个训练样本图像的预分类标签;根据各个训练样本图像及其预分类标签训练标志检测模型中的第一子模型,根据各个训练样本图像及其原始分类标签训练标志检测模型中的第二子模型,直至标志检测模型的损失函数满足预设条件;其中,标志检测模型的损失函数由第一子模型的损失函数和第二子模型的损失函数构成;将待预测图像输入至训练后的标志检测模型中进行处理,得到待预测图像的标志检测结果。通过上述方式,能够增强标志检测模型对不同形式标志的特征表达能力,提升模型的检测和识别性能。

    文本检索方法、装置、计算设备及计算机存储介质

    公开(公告)号:CN116186203B

    公开(公告)日:2023-10-10

    申请号:CN202310225088.6

    申请日:2023-03-01

    摘要: 本发明公开了一种文本检索方法、装置、计算设备及计算机存储介质,其中方法包括:对用户输入的检索语句进行分词以获得多个词语;计算检索语句与文本库中的各个文本的相似度得分,对各个文本进行第一次排序,根据第一次排序结果获得多个目标文本;针对任一目标文本中的任一当前词语,查找该目标文本中当前词语的下一词语,根据当前词语与下一词语的距离分别计算当前词语和下一词语的距离累计得分;以及,根据目标文本中各个词语的距离累计得分计算该目标文本相对于检索语句的邻近度得分;对多个目标文本进行第二次排序,将第二次排序后的多个目标文本返回给用户。本方法能够使检索结果尽可能覆盖所有的查询片段,并且实现与检索语句的语义一致性。

    图像数据扩增方法、装置、计算设备及存储介质

    公开(公告)号:CN116109891B

    公开(公告)日:2023-07-25

    申请号:CN202310142885.8

    申请日:2023-02-08

    摘要: 本发明公开了一种图像数据扩增方法、装置、计算设备及存储介质。方法包括:获取包含柔性目标的基准图片;确定基准图片的基准点选取区,从基准点选取区中提取第一数量的第一像素点作为基准点;针对基准点,对该基准点进行位置偏移后生成变形点,并生成变形点对;采用薄板样条插值算法对各个变形点对中基准点以及变形点的坐标进行处理后,获得扩增图片至基准图片的映射函数;针对扩增图片中任一第二像素点,基于映射函数确定第二像素点映射的第一像素点,根据该第一像素点的像素值生成该第二像素点的像素值以生成扩增图片。采用本方案,能够获得柔性目标在柔性变形后的扩增图片,提高柔性目标的样本多样性,提升模型的泛化能力以及检测精度。

    人脸图库构建方法、装置及计算设备

    公开(公告)号:CN116012924A

    公开(公告)日:2023-04-25

    申请号:CN202310095642.3

    申请日:2023-01-30

    摘要: 本申请公开了一种人脸图库构建方法、装置及计算设备,该方法包括:采集与人物关键词相匹配的至少一个人物图片;检测是否存在与人物关键词相匹配的至少一个可信人物图片;若是,根据至少一个人物图片与至少一个可信人物图片的人脸相似度,从至少一个人物图片中筛选至少一个模板图片;若否,从至少一个人物图片中筛选至少一个第一候选图片,将至少一个第一候选图片反馈至标注用户,以供标注用户在至少一个第一候选图片中标记至少一个模板图片;根据至少一个模板图片以及人物关键词,构建人脸图库。通过上述方式,本申请实现了人脸数据的采集及标注,整个过程中人工只需要参与很少的确认工作,减少了人为干预,提升了构建人脸图库的效率。

    几何神经网络模型构建方法、装置、设备及存储介质

    公开(公告)号:CN116011515A

    公开(公告)日:2023-04-25

    申请号:CN202211671186.4

    申请日:2022-12-26

    摘要: 本申请公开了一种几何神经网络模型构建方法、装置、设备及存储介质。其中,所述方法包括:根据预设模型确定神经网络的连接关系、节点、连边和连边方向;其中,节点用于对数据进行特征处理;连边表征神经网络中的数据流;连边方向表征数据的传递方向;根据节点对数据的特征处理确定节点模型;其中,节点模型包含预设个卷积层;根据神经网络的连接关系与节点模型,构建几何神经网络模型;其中,几何神经网络模型包括提取图像的低层次特征、神经网络中的特征重用、特征通道线性组合、构建图像的全局特征、网络正则化中的至少一部分功能实现。本方案将具有自然特征的预设模型与神经网络结合,形成具有自然网络特征的几何神经网络模型。

    一种多模态多粒度实体识别系统及实体识别方法

    公开(公告)号:CN115545018A

    公开(公告)日:2022-12-30

    申请号:CN202211263174.8

    申请日:2022-10-14

    IPC分类号: G06F40/279

    摘要: 一种多模态多粒度实体识别系统及实体识别方法,本发明涉及实体识别系统及实体识别方法。本发明的目的是为了解决当前多模态实体抽取模型中缺少对细粒度图文匹配的建模,导致部分实体识别错误,实体识别准确率低的问题。系统包括:训练集获取模块用于获取训练集;实体识别模型构建模块用于构建实体识别模型;实体识别模型包括多模态多粒度实体识别模型、VGTR模型和CLIP模型;实体识别模型训练模块用于得到训练好的实体识别模型;预测模块用于将待测的匹配图片和文本输入训练好的实体识别模型中的多模态多粒度实体识别模型中,输出标注序列,获得待测的匹配图片和文本中的实体。本发明用于新闻、医疗、军事、农业实体识别领域。

    小样本多标签文本分类模型训练方法及文本分类方法

    公开(公告)号:CN114818891B

    公开(公告)日:2022-11-18

    申请号:CN202210390623.9

    申请日:2022-04-14

    摘要: 本发明公开了一种小样本多标签文本分类模型训练方法、小样本多标签文本分类方法、装置、计算设备及计算机存储介质。该方法通过从文本标签对应的标注样本文本中提取关键短语,根据关键短语实现提示模板的扩充,并基于提示模板来实现数据增广,从而实现了基于小样本的标注样本文本进行模型训练,克服了大规模有标注的文本不可得的缺陷,而且提升了文本分类模型的训练效率,无需人工花费较长时间进行标注,降低了人工成本以及时间成本。

    文本校对模型训练方法及装置、计算设备

    公开(公告)号:CN114925170A

    公开(公告)日:2022-08-19

    申请号:CN202210577416.4

    申请日:2022-05-25

    IPC分类号: G06F16/33 G06F40/58 G06K9/62

    摘要: 本发明公开了一种文本校对模型训练方法,基于已标注错误类型标注数据集,训练得到数据增强模型;数据增强模型训练输入数据包含错误位置的文本被替换为掩码标记第一向量以及被赋值为错误类型第二向量;基于各个错误类型特征分布和一部分未标注文本数据构建指定错误类型的预测输入数据;将预测输入数据输入给训练得到的数据增强模型,得到预测输出数据;对另一部分未标注文本数据进行随机删除操作;将预测输出数据和随机删除操作所得数据加入到标注数据集中,得到拓展数据集;利用拓展数据集,训练得到文本校对模型。本发明将错误类型作为额外的输入生成指定类型错误文本拓展数据集,减少了训练数据生成的随机性,解决了训练数据数量少的问题。