一种基于关联建模的知识检索问答方法

    公开(公告)号:CN118093846A

    公开(公告)日:2024-05-28

    申请号:CN202410512955.9

    申请日:2024-04-26

    Inventor: 黄森

    Abstract: 本发明公开了一种基于关联建模的知识检索问答方法,所述方法包括:构建专利特征提取模型,包括节点单一特征提取模块,节点层级特征提取模块;利用专利特征提取模型可以提取出每个权利要求的层级特征;把各个权利要求输入大语言模型,得到对应的查询,并把查询输入查询特征提取模型,得到权利要求的查询特征;对权利要求的层级特征和查询特征计算损失函数;利用损失函数训练专利特征提取模型和查询特征提取模型;利用训练好的专利特征提取模型和查询特征提取模型进行专利检索问答。本发明通过显式建模专利的权利要求的依赖关系,实现权利要求的有效特征表示,通过对自然语言查询特征和权利要求的层级特征的匹配,实现专利权利要求的检索问答。

    一种基于深度学习的机车工单信息智能识别方法及系统

    公开(公告)号:CN117576699A

    公开(公告)日:2024-02-20

    申请号:CN202311462227.3

    申请日:2023-11-06

    Abstract: 本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统,包括以下步骤:步骤1,获得机车工单图像数据;步骤2,对机车工单图像数据进行图像预处理得到预处理后的图像数据;步骤3,利用预处理后的图像数据进行文本检测和文本识别;步骤4,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建,获得机车工单图像的文本信息及文本之间的联系;提升了对机车工单信息智能识别的识别精度,实现了机车工单复杂表格的无模板重建;特别在机车工单多类别的识别场景,都能满足机车维修等后勤工作对机车工单识别的高精度性能需求,能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。

    一种基于深度学习的表格摘要生成方法

    公开(公告)号:CN117216245B

    公开(公告)日:2024-01-26

    申请号:CN202311482529.7

    申请日:2023-11-09

    Abstract: 本发明公开了一种基于深度学习的表格摘要生成方法,包括以下步骤:步骤1,将表格的参考摘要进行切分,通过匹配算法得到表格对应的内容行;步骤2,将表格对应的内容行进行两两配对,得到独立内容行与合并内容行;步骤3,获取所述独立内容行与所述合并内容行分别对应的文本摘要;步骤4,将所述分别对应的文本摘要融合在一起,形成整个表格的文本摘要作为最终模型的输出;通过对表格进行跨行合并和将内容行逐行生成摘要的方式,解决了表格存在跨行较多以及单元格数目较多时效果不佳的问题,从而提高了表格生成摘要的鲁棒性和准确性。

    一种基于视频动作的多模型集成多相位MRI肿瘤分类方法

    公开(公告)号:CN117351003A

    公开(公告)日:2024-01-05

    申请号:CN202311579723.7

    申请日:2023-11-24

    Abstract: 本发明公开了一种基于视频动作的多模型集成多相位MRI肿瘤分类方法,包括以下步骤:步骤1,对MRI肿瘤病例数进行划分处理与对MRI三维图像进行预处理;步骤2,通过分类模型获取MRI三维图像的特征图;步骤3,对特征图进行融合并映射到输出类别中得到预测结果;步骤4,重复步骤2和步骤3,获取多个独立且对不同类别具有不同分类能力的模型的预测结果;步骤5,集成多个模型的预测结果从而得到最终的多相位MRI肿瘤分类结果;得到更具鲁棒性和更精准的预测结果,使自动诊断多相位MRI肿瘤分类结果的精准度进一步提高,有效的缓解了医疗数据集中、数据量少、数据集不平衡的问题。

    基于感知和语义关联性的文本识别模型可靠性正则方法

    公开(公告)号:CN117151111A

    公开(公告)日:2023-12-01

    申请号:CN202311027442.0

    申请日:2023-08-15

    Abstract: 本发明公开了基于感知和语义关联性的文本识别模型可靠性正则方法,包括:利用语义上下文无关的识别模型和预训练语言模型分别获取感知关联序列集和语义关联序列集,构建实例特定的关联序列集;根据关联序列集,联合利用感知和语义关联序列平滑目标序列的损失,以实现更加有效的序列可靠性正则;构建调制函数,根据样本的难易程度自适应调整校准强度,以实现自适应细粒度序列可靠性正则;引入全局平滑因子,联合预测序列与标签序列的KL散度,构建全局校准损失函数,以实现总体的序列可靠性正则;利用最终损失重新训练待校准训练模型,最后得到校准的场景文本识别模型,用于输出预测文本序列及校准的置信度。

Patent Agency Ranking