-
公开(公告)号:CN118093846A
公开(公告)日:2024-05-28
申请号:CN202410512955.9
申请日:2024-04-26
Applicant: 华南理工大学
Inventor: 黄森
IPC: G06F16/332 , G06F40/216 , G06F16/33 , G06F16/36 , G06F18/213 , G06F18/22 , G06N3/084 , G06Q50/18
Abstract: 本发明公开了一种基于关联建模的知识检索问答方法,所述方法包括:构建专利特征提取模型,包括节点单一特征提取模块,节点层级特征提取模块;利用专利特征提取模型可以提取出每个权利要求的层级特征;把各个权利要求输入大语言模型,得到对应的查询,并把查询输入查询特征提取模型,得到权利要求的查询特征;对权利要求的层级特征和查询特征计算损失函数;利用损失函数训练专利特征提取模型和查询特征提取模型;利用训练好的专利特征提取模型和查询特征提取模型进行专利检索问答。本发明通过显式建模专利的权利要求的依赖关系,实现权利要求的有效特征表示,通过对自然语言查询特征和权利要求的层级特征的匹配,实现专利权利要求的检索问答。
-
公开(公告)号:CN117576699A
公开(公告)日:2024-02-20
申请号:CN202311462227.3
申请日:2023-11-06
Applicant: 华南理工大学 , 株洲中车时代电气股份有限公司
IPC: G06V30/148 , G06N3/0464 , G06V10/24 , G06V10/82 , G06V30/19
Abstract: 本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统,包括以下步骤:步骤1,获得机车工单图像数据;步骤2,对机车工单图像数据进行图像预处理得到预处理后的图像数据;步骤3,利用预处理后的图像数据进行文本检测和文本识别;步骤4,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建,获得机车工单图像的文本信息及文本之间的联系;提升了对机车工单信息智能识别的识别精度,实现了机车工单复杂表格的无模板重建;特别在机车工单多类别的识别场景,都能满足机车维修等后勤工作对机车工单识别的高精度性能需求,能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。
-
公开(公告)号:CN117216245B
公开(公告)日:2024-01-26
申请号:CN202311482529.7
申请日:2023-11-09
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的表格摘要生成方法,包括以下步骤:步骤1,将表格的参考摘要进行切分,通过匹配算法得到表格对应的内容行;步骤2,将表格对应的内容行进行两两配对,得到独立内容行与合并内容行;步骤3,获取所述独立内容行与所述合并内容行分别对应的文本摘要;步骤4,将所述分别对应的文本摘要融合在一起,形成整个表格的文本摘要作为最终模型的输出;通过对表格进行跨行合并和将内容行逐行生成摘要的方式,解决了表格存在跨行较多以及单元格数目较多时效果不佳的问题,从而提高了表格生成摘要的鲁棒性和准确性。
-
公开(公告)号:CN117351003A
公开(公告)日:2024-01-05
申请号:CN202311579723.7
申请日:2023-11-24
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于视频动作的多模型集成多相位MRI肿瘤分类方法,包括以下步骤:步骤1,对MRI肿瘤病例数进行划分处理与对MRI三维图像进行预处理;步骤2,通过分类模型获取MRI三维图像的特征图;步骤3,对特征图进行融合并映射到输出类别中得到预测结果;步骤4,重复步骤2和步骤3,获取多个独立且对不同类别具有不同分类能力的模型的预测结果;步骤5,集成多个模型的预测结果从而得到最终的多相位MRI肿瘤分类结果;得到更具鲁棒性和更精准的预测结果,使自动诊断多相位MRI肿瘤分类结果的精准度进一步提高,有效的缓解了医疗数据集中、数据量少、数据集不平衡的问题。
-
公开(公告)号:CN117151111A
公开(公告)日:2023-12-01
申请号:CN202311027442.0
申请日:2023-08-15
Applicant: 华南理工大学
IPC: G06F40/30 , G06F16/33 , G06F18/214 , G06F18/2415
Abstract: 本发明公开了基于感知和语义关联性的文本识别模型可靠性正则方法,包括:利用语义上下文无关的识别模型和预训练语言模型分别获取感知关联序列集和语义关联序列集,构建实例特定的关联序列集;根据关联序列集,联合利用感知和语义关联序列平滑目标序列的损失,以实现更加有效的序列可靠性正则;构建调制函数,根据样本的难易程度自适应调整校准强度,以实现自适应细粒度序列可靠性正则;引入全局平滑因子,联合预测序列与标签序列的KL散度,构建全局校准损失函数,以实现总体的序列可靠性正则;利用最终损失重新训练待校准训练模型,最后得到校准的场景文本识别模型,用于输出预测文本序列及校准的置信度。
-
公开(公告)号:CN116563867A
公开(公告)日:2023-08-08
申请号:CN202310533619.8
申请日:2023-05-12
Applicant: 华南理工大学 , 广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院)
IPC: G06V30/41 , G06V30/164 , G06V30/19 , G06V10/774 , G06V10/82 , G06N3/091
Abstract: 本发明公开了一种用于医疗文档OCR识别的噪声鲁棒主动学习方法,包括:在主动学习样本筛选阶段,该算法首先采用基于最小置信度的筛选方法,通过累乘得到序列整体置信度作为指标,筛选出一批高度不确定的有价值样本;然后,在迭代训练阶段,设计动态噪声标签校正损失函数,该算法在原识别损失基础上引入正则项用以鼓励样本预测概率分布朝着低熵的方向变化,获得一个确信的预测用于校正噪声标签;进一步,算法设计一个动态调控函数控制正则项,在前期分配给使用真实标签的识别损失项更高的权重,而后期则将权重更多地分配到熵最小化项上,鼓励信任低熵预测概率分布,以达到动态校正噪声标签目的。
-
公开(公告)号:CN115620265A
公开(公告)日:2023-01-17
申请号:CN202211631506.3
申请日:2022-12-19
Applicant: 华南理工大学 , 株洲中车时代软件技术有限公司
IPC: G06V20/58 , G06N3/04 , G06N3/08 , G06V10/44 , G06V10/764 , G06V10/82 , G06V30/146 , G06V30/18 , G06V30/19
Abstract: 本发明公开了基于深度学习的机车标志牌信息智能识别方法,包括以下步骤:获得机车标志牌图像数据;对所述的机车标志牌图像进行预分类;根据预分类结果,采用对应的方法进行图像文本识别及分类;获得所述的机车标志牌图像的具体类别及文本信息;所述的预分类结果包括单一文本标志牌、单行文本标志牌、单列文本标志牌和多文本标志牌。本发明实施例实现了机车线路标志牌类别信息与文本信息的智能识别,通过标志牌预分类算法,对不同的预分类采用不同的处理方法,提升了对机车标志牌的识别速度与复杂标志牌的识别精度,并通过融合文本与图像的多模态特征,实现了高精度的具体分类识别和文本信息提取。
-
-
-
-
-
-