-
公开(公告)号:CN118711191A
公开(公告)日:2024-09-27
申请号:CN202410510028.3
申请日:2024-04-26
申请人: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC分类号: G06V30/16 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
摘要: 本发明提出一种应用于扭曲文档的文档图像校正方法及其装置,包括:构建并训练获得基于几何失真和照明表征的文档图像校正模型;将待检测的文档图像信息输入获得的所述校正模型中,得到几何校正后的文档图像,再根据所述文档图像所受的环境光信息区分是否需要进行亮度表征学习;对于所受的环境光信息很差的文档图像,将经过几何表示学习后把图像输入到亮度表征模型中,得到亮度表征学习后的文档图像;对于照明条件良好的图像,则不需要进行亮度表征学习;将输出的文档图像结果,输出至下游任务进行文字识别或者关键信息提取处理。实现对歪曲的和环境光差的文档图像分别进行几何表示和亮度表征学习;同时引入多层注意力机制提高文档图像校正的精度。
-
公开(公告)号:CN118606498A
公开(公告)日:2024-09-06
申请号:CN202410709765.6
申请日:2024-06-03
申请人: 福建火炬电子科技股份有限公司 , 厦门理工学院
IPC分类号: G06F16/532 , G06F16/51 , G06F16/583 , G06F16/55 , G06F40/30 , G06F18/25 , G06F18/213 , G06F18/2433 , G06N3/0464 , G06N3/0455 , G06N3/048
摘要: 本发明公开一种基于文本图像对齐的电容检测报告文档检索方法,提取文档图像的语义特征#imgabs0#和待搜索关键字的语义特征#imgabs1#;图像语义特征#imgabs2#和文本语义特征#imgabs3#融合得到自注意力对齐修正后的概率特征图#imgabs4#;基于所述概率特征图#imgabs5#通过设定阈值Hr得到文档图像的二值图Bm,获取文本框位置;基于概率特征图#imgabs6#通过设定阈值Ht进行特征选择,提取每个文本行的特征区域,构建出概率特征图#imgabs7#上所有存在文本的选择特征集合;基于所述选择特征集合进行GLR预测,得到包含待搜索关键字的位置信息,将位置信息映射到二值图Bm的文本框中,从而得到待搜索关键字在所述输入的文档图像中的位置。此种方法能够实现高效准确地对电容检测报告进行关键词检索和定位。
-
公开(公告)号:CN118606849A
公开(公告)日:2024-09-06
申请号:CN202410511896.3
申请日:2024-04-26
申请人: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC分类号: G06F18/2433 , G06F18/10 , G06F18/214 , G06F40/186 , G06F40/177
摘要: 本申请提出了一种陶瓷电容检测与分析报告自动化生成方法,包括:S1、按照统一的时间戳采集初始数据,初始数据为待测陶瓷电容的性能指标数据,并对初始数据进行预处理;S2、利用多维时间序列异常检测可解释性方法对预处理后的初始数据进行AI训练,得到检测分析模型,检测分析模型由基于深度学习异常检测方法及可解释性方法搭建;S3、利用检测分析模型对经过预处理的初始数据进行分析;S4、根据选择的报告样式生成分析报告并输出。该方法能够利用多维时间序列异常检测可解释性方法自动对陶瓷电容的检测数据进行异常检测分析,生成一份详尽且精确的分析报告,还可以展示生成的陶瓷电容检测与分析报告和提供用户交互功能。
-
公开(公告)号:CN118609147A
公开(公告)日:2024-09-06
申请号:CN202410511895.9
申请日:2024-04-26
申请人: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC分类号: G06V30/412 , G06V30/18 , G06V30/19 , G06N3/0464 , G06N3/0455 , G06N3/08
摘要: 本申请提出了一种基于掩码注意力的电容检验报告表格识别方法,包括:S1、输入含有电容检验报告表格的图像,并对输入的图像进行特征提取;S2、对提取的图像特征进行卷积得到不同尺寸的图像特征,融合不同尺寸的图像特征,并对融合后的图像特征进行反卷积得到适应三个不同尺寸的特征图;S3、对特征图进行n级解码并输出每个单元信息的14个属性。该方法采用了掩码注意力机制的编解码特征学习机制,模型可以直接输出表格的表格结构信息,从而通过后处理可以构造出电容检验报告的完整表格信息,具备准确高效的应用效果,大大提高了电容检验报告分析工作效率和分析报告的准确性。
-
公开(公告)号:CN118898847A
公开(公告)日:2024-11-05
申请号:CN202411390566.X
申请日:2024-10-08
申请人: 厦门理工学院
IPC分类号: G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0464
摘要: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法,包括以下步骤;步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签,以识别阴影区域;步骤S2、通过阴影注意力生成子网络,采用多尺度大核注意力机制,提取阴影特征,获得最优注意力图;步骤S3、对所述最优注意力图和阴影特征进行动态融合;步骤S4、通过细节细化子网络,采用轻量级空间通道卷积计算并恢复图像细节;步骤S5、基于损失函数,通过端到端训练优化网络参数;步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影,同时保留图像细节,并以较低的计算复杂度实现。
-
公开(公告)号:CN118471253B
公开(公告)日:2024-10-11
申请号:CN202410917115.0
申请日:2024-07-10
申请人: 厦门理工学院
摘要: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。
-
公开(公告)号:CN118379501B
公开(公告)日:2024-08-30
申请号:CN202410805765.6
申请日:2024-06-21
申请人: 厦门理工学院
摘要: 本发明提供了大脑动脉环多模态分割中时间语义一致性确保方法、装置,本方法首先,通过引入跨时间对齐和注意力机制,有效整合多模态数据,提高了分割结果的准确性和鲁棒性;其次,开发了时间对齐模块(TAM)和跨时间跨模态注意力模块(CCAM),确保对治疗效果的准确评估;再次,引入了Laplacian Enhanced Fourier Encoder(LEFE),显著提升了对细小和复杂血管结构的检测和分割能力;最后,设计了一种新的损失函数,强制不同模态下的语义一致性,提高了跨模态数据处理的一致性和准确性。
-
公开(公告)号:CN118246070B
公开(公告)日:2024-08-06
申请号:CN202410670082.4
申请日:2024-05-28
申请人: 厦门理工学院
IPC分类号: G06F21/62 , G06V10/764 , G06V10/82 , G06N3/0475 , G06N3/094
摘要: 本发明提供一种基于灰度不变性的双阶段集成可逆对抗攻击方法、装置、设备和介质,涉及图像对抗处理技术领域。其包含步骤S1至步骤S4以根据初始图像生成可逆对抗攻击样本。S1、获取初始图像。S2、通过动量迭代快速梯度攻击法和梯度量化二进制编码对所述初始图像进行白盒攻击,获取第一扰动信息和第一对抗攻击样本。S3、对所述第一对抗攻击样本进行黑盒攻击,对未能成功攻击目标网络的部分样本,采用阈值信息超像素攻击进一步调整扰动,获取第二扰动信息和第二对抗攻击样本。S4、将所述第二扰动信息的扰动矩阵编码为二进制信息流,然后使用可逆数据隐藏技术RDH将所述二进制信息流嵌入所述第二对抗攻击样本,获得最终的双阶段集成可逆对抗攻击样本。
-
公开(公告)号:CN117853945A
公开(公告)日:2024-04-09
申请号:CN202410037867.8
申请日:2024-01-10
申请人: 厦门理工学院
摘要: 本发明涉及一种基于多源信息融合的遥感图像语义分割方法(即MSGFormer)。具体来说MSGFormer包含三个模块首先,MSG(多尺度自注意全局特征融合),通过多尺度卷积将不同大小感受野的特征图通过自注意卷积去除冗余特征,获得长距离依赖关系集成到每个解码器阶段。其次PA(坐标注意力)有效解决了类别之间的位置联系;最后提取解码器的低级语义信息(CNN_Stem)作为支流注入解码器上采样最后一层中作为细节分割补充。本发明方法在两个公开的基准数据集上优于当前最先进的算法。
-
公开(公告)号:CN116758557B
公开(公告)日:2024-04-05
申请号:CN202310738640.1
申请日:2023-06-21
申请人: 厦门理工学院
IPC分类号: G06V30/19 , G06V30/18 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/08
摘要: 本发明提出一种基于浅层图神经网络的联机手写笔画分类方法,包括以下步骤:步骤S1、对联机手写文档的每一个笔画提取若干特征;提取笔画对的若干特征;步骤S2、得到文档笔画的初始图结构;步骤S3、将初始图结构送入边缘分支进行边缘特征学习;步骤S4、将分类结果作为图的邻接矩阵,从而更新图结构;步骤S5、从更新后的图结构的节点特征中提取连通子图特征与全局特征;步骤S6、在更新后的图结构基础上,得到最终的节点特征。对最终的节点特征进行分类,得到版面分析结果。
-
-
-
-
-
-
-
-
-