-
公开(公告)号:CN119579416A
公开(公告)日:2025-03-07
申请号:CN202510135348.X
申请日:2025-02-07
Applicant: 南京航空航天大学
IPC: G06T3/4076 , G06N3/045 , G06N3/0464 , G06N3/048 , G06T3/4046 , G06T5/50 , G06T5/60 , G06V10/44 , G06V10/52 , G06V10/80 , G06V10/82 , G06V20/13
Abstract: 本发明公开了一种基于多尺度动态加权的遥感图像时空降尺度方法及系统,包括如下步骤:获取目标地区中一段时间内相同日期的高空间和低空间分辨率图像,并划分为训练集和测试集;构建时空特征强化层级网络,时空特征强化层级网络包括特征提取模块、特征融合模块和特征重构模块;利用训练集训练时空特征强化层级网络,构建并计算多维时空损失函数,通过反向传播对网络内部参数进行优化,利用测试集对优化后的网络进行质量评估,保存训练好的网络;获取某一日期的高空间分辨率图像以及预测日期的低空间分辨率图像,送入训练好的网络进行降尺度处理,获得预测日期的高空间分辨率预测图像。本发明可填补部分日期缺少的高空间分辨率遥感图像。
-
公开(公告)号:CN119579412A
公开(公告)日:2025-03-07
申请号:CN202411654998.7
申请日:2024-11-19
Applicant: 阜阳师范大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0455 , G06N3/08 , G06T5/60 , G06T5/50
Abstract: 本发明公开了一种基于可变形transformer对齐的多尺度调制视频超分重构方法,涉及计算机视觉领域。方法包括:获取视频的浅层特征图序列;采用基于可变形transformer对齐的多尺度调制网络对浅层特征图序列进行处理;所述基于可变形transformer对齐的多尺度调制网络中包括:可变形transformer对齐模块、多尺度调制模块,Swin Transformer混合模块和重建模块;可变形transformer对齐模块用于特征对齐;多尺度调制模块用于多尺度特征融合;Swin Transformer混合模块对调制特征图进行空间特征捕捉;重建模块用于重构高分率图像。本发明提出基于可变形transformer对齐的多尺度调制网络,通过可变形transformer对齐模块与多尺度调制模块结合,在保证重构性能的同时,利用相对较少的网络参数提升了网络的计算效率,平衡了网络的复杂度和性能。
-
公开(公告)号:CN119579408A
公开(公告)日:2025-03-07
申请号:CN202411492260.5
申请日:2024-10-24
Applicant: 浙江工业大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/045 , G06N3/084 , G06V10/44 , G06V10/77 , G06V10/80 , G06V10/766 , G06V10/82 , G06N3/048
Abstract: 本发明涉及涉及图像处理技术领域,公开了一种面向视觉位移测量的轻量级图像超分辨率重建方法,可以显著提高视觉位移测量的精度。首先,该方法面向视觉位移测量为图像超分辨率重建方法确定了一种合适的训练策略:对偶回归策略,该策略能确保重建网络模型输出高分辨率图像的特征点坐标与实际情况一致,从而保证视觉位移测量的稳定性和准确性;同时,该方法引入降采样模块将输入低分辨率图像降采样为特征图,减少推理过程中计算量,并且设计可重参数化的细节增强卷积DEConv减少模型参数量,最终提升模型的推理速度,满足视觉位移测量任务实时处理图像的需求。
-
公开(公告)号:CN119559318A
公开(公告)日:2025-03-04
申请号:CN202410291846.9
申请日:2024-03-14
Applicant: 中山大学
IPC: G06T17/00 , G06T3/4038 , G06T3/4046 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种基于隐式表征的单目图像人体重建方法与系统。包括:获取真实的人体三维模型,渲染得到人体二维图像并随机生成索引值;对人体二维图像使用Multi‑view SMPLify方法,生成人体三维SMPL模型;对人体三维SMPL模型使用基于射线对采样方法,得到表征三维特征的二维特征图;根据索引值,找到对应的角度下的人体二维图像,并将其传入编码器中进行编码,得到像素对齐的二维特征图;将前述两种二维特征图进行拼接,传入全连接神经网络,用深度歧义感知重建损失来训练表征人体曲面的隐函数,输出重建的三维人体模型。本发明能够综合利用基于统计的人体模型的正则化特征和隐式函数拟合任意拓扑结构的优势,并提高特征图分辨率和训练效率,减少时间开销。
-
公开(公告)号:CN119559049A
公开(公告)日:2025-03-04
申请号:CN202411618585.3
申请日:2024-11-13
Applicant: 中国矿业大学
IPC: G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/08 , G06N3/0455
Abstract: 本发明公开了一种基于多域信息增强的图像超分辨率重建方法及装置,涉及单幅图像超分辨率重建技术领域,本发明构建多路大核可分离注意力模块、多路大核注意力模块、高频特征增强模块及局部信息增强注意力模块,并与层归一化整合形成多域信息增强特征提取块从而形成多域信息增强的轻量级图像超分辨率重建网络模型,对模型内浅层特征提取模块、深层特征提取模块及重建模块内的参数集分别训练,使模型内所包含四个模块分别对图像中的局部信息、高频信息、长程信息、横纵方向上的频率成分重点关注,从而能从图像中的整体布局、细节信息、纹理信息及物体形象四个方面提升网络重建图像的质量,使得图像的质量大大提高。
-
公开(公告)号:CN119313671B
公开(公告)日:2025-03-04
申请号:CN202411855179.9
申请日:2024-12-17
Applicant: 四川大学
Inventor: 郜若涵
IPC: G06T7/00 , G06T7/13 , G06T3/4053 , G06T3/4046 , G06T5/70 , G06T5/90 , H04N19/146 , H04N19/587 , H04N19/59 , G10L21/0208 , G10L21/0272 , G10L25/30 , A61B5/16 , A61B5/00
Abstract: 本发明公开了一种基于视觉‑语言多模信息的CCBT系统数据处理方法,涉及抑郁症检测技术领域。该基于视觉‑语言多模信息的CCBT系统数据处理方法,包括以下步骤:数据采集;音频有效性评估;视频有效性评估;优化有效性评估。本发明通过获取的语音特征得到音频有效评估值,基于音频有效评估值判断是否进行音频优化,然后根据获取的视频特征得到视频有效评估值,基于视频有效评估值判断是否进行视频优化,最后根据测试优化后得到的测试数据和测试数据得到优化有效评估值,基于优化有效评估值判断是否进行反馈,提高了CCBT系统中抑郁症诊断数据处理准确性,解决了现有技术中存在CCBT系统中抑郁症诊断数据处理准确性低的问题。
-
公开(公告)号:CN114219738B
公开(公告)日:2025-03-04
申请号:CN202111657697.6
申请日:2021-12-30
Applicant: 中国电建集团中南勘测设计研究院有限公司
IPC: G06T3/4092 , G06T3/4046 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06T5/60
Abstract: 本发明公开了一种单幅图像多尺度超分辨重建网络结构及方法,本发明网络结构包括:特征提取层,输入为原始图像,输出连接空洞卷积神经网络输入层;级联扩张层,输入与空洞卷积神经网络输出层连接;聚合层,用于融合所述特征提取层不同尺度的低层编码信息以及所述级联扩张层的解码信息;重建模块,输入为所述级联扩张层的输出,输出为重建后的图像。本发明采用后端升采样网络将图像映射变换都在低分辨率空间进行,降低了计算复杂度和空间复杂度。
-
公开(公告)号:CN119540031A
公开(公告)日:2025-02-28
申请号:CN202311004717.9
申请日:2023-08-09
Applicant: 每平每屋(上海)科技有限公司
IPC: G06T3/04 , G06T3/4046 , G06T3/4007 , G06T3/4038 , G06T5/50 , G06T9/00 , G06N3/0464 , G06N3/0475 , G06N3/0455 , G06N3/094 , G06N3/096 , G06V10/44 , G06V10/82
Abstract: 本说明书一个或多个实施例公开了一种图像风格迁移模型的训练方法、风格迁移方法及相关装置,该方法包括:对内容图像分别进行切分以及缩放处理,得到多个内容图像块以及一个缩略内容图像,将内容图像块和缩略内容图像以及风格图像输入预设网络模型,基于生成的风格化内容图像块和风格化缩略内容图像确定感知损失,基于感知损失和对抗损失对预设网络模型进行优化调整得到图像风格迁移模型。由于内容图像进行了切分处理,可以适用于任意高分辨率的图像迁移处理,提升风格迁移方案的普适性。而且,由于感知损失是结合缩略内容图像确定,可以引导图像风格迁移模型生成较粗线条和较稀疏纹理的风格迁移图像,改善高分辨率图像效果。
-
公开(公告)号:CN119515687A
公开(公告)日:2025-02-25
申请号:CN202311048974.2
申请日:2023-08-21
Applicant: 四川大学
IPC: G06T3/4076 , G06T3/4046 , G06N3/0464
Abstract: 本发明公开了一种基于双域动态编码的图像超分辨率重建方法。主要包括以下步骤:分别训练不同放大倍数的卷积神经网络模型;将低分辨率图像作为输入,通过上一步骤训练的网络模型,得到最终的重建结果。本发明所述方法可以由低分辨率图像重建出高质量的高分辨率图像,是一种有效的图像超分辨率重建方法。
-
公开(公告)号:CN119478175A
公开(公告)日:2025-02-18
申请号:CN202510062501.0
申请日:2025-01-15
Applicant: 长沙韶光半导体有限公司
IPC: G06T15/00 , G06N3/0464 , G06N3/0475 , G06T15/04 , G06T15/50 , G06T15/60 , G06T3/4046 , G06T3/4053
Abstract: 本发明涉及图形渲染领域,具体涉及一种基于人工智能核心算力的高效图形渲染系统,包括:智能任务解耦模块:对图形渲染任务进行任务解耦;AI增强纹理生成优化模块:学习动态场景变化规律实时生成纹理贴图,在重复纹理区域利用复用算法减少计算开销,同时利用深度卷积神经网络对低分辨率纹理进行超分辨率补偿;AI驱动光照与阴影计算模块:利用AI预测场景中的光照传输路径并重建动态阴影效果,实现高全局光照和阴影模拟;任务结果同步模块:对各子任务输出的渲染数据进行同步;本发明,动态生成高质量纹理贴图并对低分辨率纹理进行超分辨率补偿,通过纹理复用算法避免重复计算,显著减少了计算开销并提升了大规模复杂场景的实时渲染效率。
-
-
-
-
-
-
-
-
-