一种基于可变形transformer对齐的多尺度调制视频超分重构方法

    公开(公告)号:CN119579412A

    公开(公告)日:2025-03-07

    申请号:CN202411654998.7

    申请日:2024-11-19

    Abstract: 本发明公开了一种基于可变形transformer对齐的多尺度调制视频超分重构方法,涉及计算机视觉领域。方法包括:获取视频的浅层特征图序列;采用基于可变形transformer对齐的多尺度调制网络对浅层特征图序列进行处理;所述基于可变形transformer对齐的多尺度调制网络中包括:可变形transformer对齐模块、多尺度调制模块,Swin Transformer混合模块和重建模块;可变形transformer对齐模块用于特征对齐;多尺度调制模块用于多尺度特征融合;Swin Transformer混合模块对调制特征图进行空间特征捕捉;重建模块用于重构高分率图像。本发明提出基于可变形transformer对齐的多尺度调制网络,通过可变形transformer对齐模块与多尺度调制模块结合,在保证重构性能的同时,利用相对较少的网络参数提升了网络的计算效率,平衡了网络的复杂度和性能。

    一种基于隐式表征的单目图像人体重建方法与系统

    公开(公告)号:CN119559318A

    公开(公告)日:2025-03-04

    申请号:CN202410291846.9

    申请日:2024-03-14

    Applicant: 中山大学

    Abstract: 本发明公开了一种基于隐式表征的单目图像人体重建方法与系统。包括:获取真实的人体三维模型,渲染得到人体二维图像并随机生成索引值;对人体二维图像使用Multi‑view SMPLify方法,生成人体三维SMPL模型;对人体三维SMPL模型使用基于射线对采样方法,得到表征三维特征的二维特征图;根据索引值,找到对应的角度下的人体二维图像,并将其传入编码器中进行编码,得到像素对齐的二维特征图;将前述两种二维特征图进行拼接,传入全连接神经网络,用深度歧义感知重建损失来训练表征人体曲面的隐函数,输出重建的三维人体模型。本发明能够综合利用基于统计的人体模型的正则化特征和隐式函数拟合任意拓扑结构的优势,并提高特征图分辨率和训练效率,减少时间开销。

    一种基于多域信息增强的图像超分辨率重建方法及装置

    公开(公告)号:CN119559049A

    公开(公告)日:2025-03-04

    申请号:CN202411618585.3

    申请日:2024-11-13

    Abstract: 本发明公开了一种基于多域信息增强的图像超分辨率重建方法及装置,涉及单幅图像超分辨率重建技术领域,本发明构建多路大核可分离注意力模块、多路大核注意力模块、高频特征增强模块及局部信息增强注意力模块,并与层归一化整合形成多域信息增强特征提取块从而形成多域信息增强的轻量级图像超分辨率重建网络模型,对模型内浅层特征提取模块、深层特征提取模块及重建模块内的参数集分别训练,使模型内所包含四个模块分别对图像中的局部信息、高频信息、长程信息、横纵方向上的频率成分重点关注,从而能从图像中的整体布局、细节信息、纹理信息及物体形象四个方面提升网络重建图像的质量,使得图像的质量大大提高。

    一种基于视觉-语言多模信息的CCBT系统数据处理方法

    公开(公告)号:CN119313671B

    公开(公告)日:2025-03-04

    申请号:CN202411855179.9

    申请日:2024-12-17

    Applicant: 四川大学

    Inventor: 郜若涵

    Abstract: 本发明公开了一种基于视觉‑语言多模信息的CCBT系统数据处理方法,涉及抑郁症检测技术领域。该基于视觉‑语言多模信息的CCBT系统数据处理方法,包括以下步骤:数据采集;音频有效性评估;视频有效性评估;优化有效性评估。本发明通过获取的语音特征得到音频有效评估值,基于音频有效评估值判断是否进行音频优化,然后根据获取的视频特征得到视频有效评估值,基于视频有效评估值判断是否进行视频优化,最后根据测试优化后得到的测试数据和测试数据得到优化有效评估值,基于优化有效评估值判断是否进行反馈,提高了CCBT系统中抑郁症诊断数据处理准确性,解决了现有技术中存在CCBT系统中抑郁症诊断数据处理准确性低的问题。

    一种基于人工智能核心算力的高效图形渲染系统

    公开(公告)号:CN119478175A

    公开(公告)日:2025-02-18

    申请号:CN202510062501.0

    申请日:2025-01-15

    Inventor: 高杰 贺先要 提干

    Abstract: 本发明涉及图形渲染领域,具体涉及一种基于人工智能核心算力的高效图形渲染系统,包括:智能任务解耦模块:对图形渲染任务进行任务解耦;AI增强纹理生成优化模块:学习动态场景变化规律实时生成纹理贴图,在重复纹理区域利用复用算法减少计算开销,同时利用深度卷积神经网络对低分辨率纹理进行超分辨率补偿;AI驱动光照与阴影计算模块:利用AI预测场景中的光照传输路径并重建动态阴影效果,实现高全局光照和阴影模拟;任务结果同步模块:对各子任务输出的渲染数据进行同步;本发明,动态生成高质量纹理贴图并对低分辨率纹理进行超分辨率补偿,通过纹理复用算法避免重复计算,显著减少了计算开销并提升了大规模复杂场景的实时渲染效率。

Patent Agency Ranking