-
公开(公告)号:CN116912419A
公开(公告)日:2023-10-20
申请号:CN202310898343.3
申请日:2023-07-21
Applicant: 广州大学
Abstract: 本说明书实施例提供了一种基于扩散模型的三维人体重建方法、系统、设备及介质,其中,方法包括:以单目人体自旋转视频为输入,逐帧生成粗糙的法向图;将所述粗糙的法向图通过扩散模型进行去噪声处理,得到精细的法向图;通过所述精细的法向图生成高保真三维数字人体网格模型。本发明利用扩散模型从粗糙的法向图中去噪恢复出精细的法向图,通过法向图辅助网络重建出高保真的三维数字人网格模型,解决了重建精度低、鲁棒性差的问题。
-
公开(公告)号:CN116805345A
公开(公告)日:2023-09-26
申请号:CN202310852666.9
申请日:2023-07-11
Applicant: 广州大学
Abstract: 本发明提供了一种可塑身神经辐射表示的三维人体重建方法及系统,涉及三维重建技术领域,其中,方法包括:使用SMPLify工具进行姿态估计,得到视频中每一帧的姿态及身体形状;将从目标外观体到标准体拆分为由骨架运动驱动的变形和由身体形状驱动的变形,完成从目标外观体到标准体的映射;通过设置低维塑身参数去调整身体形状;根据预设的可塑身的神经辐射场模型,通过从目标外观体到标准体的映射对调整后的身体形状重表示,最终可生成任意视角下的塑身后的视频。以解决三维人体重建的可塑身问题。
-
公开(公告)号:CN116778045A
公开(公告)日:2023-09-19
申请号:CN202310838277.0
申请日:2023-07-07
Applicant: 广州大学
Abstract: 本发明公开了一种神经辐射场数字人生成方法、系统及装置,包括:S1、构建动作和纹理编辑的神经辐射场模型;S2、训练动作和纹理编辑的神经辐射场模型;S3、基于训练好的动作和纹理编辑的神经辐射场模型得到动作和纹理编辑的定制数字人二维图像。本发明可以实现神经辐射场数字人生成方法、系统及装置。
-
公开(公告)号:CN118898749A
公开(公告)日:2024-11-05
申请号:CN202411069550.9
申请日:2024-08-05
Applicant: 广州大学
IPC: G06V10/764 , G06F40/30 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请关于一种基于语义偏移的对抗样本生成方法以及系统。该方法包括:获取原始样本;将原始样本输入对抗生成模型,得到对抗样本;将原始样本输入大语言模型,得到第一语义特征;对对抗样本进行文本特征提取,得到第二语义特征;根据语义损失函数计算第一语义特征和第二语义特征的语义损失;根据语义损失优化对抗生成模型,直至训练完成。本申请通过原始样本和对抗样本之间的语义相似度来构建语义损失函数,最后通过语义损失函数的梯度回传来优化对抗生成模型。因此,本申请能够利用大语言模型生成的深层语义信息,来优化对抗样本的语义特征,使对抗样本远离原始样本的语义空间,从而显著提升了对抗样本应对各种分类器的攻击成功率。
-
公开(公告)号:CN118864281A
公开(公告)日:2024-10-29
申请号:CN202410886402.X
申请日:2024-07-03
Applicant: 广州大学
IPC: G06T5/60 , G06V20/13 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本说明书实施例提供一种基于注意力机制的遥感卫星图像修复模型构建方法及系统,其中,方法包括:获取遥感影像数据集,对其中的图像进行数据增强处理,并将处理后的数据集按照一定比例划分为训练集和测试集;基于U‑net网络,结合Transformer模块构建遥感卫星图像修复网络模型,采用所述训练集对构建的遥感卫星图像修复网络模型进行训练;采用所述测试集对训练好的模型的修复效果进行评估,优化得到最终的修复模型。本发明将Transformer与CNN网络相结合,提升了遥感卫星图像修复的质量,简化了修复过程,提高了修复效率,节省了人力和时间成本,避免了信息丢失或变形的可能性。
-
公开(公告)号:CN118608426A
公开(公告)日:2024-09-06
申请号:CN202410697755.5
申请日:2024-05-31
Applicant: 广州大学
IPC: G06T5/77 , G06T3/4053 , G06T5/60 , G06V10/77 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例提供了一种超分辨率图像复原模型构建方法及系统,其中,方法包括:获取图像数据集,将数据集按照预设比例划分为训练集和测试集;基于预设学习策略对预置高频特征提取器、transformer残差块与图像重组模块进行链接,以构建超分辨率图像复原模型;通过训练集对超分辨率图像复原模型进行训练拟合,获取训练好的超分辨率图像复原模型,基于测试集对训练好的超分辨率图像复原模型进行测试,获得符合要求的超分辨率图像复原模型。本申请通过高频特征提取器提取图像的高频信息,然后使用多维度自注意力机制交互的Transformer进行深层学习,将学习到的信息作为超分辨率图像的像素补充,从而使得超分辨图像更清晰,细节纹理更加丰富和准确,复原效果更好。
-
公开(公告)号:CN116883621A
公开(公告)日:2023-10-13
申请号:CN202310862935.X
申请日:2023-07-13
Applicant: 广州大学
IPC: G06T17/20 , G06V10/764
Abstract: 本发明提供了一种提取3D牙齿网格模型的方法、装置、设备及介质,涉及牙齿网络建模技术领域,其中,方法包括:获取牙齿的CBCT图像,将所述CBCT图像输入预设的检测器获取检测结果,所述检测结果包括:牙齿的中心点、牙齿的大小以及牙齿的分类;根据所述监测结果进行裁剪,将裁剪后的CBCT图像输入预设的金字塔微分变形网络进行网格重建,以获取3D牙齿网格模型。本申请不需要从分割的3D影像中提取网格,不需要复杂的后期处理,直接生成高质量的3D牙齿网格。
-
公开(公告)号:CN116740102A
公开(公告)日:2023-09-12
申请号:CN202310711080.0
申请日:2023-06-15
Applicant: 广州大学
Abstract: 本发明涉及一种基于测地循环的流形人脸网格分割与提取方法,包括:获取流形人脸网格,定义所述流形人脸网格中的特征点以及所述特征点之间的连接关系,根据所述连接关系计算测地线;对所述测地线的路径点进行距离判断,将判断后的所述路径点进行内边分类,获取含有内边的三角形,重三角化所述含有内边的三角形,更新所述流形人脸网格;对更新后所述流形人脸网格进行组合划分,获取测地循环,根据所述测地循环,构造并迭代半边边界,提取所述测地循环所包围的三角形,完成人脸网格分割。本发明中人脸网格分割与提取的边界光滑可控,且是流形的人脸网格分割结果,并且能够通过不同的测地循环组合得到任意的网格分割,从而灵活的表达人脸特征。
-
公开(公告)号:CN115170817A
公开(公告)日:2022-10-11
申请号:CN202210862950.X
申请日:2022-07-21
Applicant: 广州大学
IPC: G06V10/40 , G06V10/80 , G06V10/82 , G06V40/20 , G06V10/46 , G06V10/764 , G06V10/774 , G06V10/25 , G06T17/00 , G06T17/20 , G06N3/04 , G06F3/01
Abstract: 本发明公开了一种基于三维人‑物网格拓扑增强的人物交互检测方法,包括:获取单张图片中的人体与物体的视觉特征;获取单张图片中的人体三维结构与物体三维结构,融合构建初始三维人‑物一体网格拓扑模型;基于增强三维人‑物一体网格拓扑获取三维人体的拓扑特征和三维人‑物的拓扑特征;将视觉特征与拓扑特征融合,获取增强三维人‑物一体网格拓扑模型;对增强三维人‑物一体网格拓扑模型进行训练,并基于训练后的模型获取识别结果。本发明采用了自底而上的拓扑特征提取,在提取三维人体姿态上取得了高效的效果。在HOI检测问题上融合了三维人物体网格特征,有效提高了HOI的识别性能,在HICO_DET基准数据集上取得了较高的精确度。
-
公开(公告)号:CN113780446A
公开(公告)日:2021-12-10
申请号:CN202111086655.1
申请日:2021-09-16
Applicant: 广州大学
Abstract: 本发明公开一种可重参数化的轻量级体素深度学习方法,包括:获取体素网格,将体素网格输入有若干个大小不同卷积核的3DCNN网络进行训练,获得训练好的若干个大小不同的卷积核;将若干个大小不同的卷积核进行重参数化,获得重参数化的3DCNN网络;基于重参数化的3DCNN网络对体素网格进行推理,获得最终体素网格特征。本发明在训练时采用多个卷积核提取体素特征,在推理时会将多个卷积核融合成一个卷积核以减少复杂度,但其推理最终效果不变;本发明基于体素方法采用的是低分辨率,将具有更少的内存占用;模型只对点云扫描一次,从而降低了内存成本和时间成本。
-
-
-
-
-
-
-
-
-