人体胸部平面估计方法和装置
    31.
    发明公开

    公开(公告)号:CN117115363A

    公开(公告)日:2023-11-24

    申请号:CN202311376949.7

    申请日:2023-10-24

    申请人: 清华大学

    发明人: 黄高 蒋昊峻

    摘要: 本公开提供了一种人体胸部平面估计方法和装置,涉及人体姿态估计领域,旨在准确估计人体胸部平面。所述方法包括:获取人体图像的图像特征;将图像特征输入二维胸部分割注意力模型,得到注意力特征;将图像特征输入三维人体姿态估计模型,得到人体姿态特征;对注意力特征和人体姿态特征进行融合处理,得到融合特征;对融合特征进行特征变换,得到人体模型参数;将人体模型参数输入三维人体模型,得到三维人体结构;基于三维人体结构,确定三维空间中的人体胸部平面。

    一种基于自适应推理的视频识别方法和装置

    公开(公告)号:CN114241360A

    公开(公告)日:2022-03-25

    申请号:CN202111402759.9

    申请日:2021-11-23

    申请人: 清华大学

    摘要: 本申请提供了一种基于自适应推理的视频识别方法和装置,属于视频分析技术领域。本申请实施例使用全局特征提取网络提取视频流中的每帧图像的粗粒度全局特征图后,使用策略网络将包含目标物体的初始局部区域图像裁剪出来,再通过局部特征提取网络提取细粒度局部特征图,并对粗粒度全局特征图和细粒度局部特征图进行平均池化和级联操作,得到融合特征向量,最后利用分类器根据融合特征向量,确定当前帧图像的目标局部图像以及目标局部图像对应的预测标签。本申请实施例能够有效识别出每帧图像中信息量最丰富的目标局部图像,并输出对应的预测标签,实现对每帧图像的自适应在线推理,并通过压缩每帧图像的空间冗余信息,有效降低推理时延和计算量。

    肺部影像分类方法、分类网络确定方法及其装置

    公开(公告)号:CN112733959A

    公开(公告)日:2021-04-30

    申请号:CN202110090885.9

    申请日:2021-01-22

    申请人: 清华大学

    IPC分类号: G06K9/62 G06N3/08 G06N3/04

    摘要: 本文公开了一种肺部影像分类网络的确定方法、装置和存储介质,以及肺部影像分类方法、装置和存储介质。其中,所述肺部影像分类网络的确定方法,包括,获取带有标签的肺部影像图片,建立肺部影像数据集;根据所述数据集中的图片和标签对完整的DenseNet网络进行预训练,确定第一部分网络;根据所述第一部分网络,提取所述数据集中各图片的图像特征,对所述图像特征消除共线性,确定各图像特征的权重;根据所述数据集中图片的图像特征和对应的权重,训练第一线性分类器,确定第二部分网络;将所述第一部分网络和所述第二部分网络进行组合,确定为所述肺部影像分类网络。

    一种数字钱包交易方法、装置及系统

    公开(公告)号:CN112613876A

    公开(公告)日:2021-04-06

    申请号:CN202011613061.7

    申请日:2020-12-30

    申请人: 清华大学

    IPC分类号: G06Q20/36 G06Q20/06

    摘要: 本发明实施例公开了一种数字钱包交易方法、装置及系统,该方法包括:在满足设定条件时,检测是否获取到从冷钱包转移资产到热钱包的操作权限信息,操作权限信息包括操作权限码;若是,则将操作权限码和交易信息进行加密以得到加密信息,并将加密信息通过非接触通信方式传递给冷钱包;检测冷钱包通过非接触通信方式传递的反馈信息,在反馈信息包括签名数据时,从冷钱包转移资产到热钱包。本发明实施例公开的数字钱包交易方法、装置及系统,既具有冷钱包的安全存储特性,也具有热钱包的交易便捷特性,能够满足资产量大交易频繁的用户需求。

    神经网络模型中数据处理方法、存储介质和电子装置

    公开(公告)号:CN112598012A

    公开(公告)日:2021-04-02

    申请号:CN202011541149.2

    申请日:2020-12-23

    申请人: 清华大学

    IPC分类号: G06K9/46 G06N3/04

    摘要: 本申请实施例公开了一种神经网络模型中数据处理方法、存储介质和电子装置,其中所述神经网络模型的卷积层采用分情况赋予参数的卷积核,所述方法包括:将卷积层的输入特征图通过预设的寻径函数进行处理,得到所述输入特征图在预设的旋转维度上的空间特征;利用所述空间特征对所述卷积层中的E组卷积权重参数进行空间变换,得到空间变换后的卷积权重参数,其中E为大于等于2的整数;根据所述空间变换后的E组卷积权重参数,获取所述输入特征图的目标卷积权重参数;将所述目标卷积权重参数与所述输入特征图执行卷积运算,得到所述卷积层的输出特征图。

    训练姿态估计模型的方法、装置、姿态估计的方法及装置

    公开(公告)号:CN112418399A

    公开(公告)日:2021-02-26

    申请号:CN202011309347.6

    申请日:2020-11-20

    申请人: 清华大学

    摘要: 本文公开一种训练姿态估计模型的方法、装置、姿态估计的方法及装置,本发明实施例获取包括第一数据集和第二数据集的原始图像数据集;其中,第一数据集中包含的原始图像均进行了人体三维关键点标记;第二数据集中仅小于预设比例的原始图像标记了人体三维关键点;通过采用共用编码器的循环对抗生成网络对第一数据集和第二数据集中的原始图像进行训练,获得了用于姿态估计模型训练的具有多样性的待标记图像;通过共用编码器获得待标记图像的图像特征后,通过关键点检测模型对获得图像特征的图像进行人体三维关键点标记;通过标记的人体三维关键点对姿态估计模型进行参数调整,实现了姿态估计模型的训练。

    一种基于图嵌入的极限学习机的图像降维方法

    公开(公告)号:CN110473140A

    公开(公告)日:2019-11-19

    申请号:CN201910648074.9

    申请日:2019-07-18

    申请人: 清华大学

    发明人: 宋士吉 杨乐 黄高

    摘要: 本发明提出一种基于图嵌入的极限学习机的图像降维方法,属于机器学习和数据挖掘领域。该方法首先选取原始图像样本集合,利用原始图像样本的样本间距离和标签信息构建样本关系矩阵;之后根据构建的样本关系矩阵,首先对输入的向量化图像样本进行随机映射,随后通过最小化加权样本重构误差,来学习特征提取矩阵。最终使用所学习到的特征提取矩阵对向量化图像数据实现数据降维。本发明训练时间短,数据压缩高效,有效提升数据的压缩质量和降维的稳定性。

    训练姿态估计模型的方法、装置、姿态估计的方法及装置

    公开(公告)号:CN112418399B

    公开(公告)日:2024-03-26

    申请号:CN202011309347.6

    申请日:2020-11-20

    申请人: 清华大学

    摘要: 本文公开一种训练姿态估计模型的方法、装置、姿态估计的方法及装置,本发明实施例获取包括第一数据集和第二数据集的原始图像数据集;其中,第一数据集中包含的原始图像均进行了人体三维关键点标记;第二数据集中仅小于预设比例的原始图像标记了人体三维关键点;通过采用共用编码器的循环对抗生成网络对第一数据集和第二数据集中的原始图像进行训练,获得了用于姿态估计模型训练的具有多样性的待标记图像;通过共用编码器获得待标记图像的图像特征后,通过关键点检测模型对获得图像特征的图像进行人体三维关键点标记;通过标记的人体三维关键点对姿态估计模型进行参数调整,实现了姿态估计模型的训练。

    一种视频识别方法
    39.
    发明公开

    公开(公告)号:CN117523454A

    公开(公告)日:2024-02-06

    申请号:CN202311560317.6

    申请日:2023-11-21

    申请人: 清华大学

    摘要: 本公开提供了一种视频识别方法,涉及计算机技术领域,旨在高效地实现视频识别。所述方法包括:将目标视频输入视频识别模型,得到全局特征提取网络输出的目标视频的各个视频帧的全局特征图;将各个视频帧的全局特征图输入策略网络,得到多个目标视频帧;其中,目标视频帧包含的信息量大于非目标视频帧包含的信息量;将每个目标视频帧的全局特征图输入策略网络,得到每个目标视频帧的目标图像区域;其中,目标图像区域包含的信息量大于非目标图像区域包含的信息量;将每个目标视频帧的目标图像区域输入局部特征提取网络,得到每个目标视频帧的局部特征图;将每个目标视频帧的局部特征图输入分类器,得到目标视频的识别结果。

    图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN116403061A

    公开(公告)日:2023-07-07

    申请号:CN202310340521.0

    申请日:2023-03-31

    申请人: 清华大学

    摘要: 本公开提供了一种图像处理方法、装置、电子设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取输入图像的图像向量;从所述图像向量中,获取多个查询矩阵;对所述图像向量进行移动处理,得到按行展开的键值矩阵;根据所述多个查询矩阵和所述键值矩阵,得到每个所述查询矩阵对应的输出矩阵,每个所述查询矩阵对应的输出矩阵包含:所述图像向量对所述查询矩阵的注意力;根据所述多个输出矩阵,输出所述输入图像的图像处理结果。