-
公开(公告)号:CN115797843A
公开(公告)日:2023-03-14
申请号:CN202211604281.2
申请日:2022-12-13
申请人: 杭州亚体智能科技有限公司
IPC分类号: G06V20/40 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/048 , G06N3/08 , G06N3/0464 , G06N3/0442
摘要: 本发明公开了一种基于深度学习运动训练视频分类系统及方法,系统包括:输入端的下采样处理模块;主分支模块,用于接收输入端的下采样处理模块降维后的图像帧并提取全局特征;第一辅助分支模块,用于提取第一局部特征图;第二辅助分支模块,用于提取特征并恢复维度输出第二局部特征图;特征融合模块,用于将全局特征、第一局部特征图和第二局部特征图按维度方式进行特征融合并输出融合的特征图;分类网络模块,用于将融合的特征图结合视频标签进行训练并分类。本发明解决了运动训练视频中目标运动的随机性导致分类准确率低的问题。
-
公开(公告)号:CN116847042A
公开(公告)日:2023-10-03
申请号:CN202310404448.9
申请日:2023-04-11
申请人: 杭州亚体智能科技有限公司
IPC分类号: H04N5/265 , G10L25/24 , G10L21/0356 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种艺术体操动作生成方法,包括:对专业的艺术体操运动员进行动作捕捉;先进行音频特征提取,将音频特征分为音频片段;艺术体操动作捕捉视频分为视频片段;将音频片段和体视频片段进行数据归一化,再输入至生成扩散模型中,进行模型训练;对每个艺术体操片段生成的体操动作和音频的适配性进行打分,得分最高的艺术体操片段作为生成片段保留;使用损失函数结合动量梯度下降法算法对数据集的视频进行训练,得到艺术体操动作生成模型,输入音频通过模型得到艺术体操动作视频。本发明使用了生成扩散模型用于艺术体操的,相比于GAN等神经网络模型具有长期建模能力,能够生成长期稳定的动作序列。
-