一种全局与局部互补的双向注意的视频问答方法与系统

    公开(公告)号:CN114911930B

    公开(公告)日:2024-09-13

    申请号:CN202210393827.8

    申请日:2022-04-15

    申请人: 中山大学

    摘要: 本发明公开了一种全局与局部互补的双向注意的视频问答方法与系统。包括:首先对数据集进行预处理,利用多头自注意力层和卷积层获取具有全局和局部上下文信息的特征,然后利用图注意机制进行聚合,最后通过将获取的特征输入答案预测模块,进行模型训练和预测。本发明利用多头自注意力机制提取完整的全局上下文信息,利用一维卷积神经网络网络提取精确的局部上下文信息,实现更加完整和精确的特征提取。同时,本发明以不同的顺序堆叠多头自注意力层和一维卷积层,使全局信息和局部信息相互补充与融合,实现了特征表示的多步推理过程。本发明通过对答案预测模块的修改,能够在多项视频问答任务中发挥作用,提高精确度,也拓展了应用场景。

    一种利用时间因素的个性化服饰搭配推荐方法与系统

    公开(公告)号:CN113592609B

    公开(公告)日:2024-06-04

    申请号:CN202110940385.X

    申请日:2021-08-17

    申请人: 中山大学

    摘要: 本发明公开了一种利用时间因素的个性化服饰搭配推荐方法与系统。包括:收集数据集,构建异构图,学习服饰和用户的特征表示和服饰搭配的一般规则,学习用户对套装的偏好规则,计算个性化搭配评分,对异构图网络进行训练,得到综合服饰搭配匹配度与用户个人偏好的评分模型,最后用户根据该模型获取个性化服饰搭配推荐。本发明构建异构图神经网络,考虑用户的不同交互行为所包含的对服饰的不同的偏好程度,通过融入用户交互行为时间与服饰节点时间,学习时间因素对用户偏好的影响规律,最后通过用户历史记录与服饰信息、用户对单品的偏好学习用户对套装的偏好,建模服饰与用户的特征表示及内在联系,实现个性化服饰搭配推荐方法。

    基于表面隐函数的单目图像着装人体重建方法与系统

    公开(公告)号:CN114782634B

    公开(公告)日:2024-05-14

    申请号:CN202210500678.0

    申请日:2022-05-10

    申请人: 中山大学

    摘要: 本发明公开了一种基于表面隐函数的单目图像着装人体重建方法与系统。包括:获取高精度着装人体模型并进行渲染和表面采样,运用所述采样点构建训练集,提取所述渲染得到的着装人体图像的特征图和粗预测SMPL,将所述生成的SMPL体素化并使用三维卷积融合各部分的特征,得到三维空间下融合编码后的体素特征,获取给定查询点的混合局部特征,通过图卷积和交叉注意力获取空间中给定查询点的局部点云特征,训练和构建离散点占有率估算模型,生成着装人体模型。本发明具备对输入图像更好的保真性和细节恢复能力;设计的网络保证模型结构的鲁棒性,提高模型对人体图像与3D语义特征的感知和表达能力,并保证重建人体模型的完整性和细致程度,可视化效果更好。

    基于深度学习的人体热湿状态识别和健康预测方法与系统

    公开(公告)号:CN117912703A

    公开(公告)日:2024-04-19

    申请号:CN202410074128.6

    申请日:2024-01-18

    申请人: 中山大学

    摘要: 本发明公开了基于深度学习的人体热湿状态识别和健康预测方法与系统。包括:将生理参数、服装参数、环境参数和活动条件输入热湿生理状态仿真模块,得到人体在不同情境下的仿真热湿传输数据;将所述仿真热湿传输数据和实际采集的个体数据输入基于深度学习的数据集构建模块,得到多模态数据集;将所述多模态数据集输入基于深度学习的识别和预测模块,得到识别。本发明通过深度学习技术、多模态数据整合和注意力机制的运用,提高热湿生理状态的监测和预测的精确性、提前预测生理状态、降低监测成本、提供个性化支持,以改进现有的健康管理方式,为个体用户提供更全面、准确、实用的健康管理解决方案。

    基于表面隐函数的单目图像着装人体重建方法与系统

    公开(公告)号:CN114782634A

    公开(公告)日:2022-07-22

    申请号:CN202210500678.0

    申请日:2022-05-10

    申请人: 中山大学

    摘要: 本发明公开了一种基于表面隐函数的单目图像着装人体重建方法与系统。包括:获取高精度着装人体模型并进行渲染和表面采样,运用所述采样点构建训练集,提取所述渲染得到的着装人体图像的特征图和粗预测SMPL,将所述生成的SMPL体素化并使用三维卷积融合各部分的特征,得到三维空间下融合编码后的体素特征,获取给定查询点的混合局部特征,通过图卷积和交叉注意力获取空间中给定查询点的局部点云特征,训练和构建离散点占有率估算模型,生成着装人体模型。本发明具备对输入图像更好的保真性和细节恢复能力;设计的网络保证模型结构的鲁棒性,提高模型对人体图像与3D语义特征的感知和表达能力,并保证重建人体模型的完整性和细致程度,可视化效果更好。

    基于面部神态识别的老年人身心状态实时评估方法与系统

    公开(公告)号:CN114639140A

    公开(公告)日:2022-06-17

    申请号:CN202210163068.6

    申请日:2022-02-22

    申请人: 中山大学

    发明人: 王若梅 周凡 苏卓

    摘要: 本发明公开了一种基于面部神态识别的老年人身心状态实时评估方法与系统。包括:搭建基于注意力模块的面部表情识别网络框架,基于注意力模块的面部表情识别网络框架包括图像序列、三维卷积Conv3D、三维残差块3D Residual Block、全连接层FC、基于交叉熵损失的Softmax分类器及高效注意力模块EAM Block;根据用户需求构建训练数据集;输入构建好的训练数据集对面部表情识别模型进行训练;将待处理的老人面部表情的视频输入训练好的面部表情识别模型,确定老人的情绪或身心状态。本发明通过构建用于人脸情绪识别的高效注意力模块EAM,对通道和视频不同帧的信息特征进行建模,提高了网络对重要信息的关注度,更加准确和高效地根据老人面部表情视频识别老人身心状态。

    基于低维图像编码与集成学习的白胚布平整度分级方法

    公开(公告)号:CN108038516B

    公开(公告)日:2022-02-01

    申请号:CN201711451486.0

    申请日:2017-12-27

    申请人: 中山大学

    IPC分类号: G06K9/62

    摘要: 本发明实施例公开了基于低维图像编码与集成学习的白胚布平整度分级方法。该方法主要通过特征提取来生成图像编码,然后通过机器学习来生成学习器,最后通过集成学习的思想来综合多个基学习器的结果得到最后结果。实施本发明实施例,使用计算机自动化的方法来对图像平整度进行客观、准确的评级,利用特征中心直方图作为图像编码,极大降低了编码维数,减少学习器计算量;使用集成学习的策略为最后结果提供可靠的保证,从而在节省人工成本的同时降低主观误差,并且在分级结果上能达到资深工程师的评级能力。

    一种基于多特征融合和随机森林模型的新闻故事分割方法

    公开(公告)号:CN112633241A

    公开(公告)日:2021-04-09

    申请号:CN202011638105.1

    申请日:2020-12-31

    申请人: 中山大学

    摘要: 本发明公开了一种基于多特征融合和随机森林模型的新闻故事分割方法。首先以新闻视频作为输入源,进行视觉特征提取和听觉特征提取,包括新闻主题字幕特征提取、直播间特征提取、镜头切换特征提取和静音区特征提取;其次对新闻视频进行语音识别,获得语音识别结果,确定具体候选边界点;接着将语音识别结果作为输入,进行语义特征提取,包括概要匹配特征提取、语义相似度特征提取和文本深度特征提取;再次手动标注新闻视频特征对随机森林模型进行训练,将提取的视频特征值和具体候选边界输入训练好的模型进行目标视频的二分类任务,归类结果为新闻故事单元边界和非边界;最后以归类结果对目标视频进行分割,获得最终的新闻视频故事单元。

    一种基于人体运动热生理的仿真风险评估方法及其系统

    公开(公告)号:CN106446530B

    公开(公告)日:2019-04-26

    申请号:CN201610806593.X

    申请日:2016-09-05

    申请人: 中山大学

    发明人: 余亮 贾楠 王若梅

    IPC分类号: G16H50/30

    摘要: 本发明实施例公开了一种基于人体运动热生理的仿真风险评估方法及其系统,其中,该方法包括:获取仿真计算模型所需的相关输入参数;进行人体热生理状态仿真计算,得到运动条件下人体内核温度和出汗率的动态变化;进行人体心血管功能状态仿真计算,得到运动条件下心率的动态变化;根据所述人体内核温度和出汗率的动态变化和心率的动态变化进行人体健康状态的诊断和环境条件风险的评估。实施本发明实施例,不仅能仿真出运动条件下人体热生理指标的变化,同时也能仿真出运动条件下反映人体心血管功能重要指标的心率的变化,可以对运动过程中人体的重要生理指标进行仿真,能够帮助提供更加准确和完善的运动健康状态诊断和环境条件风险评估。

    基于体素模型的影像重建四边形网格方法及系统

    公开(公告)号:CN109285223A

    公开(公告)日:2019-01-29

    申请号:CN201811044724.0

    申请日:2018-09-07

    申请人: 中山大学

    IPC分类号: G06T17/20

    CPC分类号: G06T17/20

    摘要: 本发明公开了一种基于体素模型的影像重建四边形网格方法,包括:S1,将CT影像转换为文本格式并进行平滑处理;S2,选取灰度值并使用插值法提取出等值点作为点云数据;S3,根据堆叠立方体的方法构建初始体素模型,并对体素模型进行体素优化,通过深度优先搜索提取出体素模型外表面;S4,计算体素模型外表面每个顶点的法向量,通过领域搜索方法查找与法向量最近的一个点云点作为顶点的映射点;S5,将四边形网格的顶点调整到重心后进行重新映射并对四边形网格进行网格塌缩处理。本发明还公开了一种基于体素模型的影像重建四边形网格系统。采用本发明,可直接从点云重建出四边形网格,并可选取不同的体素立方体大小来控制生成的四边形网格精细程度。