-
公开(公告)号:CN117541866A
公开(公告)日:2024-02-09
申请号:CN202311519087.9
申请日:2023-11-14
申请人: 西北大学
IPC分类号: G06V10/764 , G06V10/20 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种轻量型平衡胶囊网络模型的瓷器碎片分类方法,包括如下步骤:步骤1、采集和构建瓷器碎片图像数据集;步骤2、对瓷器碎片图像进行预处理;步骤3、先在胶囊网络的普通卷积层和主胶囊层之间引入一个轻量化通道变换模块ChannelTrans,再结合焦点损失focal loss设计损失函数MF‑R loss,然后利用动态学习率对原始动态路由进行自适应改进,从而构建出用于对陶瓷碎片进行分类的轻量型平衡胶囊网络模型;步骤4、整合并训练轻量型平衡胶囊网络模型;步骤5、利用训练好的轻量型平衡胶囊网络模型预测出图像分类结果,提高了对陶瓷图像分类的准确率。
-
公开(公告)号:CN116506870A
公开(公告)日:2023-07-28
申请号:CN202310405570.8
申请日:2023-04-14
申请人: 西北大学
IPC分类号: H04W24/02 , H04W24/06 , H04W12/122 , G06N3/0464 , G06N3/098
摘要: 本申请涉及一种智能反射面辅助隐蔽空中计算的无线联邦学习方法,利用智能反射面来实现隐蔽的基于空中计算的联邦学习,可以设计反射相位和幅度来提升接入点处的信号,并降低窃听者处的窃听性能,从而提高基于隐蔽空中计算的联邦学习系统的性能;本申请通过在一定的均方误差要求和隐蔽约束下选择更多的用户设备,实现了更低的训练损失和更高的测试精度。
-
公开(公告)号:CN118072174A
公开(公告)日:2024-05-24
申请号:CN202410253656.8
申请日:2024-03-06
申请人: 西北大学
IPC分类号: G06V20/10 , G06V10/30 , G06V10/34 , G06V10/44 , G06V10/42 , G06V10/764 , G06V10/82 , G06V10/77 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于毫米波雷达的深度学习细粒度材质识别方法,包括如下步骤:1、构建基于深度学习网络模型的细粒度材质识别系统RF‑MID,包括数据重组模块、信号预处理模块、材料特征提取模块和分类器模块;2、数据重组模块将毫米波雷达接收到的反射信号重组为三维数据块;3、信号预处理模块采用变分自编码器模型对输入的三维数据块进行预处理去噪;4、材料特征提取模块利用三维复值膨胀卷积网络从预处理后三维数据块提取高维特征信息,生成表征材质差异的特征图;5、分类器模块对提取的特征图进行压缩,得到用于输出材料类别分数的一维材质类别特征,从而对细粒度材质进行识别,能够准确高效地识别多种不同形状物料的细粒度材质。
-
公开(公告)号:CN114677631B
公开(公告)日:2024-03-12
申请号:CN202210430266.4
申请日:2022-04-22
申请人: 西北大学
IPC分类号: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 一种基于多特征融合及多阶段训练的文化资源视频中文描述生成方法,包括从外观、运动、语义和音频方面提取多维特征,以增强编码器的内容表示能力;构造编码器,进行多特征的融合;构造解码器,进行词句的预测生成;采取多阶段训练策略进行模型训练。本发明使用最新提出的大规模多语言视频描述数据集VATEX,解决了以往视频描述只有英语数据集的问题,使用多特征融合方法进行编码,模型训练采取多阶段训练策略,避免了“曝光偏差”问题。
-
公开(公告)号:CN116958671A
公开(公告)日:2023-10-27
申请号:CN202310865555.1
申请日:2023-07-14
申请人: 西北大学
IPC分类号: G06V10/764 , G06V10/774 , G06V10/778 , G06V10/766
摘要: 本申请涉及一种全监督目标检测模型构建方法及装置,立足于全监督数据集,大幅提升了该领域中模型的训练效率以及检测性能,并降低了训练所需资源;此外,使用递归复用教师模型进行自训练,关联上下文信息,进而为学生模型提供高质量伪标签;并且,Transformer模块通过添加额外的框回归任务,帮助模型提高学习稳定性。
-
公开(公告)号:CN114677631A
公开(公告)日:2022-06-28
申请号:CN202210430266.4
申请日:2022-04-22
申请人: 西北大学
摘要: 一种基于多特征融合及多阶段训练的文化资源视频中文描述生成方法,包括从外观、运动、语义和音频方面提取多维特征,以增强编码器的内容表示能力;构造编码器,进行多特征的融合;构造解码器,进行词句的预测生成;采取多阶段训练策略进行模型训练。本发明使用最新提出的大规模多语言视频描述数据集VATEX,解决了以往视频描述只有英语数据集的问题,使用多特征融合方法进行编码,模型训练采取多阶段训练策略,避免了“曝光偏差”问题。
-
-
-
-
-