-
公开(公告)号:CN118605547A
公开(公告)日:2024-09-06
申请号:CN202410563913.8
申请日:2024-05-08
申请人: 中国电子科技集团公司第五十四研究所 , 北京交通大学
IPC分类号: G05D1/46 , G05D109/20
摘要: 本发明公开了一种基于互馈学习的无人机具身智能安全决策方法,即获取多个连续时间点拍摄的无人机拍摄图像;基于多个连续时间点拍摄的无人机拍摄图像,获得多个基础环境信息;根据多个连续时间点的环境物体位置,判断环境物体为静止或为运动;若环境物体为运动,根据多个连续时间点的无人机拍摄图像和基础环境信息,通过环境匹配网络和时间判别网络,得到环境物体运动速度、环境物体运动方向和环境物体相隔距离;根据所述环境物体运动速度、环境物体运动方向和环境物体相隔距离,进行安全决策。此决策方法提高了无人机具身智能感知环境数据的准确性,在此基础上,判断无人机是否将会发生碰撞,以控制无人机停止,提高了高智能安全决策的准确性。
-
公开(公告)号:CN118135431A
公开(公告)日:2024-06-04
申请号:CN202410069716.0
申请日:2024-01-18
申请人: 中国电子科技集团公司第五十四研究所 , 北京交通大学
IPC分类号: G06V20/17 , G06V10/74 , G06V10/75 , G06T5/50 , G06T7/10 , G06V10/764 , G06V10/80 , G06N3/0464
摘要: 本发明公开了一种基于多尺度结构方向的无人机多模态匹配方法及系统,采用多模态的无人机拍摄的待检测目标的图像提供更多的特征进行检测,使用超体素分割对多模态的图像进行分割,连续不同时间的待检测目标的图像用于动态的变化情况判断,再静态判断待检测目标在姿态变化的无人机中的设备中拍摄的角度,能够更加准确地判断待检测目标的拍摄角度,从而更加准确的在相同位置构建不同特征的三维图,从而进行特征融合。由融合的特征对超体素分离的结构区域进行结构特征的提取,按照不同结构进行加权,按照加权特征进行模板匹配能够更加准确的按照局部结构和融合后的整体结构对待检测目标进行匹配,使得注重结构地对待检测目标进行准确的匹配。
-
公开(公告)号:CN116563145B
公开(公告)日:2024-04-05
申请号:CN202310463009.5
申请日:2023-04-26
申请人: 北京交通大学
摘要: 本发明提供一种基于颜色特征融合的水下图像增强方法及系统,属于水下图像处理技术领域,并为不同通道的信息设定大小不同的丢弃比例,生成各个通道的残差,将三个通道的特征信息进行融合,利用可变形卷积提取更加多样化的特征信息,采用一个残差连接将普通卷积和可变形卷积的特征融合;引入原始输入图像各个颜色通道的信息,让模型的训练能够更加稳定。本发明给不同颜色通道的信息分配不同大小的感受野,得以更好地学习图像的全局和局部特征,同时结合通道‑空间注意力机制对水下图像各个通道的信息进一步细化,利用可变形卷积的灵活性来捕捉更加丰富的特征信息,以防止增强结果出现纹理损坏或平滑伪影等问题,提高算法的鲁棒性和可靠性。
-
公开(公告)号:CN116980590A
公开(公告)日:2023-10-31
申请号:CN202310646825.X
申请日:2023-06-02
IPC分类号: H04N19/105 , H04N19/119 , H04N19/176 , H04N19/186 , H04N19/593
摘要: 一种用于对IBC参考区域的自适应选择的方法,包括:确定对当前CU使用IBC编码模式;以及如果当前CU的宽度和高度均小于32,则按照如下三个优先级别和每个优先级内的CTU顺序,对当前CU所在CTU位置(m,n)的周围区域进行基于哈希匹配的搜索,并在找到匹配区域后不进行下一优先级和CTU的搜索:第一优先级:(m‑2,n)处的CTU,第二优先级:(m‑1,n‑1)、(m,n‑1)和(m+1,n‑1)处的CTU,以及第三优先级:(m,n‑2)和(m+1,n‑2)处的CTU。
-
公开(公告)号:CN113709455B
公开(公告)日:2023-10-24
申请号:CN202111138182.5
申请日:2021-09-27
申请人: 北京交通大学
IPC分类号: H04N19/103 , H04N19/20 , H04N19/30 , H04N19/42
摘要: 本发明公开一种使用Transformer的多层次图像压缩方法,以Transformer模块为主,辅之以卷积层神经网络的多层次的图像压缩框架,Transformer模块包括多层编码器组件组件、解码器组件,编码端采用编码器组件,解码端采用解码器组件;解码器拥有交叉注意力机制,该交叉注意力机制将解码器的输入的自注意力特征与编码器的自注意力特征进行联合计算,对压缩压缩框架编码器的编码端学习到的特征充分利用。本发明保留了Transformer中的解码器组件及其交叉注意力机制,应用在解码端以实现对编码端学习到的特征的充分利用,达到更好的效果。且本发明框架对硬件的需求更小。
-
公开(公告)号:CN116704552A
公开(公告)日:2023-09-05
申请号:CN202310697045.8
申请日:2023-06-13
申请人: 中国电子科技集团公司第五十四研究所 , 北京交通大学
IPC分类号: G06V40/10 , G06V10/40 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了基于主要次要特征的人体姿态估计方法,属于人工智能技术领域。本发明首先构建人体姿态估计模型,然后使用训练数据集对人体姿态估计模型进行训练,最后,使用训练好的人体姿态估计模型进行人体姿态估计,得到人体关键点热图。本发明的人体姿态估计模型引入了一种主次特征划分机制,对于主要、次要特征引入了基于自注意力机制的特征增强模块,对次要特征进行动态激活从而获得完整的目标特征,能够提高人体姿态估计的准确率。
-
公开(公告)号:CN116684578A
公开(公告)日:2023-09-01
申请号:CN202310646540.6
申请日:2023-06-02
IPC分类号: H04N19/103 , H04N19/513 , H04N19/57 , H04N19/96
摘要: 一种用于仿射模式帧间预测的方法,包括:在构造当前CU的仿射运动估计候选列表时,考虑如下运动矢量:当前CU的左下方紧邻块的左侧第一块和左侧第二块、当前CU右上方紧邻块的上方第一块和左侧第二块、当前CU上方最右侧紧邻块的左侧第一块、当前CU左侧最下方紧邻块的上方第一块;以及基于候选列表是否被填满,来在候选列表中加入零运动矢量。
-
公开(公告)号:CN110969089B
公开(公告)日:2023-08-18
申请号:CN201911059976.5
申请日:2019-11-01
申请人: 北京交通大学
IPC分类号: G06V40/16 , G06V10/82 , G06N3/0464
摘要: 本发明提供了一种噪声环境下的轻量级人脸识别系统及识别方法,属于计算机人脸识别技术领域,首先,输入噪声图片,使用3×3卷积核提取特征,然后添加去噪块,对卷积层提取到的特征进行特征去噪,然后使用深度可分离卷积,以及十层瓶颈结构,最后通过1×1卷积和线性全局深度可分离卷积得到输出特征。本发明提出了可以方便的与任何卷积神经网络结构相结合的有效独立的去噪声模块‑‑LD‑MobileFaceNet;在去噪操作中,采用非局部均值去噪方法提高了MobileFaceNet的性能,提高了噪声环境下的人脸识别准确率;移除了网络中部分的瓶颈层,使系统更加轻量化,在噪声数据集上实现了更好的鲁棒性;非线性激活函数swish代替PReLU,弥补了识别精度的损失,保证了不同噪声等级下的识别准确率。
-
公开(公告)号:CN116563800A
公开(公告)日:2023-08-08
申请号:CN202310463003.8
申请日:2023-04-26
申请人: 北京交通大学
IPC分类号: G06V20/54 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0495 , G06N3/08
摘要: 本发明提供一种基于轻量化YOLOv3的隧道内车辆检测方法及系统,属于目标检测技术领域,采集隧道内车辆图像构建数据集tunnel_img;基于YOLOv3算法,将Backbone替换成轻量化模型MobileNetV2,减小网络模型的体积,提升检测速度;在此基础上,添加高效通道注意力模块ECA,增加网络视野,对重要特征进行强化来提升隧道场景检测准确率。本发明训练后的模型在保证检测效果的前提下,体积参数远小于基础模型,能够在计算力不强,存储能力有限的隧道终端上部署应用,相较与之前传统的虚拟检测区域的技术,本发明可以快速识别检测对象,提高检测效率和部署数量。
-
公开(公告)号:CN116437089A
公开(公告)日:2023-07-14
申请号:CN202310675512.7
申请日:2023-06-08
申请人: 北京交通大学 , 航天恒星科技有限公司
IPC分类号: H04N19/124 , H04N19/172 , H04N19/20 , H04N19/57 , H04N19/87 , H04N19/88 , H04N13/128
摘要: 本发明提出一种基于关键目标的深度视频压缩算法,模型主要包括两部分。第一部分是基于长短期注意力机制的语义分割网络,该模块利用长期注意力机制和短期注意力机制以聚合目标的信息并学习时间平滑性,生成高质量的特征图,最后,通过解码器输出带有语义信息的帧序列。第二部分是基于残差编码的深度视频压缩网络DVC,通过对输入帧序列做运动估计提取运动信息,并将运动编解码后的运行信息做残差,然后对残差进行压缩,最后将重建的残差与运动信息相加重建帧序列。
-
-
-
-
-
-
-
-
-