-
公开(公告)号:CN114118406A
公开(公告)日:2022-03-01
申请号:CN202111262226.5
申请日:2021-10-28
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
摘要: 一种卷积神经网络的量化压缩方法,解决了如何能够在提高压缩比的同时有效保留精度的问题,属于神经网络加速领域。本发明包括:S1、获取卷积神经网络的原始权重张量、输入特征张量以及量化点;S2、将原始权重张量输入至DP结构,DP结构对原始权重张量进行修改,输出修改后的原始权重张量;S3、利用量化点及量化函数对修改后的原始权重张量及除第一层外的原始输入特征张量进行定点量化;利用定点量化后的权重张量和输入特征张量替换原始权值张量和输入特征张量,得到量化后的卷积神经网络;S4、将训练数据输入至量化后的卷积神经网络,计算loss,利用反向传播和梯度下降更新DP结构的参数和原始权重张量,转入S2,进行下一轮,直至训练完成。
-
公开(公告)号:CN113867178A
公开(公告)日:2021-12-31
申请号:CN202111248683.9
申请日:2021-10-26
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05B17/02
摘要: 面向多机器人对抗的虚实迁移训练系统,涉及机器人对抗技术领域,针对现有决策训练过程中,单纯使用真实环境进行决策训练时训练成本较高,安全性较差的问题,本申请通过使用创新的训练方法,大大地减少了决策训练的成本,相比于传统的方法能够更加地充分考虑实际环境中的各种因素,经过该方法训练得到的决策适应度高、所需的训练时间短,决策准确度高,响应速度快等优点。通过该训练方法可以实现机器人在各种复杂环境下快速准确的完成决策训练。
-
公开(公告)号:CN113867178B
公开(公告)日:2022-05-31
申请号:CN202111248683.9
申请日:2021-10-26
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05B17/02
摘要: 面向多机器人对抗的虚实迁移训练系统,涉及机器人对抗技术领域,针对现有决策训练过程中,单纯使用真实环境进行决策训练时训练成本较高,安全性较差的问题,本申请通过使用创新的训练方法,大大地减少了决策训练的成本,相比于传统的方法能够更加地充分考虑实际环境中的各种因素,经过该方法训练得到的决策适应度高、所需的训练时间短,决策准确度高,响应速度快等优点。通过该训练方法可以实现机器人在各种复杂环境下快速准确的完成决策训练。
-
公开(公告)号:CN115454096B
公开(公告)日:2024-07-19
申请号:CN202211227150.7
申请日:2022-10-09
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
摘要: 一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
-
公开(公告)号:CN115454096A
公开(公告)日:2022-12-09
申请号:CN202211227150.7
申请日:2022-10-09
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05D1/02
摘要: 一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
-
公开(公告)号:CN113919485B
公开(公告)日:2024-03-15
申请号:CN202111216476.5
申请日:2021-10-19
申请人: 西安交通大学 , 中国航天科工集团第二研究院
摘要: 本发明公开了一种基于动态层级通信网络的多智能体强化学习方法及系统,方法包括:S100,编码当前时刻观测信息和历史信息,获得当前时刻观测特征和依赖特征,并进行预决策;S200,基于注意力机制,根据预决策信息与观测特征,获取依赖矩阵;S300,基于最小生成树算法,动态生成层级关系网络并进行选择性有向地通信,生成联合决策并与环境交互,收集经验数据;S400,基于线性值分解网络,为每个智能体分配状态‑动作值函数,更新智能体策略网络;S500,基于内在奖励机制,根据演员‑评论家框架更新层级网络参数。在该方法中,多智能体利用动态生成的层级通信网络进行选择性的观测信息和意图信息共享,基于条件状态‑动作值分解网络和内在通信奖励,减少环境的非稳态问题,并对联合策略及层级通信协议进行高效的学习和更新。
-
公开(公告)号:CN112560596B
公开(公告)日:2023-09-19
申请号:CN202011381830.5
申请日:2020-12-01
申请人: 中国航天科工集团第二研究院
发明人: 董博
IPC分类号: G06F18/241 , G06F18/214 , G06F18/213 , G06N3/0475 , G06N3/091 , G06N3/094 , G06N3/0464
摘要: 本发明公开的雷达干扰类别识别方法及系统,属于数据处理技术领域,以解决现有深度学习技术由于实际积累的数据样本量远不能满足深度学习对训练数据的要求,导致深度学习技术在干扰识别领域并未得到广泛应用的问题。方法包括:提取定量的雷达欺骗干扰数据,作为新的特征向量,在特征向量中选取预定数量的特征向量作为训练集;生成样本数据,采用生成对抗网络对样本数据进行训练和调整,得到候选样本数据;采用主动学习算法,对候选样本数据进行优化,在优化后的候选样本数据中选择目标样本,构成目标样本训练集;构建鲁棒性识别模型,基于目标样本集,进行干扰类识别。上述方法计算结果可靠,可具体应用于雷达干扰抑制数据分析中。
-
公开(公告)号:CN113989553A
公开(公告)日:2022-01-28
申请号:CN202111243672.1
申请日:2021-10-25
申请人: 西安交通大学 , 中国航天科工集团第二研究院
摘要: 本发明公开了一种面向图像模式分类的基于含混样本密度估计的证据建模方法及系统,所述方法包括以下步骤:获取拼接后图像的一维向量图像特征;构建属于混合焦元的含混样本;基于构建获得的含混样本,估计出混合焦元在各属性上对应的概率密度函数和单点焦元的概率密度函数;基于获得的概率密度函数,求出待建模样本在每个焦元的概率密度函数上对应的概率密度值,将待建模样本在所有焦元上的概率密度值归一化生成基本信度分配函数。本发明能够直接生成混合焦元的BBA函数,可更直观地对混合焦元进行证据建模,且能够更有效地提升其应用于基于证据组合的图像识别分类时的性能。
-
公开(公告)号:CN113989553B
公开(公告)日:2024-04-05
申请号:CN202111243672.1
申请日:2021-10-25
申请人: 西安交通大学 , 中国航天科工集团第二研究院
IPC分类号: G06V10/764 , G06V10/80 , G06V10/82 , G06T3/4038 , G06N3/0464 , G06N7/01
摘要: 本发明公开了一种面向图像模式分类的基于含混样本密度估计的证据建模方法及系统,所述方法包括以下步骤:获取拼接后图像的一维向量图像特征;构建属于混合焦元的含混样本;基于构建获得的含混样本,估计出混合焦元在各属性上对应的概率密度函数和单点焦元的概率密度函数;基于获得的概率密度函数,求出待建模样本在每个焦元的概率密度函数上对应的概率密度值,将待建模样本在所有焦元上的概率密度值归一化生成基本信度分配函数。本发明能够直接生成混合焦元的BBA函数,可更直观地对混合焦元进行证据建模,且能够更有效地提升其应用于基于证据组合的图像识别分类时的性能。
-
公开(公告)号:CN113267761B
公开(公告)日:2023-06-23
申请号:CN202110592960.1
申请日:2021-05-28
申请人: 中国航天科工集团第二研究院
IPC分类号: G01S7/48 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种激光雷达目标检测识别方法、系统及计算机可读存储介质。该激光雷达目标检测识别方法,对获取的激光雷达点云数据进行二维投影,有效减少后续检测识别的计算量;并且,利用卷积神经网络对二维图像进行目标检测,避免了传统手工设置特征繁琐的工作流程。进一步,基于二维投影图像和三维点云关联的三维目标检测识别法,能够提升模型检测识别的准确性和适用性,进而有效提升检测识别效率,使得整体方案具有算法原理简单、计算结果可靠等特点,可具体应用于激光雷达目标检测识别中,具有广阔的应用价值和市场前景。
-
-
-
-
-
-
-
-
-