一种基于值分布DDPG算法的燃煤发电系统协调控制方法

    公开(公告)号:CN116755409B

    公开(公告)日:2024-01-12

    申请号:CN202310812903.9

    申请日:2023-07-04

    Abstract: 本发明公开了一种基于值分布DDPG算法的燃煤发电系统协调控制方法,包括:将燃煤发电系统协调控制问题建模为马尔可夫决策过程;通过Q函数评估长期期望控制代价函数,使用分位数对标量Q值进行分布建模;引入贝尔曼算子的分布型表达式构建目标分布,度量分布之间的1‑Wassertein最小距离,设计分位数损失与最小化分布之间的距离;构建估计网络和目标网络两个行动者‑评论家网络结构,标准化燃煤发电系统的数据样本,采用DDPG算法以实现对值分布的估计和策略的更新,得到协调控制策略。本发明基于系统运行数据和值分布DDPG算法解决了环境复杂不确定性燃煤发电系统协调控制中难以精确建模、缺乏自适应能力等难题。

    一种基于双分类器对抗增强网络的高光谱图像分类方法

    公开(公告)号:CN114723994B

    公开(公告)日:2023-05-23

    申请号:CN202210401324.0

    申请日:2022-04-18

    Abstract: 本发明公开了一种基于双分类器对抗增强网络的高光谱图像分类方法,首先将原始HSI的源域和目标域数据进行向量化并输入BCAAN进行训练,使用源域数据预训练整个网络;然后固定特征生成器,使用目标域数据训练两分类器,使其差异最大;然后固定两分类器,使用目标域数据优化特征生成器,使两分类器差异最小;使用预训练的网络获取目标域数据的伪标签,每个样本对应两个伪标签;把两伪标签相同且输出概率皆大于区分阈值的目标域数据选为可靠样本。使用随机置零的方式对可靠样本进行数据增强,后将可靠的目标域和增强后的数据添加到源域数据中。最后,训练一个epoch后重新采样,基于分类器差异在对抗的过程中对齐源域和目标域,直到模型收敛。

    一种基于批判反思性学习的开放集跨域高光谱图像分类方法和网络

    公开(公告)号:CN119992199A

    公开(公告)日:2025-05-13

    申请号:CN202510085621.2

    申请日:2025-01-20

    Abstract: 本申请公开了一种基于批判反思性学习的开放集跨域高光谱图像分类方法和网络,属于计算机视觉技术领域,包括:对源域数据和目标域数据进行特征提取,获取源域嵌入特征和目标域嵌入特征;将源域嵌入特征和目标域嵌入特征分别输入到教师网络和学生网络,以获取教师网络输出和学生网络输出;将教师网络输出的维度扩充至学生网络输出的维度,得到修正后的教师网络,同时控制学生网络学习修正的教师网络的输出结果,得到修正的学生网络;将目标域嵌入特征输入修正的学生网络,获取对目标域数据的类别预测结果。本申请将教师‑学生的思想引入开放集跨域高光谱图像分类任务,通过教师网络指导使学生网络掌握已知/未知类别的决策边界。

    基于T-S模糊与TD3的慢动态未知燃煤发电系统协调控制方法

    公开(公告)号:CN119536167A

    公开(公告)日:2025-02-28

    申请号:CN202411691750.8

    申请日:2024-11-25

    Abstract: 本发明公开了基于T‑S模糊与TD3的慢动态未知燃煤发电系统协调控制方法,包括以下步骤:首先,利用奇异摄动理论将燃煤发电系统分解为快子系统和慢子系统,将原始的控制任务分解为快子系统的镇定任务和慢子系统的跟踪任务。对于快子系统,利用蒸汽压力的慢变特性,在其定义域上选取模糊集,构建T‑S模糊模型。通过求解多个线性系统对应代数黎卡提方程,得到快子系统控制器。对于慢子系统,采用双Q网络减小Q值的过估计,引入动态学习率和批大小调整机制加速训练收敛,在TD3算法框架下学习得到慢子系统控制输入。快、慢子系统控制输入组合后作用于原系统以获取下一时刻状态信息,智能体与原系统交互进而完成协同优化。

Patent Agency Ranking