强化学习模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN117993473A

    公开(公告)日:2024-05-07

    申请号:CN202410237664.3

    申请日:2024-03-01

    IPC分类号: G06N3/092

    摘要: 本申请提出一种强化学习模型的训练方法、装置、电子设备及存储介质,其中,方法包括:将第一时刻下的样本状态数据输入至PID控制器,由PID控制器输出样本第一动作;获取样本第一动作的样本奖励数据;对第一时刻下的样本状态数据、样本第一动作和样本第一动作的样本奖励数据进行关联,得到第一训练样本;将第一训练样本添加到智能体的强化学习模型的经验池;从经验池中筛选出目标训练样本,并基于目标训练样本,对强化学习模型进行训练。由此,可基于PID控制器生成第一训练样本,并将第一训练样本添加到经验池,以对强化学习模型进行训练,加快了强化学习模型的收敛速度,可自动生成大量的第一训练样本,提高了强化学习模型的鲁棒性。

    一种矿井突水灾害治理系统及方法

    公开(公告)号:CN118564290A

    公开(公告)日:2024-08-30

    申请号:CN202410641240.3

    申请日:2024-05-22

    IPC分类号: E21F16/00

    摘要: 本发明提出一种矿井突水灾害治理系统及方法,所述矿井突水灾害治理系统包括储水器、引流组件、筛板和抽水组件,储水器位于排水巷的低位端的下方,储水器包括壳体和隔板,隔板与壳体相连且置于壳体围成的空腔内,隔板将空腔分隔为沉淀腔和抽水腔,引流组件包括引流板和阻拦板,引流板铺设在排水巷的低位端,阻拦板的下端与引流板邻近储水器的一端相连,筛板在排水巷的高度方向上位于引流组件的下方,筛板的第一端可转动地与壳体相连,筛板的第一端邻近隔板布置,筛板的第一端的部分置于沉淀腔内,筛板与隔板具有间隙,抽水组件包括抽水泵和抽水管路,以便将抽水腔内的水抽出并在地面上排出。本发明的矿井突水灾害治理系统结构简单,排水效率高。

    双绞通信线束和线束总成

    公开(公告)号:CN221530325U

    公开(公告)日:2024-08-13

    申请号:CN202322923298.0

    申请日:2023-10-30

    IPC分类号: H01R13/40 H01R4/02 H01R31/06

    摘要: 本公开实施例提供一种双绞通信线束和线束总成,双绞通信线束包括双绞线束本体和线束接口;线束接口的防护外壳包括前端开口部、中间安装部、后端限位部和固定部;前端开口部形成开口腔;中间安装部设置有与开口腔连通的端子座安装孔;线束接口的端子座包括座本体、限位配合部、固定配合部和多个轴向弹性接线端子;座本体从防护外壳的后部插入到端子座安装孔内;座本体上的端子安装孔的延伸方向平行于端子座安装孔的延伸方向;各个轴向弹性接线端子分别固定于对应的端子安装孔中;双绞线束本体中的通信线缆与轴向弹性接线端子焊接连接。通过设置前述专门线束接口,实现双绞通信线束与对应外部设备接口的可靠连接,保证通信连接的可靠性。