-
公开(公告)号:CN117540214A
公开(公告)日:2024-02-09
申请号:CN202311677765.4
申请日:2023-12-07
Applicant: 吉林大学
IPC: G06F18/214 , G06N20/00 , G06F17/18 , G06F18/211
Abstract: 本说明书公开了一种智能体训练方法、装置、存储介质及电子设备,其中方法包括:获取环境向量、智能体的局部状态向量和动作向量进行拼接,得到智能体的全局向量,采用对比模块对全局向量进行计算,得到目标向量,采用集成评价网络对目标向量进行评价得到样本评分,对样本评分进行处理得到预估评分,计算对比模块、策略网络和集成评价网络的损失函数,基于损失函数对网络参数进行调整,直至损失函数指示收敛,得到训练完成的对比模块、策略网络和集成评价网络,采用本说明书,采用对比模块辅助评价网络进行训练增加额外的损失函数,提高目标向量的表示能力,并通过集成式评价网络减少预估时产生的误差,提高了智能体训练模型的样本训练效率。
-
公开(公告)号:CN117477738A
公开(公告)日:2024-01-30
申请号:CN202311425124.X
申请日:2023-10-31
Applicant: 吉林大学
Abstract: 本发明涉及一种基于复合发电机的脚踏车能量收集及氛围渲染系统,该系统包括整流电路盒,其输出端连接低功率小音箱、充电宝充电座和低功率里程表为其供电起氛围渲染作用,其输入端连接复合发电机起能量存储作用。V形支撑板固定连接在普通碟刹夹器上,其凹槽内置串联的铜质线圈。V形支撑板上固定外附PTFE材料的铜质摩擦滑轮组。碟式刹车盘长形通孔内附PET材料,其圆形通孔内置柔性圆形磁体片。骑行时通过摩擦起电和电磁感应原理两倍地收集脚踏车轮转动的机械能为整流电路盒充电,进而实现自供电的氛围渲染系统。本系统将脚踏车骑行的机械能收集起来合理利用,在节能减排方面,一定程度上起积极作用,同时改善了中长期骑行用户的体验。
-