-
公开(公告)号:CN115719051A
公开(公告)日:2023-02-28
申请号:CN202211415888.6
申请日:2022-11-12
Applicant: 福州大学
IPC: G06F30/3947 , G06F30/3953 , G06N3/02 , G06N3/084 , G06N20/00
Abstract: 本发明提出基于深度强化学习的轨道分配方法,可提高超大规模集成电路设计布线阶段的轨道分配质量,所述方法采用双深度Q网络(Double Deep Q‑Network,DDQN)算法统筹所有布线层、所有导线以及所有轨道的状态,该算法引入奖赏函数,将动作和状态相互映射,通过计算导线在不同状态下的重叠成本和障碍成本来评估重叠成本和障碍成本是增加或是减少,以此来区分是反馈正向奖赏或是负向奖赏,从而持续提升策略神经网络选取动作的合理性,同时利用策略神经网络和ε‑greedy算法共同选取动作,利用目标神经网络来更新Q值,以防止算法陷入局部最优;本发明提升了算法的运行速度和效率,能提高布线方案的可布线性。