用于训练用于模仿演示者的行为的神经网络的方法和装置

    公开(公告)号:CN117441174A

    公开(公告)日:2024-01-23

    申请号:CN202180098842.3

    申请日:2021-05-31

    IPC分类号: G06N3/094 G06N3/0475

    摘要: 本公开内容提供了一种用于训练用于模仿演示者的行为的神经网络(NN)模型的方法。该方法包括:获得表示演示者的用于执行任务的行为的演示数据,演示数据包括状态数据、动作数据和选项数据,其中,状态数据对应于用于执行任务的条件,选项数据对应于任务的子任务,并且动作数据对应于演示者的针对任务执行的动作;基于当前学习的策略来对表示NN模型的用于执行任务的行为的学习者数据进行采样,学习者数据包括状态数据、动作数据和选项数据,其中,状态数据对应于用于执行任务的条件,选项数据对应于任务的子任务,并且动作数据对应于NN模型的针对任务执行的动作,策略由用于确定当前选项的高级策略部分和用于确定当前动作的低级策略部分组成;以及基于演示数据和学习者数据,通过使用生成对抗性模仿学习(GAIL)过程来更新策略。

    抗体生成方法、装置、电子设备及存储介质

    公开(公告)号:CN115376611A

    公开(公告)日:2022-11-22

    申请号:CN202210918638.8

    申请日:2022-08-01

    申请人: 清华大学

    IPC分类号: G16B25/00 C07K16/00 G06N3/08

    摘要: 本发明提供一种抗体生成方法、装置、电子设备及存储介质,其中,所述方法包括S1:获取待处理抗原‑抗体复合物;S2:基于待处理抗原‑抗体复合物得到表示图;S3:基于邻居节点的邻居节点表示和邻居节点坐标对节点进行链内更新,得到链内更新节点表示和链内更新节点坐标;S4:基于链内更新节点表示和链内更新节点坐标对节点进行链间更新,得到链间更新节点表示和链间更新节点坐标和链间更新表示图;S6:链间更新表示图作为表示图执行预设轮数S3至S5得到第一更新表示图;S7:第一更新表示图作为表示图执行预设轮数S3至S6得到目标更新表示图,基于目标更新表示图得到补全互补决定区的抗体。通过本发明使生成的抗体满足抗原特异性要求。

    一种对时间序列进行建模并识别的方法

    公开(公告)号:CN106295703B

    公开(公告)日:2022-03-25

    申请号:CN201610671152.3

    申请日:2016-08-15

    申请人: 清华大学

    摘要: 本发明涉及一种对时间序列进行建模并识别的方法,属于机器学习领域。该方法包括将传感器采集的数据按采集时间先后顺序排列而成的动态数据构成L条时间序列,随机选择L条时间序列中的60%‑80%的N条时间序列作为训练集,剩下的时间序列作为测试集;对训练集中的每一条时间序列采用线性动态系统模型进行建模,并训练集每一条时间序列的特征表示;随机从训练集中抽取J条时间序列作为字典组成字典集,从得到的训练集每一条训练时间序列的特征表示,学习出字典集的每一条时间序列的最优特征表示,同时计算每一条训练时间序列在字典集下的编码系数;用训练集的编码系数训练支持向量机模型,实现对时间序列的识别。本方法大幅降低了数据表示的复杂度,同时显著提高识别精度。