大语言模型增强的高效强化学习信用分配方法及装置

    公开(公告)号:CN119443197A

    公开(公告)日:2025-02-14

    申请号:CN202411475138.7

    申请日:2024-10-22

    Applicant: 清华大学

    Abstract: 本申请涉及强化学习技术领域,特别涉及一种大语言模型增强的高效强化学习信用分配方法及装置,其中,方法包括:利用目标大语言模型的先验知识获取目标环境信息中的潜在奖励;基于潜在奖励增强的回报分解方式,将潜在奖励转换为代理奖励;将代理奖励添加至强化学习训练中,以获得大语言模型增强的高效强化学习信用分配结果。由此,解决了相关技术中大语言模型的语言知识与特定任务所需的符号表示之间的存在差异,同时大语言模型推理中存在随机性和幻觉现象,导致模型的信任度较低,降低了强化学习系统的整体性能的问题。

    连续流反应器和水处理方法
    6.
    发明公开

    公开(公告)号:CN117700038A

    公开(公告)日:2024-03-15

    申请号:CN202311871291.7

    申请日:2023-12-29

    Applicant: 清华大学

    Abstract: 本发明提供了一种连续流反应器和水处理方法。尤其适合超纯水中尿素的处理。具体而言,本发明的反应器在所述超纯水流动方向上包括:氯化处理单元,以及与之串联连接的、并在所述氯化处理单元之后设置的紫外处理单元,其中:所述氯化处理单元包括氯化反应位置以及用于向所述氯化反应位置供给氯化试剂的氯化试剂供给部,并且,所述氯化处理单元进一步还包括酸化试剂供给部,所述酸化试剂供给部被设置为在所述氯化试剂被供给之前供给酸化试剂;所述紫外处理单元包括紫外光源部件以及紫外处理位置,所述紫外光源被设置为至少同时发射185nm和254nm波长的紫外光以向流过紫外处理位置的超纯水照射该紫外光。

    一种测井约束下的高维闭环网络地震反演方法

    公开(公告)号:CN113296150A

    公开(公告)日:2021-08-24

    申请号:CN202110752889.9

    申请日:2021-07-02

    Applicant: 清华大学

    Inventor: 陆文凯 王琦

    Abstract: 本发明公开了属于地球物理技术领域的一种测井约束下的高维闭环网络地震反演方法。该方法具体包括如下步骤:步骤1:搭建卷积神经网络;包括一个正演网络和一个反演网络;步骤2:准备训练数据;包括测井波阻抗数据、插值波阻抗数据和合成地震数据;步骤3:训练网络并进行微调:对正演网络和反演网络进行训练,然后将一维的测井数据应用到二维模型和三维模型上,并进行微调;步骤4:预测及评估:首先对地震数据进行反演;然后对反演结果进行正演得到重构地震数据;最后使用该重构地震数据对反演结果的有效性进行评估。本方法无需额外收集输入和参考图像,能够保证良好的横向连续性,精度高于传统及其他深度学习反演方法。

    低温等离子体循环流化床制备氯化聚氯乙烯的方法及装置

    公开(公告)号:CN101654493B

    公开(公告)日:2011-05-11

    申请号:CN200910092928.6

    申请日:2009-09-11

    Applicant: 清华大学

    Abstract: 低温等离子体循环流化床制备氯化聚氯乙烯的方法及装置,用于高分子聚合物氯化聚氯乙烯(氯化聚氯乙烯)的合成。该工艺利用低温等离子体能够同时活化氯气与聚氯乙烯(PVC)表面的特点,在下行床中实现了高效激发聚氯乙烯氯化反应的过程,并进一步在提升管和湍动床中实现表面氯向内部转动迁移的过程,从而将整个氯化过程解耦为快慢两个步骤,生产效率明显优于紫外加氯与水相悬浮法加氯过程。分离了氯化氢的氯气还可以循环利用,整个过程中没有污染物的排放与原料的浪费,因此该过程是一种清洁工艺。

    低温等离子体合成氯化聚氯乙烯的喷动床反应器及其方法

    公开(公告)号:CN101649010B

    公开(公告)日:2011-01-12

    申请号:CN200910092630.5

    申请日:2009-09-18

    Applicant: 清华大学

    Abstract: 低温等离子体合成氯化聚氯乙烯的喷动床反应器及其方法,该反应器主要包括反应器主体,反应器主体顶部的气固分离区和气固分离装置等,在反应器主体内部设有低温等离子体发生装置,该低温等离子体发生装置将反应器主体内部划分成低温等离子体反应区和颗粒下行氯迁移区两部分。本发明所提供的喷动床反应器合成氯化聚氯乙烯的方法,是利用低温等离子体引发聚氯乙烯快速氯化,使聚氯乙烯颗粒在低温等离子体放电区内喷动,发生氯化反应;被气流带出低温等离子体反应区的颗粒在颗粒下行氯迁移区内沉降,实现颗粒的循环氯化。本发明利用低温等离子体手段,在较低温度下同时活化氯气和聚氯乙烯颗粒,优选提高了生产效率和产品质量。

    二维torus网中的无死锁自适应路由方法

    公开(公告)号:CN101267398B

    公开(公告)日:2010-09-01

    申请号:CN200810104406.9

    申请日:2008-04-18

    Applicant: 清华大学

    Inventor: 向东 陈振 王琦

    Abstract: 二维torus网络无死锁的自适应路由方法属于分布式高性能容错计算技术领域,其特征在于,把节点之间的每条物理通道被划分为两条虚拟通道,这两条通道均为两向通道,并分配到二维torus网络的四个虚拟子网中,利用虚拟通道分配策略避免了各子网内以及各子网间可能形成的死锁,同时达到更高的自适应性。本发明与传统的维序路由方法、西向优先和负向优先方法相比,当标准化输入负载和网络中故障节点数提高时,我们的方法明显可以提高网络实际流量,并降低传输延迟,从而提高整个网络的传输性能。

Patent Agency Ranking