一种模型训练方法和解决特定领域问题的方法

    公开(公告)号:CN117852654B

    公开(公告)日:2024-09-03

    申请号:CN202410166430.4

    申请日:2024-02-05

    申请人: 清华大学

    摘要: 本申请涉及一种模型训练方法和解决特定领域问题的方法,其中,模型训练方法包括:获取第一样本数据;第一样本数据包括N个第一问题文本和N个第一答案文本;根据第一样本数据和第一大语言模型,得到N个第一知识文本;根据第一样本数据中的至少部分数据和N个第一知识文本中的至少部分数据,对第一中间语言模型继续进行训练,得到第一语言模型;本申请提供的模型训练方法通过预训练一个应用于特定领域的小型语言模型,并利用大语言模型生成伪数据对该小型语言模型进行调整,可以得到能够生成针对特定领域问题的相关知识的第一语言模型,第一语言模型可以帮助大语言模型解决特定领域问题,提高大语言模型解决特定领域问题的能力。

    一种预训练语言模型的训练方法及装置

    公开(公告)号:CN116561574A

    公开(公告)日:2023-08-08

    申请号:CN202310431071.6

    申请日:2023-04-20

    申请人: 清华大学

    摘要: 本申请涉及一种预训练语言模型的训练方法及装置,其中,预训练语言模型包括编码器及至少一个解码器,该方法包括:获取法律文书样本;法律文书样本包括表示基本事实的第一文本;对第一文本中的至少一个字符进行替换处理,得到第一替换文本;根据标志符和第一替换文本对编码器进行训练,并根据基本事实向量和第二文本对至少一个解码器进行训练;其中,基本事实向量为编码器输出的表征第一文本语义的向量,第二文本为法律文书样本中除所述第一文本以外的文本;本申请提供的预训练语言模型的训练方法可以捕获法律文书不同结构之间的联系,增强预训练语言模型对关键法律要素的理解,提升预训练语言模型在法律领域的检索效果。

    DHA或其衍生物在制备冠状病毒抑制剂中的应用

    公开(公告)号:CN114469919A

    公开(公告)日:2022-05-13

    申请号:CN202210354844.0

    申请日:2022-04-06

    申请人: 清华大学

    发明人: 李海涛 项斌

    摘要: 本发明公开了DHA或其衍生物在制备冠状病毒抑制剂中的应用,属于医用配制品领域。本发明还公开了一种冠状病毒抑制剂,所述冠状病毒抑制剂包括DHA或其衍生物和抗冠状病毒的抗体,所述冠状病毒可为β属冠状病毒,如SARS‑CoV‑2。本发明提供的试验结果表明DHA可影响RBD热变温度,降低RBD蛋白的稳定性;同时,DHA或其衍生物与抗新冠抗体联用可提高抗体的中和率。

    用于安装抛光垫的装置
    4.
    发明授权

    公开(公告)号:CN107127679B

    公开(公告)日:2019-09-03

    申请号:CN201710363911.4

    申请日:2017-05-22

    IPC分类号: B24B45/00

    摘要: 本发明公开了一种用于安装抛光垫的装置,包括:底盘;至少两个调节定位装置,所述调节定位装置安装于所述底盘的侧壁上且位于同一圆周面,所述调节定位装置包括:滑台组件,所述滑台组件相对所述底盘径向方向可移动,通过调节所述滑台组件相对所述底盘的位置从而限定出所述抛光垫的安装区域,使得所述抛光垫同心设置于所述底盘的安装面上。根据本发明实施例的用于安装抛光垫的装置,在底盘的侧壁上设置至少两个调节定位装置,通过调节滑台组件相对底盘的位置从而限定出抛光垫的安装区域,使得抛光垫同心设置于底盘的安装面上,提高对晶圆抛光的工艺效果。

    一种模型训练方法和解决特定领域问题的方法

    公开(公告)号:CN117852654A

    公开(公告)日:2024-04-09

    申请号:CN202410166430.4

    申请日:2024-02-05

    申请人: 清华大学

    摘要: 本申请涉及一种模型训练方法和解决特定领域问题的方法,其中,模型训练方法包括:获取第一样本数据;第一样本数据包括N个第一问题文本和N个第一答案文本;根据第一样本数据和第一大语言模型,得到N个第一知识文本;根据第一样本数据中的至少部分数据和N个第一知识文本中的至少部分数据,对第一中间语言模型继续进行训练,得到第一语言模型;本申请提供的模型训练方法通过预训练一个应用于特定领域的小型语言模型,并利用大语言模型生成伪数据对该小型语言模型进行调整,可以得到能够生成针对特定领域问题的相关知识的第一语言模型,第一语言模型可以帮助大语言模型解决特定领域问题,提高大语言模型解决特定领域问题的能力。

    基于智能体的交互式评估方法、系统及智能体

    公开(公告)号:CN103942648A

    公开(公告)日:2014-07-23

    申请号:CN201410160937.5

    申请日:2014-04-21

    申请人: 清华大学

    IPC分类号: G06Q10/06

    摘要: 本发明提出一种基于智能体的交互式评估方法,包括以下步骤:将所输入的原始数据统一标准化为评估平台可处理的标准数据,并存储标准数据;根据由用户预设的评估需求,从标准数据中选择待处理数据;对待处理数据进行相应的评估处理以获取评估结果,并存储评估结果;输出和显示评估结果以及标准数据。根据本发明的方法,能够实现分布式、交互式和实时性的评估。本发明还提出一种基于智能体的交互式评估系统及一种智能体。

    文本编码模型训练方法、类案检索方法、装置及电子设备

    公开(公告)号:CN116340464A

    公开(公告)日:2023-06-27

    申请号:CN202310369775.5

    申请日:2023-04-07

    申请人: 清华大学

    摘要: 本公开涉及文本编码模型训练方法、类案检索方法、装置及电子设备,文本编码模型训练方法包括:获取训练数据集,训练数据集包括多个查询案件的案件信息以及正面案件与负面案件的案件信息;利用文本编码模型对训练数据集中的案件信息进行编码,得到训练数据集对应的案件特征集;根据案件特征集,确定每个查询案件与对应的正面案件之间的第一相关性分数,以及每个查询案件与对应的负面案件之间的第二相关性分数;根据第一相关性分数以及第二相关性分数,确定对比学习损失并基于对比学习损失训练文本编码模型。根据本公开实施例,能够训练文本编码模型从无标注的训练数据集中学习法律知识,进而提升训练后的文本编码模型在法律领域下游任务的性能。

    用于安装抛光垫的装置
    9.
    发明公开

    公开(公告)号:CN107127679A

    公开(公告)日:2017-09-05

    申请号:CN201710363911.4

    申请日:2017-05-22

    IPC分类号: B24B45/00

    摘要: 本发明公开了一种用于安装抛光垫的装置,包括:底盘;至少两个调节定位装置,所述调节定位装置安装于所述底盘的侧壁上且位于同一圆周面,所述调节定位装置包括:滑台组件,所述滑台组件相对所述底盘径向方向可移动,通过调节所述滑台组件相对所述底盘的位置从而限定出所述抛光垫的安装区域,使得所述抛光垫同心设置于所述底盘的安装面上。根据本发明实施例的用于安装抛光垫的装置,在底盘的侧壁上设置至少两个调节定位装置,通过调节滑台组件相对底盘的位置从而限定出抛光垫的安装区域,使得抛光垫同心设置于底盘的安装面上,提高对晶圆抛光的工艺效果。

    DHA或其衍生物在制备冠状病毒抑制剂中的应用

    公开(公告)号:CN114469919B

    公开(公告)日:2022-07-26

    申请号:CN202210354844.0

    申请日:2022-04-06

    申请人: 清华大学

    发明人: 李海涛 项斌

    摘要: 本发明公开了DHA或其衍生物在制备冠状病毒抑制剂中的应用,属于医用配制品领域。本发明还公开了一种冠状病毒抑制剂,所述冠状病毒抑制剂包括DHA或其衍生物和抗冠状病毒的抗体,所述冠状病毒可为β属冠状病毒,如SARS‑CoV‑2。本发明提供的试验结果表明DHA可影响RBD热变温度,降低RBD蛋白的稳定性;同时,DHA或其衍生物与抗新冠抗体联用可提高抗体的中和率。