-
公开(公告)号:CN116245167A
公开(公告)日:2023-06-09
申请号:CN202310318021.7
申请日:2023-03-28
申请人: 清华大学
IPC分类号: G06N3/0895 , G06N3/0455 , G06F40/289 , G06F18/22 , G06F16/33
摘要: 本公开涉及文本编码器训练方法、类案检索方法、装置及电子设备,文本编码器训练方法包括:获取多个案件组,每个案件组包括至少两个案件的案件信息以及对应的相似度信息;利用文本编码器对各个案件的案件信息进行编码,得到各个案件的案件特征;根据各个案件的案件特征,确定每个案件组中的类内特征相似度以及每个案件与异类案件的类间特征相似度;根据类内特征相似度、类间特征相似度以及案件对应的相似度信息,确定对比学习损失并基于对比学习损失训练文本编码器。根据本公开实施例,能够引入细粒度的法律知识训练文本编码器,使训练后的文本编码器输出高质量的案件特征,进而提高类案检索的准确性,同时使检索出的同类案件具有可解释性。
-
公开(公告)号:CN116340464A
公开(公告)日:2023-06-27
申请号:CN202310369775.5
申请日:2023-04-07
申请人: 清华大学
摘要: 本公开涉及文本编码模型训练方法、类案检索方法、装置及电子设备,文本编码模型训练方法包括:获取训练数据集,训练数据集包括多个查询案件的案件信息以及正面案件与负面案件的案件信息;利用文本编码模型对训练数据集中的案件信息进行编码,得到训练数据集对应的案件特征集;根据案件特征集,确定每个查询案件与对应的正面案件之间的第一相关性分数,以及每个查询案件与对应的负面案件之间的第二相关性分数;根据第一相关性分数以及第二相关性分数,确定对比学习损失并基于对比学习损失训练文本编码模型。根据本公开实施例,能够训练文本编码模型从无标注的训练数据集中学习法律知识,进而提升训练后的文本编码模型在法律领域下游任务的性能。
-
公开(公告)号:CN117852654A
公开(公告)日:2024-04-09
申请号:CN202410166430.4
申请日:2024-02-05
申请人: 清华大学
摘要: 本申请涉及一种模型训练方法和解决特定领域问题的方法,其中,模型训练方法包括:获取第一样本数据;第一样本数据包括N个第一问题文本和N个第一答案文本;根据第一样本数据和第一大语言模型,得到N个第一知识文本;根据第一样本数据中的至少部分数据和N个第一知识文本中的至少部分数据,对第一中间语言模型继续进行训练,得到第一语言模型;本申请提供的模型训练方法通过预训练一个应用于特定领域的小型语言模型,并利用大语言模型生成伪数据对该小型语言模型进行调整,可以得到能够生成针对特定领域问题的相关知识的第一语言模型,第一语言模型可以帮助大语言模型解决特定领域问题,提高大语言模型解决特定领域问题的能力。
-
公开(公告)号:CN117852654B
公开(公告)日:2024-09-03
申请号:CN202410166430.4
申请日:2024-02-05
申请人: 清华大学
摘要: 本申请涉及一种模型训练方法和解决特定领域问题的方法,其中,模型训练方法包括:获取第一样本数据;第一样本数据包括N个第一问题文本和N个第一答案文本;根据第一样本数据和第一大语言模型,得到N个第一知识文本;根据第一样本数据中的至少部分数据和N个第一知识文本中的至少部分数据,对第一中间语言模型继续进行训练,得到第一语言模型;本申请提供的模型训练方法通过预训练一个应用于特定领域的小型语言模型,并利用大语言模型生成伪数据对该小型语言模型进行调整,可以得到能够生成针对特定领域问题的相关知识的第一语言模型,第一语言模型可以帮助大语言模型解决特定领域问题,提高大语言模型解决特定领域问题的能力。
-
公开(公告)号:CN116561574A
公开(公告)日:2023-08-08
申请号:CN202310431071.6
申请日:2023-04-20
申请人: 清华大学
IPC分类号: G06F18/214 , G06F40/205 , G06F40/30 , G06F40/126 , G06F40/166
摘要: 本申请涉及一种预训练语言模型的训练方法及装置,其中,预训练语言模型包括编码器及至少一个解码器,该方法包括:获取法律文书样本;法律文书样本包括表示基本事实的第一文本;对第一文本中的至少一个字符进行替换处理,得到第一替换文本;根据标志符和第一替换文本对编码器进行训练,并根据基本事实向量和第二文本对至少一个解码器进行训练;其中,基本事实向量为编码器输出的表征第一文本语义的向量,第二文本为法律文书样本中除所述第一文本以外的文本;本申请提供的预训练语言模型的训练方法可以捕获法律文书不同结构之间的联系,增强预训练语言模型对关键法律要素的理解,提升预训练语言模型在法律领域的检索效果。
-
-
-
-