-
公开(公告)号:CN119322824A
公开(公告)日:2025-01-17
申请号:CN202410564432.9
申请日:2024-05-09
Applicant: 哈尔滨工业大学
IPC: G06F16/3329 , G06F16/334 , G06N5/022 , G06F40/194
Abstract: 本发明属于自然语言处理中的人机对话技术领域,具体涉及一种开放域对话领域以知识为中心的回复筛选方法及其系统。步骤1、利用现有的对话数据以及百科知识数据构建所需训练数据,构造伪数据算法;步骤2、利用步骤1构造的训练集对BERT模型进行三阶段训练;步骤3、在测试时,使用步骤2三阶段的得分之和作为最终评分。本发明用以解决现有非结构化知识增强方法存在的知识筛选准确率低以及知识筛选结果与筛选到的回复不一致的问题。
-
公开(公告)号:CN118364103A
公开(公告)日:2024-07-19
申请号:CN202410461572.3
申请日:2024-04-17
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F18/21 , G06F18/2431 , G06F40/216 , G06N3/042 , G06N3/0455 , G06N3/0895 , G06N5/045
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种自验证式的探索预训练语言模型中明喻知识的方法及其系统。步骤1、构建多级明喻识别数据集;步骤2、创建多级明喻识别任务,帮助PLMs评估明喻质量;步骤3、将多级明喻识别分数融合进明喻生成任务。本发明为解决现有预训练语言模型无法很好评价明喻好坏从而无法很好地探索明喻知识的问题。
-