-
公开(公告)号:CN118210885A
公开(公告)日:2024-06-18
申请号:CN202410111963.2
申请日:2024-01-25
申请人: 浙江工业大学
IPC分类号: G06F16/332 , G06N3/0464 , G06F18/214 , G06F18/22
摘要: 本发明公开了一种应用于问答系统的基于子图分解和无监督检索的两阶段知识库问题生成方法,包括:采用转换规则将SPARQL查询语句转换为查询子图;设计子图分解器将查询子图分解为主干子图和枝干子图集;利用Bert+TextCNN模型预测问题疑问词;使用KBQA数据集构建主干问题生成数据集和问题重写数据集;设计无监督相似样本检索器,从构建的数据集中检索相似样本,以构建任务集;利用任务集,通过MAML算法训练主干问题生成模型和问题重写模型,主干问题生成模型利用主干子图和预测疑问词生成主干问题,问题重写模型利用枝干子图集对主干问题迭代改写,从而实现两阶段知识库问题生成,为问答系统构建问答数据集。