一种基于多任务联合的问题生成方法

    公开(公告)号:CN111488440B

    公开(公告)日:2024-02-13

    申请号:CN202010236154.6

    申请日:2020-03-30

    Abstract: 本发明公开了一种基于多任务联合的问题生成的方法,构建多任务联合的问题生成模型,问题生成模型包括摘要抽取模块和问题生成模块,问题生成模型采用seq2seq模型;所述方法包括步骤:利用抽取式摘要生成的方法抽取出给定文本的中心句子形成文本摘要;根据给定文本建立高频词词汇表和低频词词汇表;通过预训练好的Glove词嵌入方法将得到的文本摘要进行词向量表示;将得到的词向量表示输入到seq2seq模型的encode部分,再结合注意力机制将词向量编码为隐藏状态;通过Seq2Seq模型中的decode将得到的隐藏层状态解码为问题序列。本发明通过自动摘要的方法抽取出给定文本的中心句,再结合注意力机制、copy机制使得生成的问题更贴近文章中心。

    一种基于推理的难度可控问题生成方法

    公开(公告)号:CN111563146A

    公开(公告)日:2020-08-21

    申请号:CN202010253345.3

    申请日:2020-04-02

    Inventor: 蔡毅 黄清宝 梁宇

    Abstract: 本发明公开了一种基于推理的难度可控问题生成的方法,包括:识别文本中的命名实体,根据设定的实体连结关系构建实体网络图;分别通过词嵌入方法和难度嵌入矩阵对自然语言文本编码得到其语义表示和难度表示;将得到的语义表示通过双向LSTM层进行编码,并利用图神经网络得到新的含有推理的上下文状态表示,随后使用注意力机制辅助解码器得到词语的推理生成概率;将难度嵌入矩阵使用难度等级控制变量经过高斯核层得到难度生成概率;将得到的推理生成词概率和难度生成词概率整合得到最终的生成概率,进而生成问题序列。本发明所定义的问题生成难度等级更具有人类客观逻辑性,将多跳推理融入自然语言文本的表示中,生成更加符合所定义难度的多样化问题。

    一种基于推理的难度可控问题生成方法

    公开(公告)号:CN111563146B

    公开(公告)日:2023-05-23

    申请号:CN202010253345.3

    申请日:2020-04-02

    Inventor: 蔡毅 黄清宝 梁宇

    Abstract: 本发明公开了一种基于推理的难度可控问题生成的方法,包括:识别文本中的命名实体,根据设定的实体连结关系构建实体网络图;分别通过词嵌入方法和难度嵌入矩阵对自然语言文本编码得到其语义表示和难度表示;将得到的语义表示通过双向LSTM层进行编码,并利用图神经网络得到新的含有推理的上下文状态表示,随后使用注意力机制辅助解码器得到词语的推理生成概率;将难度嵌入矩阵使用难度等级控制变量经过高斯核层得到难度生成概率;将得到的推理生成词概率和难度生成词概率整合得到最终的生成概率,进而生成问题序列。本发明所定义的问题生成难度等级更具有人类客观逻辑性,将多跳推理融入自然语言文本的表示中,生成更加符合所定义难度的多样化问题。

    一种基于多任务联合的问题生成方法

    公开(公告)号:CN111488440A

    公开(公告)日:2020-08-04

    申请号:CN202010236154.6

    申请日:2020-03-30

    Abstract: 本发明公开了一种基于多任务联合的问题生成的方法,构建多任务联合的问题生成模型,问题生成模型包括摘要抽取模块和问题生成模块,问题生成模型采用seq2seq模型;所述方法包括步骤:利用抽取式摘要生成的方法抽取出给定文本的中心句子形成文本摘要;根据给定文本建立高频词词汇表和低频词词汇表;通过预训练好的Glove词嵌入方法将得到的文本摘要进行词向量表示;将得到的词向量表示输入到seq2seq模型的encode部分,再结合注意力机制将词向量编码为隐藏状态;通过Seq2Seq模型中的decode将得到的隐藏层状态解码为问题序列。本发明通过自动摘要的方法抽取出给定文本的中心句,再结合注意力机制、copy机制使得生成的问题更贴近文章中心。

Patent Agency Ranking