利用分布式语义信息的论文标题生成方法

    公开(公告)号:CN106383817A

    公开(公告)日:2017-02-08

    申请号:CN201610866179.8

    申请日:2016-09-29

    IPC分类号: G06F17/27

    CPC分类号: G06F17/2775 G06F17/2785

    摘要: 本发明涉及一种利用分布式语义信息的论文标题生成方法,属于自然语言处理领域。本发明首先利用TextRank算法获取论文摘要的前k个关键词,训练GloVe模型得到词向量,对提取的关键词进行向量初始化,然后利用基于长短期记忆单元的循环神经网络标题生成模型获取标题,最后进行标题构建。本发明利用深度学习的方法挖掘标题的深层语义信息,使生成的标题可读性强,且符合标题的语义规则。

    利用分布式语义信息的论文标题生成方法

    公开(公告)号:CN106383817B

    公开(公告)日:2019-07-02

    申请号:CN201610866179.8

    申请日:2016-09-29

    IPC分类号: G06F17/27

    摘要: 本发明涉及一种利用分布式语义信息的论文标题生成方法,属于自然语言处理领域。本发明首先利用TextRank算法获取论文摘要的前k个关键词,训练GloVe模型得到词向量,对提取的关键词进行向量初始化,然后利用基于长短期记忆单元的循环神经网络标题生成模型获取标题,最后进行标题构建。本发明利用深度学习的方法挖掘标题的深层语义信息,使生成的标题可读性强,且符合标题的语义规则。

    融合序列语法标注框架的生成式文本摘要方法

    公开(公告)号:CN109948162A

    公开(公告)日:2019-06-28

    申请号:CN201910225744.6

    申请日:2019-03-25

    IPC分类号: G06F17/27 G06F17/21

    摘要: 本发明涉及融合序列语法标注框架的生成式文本摘要方法,属于自然语言处理领域。主要为了解决现有模型在产生摘要时没有考虑语法结构,因此生成的摘要存在不满足语法规则的问题。本发明首先利用开源句法分析器Berkeley Parser对句子进行成分句法分析,生成短语解析树;其次通过深度优先遍历算法,将短语解析树线性化成一个结构标签序列;然后使用word2vec工具对语法标注序列进行向量化;最后将源语法结构信息输入到编码器中,经过摘要生成模块编、解码,最终生成摘要。实验在CNN/Daily Mail数据集上进行,结果表明本发明不仅解决了超纲词、重复短语、主题不显著等问题,而且生成的摘要基本满足语法规则,可读性更强,与源文本语法更具有一致性,ROUGE得分比先进算法有一定提高。