基于动态词向量的自动文本摘要生成方法

    公开(公告)号:CN110619043A

    公开(公告)日:2019-12-27

    申请号:CN201910810862.3

    申请日:2019-08-30

    Abstract: 本发明公开的一种基于动态词向量的自动文本摘要生成方法,旨在提供一种准确性和流畅度更高的文本摘要自动生成方法。本发明通过下述技术方案予以实现:首先通过文本预处理模块对文本进行预处理,预处理包括分词操作、高频词过滤与词性标注,将处理后的文本生成初始词向量;紧接着将初始词向量输入ELMo模型模块,生成初步动态词向量;同时将文本输入Doc2Vec句向量模块得到每个句子的句向量,句向量输入自注意力机制模块计算出相对摘要结果的重要性权重以生成加权句向量,将加权句向量作为各个词的环境特征向量,环境特征向量与初始动态词向量相加得到最终的动态词向量,动态词向量输入Transformer神经网络模型生成高质量的文本摘要。

Patent Agency Ranking