一种基于双编码指针混合网络的中文摘要生成方法

    公开(公告)号:CN114357154A

    公开(公告)日:2022-04-15

    申请号:CN202111420505.X

    申请日:2021-11-26

    摘要: 本发明涉及一种双编码指针混合网络的中文摘要生成方法,包括:从语料数据集中获取中文文本数据,中文文本数据包括正文文本及对应的摘要;对获取的中文文本数据进行预处理,并将预处理后的中文文本数据按照设定的比例划分为训练集、验证集和测试集;根据训练集、验证集和测试集,创建对应的词典;基于双编码指针混合网络算法,构建双编码模型;基于训练集和验证集,对双编码模型进行训练和交叉验证;基于测试集对训练后的双编码模型进行测试,以得到中文摘要生成模型;将目标文本输入中文摘要生成模型,输出得到对应的中文摘要。与现有技术相比,本发明能够自动、准确地生成对应于中文文本的中文摘要,具有准确率高、概括能力强、语句通顺的优点。

    一种基于编码器-双解码器的图像中文描述生成方法

    公开(公告)号:CN114139011A

    公开(公告)日:2022-03-04

    申请号:CN202111419735.4

    申请日:2021-11-26

    摘要: 本发明涉及一种基于编码器‑双解码器的图像中文描述生成方法,包括:获取数据集,包括图像描述数据集和对应的背景语料数据集;对数据集进行数据预处理,将预处理后的数据集划分为训练集、验证集和测试集;构建编码器‑双解码器模型,并设定模型参数以及超参数,基于训练集和验证集,对编码器‑双解码器模型进行训练;基于测试集对训练后的编码器‑双解码器模型进行测试,以得到图像描述生成模型;将待描述图像输入图像描述生成模型,输出得到待描述图像对应的标题字段以及描述文本。与现有技术相比,本发明能够充分利用编码器获取的特征信息、能够对图像包含的信息进行丰富描述,具有准确率高、语句含义丰富通顺、图像与文本相关性强的优点。