中文媒体评论文本自动生成方法、系统、设备、客户端

    公开(公告)号:CN116431803A

    公开(公告)日:2023-07-14

    申请号:CN202310089975.5

    申请日:2023-02-09

    摘要: 本发明属于舆情数据信息处理技术领域,公开了中文媒体评论文本自动生成方法、系统、设备、客户端。将NEZHA中文预训练模型对输入的贴文进行文本编码;通过束搜索解码生成多条评论;用户通过指定情感极性,使用情感分类器进行指定情感的评论取舍;并使用文本相似度计算算法计算每条评论和贴文之间的相关度,根据相关度值对生成的评论进行从高到低排序输出评论文本。本发明使用NEZHA中文语言预训练模型解决中文媒体评论文本自动生成算法中文本长度限制的问题。使用束搜索解码算法增加中文媒体评论文本自动生成领域所生成评论文本的多样性。本发明使用情感极性判定算法和文本相关度算法对所生成评论文本进行过滤和排序。