发明公开
- 专利标题: 中文媒体评论文本自动生成方法、系统、设备、客户端
-
申请号: CN202310089975.5申请日: 2023-02-09
-
公开(公告)号: CN116431803A公开(公告)日: 2023-07-14
- 发明人: 陈靖元 , 石珺 , 刘汪洋 , 廖伟 , 金平艳
- 申请人: 深圳市网联安瑞网络科技有限公司
- 申请人地址: 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)C栋二十二层
- 专利权人: 深圳市网联安瑞网络科技有限公司
- 当前专利权人: 深圳市网联安瑞网络科技有限公司
- 当前专利权人地址: 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)C栋二十二层
- 代理机构: 广东普润知识产权代理有限公司
- 代理商 王政
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/33 ; G06F16/338 ; G06F40/30 ; G06F18/22 ; G06N20/00
摘要:
本发明属于舆情数据信息处理技术领域,公开了中文媒体评论文本自动生成方法、系统、设备、客户端。将NEZHA中文预训练模型对输入的贴文进行文本编码;通过束搜索解码生成多条评论;用户通过指定情感极性,使用情感分类器进行指定情感的评论取舍;并使用文本相似度计算算法计算每条评论和贴文之间的相关度,根据相关度值对生成的评论进行从高到低排序输出评论文本。本发明使用NEZHA中文语言预训练模型解决中文媒体评论文本自动生成算法中文本长度限制的问题。使用束搜索解码算法增加中文媒体评论文本自动生成领域所生成评论文本的多样性。本发明使用情感极性判定算法和文本相关度算法对所生成评论文本进行过滤和排序。