发明授权
- 专利标题: 一种基于多粒度特征的文本生成评价方法
-
申请号: CN202111078487.1申请日: 2021-09-15
-
公开(公告)号: CN113901840B公开(公告)日: 2024-04-19
- 发明人: 赖华 , 高玉梦 , 余正涛 , 黄于欣 , 相艳
- 申请人: 昆明理工大学
- 申请人地址: 云南省昆明市五华区学府路253号
- 专利权人: 昆明理工大学
- 当前专利权人: 昆明理工大学
- 当前专利权人地址: 云南省昆明市五华区学府路253号
- 代理机构: 昆明隆合知识产权代理事务所
- 代理商 何娇
- 主分类号: G06F40/51
- IPC分类号: G06F40/51 ; G06F40/205 ; G06F40/289 ; G06F40/30
摘要:
本发明涉及一种基于多粒度特征的文本生成评价方法。为了获取不同粒度特征的语义表示,本发明首先采用MBERT得到参考句与生成句的子词序列并进行向量表征;基于此,根据构成音节与词组的子词组合,结合不同子词语义向量表征得到音节语义向量表征以及词组语义向量表征;其次,采用贪婪匹配分别对参考句与生成句不同粒度下的语义特征向量进行最大余弦相似度计算,使模型在多个粒度上考虑两个句子间的语义相关关系;最后,结合多粒度特征对生成句打分。本发明从子词、音节、词组三个粒度考虑,更大化的包容不同字词结构之间的差异性,能够更准确评估生成系统模型的好坏,同时也能有效引导生成模型提升性能。
公开/授权文献
- CN113901840A 一种基于多粒度特征的文本生成评价方法 公开/授权日:2022-01-07