发明授权
- 专利标题: 一种基于异构图的单语言主题摘要生成方法
-
申请号: CN202210416073.3申请日: 2022-04-20
-
公开(公告)号: CN114860920B公开(公告)日: 2024-09-13
- 发明人: 云静 , 郑博飞 , 焦磊 , 袁静姝 , 刘利民
- 申请人: 内蒙古工业大学
- 申请人地址: 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区
- 专利权人: 内蒙古工业大学
- 当前专利权人: 内蒙古工业大学
- 当前专利权人地址: 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区
- 代理机构: 西安智大知识产权代理事务所
- 代理商 段俊涛
- 主分类号: G06F16/34
- IPC分类号: G06F16/34 ; G06F40/211 ; G06F40/284 ; G06F40/289 ; G06N3/0464 ; G06N3/094 ; G06N3/0475 ; G06N3/045
摘要:
一种基于异构图的单语言主题摘要生成方法,从网络爬取源语言的摘要数据集,并进行分词、分句和打标签操作;使用对抗训练学习一个从源语言到目标语言的空间线性映射,得到源语言与目标语言在同一个共享向量空间的词向量,对分词、分句和打标签操作得到的数据进行预处理,得到包含单词节点、句子节点和边特征的向量,其中源语言即为需要生成摘要的数据集的语种,目标语言为一个大型语种;使用图注意力网络,将包含单词节点、句子节点和边特征的向量进行信息聚合,不断更新单词节点与句子节点,得到信息聚合之后的句子节点;将信息聚合之后的句子节点进行节点分类,并以交叉熵损失作为训练目标,根据句子的分数排序,筛选适合作为摘要的句子节点。
公开/授权文献
- CN114860920A 一种基于异构图的单语言主题摘要生成方法 公开/授权日:2022-08-05