发明公开
- 专利标题: 一种基于双层嵌套聚类的故事脉络生成方法
-
申请号: CN202410896623.5申请日: 2024-07-05
-
公开(公告)号: CN118861291A公开(公告)日: 2024-10-29
- 发明人: 员建厦 , 王丽娜 , 张学军 , 沈宇婷 , 梁宇 , 钟秋 , 许森岚 , 肖恒奕 , 呙维 , 任晖
- 申请人: 中国电子科技集团公司第五十四研究所 , 武汉大学
- 申请人地址: 河北省石家庄市中山西路589号中国电子科技集团公司第五十四研究所指控部;
- 专利权人: 中国电子科技集团公司第五十四研究所,武汉大学
- 当前专利权人: 中国电子科技集团公司第五十四研究所,武汉大学
- 当前专利权人地址: 河北省石家庄市中山西路589号中国电子科技集团公司第五十四研究所指控部;
- 代理机构: 河北东尚律师事务所
- 代理商 王文庆
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/34 ; G06F16/951 ; G06F16/9537 ; G06F18/213 ; G06F18/22 ; G06F18/231 ; G06F18/2321 ; G06F40/216 ; G06F40/284 ; G06F40/30 ; G06Q50/00
摘要:
本发明公开了一种基于双层嵌套聚类的故事脉络生成方法,属于社交媒体数据挖掘与分析技术领域。本发明首先基于生成的多主题故事集合实现代表性事件的子话题挖掘和关联分析,生成具有骨干及分支脉络的多层次故事树;在对于不同等级的脉络构建了骨干脉络标题摘要和联合语义主题及地理实体概念的GeoTextRank分支脉络摘要算法,实现了对故事主题及情节的提炼。本发明利用双层嵌套聚类的故事脉络生成方法,分别聚类生成故事脉络骨干和故事脉络的分支事件,从宏观上简明直观的展示热点事件,从微观精细化跟踪热点事件,从而实现多层次的主题抽取手段和关联策略,为事件的发展演化分析奠定基础。