-
公开(公告)号:CN116992886A
公开(公告)日:2023-11-03
申请号:CN202310940792.X
申请日:2023-07-28
IPC分类号: G06F40/30 , G06F40/284 , G06F16/33 , G06F16/335 , G06F16/35 , G06N3/0442 , G06N3/045
摘要: 本发明公开了一种基于BERT的热点新闻事件脉络生成方法及装置。在本发明中,对于批次输入的热点新闻文本数据,首先使用基于BERT的方法进行语义挖掘,目的是从语义层面理解热点新闻文本,获取其中包含的信息和事件。然后,通过文本关键词、热点事件词和衰减因子等方法,筛选并抽取出与当前热点事件相关的关键词,这些关键词构成了热点事件的语义表示。随后根据事件的语义表示,本发明使用不同策略来构建事件的主脉络和分支脉络,进一步提取事件的演变脉络。由此,本发明实现了对热点新闻事件的全面理解和描述,为相关领域的研究、分析和应用提供了有力支持。
-
公开(公告)号:CN118469786A
公开(公告)日:2024-08-09
申请号:CN202410638389.6
申请日:2024-05-22
申请人: 中国电子科技集团公司第五十四研究所
摘要: 本发明公开了一种双/多边主要领域基础实力对比分析方法,属于数据建模分析技术领域。本发明中构建模型包括:国家/地区基础实力模型,通过运算可以得到指定时间周期基础实力量化评估的综合得分;另外还包括政治领域量化评估模型、经济领域量化评估模型、安全领域量化评估模型、军事领域量化评估模型、外交领域量化评估模型;构建双/多边主要领域对比分析公式,运用加权回归算法对量化评估模型各维度指标进行静态权重和动态权重的运算处理,从而获得科学合理的双/多边主要领域基础实力对比分析结果。利用多元线性回归模型,生成双/多边主要领域数据趋势预测结果。
-
公开(公告)号:CN116992029A
公开(公告)日:2023-11-03
申请号:CN202310940176.4
申请日:2023-07-28
申请人: 中国电子科技集团公司第五十四研究所
IPC分类号: G06F16/35 , G06F40/216 , G06F40/284 , G06F18/22 , G06F18/231
摘要: 本发明公开了一种基于增量聚类与主题划分的热点事件脉络生成方法及装置,属于信息挖掘领域。该方法通过调节数据窗口,将每批次输入的新闻文本数据通过基于tf‑idf或Doc2Vec方法,以及类簇计算文本语义的相似度来得到粗粒度的事件脉络,并根据类簇内数据量的规模进行基于LDA的细粒度聚类,进一步划分主题。最终,按照文本生成的时间顺序,构建基于增量聚类与主题划分的事件脉络,以结构化的方式跟踪和揭示事件是如何随着时间发展来演化的。该方法能够在不阅读大量新闻文章的情况下,也可以对事件的发生发展脉络有清晰的认识。同时,该方法具有高效性和自动化特点,可广泛应用于热点事件追踪、舆情分析、信息提取等领域,为人们提供更加准确、全面的信息服务。
-
-