-
公开(公告)号:CN114638233A
公开(公告)日:2022-06-17
申请号:CN202210289993.3
申请日:2022-03-22
Applicant: 中国经济信息社有限公司
IPC: G06F40/30 , G06F40/258 , G06F40/194 , G06F40/279 , G06F16/33
Abstract: 本公开提出了一种新闻稿件首发认定方法、装置和设备,该方法包括:获取待分析新闻稿件,提取出待分析新闻稿件的标题;根据标题,由新闻稿件集中进行相似稿件的筛选;在由新闻稿件集中筛选出相似稿件时,分别提取待分析新闻稿件中的实体词以及相似稿件中的实体词;对待分析新闻稿件中的实体词与相似稿件中的实体词进行匹配,并根据匹配结果确认相似稿件与待分析新闻稿件是否为同一事件的稿件;在相似稿件与待分析新闻稿件为同一事件的稿件时,由与待分析新闻稿件为同一事件的稿件中确定出首发稿件,这样,便可以提高新闻稿件首发认定结果的准确性。
-
公开(公告)号:CN114490960A
公开(公告)日:2022-05-13
申请号:CN202111343122.7
申请日:2021-11-12
Applicant: 新华通讯社 , 媒体融合生产技术与系统国家重点实验室 , 中国经济信息社有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9532 , G06F40/289
Abstract: 本申请公开了一种首发新闻稿的确定方法、装置、电子设备和存储介质。该首发新闻稿的确定方法包括:获取新闻事件的第一新闻要素信息;根据第一新闻要素信息进行新闻稿搜索,得到第一新闻稿候选集,获取第一新闻稿候选集中的各候选新闻稿的第二新闻要素信息;基于第一新闻要素信息和所述第二新闻要素信息,确定特征向量;将特征向量输入预先训练好的分类器中,得到与新闻事件相匹配的第二新闻稿候选集;基于第二新闻稿候选集中的各候选新闻稿的发布时间,确定与新闻事件对应的首发新闻稿。采用本申请提供的首发新闻稿的确定方法,可以实现高效、精确的确定报道某一事件的首发新闻稿的效果。
-