-
公开(公告)号:CN117235663A
公开(公告)日:2023-12-15
申请号:CN202311164882.0
申请日:2023-09-11
Applicant: 新华通讯社
IPC: G06F18/25 , G06F40/30 , G06F40/289 , G06F40/279 , G06F40/205 , G06F18/241
Abstract: 本申请公开了一种新闻内容的立场信息确定方法、装置、设备及介质,方法包括:获取待识别的新闻内容;运用提取算法对新闻内容的多个段落内容进行提取,得到每个段落内容的立场信息;基于每个段落内容的立场信息,确定新闻内容的全文立场信息。本申请实施例能够基于提取出的多立场新闻稿件内容的多个立场信息,确定出全文立场信息,提高了新闻稿件内容的立场信息提取的准确率。
-
公开(公告)号:CN115204166A
公开(公告)日:2022-10-18
申请号:CN202210311657.4
申请日:2022-03-28
Applicant: 新华通讯社
IPC: G06F40/289 , G06F40/216
Abstract: 本申请公开了一种文本校对方法、装置、设备、介质及程序产品。该方法包括:对目标文本进行断句分词处理,获得至少一个目标单句、以及与该目标单句对应的初始分词序列;针对目标文本对应的每一个初始分词序列,至少根据两种预设词表校正规则进行校正处理,获得与每一初始分词序列对应的多个候选校正序列;至少根据两种概率模型,计算与各候选校正序列对应的置信值,根据置信值对候选校正序列进行筛选;根据置信值对多个筛选得到的候选校正序列进行融合处理,获得与初始分词序列对应的最优校正序列;根据目标单句在目标文本中的位置,组合各最优校正序列,获得校正文本。根据本申请实施例,本申请对文本进行校对的准确率高。
-
公开(公告)号:CN113033201A
公开(公告)日:2021-06-25
申请号:CN202011231567.1
申请日:2020-11-06
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/295 , G06F40/289 , G06F40/134 , G06F40/211
Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。
-
公开(公告)号:CN112307761A
公开(公告)日:2021-02-02
申请号:CN202011301062.8
申请日:2020-11-19
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F40/289 , G06F40/216 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于注意力机制的事件抽取方法及系统,其中抽取方法包括以下步骤:获取待处理文本及其事件类型,提取所述待处理文本中各字的向量,获得文本向量数据,提取所述事件类型中各字的向量,生成事件类型向量数据;将所述文本向量数据和所述事件类型向量数据输入预先构建的抽取词预测模型,获得所述待处理文本中每个字所对应的标签所形成的标签序列;基于所述标签序列对所述待处理文本进行事件抽取,获得相应的事件触发词和事件论元。本发明中通过引入事件类型,结合事件类型对应的特征数据对事件触发词和事件论元进行联合抽取,有效提升事件抽取的准召率。
-
公开(公告)号:CN112199599A
公开(公告)日:2021-01-08
申请号:CN202011171680.5
申请日:2020-10-28
Applicant: 新华智云科技有限公司 , 新华通讯社新媒体中心
IPC: G06F16/9535 , G06F16/9536 , G06F16/35 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开了一种媒体画像生成方法和系统,所述方法包括如下步骤:监测目标媒体账号,获取目标媒体的推送数据;根据推送数据可选择地获取目标媒体的公共画像数据;可选择地建立至少一个目标媒体偏好画像分析模型,根据推送数据分析获取目标媒体偏好画像数据;根据公共画像数据、偏好画像数据建立可视化的媒体画像;本发明采用人工智能技术,根据媒体属性建立多个分析模型,根据分析模型生成媒体画像,通过大数据和人工智能可以给每个媒体提供多样化的标签,从而可以自动地在细分属性中体现媒体的画像内容,提高画像内容的解析深度,提高媒体画像的准确性和多样性。
-
公开(公告)号:CN110931001A
公开(公告)日:2020-03-27
申请号:CN201910838418.2
申请日:2019-09-05
Applicant: 新华通讯社
IPC: G10L15/22 , G10L15/26 , G10L21/0208 , G10L21/0216
Abstract: 本发明公开了一种面向语音识别的抗噪音频传输的装置,将音源设备发生的扬声器信号Ss转变成能够被移动设备的TRRS接口识别的麦克风信号Sm。移动设备TRRS端接收驻极体麦克风产生的Sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对Ss的干扰,模块中使用2组有极电容C2、C1过滤掉来自驱动端的驱动电流。移动设备TRRS端会对接入的设备进行检测,以判断设备为TRS型或TRRS型,并且部分移动设备会对接入设备进行阻抗匹配。其实现方式结构简单、使用方便灵活,使原本只能通过手机放置在音箱旁边录音的方式具备抗噪传输的功能。
-
公开(公告)号:CN105049388B
公开(公告)日:2018-02-27
申请号:CN201510389068.8
申请日:2015-07-05
Abstract: 本发明涉及一种基于喷泉码与单载波频域均衡的短波通信系统及其传输方法,属于无线通信系统、通信信号处理及信道编译码等相关技术领域。本发明在短波数据传输系统中引入喷泉码,通过采用信源编码‑信道编码‑调制联合优化技术,有效缩短了短波单向无反馈信道中文件传输时延,增强了通信系统在恶劣信道环境下的可靠性,提高了文件传输的传输效率,对数据可靠性提供了有效的保障。同时本发明中采用了基于时间‑频率混合信道估计的单载波频域均衡技术,能够大幅降低单载波系统接收机的复杂度,大幅提升系统对抗短波信道多径传输造成的频域选择性衰落的能力。
-
公开(公告)号:CN104636408B
公开(公告)日:2017-08-08
申请号:CN201410414956.6
申请日:2014-08-21
Applicant: 中国科学院计算技术研究所 , 新华通讯社
IPC: G06F17/30
Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。
-
公开(公告)号:CN105975466A
公开(公告)日:2016-09-28
申请号:CN201510742043.1
申请日:2015-11-04
IPC: G06F17/30
CPC classification number: G06F16/338 , G06F16/33
Abstract: 本发明公开了一种面向短新闻的机器写稿方法及装置,该方法通过利用优化算法智能选择不同的模板组合进行新闻生成,能够提高所生成新闻的生动性与灵活性。该方法的实现过程如下,基于输入的知识点与模板库进行候选模板检索;利用优化算法进行智能模板筛选,确定最终真正使用的模板;基于筛选得到的模板进行新闻文本生成;目前的中文新闻写稿系统主要基于人工定义的模板,然而通过向固定模板填充数据而生成的新闻形式比较单一,不够生动。本发明提出基于多样化模板集的智能模板筛选生成多样化的新闻文本,有效改善新闻自动生成的效果。
-
公开(公告)号:CN104615627A
公开(公告)日:2015-05-13
申请号:CN201410490602.X
申请日:2014-09-23
Applicant: 中国科学院计算技术研究所 , 新华通讯社
IPC: G06F17/30
CPC classification number: G06F17/2765
Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。
-
-
-
-
-
-
-
-
-