-
公开(公告)号:CN118966219A
公开(公告)日:2024-11-15
申请号:CN202411006019.7
申请日:2024-07-25
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F40/295 , G06N3/0475 , G06N3/045 , G06N3/084 , G06N3/094 , G06N3/096
Abstract: 本发明公开了一种基于类增量学习的小样本命名实体识别方法及装置,属于自然语言处理领域,包括步骤:通过调整已训练模型,将生成的数据用于模拟旧类别的特征,从而帮助模型在蒸馏过程中保留这些旧信息;采用对抗性学习,将合成数据的隐藏特征与真实的新类别数据对齐,使合成数据在语义上与真实样本更加相近,最终结合合成数据和对抗学习完成命名实体识别。本发明为在资源受限的环境中持续改进NER模型打开了新的可能性,展现了其在实际应用中处理动态变化数据流的巨大潜力。
-
公开(公告)号:CN118606476A
公开(公告)日:2024-09-06
申请号:CN202410781352.9
申请日:2024-06-18
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F16/35 , G06F16/33 , G06F16/338 , G06F18/22 , G06F18/241 , G06F18/2415 , G06N5/045
Abstract: 本发明公开了一种基于证据检索的可解释虚假新闻检测方法,包括S1:收集真实新闻文章,并构建事实库存储文章信息;S2:获取待检测新闻文本,基于所述事实库中存储的数据进行文章检索;S3:根据文章检索的结果,基于所述事实库进行证据检索;S4:将待检测事件句的真伪验证建模为自然语言推理任务,进行推理验证。本发明通过结合外部事实库与待检测新闻进行证据检索来辨识新闻真伪,同时将证据检索的结果作为最终检测结果的解释信息,解决了现有方法可解释性差的问题。
-
公开(公告)号:CN116227463A
公开(公告)日:2023-06-06
申请号:CN202211632138.4
申请日:2022-12-19
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F40/205 , G06F40/30 , G06F18/23 , G06N3/088
Abstract: 本发明公开了一种富媒体文稿辅助生成装置,所述装置包括素材提取模块、主题排序模块、语义检索模块、结构化数据文本生成模块、插图推荐模块和视频合成模块。本发明利用智能化手段辅助用户高效地生成优质富媒体综合文稿,快速、准确地对主题事件进行全方位描述。
-
公开(公告)号:CN116050541A
公开(公告)日:2023-05-02
申请号:CN202310081710.0
申请日:2023-01-19
Applicant: 中国电子科技集团公司第十研究所
Abstract: 本发明涉及智能认知技术领域,公开了一种基于ACT‑R的改进型智能认知机器人认知模块,包括依次连接的认知建模智能单元模块、特征处理智能单元模块、理解计算智能单元模块、推理预测智能单元模块、联想推荐智能单元模块。本发明解决了现有技术存在的认知计算未涉及到人类情感和隐性知识、难以更真实模拟仿真人类认知决策过程等问题。
-
公开(公告)号:CN115730221A
公开(公告)日:2023-03-03
申请号:CN202211409429.7
申请日:2022-11-11
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F18/22 , G06F18/24 , G06F40/289 , G06F16/36
Abstract: 本发明公开了基于溯因推理的虚假新闻识别方法、装置、设备及介质。本发明基于文本分类、文本相似度和溯因自然语言生成等技术,设计了一种全新的虚假新闻识别流程,在一定程度上解决了基于事实的方法中由于事实库更新迟滞导致无法识别新发生新闻的不足。
-
公开(公告)号:CN115719068A
公开(公告)日:2023-02-28
申请号:CN202211391300.8
申请日:2022-11-08
Applicant: 中国电子科技集团公司第十研究所
IPC: G06F40/30 , G06F18/214
Abstract: 本发明公开了一种基于典型特征的可解释文本检测方法,其包括:将待检测文本数据输入文本属性提取模型,得到待检测文本的固有属性;所述固有属性包括字词属性、句子属性、段落属性;将所述待检测文本数据输入训练好的语义特征提取模型,得到待检测文本的语义特征;所述语义特征包括夸张、煽动、怀疑、消极、恐慌、中性、积极;将待检测文本的固有属性和多类型语义特征以及所述待检测文本数据输入训练好的文本内容辨识模型,得到文本内容的辨识结果;所述辨识结果为真实的概率值。本发明能够基于深度学习模型,能够线上实时辨识,降低辨识过程的人工成本;能够对辨识结果进行可解释性分析,做到真伪辨识的有理有据。
-
公开(公告)号:CN114169447B
公开(公告)日:2022-12-06
申请号:CN202111503580.2
申请日:2021-12-10
Applicant: 中国电子科技集团公司第十研究所 , 西安电子科技大学
IPC: G06K9/62 , G06F40/117 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于自注意力卷积双向门控循环单元网络的事件检测方法,解决现有技术在事件检测时文本特征提取不充分以及模型收敛速度慢的问题。本发明的实现步骤为:(1)生成训练集;(2)构建自注意力卷积双向门控循环单元网络;(3)训练自注意力卷积双向门控循环单元网络;(4)检测自然语言文本中的事件。本发明构建了自注意力卷积双向门控循环单元网络,使网络同时利用文本中的词汇级特征和句子级特征,并使用自注意力捕捉词汇级特征的全局信息,关注对事件检测更有效的句子级特征,提高了事件检测的准确率和效率。
-
公开(公告)号:CN110298033B
公开(公告)日:2022-07-08
申请号:CN201910455064.3
申请日:2019-05-29
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06F40/289 , G06F40/211 , G06K9/62
Abstract: 本发明公开的一种关键词语料标注训练提取工具,旨在提供一种可降低人工标注过程繁复度,并能提高海量关键词语料标注效率和准确率的标注训练工具。本发明通过下述技术方案予以实现:关键词语料标注准备模块对不同来源的海量语料数据进行区分,半自动化语料关键词标注模块创建关键词标注任务,自主选择适配算法并开展基于算法模型的自动标注,通过集成CHI、LDA、TEXTRANK、TFIDF中至少一种关键词抽取算法,对待标注文本语料数据进行预标注处理,并对多种算法标注结果进行融合,当标注任务完成后,反馈式关键词标注模型学习训练模块对关键词标注算法模型进行训练;关键词标注模型效果评估模块对模型指标量化标注效果进行自动评估。
-
公开(公告)号:CN110298032A
公开(公告)日:2019-10-01
申请号:CN201910455049.9
申请日:2019-05-29
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种文本分类语料标注训练系统,旨在提供一种能够降低人工标注反复度,并能提升预标注结果准确性的半自动化标注训练装置。本发明通过下述技术方案予以实现:文本分类语料标注准备模块统计文本词频,去除文本的噪声信息;半自动化文本分类标注模块在分类标注任务中选择CNN、KNN、ANN、深度学习算法,把非结构化和半结构化的文本转换为向量空间模型,生成文本的词向量空间,抽取反映文档主题特征;当标注任务完成后,反馈式模型学习训练模块反馈分类标注模型完善更新;文本分类标注模型效果评估模块基于分类指标规则对评测指标进行量化,建立标注算法综合评估模型,分析测试结果,评价分类结果,对模型指标量化标注效果进行评估。
-
公开(公告)号:CN109710728A
公开(公告)日:2019-05-03
申请号:CN201811417992.2
申请日:2018-11-26
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种新闻话题自动发现方法,旨在提供一种能够提高新闻话题发现的准确性的方法。本发明通过下述技术方案予以实现:首先设置增量聚类相关参数和增量聚类触发参数,对增量数据进行分批次聚类,预处理输入文本,对文章统一文本格式编码,计算文本特征,生成文本特征向量,提取文本特征词,构建文本特征向量集,在批次内先做主题聚类,再做主题内层次聚类,然后计算每一个单点主题与所有聚类的相似度即每一个单点到每一个聚类中心的距离,合并到最大的类簇,将跨批次的聚类互相凝聚起来,完成主题间层次聚类;生成新闻话题并进行新类簇融合,将新类簇质心与已有历史类簇质心进行比较,然后对新增数据聚类结果与已有聚类结果做跨批次融合。
-
-
-
-
-
-
-
-
-