-
公开(公告)号:CN117935852A
公开(公告)日:2024-04-26
申请号:CN202311682008.6
申请日:2023-12-08
申请人: 中国人民解放军国防科技大学
摘要: 本发明公开了语音识别技术领域的一种基于弱监督学习的虚假语音片段检测识别方法,包括以下步骤:步骤一、获取待检测语音并预处理;步骤二、该沟通用户是否有对应的历史特征包;步骤三、基于历史特征包得到该沟通用户对应的行为特征,并将行为特征与对应的局部声纹特征进行一致性对比;步骤四、基于该沟通用户的全频语音特征,在特定语段或采用语段下采集待对比声纹特征,并以待对比声纹特征建立历史特诊包;还将全频语音特征的波峰与波谷进行结合,得到相似声纹特征,并将不同的相似声纹特征进行相似性对比;步骤五、分离全频语音特诊中的背景音特征并对比;从而根据沟通用户自身的行为特点进行识别区分,以提高虚假语音的识别精度以及准确率。
-
公开(公告)号:CN117933262A
公开(公告)日:2024-04-26
申请号:CN202311803257.6
申请日:2023-12-26
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F40/30 , G06N3/0464
摘要: 本发明公开了基于用户帖子关系的多视图协同过滤虚假新闻检测方法,涉及虚假新闻检测技术领域,其技术方案要点是:利用难以伪装的用户‑帖子关系来建模用户对于新闻真实性的偏好,具体来说,构建了一个3D矩阵,以便在每个单一视图中进行用户到帖子和帖子到用户的传播;以及为多个帖子标签构建多个视图,同时在全局视图中采用对比学习。此外,本发明提供两种整合多个视图以全面捕捉高级用户行为特征的策略:第一种策略利用元学习来获得适当的用户偏好权重,第二种策略利用标准偏差度量来评估用户偏好的明确性;最后,利用帖子特征和用户行为特征识别虚假新闻,充分利用用户的不同偏好特征,提高新闻真假性特征提取效率,提高虚假新闻识别准确率。
-
公开(公告)号:CN115329766B
公开(公告)日:2023-04-18
申请号:CN202211009812.3
申请日:2022-08-23
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F40/295 , G06F40/284 , G06F40/242 , G06F18/25 , G06N3/0499 , G06N3/09
摘要: 本发明公开了一种基于动态词信息融合的命名实体识别方法。目的是提高实体识别准确率。技术方案是构建由字符表示模块、动态词信息融合模块、拼接模块、识别模块构成的命名实体识别系统;对命名实体识别系统进行训练;训练好的字符表示模块对输入文本处理得到输入文本字符级别的表示向量;训练好的动态词信息融合模块对输入文本字符级别的表示向量进行动态融合,得到输入文本的动态词信息表示向量;拼接模块拼接两种表示向量,得到包含输入文本字符信息、词信息以及字符与潜在词之间的相对位置信息的表示向量;训练好的识别模块对表示向量进行编码、解码,得到输入文本包含的命名实体类型。本发明可有效提高实体识别的准确率、召回率和F1值。
-
公开(公告)号:CN114356578A
公开(公告)日:2022-04-15
申请号:CN202210026412.7
申请日:2022-01-11
申请人: 中国人民解放军国防科技大学
摘要: 本发明公开了一种自然语言处理模型的并行计算方法、装置、设备及介质;在本方案中,不同计算节点组内的多个计算设备通过流水线并行方式进行训练,不同计算节点组间使用数据并行方式进行梯度共享,该方式可将流水线并行控制在一定的结点数量中,避免大规模计算结点训练中,流水线过度划分带来的性能下降的问题,可有效适用于大规模网络模型在大规模计算结点上的并行训练。并且,本方案将计算节点组间同步通信隐藏在流水线并行计算过程中,使得在迭代计算结束后,各计算结点组可尽快进入下一次迭代计算,通过该方式,可在确保自然语言处理模型的处理效果的基础上,减少自然语言处理模型训练的计算时间,提高分布式训练的效率。
-
公开(公告)号:CN113360286B
公开(公告)日:2022-04-12
申请号:CN202110686675.6
申请日:2021-06-21
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F9/50 , G06F40/295
摘要: 本发明公开了一种基于知识图谱嵌入的链接预测方法,目的是实现大规模知识图谱的快速链接预测。技术方案是先对知识图谱进行分区;然后构建嵌入模型和由N个服务器和共享文件系统组成知识图谱链接预测系统,训练时服务器作为主节点和训练节点,训练时服务器作为查询节点和预测节点,主节点安装有锁服务器进程,训练节点安装有数据加载进程和GPU训练进程;接着多机并行且CPU、GPU并行对嵌入模型进行分布式训练;最后N个服务器加载训练后的嵌入模型,对知识图谱链接进行并行预测;采用本发明既加快了知识图谱嵌入的训练和连接预测,又解决了分区造成的嵌入性能下降问题,能够快速获得高质量的知识图谱嵌入。
-
公开(公告)号:CN113360286A
公开(公告)日:2021-09-07
申请号:CN202110686675.6
申请日:2021-06-21
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F9/50 , G06F40/295
摘要: 本发明公开了一种基于知识图谱嵌入的链接预测方法,目的是实现大规模知识图谱的快速链接预测。技术方案是先对知识图谱进行分区;然后构建嵌入模型和由N个服务器和共享文件系统组成知识图谱链接预测系统,训练时服务器作为主节点和训练节点,训练时服务器作为查询节点和预测节点,主节点安装有锁服务器进程,训练节点安装有数据加载进程和GPU训练进程;接着多机并行且CPU、GPU并行对嵌入模型进行分布式训练;最后N个服务器加载训练后的嵌入模型,对知识图谱链接进行并行预测;采用本发明既加快了知识图谱嵌入的训练和连接预测,又解决了分区造成的嵌入性能下降问题,能够快速获得高质量的知识图谱嵌入。
-
公开(公告)号:CN111694714A
公开(公告)日:2020-09-22
申请号:CN202010542339.X
申请日:2020-06-15
申请人: 中国人民解放军国防科技大学
摘要: 本发明公开了一种众核芯片功耗估算方法,该方法包括以下步骤:获取待估算众核芯片进行程序执行时各CPU核的时钟频率、供电电压、以及每时钟周期指令数,得到各CPU核分别对应的指标组;将各指标组输入到功耗估算模型;其中,功耗估算模型为通过对预获取的时钟频率样本集、供电电压样本集、每时钟周期指令数样本集进行拟合训练得到;利用功耗估算模型基于各指标组对待估算众核芯片进行功耗估算操作,得到功耗估算结果。应用本发明实施例所提供的技术方案,较大地提高了众核芯片功耗估算的准确性。本发明还公开了一种众核芯片功耗估算装置、设备及存储介质,具有相应技术效果。
-
公开(公告)号:CN111581954A
公开(公告)日:2020-08-25
申请号:CN202010412904.0
申请日:2020-05-15
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F40/253 , G06F40/30 , G06F40/284 , G06F16/35 , G06N3/04
摘要: 本发明公开一种基于语法依存信息的文本事件抽取方法及装置,该方法步骤包括:S1.获取原始非结构化文本数据中各条待处理语句,并提取各条待处理语句的分布式表示向量;S2.获取各条待处理语句中各个单词之间的语法依存关系信息,构建得到各个单词之间的语法依存关系树;S3.根据各条待处理语句的分布式表示向量以及各个单词之间的语法依存关系树使用图神经网络进行迭代,提取得到各个单词的具有语法依存信息的特征向量;S4.使用步骤S3提取得到的特征向量进行事件抽取,得到事件抽取结果。本发明能够充分挖掘上下文语义信息进行事件抽取,具有实现方法简单、抽取精度高等优点。
-
公开(公告)号:CN118228771A
公开(公告)日:2024-06-21
申请号:CN202410388915.8
申请日:2024-04-01
申请人: 中国人民解放军国防科技大学
IPC分类号: G06N3/0455 , G06N3/0464 , G06N3/084 , G06F18/213 , G06F18/25 , G06F18/2415 , G06F18/21 , G06F18/214 , G06F18/15 , G06F123/00 , G06F123/02 , G06N3/048
摘要: 本发明公开了一种基于时频空注意力解耦的认知信号解码方法,目的是解决现有技术全局特征利用率低以及不同域特征提取互相干扰导致解码准确率低的问题。技术方案是:首先构建由基于多视野注意力的频域特征提取模块、基于动态脑连接图注意力的空间域特征提取模块、融合模块、基于局部时间滑窗注意力的时域特征提取模块、聚合模块构成的基于时频空注意力解耦的认知信号解码系统,然后准备训练解码系统所需的数据集,采用数据集中的训练集对解码系统进行训练,得到训练后的解码系统。最后采用训练后的解码系统对输入的脑认知数据集开展认知分类任务,得到认知分类结果。本发明能能够更有效地提取不同域的特征信息,提升脑电信息解码的准确率。
-
公开(公告)号:CN118095291A
公开(公告)日:2024-05-28
申请号:CN202410357819.7
申请日:2024-03-27
申请人: 中国人民解放军国防科技大学
IPC分类号: G06F40/30 , G06F16/35 , G06N3/0464 , G06N3/08
摘要: 本发明涉及跨域谣言检测模型的构建方法及存储介质和终端设备,包括:获取标注数据、目标领域的伪标注数据;根据伪标注数据的可靠性,在标注数据和伪标注数据中,选取构建元学习中的支撑集和查询集;使用领域对抗学习对谣言检测模型进行训练,对齐模型在不同领域的特征空间,并初始化模型对参数;支撑集中采样第一训练样本并赋予可学习的样本权重,并基于最小化内循环分类损失,在元学习内循环中伪更新模型参数;查询集中采集第二训练样本,并基于最小化外循环分类损失,在元学习外循环中更新样本权重;基于元学习更新的最优权重,重训练模型,得到最终的谣言检测模型。其是一种改进的自训练技术,来实现谣言检测模型的领域自适应。
-
-
-
-
-
-
-
-
-