一种基于弱监督学习的虚假语音片段检测识别方法

    公开(公告)号:CN117935852A

    公开(公告)日:2024-04-26

    申请号:CN202311682008.6

    申请日:2023-12-08

    摘要: 本发明公开了语音识别技术领域的一种基于弱监督学习的虚假语音片段检测识别方法,包括以下步骤:步骤一、获取待检测语音并预处理;步骤二、该沟通用户是否有对应的历史特征包;步骤三、基于历史特征包得到该沟通用户对应的行为特征,并将行为特征与对应的局部声纹特征进行一致性对比;步骤四、基于该沟通用户的全频语音特征,在特定语段或采用语段下采集待对比声纹特征,并以待对比声纹特征建立历史特诊包;还将全频语音特征的波峰与波谷进行结合,得到相似声纹特征,并将不同的相似声纹特征进行相似性对比;步骤五、分离全频语音特诊中的背景音特征并对比;从而根据沟通用户自身的行为特点进行识别区分,以提高虚假语音的识别精度以及准确率。

    基于用户帖子关系的多视图协同过滤虚假新闻检测方法

    公开(公告)号:CN117933262A

    公开(公告)日:2024-04-26

    申请号:CN202311803257.6

    申请日:2023-12-26

    IPC分类号: G06F40/30 G06N3/0464

    摘要: 本发明公开了基于用户帖子关系的多视图协同过滤虚假新闻检测方法,涉及虚假新闻检测技术领域,其技术方案要点是:利用难以伪装的用户‑帖子关系来建模用户对于新闻真实性的偏好,具体来说,构建了一个3D矩阵,以便在每个单一视图中进行用户到帖子和帖子到用户的传播;以及为多个帖子标签构建多个视图,同时在全局视图中采用对比学习。此外,本发明提供两种整合多个视图以全面捕捉高级用户行为特征的策略:第一种策略利用元学习来获得适当的用户偏好权重,第二种策略利用标准偏差度量来评估用户偏好的明确性;最后,利用帖子特征和用户行为特征识别虚假新闻,充分利用用户的不同偏好特征,提高新闻真假性特征提取效率,提高虚假新闻识别准确率。

    一种基于动态词信息融合的命名实体识别方法

    公开(公告)号:CN115329766B

    公开(公告)日:2023-04-18

    申请号:CN202211009812.3

    申请日:2022-08-23

    摘要: 本发明公开了一种基于动态词信息融合的命名实体识别方法。目的是提高实体识别准确率。技术方案是构建由字符表示模块、动态词信息融合模块、拼接模块、识别模块构成的命名实体识别系统;对命名实体识别系统进行训练;训练好的字符表示模块对输入文本处理得到输入文本字符级别的表示向量;训练好的动态词信息融合模块对输入文本字符级别的表示向量进行动态融合,得到输入文本的动态词信息表示向量;拼接模块拼接两种表示向量,得到包含输入文本字符信息、词信息以及字符与潜在词之间的相对位置信息的表示向量;训练好的识别模块对表示向量进行编码、解码,得到输入文本包含的命名实体类型。本发明可有效提高实体识别的准确率、召回率和F1值。

    自然语言处理模型的并行计算方法、装置、设备及介质

    公开(公告)号:CN114356578A

    公开(公告)日:2022-04-15

    申请号:CN202210026412.7

    申请日:2022-01-11

    摘要: 本发明公开了一种自然语言处理模型的并行计算方法、装置、设备及介质;在本方案中,不同计算节点组内的多个计算设备通过流水线并行方式进行训练,不同计算节点组间使用数据并行方式进行梯度共享,该方式可将流水线并行控制在一定的结点数量中,避免大规模计算结点训练中,流水线过度划分带来的性能下降的问题,可有效适用于大规模网络模型在大规模计算结点上的并行训练。并且,本方案将计算节点组间同步通信隐藏在流水线并行计算过程中,使得在迭代计算结束后,各计算结点组可尽快进入下一次迭代计算,通过该方式,可在确保自然语言处理模型的处理效果的基础上,减少自然语言处理模型训练的计算时间,提高分布式训练的效率。

    一种基于知识图谱嵌入的链接预测方法

    公开(公告)号:CN113360286B

    公开(公告)日:2022-04-12

    申请号:CN202110686675.6

    申请日:2021-06-21

    IPC分类号: G06F9/50 G06F40/295

    摘要: 本发明公开了一种基于知识图谱嵌入的链接预测方法,目的是实现大规模知识图谱的快速链接预测。技术方案是先对知识图谱进行分区;然后构建嵌入模型和由N个服务器和共享文件系统组成知识图谱链接预测系统,训练时服务器作为主节点和训练节点,训练时服务器作为查询节点和预测节点,主节点安装有锁服务器进程,训练节点安装有数据加载进程和GPU训练进程;接着多机并行且CPU、GPU并行对嵌入模型进行分布式训练;最后N个服务器加载训练后的嵌入模型,对知识图谱链接进行并行预测;采用本发明既加快了知识图谱嵌入的训练和连接预测,又解决了分区造成的嵌入性能下降问题,能够快速获得高质量的知识图谱嵌入。

    一种基于知识图谱嵌入的链接预测方法

    公开(公告)号:CN113360286A

    公开(公告)日:2021-09-07

    申请号:CN202110686675.6

    申请日:2021-06-21

    IPC分类号: G06F9/50 G06F40/295

    摘要: 本发明公开了一种基于知识图谱嵌入的链接预测方法,目的是实现大规模知识图谱的快速链接预测。技术方案是先对知识图谱进行分区;然后构建嵌入模型和由N个服务器和共享文件系统组成知识图谱链接预测系统,训练时服务器作为主节点和训练节点,训练时服务器作为查询节点和预测节点,主节点安装有锁服务器进程,训练节点安装有数据加载进程和GPU训练进程;接着多机并行且CPU、GPU并行对嵌入模型进行分布式训练;最后N个服务器加载训练后的嵌入模型,对知识图谱链接进行并行预测;采用本发明既加快了知识图谱嵌入的训练和连接预测,又解决了分区造成的嵌入性能下降问题,能够快速获得高质量的知识图谱嵌入。

    一种众核芯片功耗估算方法、装置、设备及可读存储介质

    公开(公告)号:CN111694714A

    公开(公告)日:2020-09-22

    申请号:CN202010542339.X

    申请日:2020-06-15

    IPC分类号: G06F11/30 G06F30/27

    摘要: 本发明公开了一种众核芯片功耗估算方法,该方法包括以下步骤:获取待估算众核芯片进行程序执行时各CPU核的时钟频率、供电电压、以及每时钟周期指令数,得到各CPU核分别对应的指标组;将各指标组输入到功耗估算模型;其中,功耗估算模型为通过对预获取的时钟频率样本集、供电电压样本集、每时钟周期指令数样本集进行拟合训练得到;利用功耗估算模型基于各指标组对待估算众核芯片进行功耗估算操作,得到功耗估算结果。应用本发明实施例所提供的技术方案,较大地提高了众核芯片功耗估算的准确性。本发明还公开了一种众核芯片功耗估算装置、设备及存储介质,具有相应技术效果。