-
公开(公告)号:CN117952176A
公开(公告)日:2024-04-30
申请号:CN202310536211.6
申请日:2023-05-12
申请人: 中国人民解放军战略支援部队信息工程大学 , 嵩山实验室
IPC分类号: G06N3/082 , G06N3/0455 , G06F40/211 , G06F40/284 , G06F40/268 , G06F40/30
摘要: 本发明提供给一种用于序列标注任务的Bert模型微调方法。该方法包括:定义token的层次化标签,记作{tag1,tag2,tag3,…,tagn,tag};其中,tag表示token的原始类别标记,tag1,tag2,tag3,…,tagn表示新增的token的其他语义信息标记,n表示标记所在层次;token表示待标注文本序列中的字或词;新增n个解码器,所述n个解码器分别与Bert模型中最后一层编码器的前n层编码器一一对应连接,使得对应层编码器的输出作为与其连接的解码器的输入;其中,第n个解码器的解码结果对应层次化标签中的第n层标记。
-
公开(公告)号:CN114911971A
公开(公告)日:2022-08-16
申请号:CN202210288932.5
申请日:2022-03-23
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F16/783 , G06V20/40 , G06V40/16 , G06V40/40
摘要: 本发明属于视频处理、网络信息安全技术领域,具体涉及一种融合标题信息的伪造人物视频检测方法及装置,该方法包括首先创建人物名字词典,基于文本规则匹配从带标题的含人脸的待检测视频的标题中提取人物的姓名信息;然后将从视频标题中提取的人物姓名作为关键词输入到互联网中进行搜索,进入相应人物的词条,提取人物的图像,将人脸区域保存为参考人脸图像;其次逐帧提取待检测视频中的视频帧,将人脸区域保存为待检测人脸图像;将待检测人脸图像和参考人脸图像输入到事先训练好的检测模型M中,如果M输出为1,则标记当前视频帧为伪造。本发明基于标题信息从互联网上获取目标对象的真实人脸图像作为先验知识,对伪造视频的真伪进行精准检测。
-
公开(公告)号:CN114758272A
公开(公告)日:2022-07-15
申请号:CN202210334683.9
申请日:2022-03-31
申请人: 中国人民解放军战略支援部队信息工程大学
摘要: 本发明提供一种基于频域自注意力的伪造视频检测方法。该方法包括:将待检测视频分为若干个视频帧;判断每个视频帧是否伪造视频帧,具体包括:提取当前视频帧中的人脸图像,记作原始人脸图像;提取所述原始人脸图像的相位谱,并基于相位谱对原始人脸图像进行重构,将重构得到的人脸图像记作重构人脸图像;将所述重构人脸图像拆分成若干个相同大小的图像块,并将若干个所述图像块转换成序列数据;将所述序列数据输入至训练好的Transformer模型中提取得到特征向量,将所述特征向量输入至多层感知机,判断所述特征向量对应的视频帧是否为伪造视频帧;统计伪造视频帧的数量与真实视频帧的数量,若前者大于后者,则认为待检测视频为伪造视频,反之为真实视频。
-
公开(公告)号:CN115410118A
公开(公告)日:2022-11-29
申请号:CN202210961313.8
申请日:2022-08-11
申请人: 中国人民解放军战略支援部队信息工程大学
摘要: 本发明属于多媒体信息处理技术领域,特别涉及一种对抗条件下的深度伪造视频检测方法及系统,首先,构建深度伪造视频检测模型集合并进行模型训练,其中,深度伪造视频检测模型集合中至少包含3个用于分别对输入视频进行真伪检测的神经网络结构模型;然后,利用训练后的深度伪造视频检测模型集合对待检测视频进行真伪检测,并针对集合中每个模型的真伪检测输出,采用大数胜出原则进行集中判决,以确定最终真伪检测结果。本发明针对伪造生成者通过对抗样本等技术添加扰动来干扰深度伪造视频检测、影响检测精度等的难题,基于多模型检测来提高对伪造视频检测的鲁棒性,提升视频鉴伪精度,便于实际场景应用。
-
公开(公告)号:CN111626056A
公开(公告)日:2020-09-04
申请号:CN202010281724.3
申请日:2020-04-11
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F40/295 , G06F40/284 , G06N3/04 , G06N3/08
摘要: 本发明属于命名实体识别技术领域,特别涉及一种基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置,该方法包括将待处理中文语料转换为字向量序列;将获得的字向量序列输入RoBERTa-BiGRU-LAN模型的第一层BiGRU-LAN,获取融合局部信息的编码序列;将上面获得的编码序列输入RoBERTa-BiGRU-LAN模型的第二层BiGRU-LAN,获取融合全局信息的注意力分布;根据上面获得的注意力分布得到命名实体识别结果。本发明改进字嵌入方法更好地进行中文表征,同时将BiLSTM-CRF改进为BiGRU-LAN,减少了模型的参数,降低模型复杂度,节省了训练时间。
-
公开(公告)号:CN110110079A
公开(公告)日:2019-08-09
申请号:CN201910218144.7
申请日:2019-03-21
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F16/35 , G06F16/9536 , G06Q50/00
摘要: 本发明提供一种社交网络垃圾用户检测方法。该方法包括:根据待检测用户的个人账户信息,提取待检测用户的行为特征,个人账户信息包括:注册时长、关注数、粉丝数、发布的原创文章数、发布的总文章数、非空转发的文章数和转发的总文章数;根据行为特征,利用预先构建的垃圾用户行为模型判断待检测用户是否为疑似垃圾用户;若待检测用户为疑似垃圾用户,则按照预设内容特征提取规则提取待检测用户的内容特征;根据内容特征,利用预先构建的垃圾用户内容模型确定待检测用户的垃圾文章比例;若待检测用户的垃圾文章比例大于预设阈值,则确定待检测用户为垃圾用户。本发明通过先后设置两个垃圾用户检测过程,既提高了检测准确度,又减少了计算量。
-
公开(公告)号:CN110619118B
公开(公告)日:2022-10-28
申请号:CN201910243895.4
申请日:2019-03-28
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F40/211 , G06F16/35 , G06F16/33 , G06K9/62
摘要: 本发明提供一种文本自动生成方法。该方法包括:步骤1、利用预训练好的自编码器得到待处理真实文本的隐藏空间向量;步骤2、利用训练好的生成网络生成所述隐藏空间向量的合成文本。针对现有技术中的基于自编码器的方法易于训练但生成文本逻辑性差的问题,或者基于生成对抗网络的方法生成文本语句通顺但稳定性差的问题,本发明能够加速生成网络的训练速度,增强训练稳定性,并在一定程度上增强合成文本的文本逻辑性。
-
公开(公告)号:CN114782858A
公开(公告)日:2022-07-22
申请号:CN202210308992.9
申请日:2022-03-28
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06V20/40 , G06V20/62 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , H04N17/00
摘要: 本发明公开一种基于预训练多模态模型的伪造视频检测方法及系统,该方法包括:步骤1、将待检测视频中声音信息转换成文本,并完成字幕和和视频帧的对齐;步骤2、筛选出含字幕的视频帧集合;步骤3、基于预训练的多模态模型逐帧判断含字幕的视频帧集合中每个视频帧的真伪;步骤4、综合含字幕的视频帧集合中所有视频帧的真伪判断结果得出待检测视频的真伪。本发明利用事先训练好的多模态模型同时提取视频中的画面和声音信息,实现视觉和听觉信息的融合,提高对伪造视频检测的精度。
-
公开(公告)号:CN114745720A
公开(公告)日:2022-07-12
申请号:CN202210287790.0
申请日:2022-03-23
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: H04W12/12 , H04W12/128 , G10L25/27 , G10L25/51
摘要: 本发明属于通信网内容安全检测技术领域,具体涉及一种变声型诈骗电话检测方法及装置,该方法包括:对于电信网中的通话,首先提取每个呼叫的前几秒有效语音的声学特征,得到声学特征图;然后将声学特征图送入虚假语音检测模型中进行判决,对于虚假语音检测模型检测出的利用变声软件发起的疑似诈骗呼叫,再提交给人工进行审核。本发明在检测过程中,不接触通话的具体内容,既不受诈骗分子更换话术内容的困扰,又能有效保护用户的通信隐私。
-
公开(公告)号:CN111626056B
公开(公告)日:2023-04-07
申请号:CN202010281724.3
申请日:2020-04-11
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F40/295 , G06F40/284 , G06N3/0442 , G06N3/048 , G06N3/045 , G06N3/082
摘要: 本发明属于命名实体识别技术领域,特别涉及一种基于RoBERTa‑BiGRU‑LAN模型的中文命名实体识别方法及装置,该方法包括将待处理中文语料转换为字向量序列;将获得的字向量序列输入RoBERTa‑BiGRU‑LAN模型的第一层BiGRU‑LAN,获取融合局部信息的编码序列;将上面获得的编码序列输入RoBERTa‑BiGRU‑LAN模型的第二层BiGRU‑LAN,获取融合全局信息的注意力分布;根据上面获得的注意力分布得到命名实体识别结果。本发明改进字嵌入方法更好地进行中文表征,同时将BiLSTM‑CRF改进为BiGRU‑LAN,减少了模型的参数,降低模型复杂度,节省了训练时间。
-
-
-
-
-
-
-
-
-