-
公开(公告)号:CN118366433A
公开(公告)日:2024-07-19
申请号:CN202410442526.9
申请日:2024-04-12
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
IPC分类号: G10L15/06 , G10L15/02 , G10L15/16 , G10L15/24 , G06F18/214 , G06F18/25 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/08
摘要: 本申请公开一种伪造语音检测模型的训练方法、伪造语音检测方法及设备,属于多媒体安全技术领域。该方法包括:获取多个音频样本文件;从多个音频样本文件的文本数据和音频数据中提取多模态样本特征,对多模态样本特征进行特征融合处理,得到各个音频样本文件对应的融合特征;使用多个音频样本文件对应的融合特征对预先构建的自蒸馏声学模型进行迭代训练,得到伪造语音检测模型。这样,能够使自蒸馏声学模型充分挖掘不同模态特征之间的相关性,提高模型的表达能力和泛化能力,从而有利于提高伪造语音检测模型对伪造语音检测的准确率。
-
公开(公告)号:CN118154737A
公开(公告)日:2024-06-07
申请号:CN202410262621.0
申请日:2024-03-07
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
摘要: 本申请公开了一种虚拟形象的生成方法、装置、计算机程序产品和电子设备,属于人工智能技术领域,用以减少生成虚拟形象使用的计算资源。所述方法包括:获取目标对象的脸部图像;对所述脸部图像中的人脸各部位进行分类,确定所述脸部图像中人脸各部位的类别;对所述图像中的人脸各部位进行检测,确定所述脸部图像中所述人脸各部位的位置和所述人脸各部位之间的面积比例关系;根据所述人脸各部位的类别,从预设的素材库中获取所述人脸各部位对应的素材;根据所述人脸各部位的位置和所述人脸各部位之间的面积比例关系,对所述人脸各部位对应的素材进行组合渲染,生成所述目标对象的虚拟形象。
-
公开(公告)号:CN118197298A
公开(公告)日:2024-06-14
申请号:CN202410368194.4
申请日:2024-03-28
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
摘要: 本申请公开了一种语音识别方法、语音识别装置、电子设备及可读存储介质,所述方法包括:通过对待识别音频进行特征分析,得到第一融合特征;在通过对所述第一融合特征进行处理,得到与所述待识别音频对应的多个第一时间块的情况下,针对每个第一时间块,基于场景权值对所述第一时间块的长度进行调整,得到与所述第一时间块对应的第二时间块,其中,所述场景权值用于表示所述第一时间块所处场景的模糊程度;根据多个所述第二时间块重新划分所述待识别音频,得到多个第三时间块;针对每一所述第三时间块,基于所述第三时间块的声学特征和所述第三时间块的上下文嵌入向量平均值,确定与所述第三时间块对应的语音识别结果。
-
公开(公告)号:CN118155240A
公开(公告)日:2024-06-07
申请号:CN202410262710.5
申请日:2024-03-07
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
摘要: 本申请公开一种身份识别方法、装置及电子设备。方法包括:获取呈现有目标对象的图像序列。以所述目标对象的特征呈现质量为标准,对所述图像序列中的图像进行评测。根据所述评测结果从所述图像序列中选取出第一预设数量的代表图像。将所述代表图像中的所述目标对象的特征信息导入至数据库进行对比,以确定所述目标对象的身份信息;其中,所述数据库存储有底库特征信息与身份信息之间对应的关系。本申请可解决现有跨镜追踪技术所存在的身份识别效率低的问题。
-
公开(公告)号:CN116958288A
公开(公告)日:2023-10-27
申请号:CN202210373024.6
申请日:2022-04-11
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
IPC分类号: G06T11/00 , G06T5/50 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/047 , G06V10/74 , G06V40/16
摘要: 本申请涉及IT应用领域,提供一种带人脸属性的人脸图像生成方法、装置及其应用。所述方法包括:获取目标人脸属性图像以及待编辑人脸图像;输入目标人脸属性图像以及待编辑人脸图像至人脸图像生成网络中,得到人脸图像生成网络生成的目标人脸图像;人脸图像生成网络用于基于目标人脸属性图像以及待编辑人脸图像生成目标人脸图像;其中,人脸图像生成网络基于人脸样本图像集、特征脸部样本图像集以及从特征脸部样本图像集中提取的样本人脸属性图像训练得到。本申请实施例提供的方法可以解决生成的人脸图像上的人脸属性的外观形态不可控的技术问题,提升带人脸属性的人脸图像的生成效率。
-
公开(公告)号:CN118298601A
公开(公告)日:2024-07-05
申请号:CN202410303927.6
申请日:2024-03-18
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
摘要: 本申请公开了一种报警消息推送方法及装置、可读存储介质、计算机程序产品,包括:获取目标场景下目标时刻检测到的报警对象;将所述目标时刻的报警对象的数量与预设时间窗口内的各历史时刻的报警对象的数量分别进行比对;如果第一历史时刻的数量超出第一预设数量阈值,则推送所述目标场景下所述目标时刻的报警对象的报警消息,第一历史时刻为报警对象的数量超出所述目标时刻的报警对象的数量的历史时刻。
-
公开(公告)号:CN118155118A
公开(公告)日:2024-06-07
申请号:CN202410262632.9
申请日:2024-03-07
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
摘要: 本申请公开了一种目标对象的检测方法、装置、计算机程序产品及电子设备,属于人工智能技术领域,用以提高目标对象检测效率。所述方法包括:对待检测的视频进行抽帧操作;将所述抽帧操作得到的图片存储到图片存储件;通过目标检测算法从所述图片存储件的图片中获取目标图片;通过所述目标算法对所述目标图片进行目标对象检测。
-
公开(公告)号:CN117037204A
公开(公告)日:2023-11-10
申请号:CN202210463049.5
申请日:2022-04-28
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
摘要: 本申请涉及计算机视觉领域,提供一种摔倒检测方法、装置、电子设备及计算机程序产品。所述方法包括:在视频帧中筛选得到有效视频帧;根据检测对象的高度属性对有效视频帧进行尺寸矫正并确定检测对象的空间比例属性;根据空间比例属性对检测对象在每一有效视频帧中的三维姿态信息进行填充,得到无遮挡视频帧;基于无遮挡视频帧,利用摔倒检测模型得到检测对象的摔倒检测结果。本申请实施例提供的摔倒检测方法可以减少无关视频帧的干扰以及解决因视角限制导致的检测对象被遮挡和变形的问题,进而提高摔倒检测结果的准确度。
-
公开(公告)号:CN116069306A
公开(公告)日:2023-05-05
申请号:CN202111290544.2
申请日:2021-11-02
申请人: 中移系统集成有限公司 , 中移雄安信息通信科技有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F8/34
摘要: 本发明提供一种算法可视化开发的方法、装置、电子设备及存储介质,该方法包括:基于不同的算法开发任务,确定需要的底层画布和基础算法的图形组件;基于所述算法的流程,确定所述算法的可视化编排;基于模型转换后的所述算法的可视化编排以及设置的校验条件,确定所述算法的校验结果;若校验结果是通过,则生成所述算法的可部署的算法容器,完成所述算法的可视化开发。本发明提供的算法可视化开发的方法、装置、电子设备及存储介质,通过将芯片和基础算法可视化,实现算法可视化编排,简单易上手,无代码开发。减少开发人员对底层平台约束限制,提高工作效率。
-
公开(公告)号:CN117095383A
公开(公告)日:2023-11-21
申请号:CN202210502377.1
申请日:2022-05-09
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V20/59 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种驾驶员驾驶状态识别方法,方法包括:获取目标驾驶员的待识别图像;将所述待识别图像输入至驾驶状态判别模型中,得到所述驾驶状态判别模型输出的驾驶状态;其中,所述驾驶状态判别模型是基于多样性数据样本训练得到的,所述多样性数据样本是多源状态信息图像经过超分辨率增强后再基于安全驾驶状态数据生成的;所述多源状态信息图像包括姿态信息、眼部信息、嘴部信息和面部信息中的至少两种。本发明用以解决单一来源信息对驾驶员状态识别不准确且样本数据少的问题,提升了驾驶员驾驶状态识别的准确性。
-
-
-
-
-
-
-
-
-