-
公开(公告)号:CN112863548A
公开(公告)日:2021-05-28
申请号:CN202110090449.1
申请日:2021-01-22
申请人: 北京百度网讯科技有限公司
摘要: 本公开公开了模型训练方法、装置、电子设备和计算机可读存储介质,涉及人工智能领域,尤其涉及深度学习领域和人工智能芯片领域。具体实现方案为:从音频文件中获取多个音频片段;基于多个音频片段中包含杂音的音频片段,确定用于训练音频检测模型的第一样本数据集;基于多个音频片段中不包含杂音的音频片段,确定用于训练音频检测模型的第二样本数据集,其中第二样本数据集与第一样本数据集不同;以及基于第一样本数据集和第二样本数据集,训练音频检测模型。以此方式,本公开的技术方案可以快速高效且低成本地完成对音频检测模型的训练,从而确定待测音文件的检测结果。
-
公开(公告)号:CN113486853B
公开(公告)日:2024-02-27
申请号:CN202110865078.X
申请日:2021-07-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种视频检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及计算机视觉、深度学习技术领域。实现方案为:获取待检测视频的多个视频帧;将多个视频帧输入到视频检测模型中,得到视频检测模型输出的与每个视频帧分别对应的识别结果;以及根据与多个视频帧分别对应的多个所述识别结果,确定待检测视频是否为经过拉伸的视频。该视频检测模型为基于包括监督数据的训练数据对预设模型进行训练得到的,该监督数据包括样本视频帧是否包含关键视频元素的标签数据。
-
公开(公告)号:CN114612492A
公开(公告)日:2022-06-10
申请号:CN202210326874.0
申请日:2022-03-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T7/13 , G06T7/90 , G06V30/413 , H04N17/00 , H04N21/435
摘要: 本公开提供了一种图像边框的检测方法、装置及电子设备,涉及人工智能技术领域,尤其涉及图像处理技术。该方法包括:确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;根据所述目标线段确定初始边框;根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框,提高了图像边框检测的准确性。
-
公开(公告)号:CN115099239B
公开(公告)日:2023-10-31
申请号:CN202210694398.8
申请日:2022-06-16
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/214 , G06N20/00
摘要: 本公开提供了一种资源识别方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及人工智能技术领域。具体实现方案为:获取待识别资源的后验信息和先验信息,后验信息用于体现用户对待识别资源的反馈信息,先验信息用于体现待识别资源的语义信息;根据第一识别模型和后验信息,对待识别资源进行识别,得到第一识别结果;根据第二识别模型和先验信息,对待识别资源进行识别,得到第二识别结果;根据第一识别结果和第二识别结果,生成第三识别结果。本公开提供的一种资源识别方法、装置、设备以及存储介质,能够提高资源识别的准确率。
-
公开(公告)号:CN114612492B
公开(公告)日:2023-01-31
申请号:CN202210326874.0
申请日:2022-03-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T7/13 , G06T7/90 , G06V30/413 , H04N17/00 , H04N21/435
摘要: 本公开提供了一种图像边框的检测方法、装置及电子设备,涉及人工智能技术领域,尤其涉及图像处理技术。该方法包括:确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;根据所述目标线段确定初始边框;根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框,提高了图像边框检测的准确性。
-
公开(公告)号:CN115099239A
公开(公告)日:2022-09-23
申请号:CN202210694398.8
申请日:2022-06-16
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06K9/62 , G06N20/00
摘要: 本公开提供了一种资源识别方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及人工智能技术领域。具体实现方案为:获取待识别资源的后验信息和先验信息,后验信息用于体现用户对待识别资源的反馈信息,先验信息用于体现待识别资源的语义信息;根据第一识别模型和后验信息,对待识别资源进行识别,得到第一识别结果;根据第二识别模型和先验信息,对待识别资源进行识别,得到第二识别结果;根据第一识别结果和第二识别结果,生成第三识别结果。本公开提供的一种资源识别方法、装置、设备以及存储介质,能够提高资源识别的准确率。
-
公开(公告)号:CN114202728B
公开(公告)日:2022-09-02
申请号:CN202111508931.9
申请日:2021-12-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/40 , G06V10/75 , G06V10/774
摘要: 本公开提供了一种视频检测方法、装置、电子设备及介质,涉及内容质量识别技术领域,尤其涉及视频处理技术领域,可应用于计算机视觉技术领域。具体实现方案包括:获取待检测视频,然后对待检测视频进行运动目标追踪,得到待检测视频中像素点的运动变化量。在运动变化量小于预设阈值时,确定待检测视频为低质量视频;在运动变化量大于等于预设阈值时,确定待检测视频不为低质量视频。从而实现了检测视频是否为低质量视频。
-
公开(公告)号:CN114202728A
公开(公告)日:2022-03-18
申请号:CN202111508931.9
申请日:2021-12-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/40 , G06K9/62 , G06V10/75 , G06V10/774
摘要: 本公开提供了一种视频检测方法、装置、电子设备、介质及产品,涉及内容质量识别技术领域,尤其涉及视频处理技术领域,可应用于计算机视觉技术领域。具体实现方案包括:获取待检测视频,然后对待检测视频进行运动目标追踪,得到待检测视频中像素点的运动变化量。在运动变化量小于预设阈值时,确定待检测视频为低质量视频;在运动变化量大于等于预设阈值时,确定待检测视频不为低质量视频。从而实现了检测视频是否为低质量视频。
-
公开(公告)号:CN113486853A
公开(公告)日:2021-10-08
申请号:CN202110865078.X
申请日:2021-07-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种视频检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及计算机视觉、深度学习技术领域。实现方案为:获取待检测视频的多个视频帧;将多个视频帧输入到视频检测模型中,得到视频检测模型输出的与每个视频帧分别对应的识别结果;以及根据与多个视频帧分别对应的多个所述识别结果,确定待检测视频是否为经过拉伸的视频。该视频检测模型为基于包括监督数据的训练数据对预设模型进行训练得到的,该监督数据包括样本视频帧是否包含关键视频元素的标签数据。
-
-
-
-
-
-
-
-