-
公开(公告)号:CN116091709B
公开(公告)日:2023-08-01
申请号:CN202310376835.6
申请日:2023-04-10
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了建筑物的三维重建方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及图像处理、数字孪生以及3D视觉技术,可应用在智慧城市、城市管理、应急管理场景。具体实现方案为:基于俯视角图像,得到多个建筑物中每个建筑物的屋顶信息以及每个建筑物的侧棱信息;基于每个建筑物的屋顶信息以及每个建筑物的侧棱信息,确定每个建筑物的底面信息;基于每个建筑物的底面信息,得到每个建筑物的三维模型。本公开可以实现基于俯视角图像进行批量建筑物的三维重建,减少建筑物三维重建的人力成本,并大幅提升效率。
-
公开(公告)号:CN116091709A
公开(公告)日:2023-05-09
申请号:CN202310376835.6
申请日:2023-04-10
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了建筑物的三维重建方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及图像处理、数字孪生以及3D视觉技术,可应用在智慧城市、城市管理、应急管理场景。具体实现方案为:基于俯视角图像,得到多个建筑物中每个建筑物的屋顶信息以及每个建筑物的侧棱信息;基于每个建筑物的屋顶信息以及每个建筑物的侧棱信息,确定每个建筑物的底面信息;基于每个建筑物的底面信息,得到每个建筑物的三维模型。本公开可以实现基于俯视角图像进行批量建筑物的三维重建,减少建筑物三维重建的人力成本,并大幅提升效率。
-
公开(公告)号:CN117612054A
公开(公告)日:2024-02-27
申请号:CN202311361310.1
申请日:2023-10-19
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了监控视频的处理方法、监控视频的处理装置、电子设备、存储介质及程序产品,涉及视频处理技术领域,尤其涉及监控视频处理技术领域,具体实现方案为:获取待处理的监控视频流;对监控视频流中的视频帧进行语义分割,得到视频帧的语义标签;根据视频帧的语义标签和场景确定规则,确定视频帧适用的业务场景;根据监控视频流中多个视频帧适用的业务场景,确定监控视频流的场景标签。
-
公开(公告)号:CN115641360A
公开(公告)日:2023-01-24
申请号:CN202211281366.1
申请日:2022-10-19
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了基于人工智能的电池检测方法、装置和电子设备,涉及人工智能技术领域,具体为图像识别和深度学习技术领域,具体实现方案为:获取视频流,对视频流进行目标检测,以识别视频流中是否存在电池,响应于存在电池,对电池进行跟踪,以判断电池是否进入目标区域,本公开基于深度学习算法,可以对电池进入目标区域行为进行实时识别,并降低了成本,提升了识别电池进入目标区域的准确性和可靠性。
-
公开(公告)号:CN117611795A
公开(公告)日:2024-02-27
申请号:CN202311402511.1
申请日:2023-10-26
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V10/25 , G06V10/774 , G06V20/40 , G06V20/52 , G06V20/70
摘要: 本公开提供了基于多任务AI大模型的目标检测方法、模型训练方法,本公开涉及计算机技术领域,尤其涉及人工智能、神经网络模型、智慧城市技术领域。目标检测方法的具体实现方案为:识别待检测图像中的目标对象,得到第一识别结果;根据第一识别结果的置信度和对应第一精确率的第一阈值,从第一识别结果中确定第一告警对象,以作为检测结果;在满足触发条件的情况下,对第一识别结果对应的待补检图像进行目标检测,得到第二识别结果;根据第二识别结果的置信度和对应第二精确率的第二阈值,从第二识别结果中确定第二告警对象;以及根据第二告警对象,更新检测结果。本公开可以保证目标检测的高精确率,同时降低漏召率。
-
公开(公告)号:CN117522913A
公开(公告)日:2024-02-06
申请号:CN202311515037.3
申请日:2023-11-14
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种目标识别方法和装置,涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域。具体实现方案为:获取可转动的摄像装置采集的视频流;基于视频流对应的图像帧中的目标,确定摄像装置的预置位;基于预置位和视频流,确定静物图像帧以及静物图像帧中的固定静物;基于静物图像帧和固定静物,确定视频流中目标的位置变动结果。该实施方式提高了目标的位置变动识别的准确性。
-
公开(公告)号:CN114943936B
公开(公告)日:2023-06-20
申请号:CN202210688810.5
申请日:2022-06-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/52 , G06V10/25 , G06V10/762 , G06V20/40 , G06V10/77
摘要: 本公开提供了目标行为识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及图像处理和智能视频分析等技术领域,可应用于智能云、智慧城市、城市治理和智能城管场景下。具体实现方案为:对采集的视频流进行抽帧,获取N个目标图像帧,并对目标图像帧进行行为识别,获取目标图像帧上的行为检测框,对行为检测框进行聚类处理,获取M个聚类簇,获取图像帧上的感兴趣区域,并基于感兴趣区域和聚类簇中包括的行为检测框,确定目标行为检测框。本公开通过对视频流抽帧得到的目标图像帧进行行为识别以获取行为检测框并进行聚类处理得到聚类簇,基于感兴趣区域和行为检测框确定目标行为检测框,提高了识别结果的准确度,增强了识别效果。
-
公开(公告)号:CN115631418B
公开(公告)日:2023-05-16
申请号:CN202211446987.0
申请日:2022-11-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/10 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本公开提供了一种图像处理方法、神经辐射场的训练方法和神经网络,涉及机器学习技术、计算机视觉技术、计算机图形学技术和深度学习技术。图像处理方法包括:从第一图像提取静态场景特征,第一图像为在第一时刻从第一视角拍摄目标场景而得到的;从第二图像提取动态场景特征,第二图像为在不同于第一时刻的第二时刻从不同于第一视角的第二视角拍摄目标场景而得到的;确定不同于第二视角的目标视角,并在与目标视角对应的空间区域中确定多个采样点;针对多个采样点中的每一个采样点,将该采样点的空间位置信息、目标视角、静态场景特征以及动态场景特征输入经训练的神经辐射场,以得到该采样点的待渲染信息;基于多个采样点各自的待渲染信息渲染目标图像。
-
公开(公告)号:CN116824491A
公开(公告)日:2023-09-29
申请号:CN202310723634.9
申请日:2023-06-16
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了能见度检测方法、检测模型的训练方法、装置及存储介质,涉及人工智能领域,具体涉及图像识别、视频分析技术,可应用在智慧城市、城市治理、应急管理场景下。具体实现方案为:从监控视频中提取与预设的第一目标区域对应的第一图像;在第一图像对应的第一描述文本符合预设规则的情况下,将第一图像确定为待检测图像;利用第一检测模型,根据待检测图像和第一描述文本,得到待检测图像的可见性标签;其中,可见性标签用于描述待检测图像中的目标对象为可见状态或不可见状态;以及根据待检测图像的可见性标签,确定监控视频对应的监控区域的能见度等级。本公开可以实现快速高效地确定能见度等级。
-
公开(公告)号:CN114943936A
公开(公告)日:2022-08-26
申请号:CN202210688810.5
申请日:2022-06-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/52 , G06V10/25 , G06V10/762 , G06V20/40 , G06V10/77
摘要: 本公开提供了目标行为识别方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及图像处理和智能视频分析等技术领域,可应用于智能云、智慧城市、城市治理和智能城管场景下。具体实现方案为:对采集的视频流进行抽帧,获取N个目标图像帧,并对目标图像帧进行行为识别,获取目标图像帧上的行为检测框,对行为检测框进行聚类处理,获取M个聚类簇,获取图像帧上的感兴趣区域,并基于感兴趣区域和聚类簇中包括的行为检测框,确定目标行为检测框。本公开通过对视频流抽帧得到的目标图像帧进行行为识别以获取行为检测框并进行聚类处理得到聚类簇,基于感兴趣区域和行为检测框确定目标行为检测框,提高了识别结果的准确度,增强了识别效果。
-
-
-
-
-
-
-
-
-