-
公开(公告)号:CN112633276B
公开(公告)日:2024-06-21
申请号:CN202011566347.4
申请日:2020-12-25
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V10/25 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种图像识别模型的训练方法、图像识别方法、装置、设备、介质和程序产品,涉及人工智能领域,尤其涉及计算机视觉、深度学习技术。实现方案为:获取样本图像及其标注信息,其中,标注信息包括按正负样本维度进行标注的初始标注信息,以及对样本图像中的正样本按不同的细粒度维度划分的至少一种细粒度标注信息;将样本图像输入预先搭建的图像识别模型,其中,图像识别模型包括至少两个独立的卷积层,不同的卷积层用于从不同维度提取样本图像的特征图的特征向量;根据样本图像的不同维度的标注信息,分别用各维度对应的损失函数对图像识别模型进行监督训练,其中,损失函数用于回传至与其对应维度的卷积层。本申请能提高图像识别精度。
-
公开(公告)号:CN111832483B
公开(公告)日:2024-03-08
申请号:CN202010674733.9
申请日:2020-07-14
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V10/25 , G06V30/422 , G06V20/62
-
公开(公告)号:CN113963300B
公开(公告)日:2023-10-03
申请号:CN202111250489.4
申请日:2021-10-26
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/40 , G06V10/25 , G06V10/77 , G06V10/764 , G06V10/774 , G06V10/80
摘要: 本公开提供了目标检测方法、装置、电子设备和存储介质,涉及图像处理技术领域,具体为人工智能、智能交通和深度学习技术领域。具体实现方案为:获取视频流;对所述视频流中图像进行划分,得到特征图像,所述特征图像的尺寸小于所述视频流中图像的尺寸;对特征图像进行目标检测,得到目标检测结果。本公开实施例可以提高目标检测的处理效率。
-
公开(公告)号:CN111858811B
公开(公告)日:2023-07-28
申请号:CN202010700885.1
申请日:2020-07-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/29 , G06F16/58 , G06F16/587
摘要: 本申请公开了一种构建兴趣点图像的方法、装置、电子设备及存储介质,涉及电子地图和兴趣点技术领域。具体方案为:在拍摄轨迹的各个位置点上对拍摄轨迹沿线的兴趣点进行拍摄,得到各个位置点对应的拍摄图像;若检测出任意一个位置点对应的拍摄图像不满足优选条件,则提取出该任意一个位置点的相邻位置点对应的拍摄图像;基于该任意一个位置点对应的拍摄图像和该任意一个位置点的相邻位置点对应的拍摄图像,构建出一张新的拍摄图像,使得新的拍摄图像满足优选条件;将新的拍摄图像作为该任意一个位置点对应的拍摄图像。本申请可以达到提升兴趣点加工效率的目的,可以应用于云平台或者云服务数据处理中。
-
公开(公告)号:CN113592980B
公开(公告)日:2023-07-25
申请号:CN202110729812.X
申请日:2021-06-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06T11/60
摘要: 本公开提供了招牌拓扑关系的构建方法、装置、电子设备和存储介质,涉及人工智能技术领域,尤其涉及图像处理、深度学习领域。具体实现方案为:获取多个街景图像;根据街景图像中的招牌信息生成对应的第一招牌拓扑关系;以及根据多个街景图像对应的多个第一招牌拓扑关系,生成多个街景图像对应的第二招牌拓扑关系。本公开的招牌拓扑关系的构建方法,通过获取多个街景图像并生成单个街景图像对应的单张图的拓扑结构图,并融合多个街景图像对应的多个单张图的拓扑结构图以进行拓扑关系的扩展,构建线状的招牌拓扑关系,可以准确详细地描述招牌间的拓扑关系。
-
公开(公告)号:CN113392795B
公开(公告)日:2023-07-04
申请号:CN202110725952.X
申请日:2021-06-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V20/64 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本公开提供了一种联合检测模型训练、联合检测方法、装置、设备及介质,涉及计算机技术领域,具体涉及人工智能领域、计算机视觉技术、深度学习技术,可应用于图像处理、自动驾驶等领域,包括:获取联合检测模型的图像训练数据;对所述图像训练数据包括的目标检测对象进行目标检测,得到目标检测结果;根据所述目标检测结果对所述目标检测对象进行深度估计,得到所述目标检测对象的3D关键点预测信息;根据所述3D关键点预测信息进行模型训练。本公开实施例能够实现目标检测和深度估计的联合训练和应用,提高联合检测模型的训练效率和检测效率。
-
公开(公告)号:CN113377888A
公开(公告)日:2021-09-10
申请号:CN202110710528.8
申请日:2021-06-25
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了训练目标检测模型和检测目标的方法及装置,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,具体可用于智能交通场景下。具体实现方案为:获取样本集,其中,样本集中的样本包括图片和标注信息,标注信息包括目标招牌的位置信息、深度值、方向角。执行以下训练步骤:从样本集中选取样本输入目标检测模型的关键点检测层,输出位置预测结果。基于位置预测结果生成候选区域。将候选区域输入目标检测模型的预测层,得到预测方向角、分类回归结果和预测深度。基于所选取的样本的标注信息与预测方向角、分类回归结果和预测深度训练目标检测模型。该实施方式生成了可以同时检测深度和位置的目标检测模型,提高了模型识别准确率。
-
公开(公告)号:CN113361524A
公开(公告)日:2021-09-07
申请号:CN202110727040.6
申请日:2021-06-29
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种图像处理方法及装置,涉及数据处理领域中的人工智能技术。具体实现方案为:确定对第一图像进行处理的第一模型,第一模型包括网络层、串联的N个卷积层、区域检测子模型和每个卷积层对应的子模型,N个卷积层和网络层串联连接,每个卷积层与对应的子模型连接,网络层与区域检测子模型连接。将第一图像输入至第一模型,以获取每个卷积层对应的子模型输出的图像识别信息、以及区域检测子模型输出的在第一图像中识别得到的目标区域。根据每个卷积层对应的子模型输出的图像识别信息和目标区域,确定目标区域的指示参数。根据指示参数,输出目标区域。通过将不同的模型组合为单一的第一模型,从而可以有效提升招牌提取的处理效率。
-
公开(公告)号:CN112200190A
公开(公告)日:2021-01-08
申请号:CN202011192213.0
申请日:2020-10-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06K9/32 , G06F16/9535 , G06F16/9537
摘要: 本申请公开了一种兴趣点的位置确定方法、装置、电子设备和存储介质,涉及智能交通和深度学习技术领域。具体实现方案为:确定包括相同兴趣点招牌的至少两个招牌图像,且将相同兴趣点作为目标兴趣点;其中,所述招牌图像关联有采集位置和方向角;根据所述至少两个招牌图像关联的采集位置和方向角,确定所述目标兴趣点的位置。本申请能够提高兴趣点位置的准确度。
-
公开(公告)号:CN111832483A
公开(公告)日:2020-10-27
申请号:CN202010674733.9
申请日:2020-07-14
申请人: 北京百度网讯科技有限公司
摘要: 本申请公开了一种兴趣点有效性识别方法、装置、设备以及存储介质,涉及电子地图、人工智能、以及深度学习技术领域。具体实现方案为:依据兴趣点POI图像数据,确定POI门脸文本;依据POI图像采集位置和所述POI门脸文本,从电子地图中确定关联POI;依据所述POI门脸文本与搬迁词表中词语的匹配结果,识别所述关联POI的有效性。以解决目前判断POI是否失效方案成本高且效率低下的问题,降低了成本,且能够高效精准识别出电子地图中已有POI是否失效,为识别电子地图中已有POI是否失效提供了一种新思路。
-
-
-
-
-
-
-
-
-