-
公开(公告)号:CN111274422A
公开(公告)日:2020-06-12
申请号:CN201811474629.4
申请日:2018-12-04
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供了一种模型训练方法、图像特征提取方法、装置及电子设备,其中,所述模型训练方法包括:使用训练数据对待训练模型进行第一阶段训练,得到第一阶段模型,其中,所述第一阶段训练中使用第一损失函数作为监督信号;使用所述训练数据对所述第一阶段模型进行第二阶段训练,得到第二阶段模型,其中,所述第二阶段训练使用所述第一损失函数和第二损失函数作为监督信号,所述训练数据为一图像数据集;使用所述训练数据对所述第二阶段模型进行第三阶段训练,得到目标模型,其中,所述第三阶段训练中使用第二损失函数作为监督信号。通过三个阶段分别训练得到的目标模型能够更好地分类图像特征。
-
公开(公告)号:CN110956251A
公开(公告)日:2020-04-03
申请号:CN201811128950.7
申请日:2018-09-26
申请人: 北京嘀嘀无限科技发展有限公司
发明人: 赵元
摘要: 本发明实施例提供一种模型训练方法及装置,涉及机器学习技术领域。该方法包括获取多个训练样本并输入待训练模型中,获得训练样本对应的预测值;根据训练样本对应的实际值和预测值计算训练样本对应的代价值;将代价值进行非线性映射获得对应的映射值;利用映射值对待训练模型中的参数进行优化,直至待训练模型达到预设要求。装置用于执行上述方法。本发明实施例通过将代价值进行非线性映射获得映射值,利用映射值对待训练模型中的参数进行优化,由于通过对代价值进行了非线性映射,从而实现了放大较大的代价值,缩小较小的代价值,在不减少训练样本数量的基础上增大了大代价值对应的训练样本在模型训练时的作用,提高了模型训练的稳定性。
-
公开(公告)号:CN110956058A
公开(公告)日:2020-04-03
申请号:CN201811126791.7
申请日:2018-09-26
申请人: 北京嘀嘀无限科技发展有限公司
发明人: 赵元
摘要: 本发明实施例提供一种图像识别方法、装置及电子设备。所述图像识别方法包括:将待识别图像进行检测,得到该待识别图像中每个目标识别区域的识别候选结果;将所有目标识别区域的识别候选结果进行组合得到多个预测目标序列;使用预训练的图像语言模型对所述多个预测目标序列进行计算得到每个预测目标序列的组合概率;根据各个预测目标序列的组合概率得到所述待识别图像的识别结果。
-
公开(公告)号:CN108805180B
公开(公告)日:2020-03-20
申请号:CN201810510732.3
申请日:2018-05-24
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本发明实施例提供一种目标对象的检测方法及装置,该方法包括:获取目标检测模型;目标检测模型是对训练图像数据中的监督标注数据和非监督标注数据训练得到的,目标检测模型为用于指示目标对象的检测模型;监督标注数据和非监督标注数据用于指示训练图像数据中目标对象的属性信息;确定待检测图像数据;通过目标检测模型对待检测图像数据进行检测,输出待检测图像数据中目标对象的属性信息。本发明实施例提供的目标对象的检测方法及装置,不仅提高了目标对象的检测效率,而且提高了目标对象检测的准确度。
-
公开(公告)号:CN111833263B
公开(公告)日:2024-06-07
申请号:CN202010514617.0
申请日:2020-06-08
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本发明实施例公开了一种图像处理方法、装置、可读存储介质和电子设备,通过以初始目标图像和初始传输率图像作为初始输入进行迭代处理,在每一次迭代过程中将当前目标图像和当前传输率图像输入第一彩色压缩场输出参考场景图,将所述参考场景图和当前传输率图输入第二彩色压缩场得到更新的当前目标图像,将所述更新的当前目标图像和当前传输率图输入第三彩色压缩场得到更新的当前传输率图像,在结束迭代过程后输出当前目标图像和当前传输率图。本发明实施例能够将由于拍摄场景造成模糊的目标图像转换为清晰的场景图,提高目标图像的视觉效果。
-
公开(公告)号:CN111832383B
公开(公告)日:2023-12-08
申请号:CN202010383035.3
申请日:2020-05-08
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06V10/82 , G06V40/20 , G06V40/10 , G06V20/59 , G06V10/44 , G06V10/52 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明实施例公开了一种姿态关键点识别模型的训练方法、姿态识别方法及装置,其中,基于第一损失函数和第二损失函数,根据训练图像训练姿态关键点识别模型的特征金字塔网络和矫正网络,并在第一损失和第二损失满足预定条件时,确定姿态关键点识别模型,将经过目标检测后裁剪获取的目标区域图像输入至训练好的姿态关键点识别模型中进行处理,得到各关键点对应的热力图,根据各关键点对应的热力图确定目标对象的姿态,由此,本实施例通过采用包括特征金字塔网络和矫正网络的姿态关键识别模型,提高了姿态关键点识别的准确性。
-
公开(公告)号:CN111860512B
公开(公告)日:2023-12-05
申请号:CN202010115418.2
申请日:2020-02-25
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供了一种车辆识别方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取目标图像并对所述目标图像进行车牌识别,获得车牌识别结果;如果车牌识别结果中未识别出车牌,则对待检测车辆进行外形特征识别获得待检测车辆的车辆识别信息;如果车牌识别结果中包括车牌的至少部分字符,则根据车牌的至少部分字符以及预先存储的已知车辆的车辆信息进行车辆识别,获得待检测车辆的车辆识别信息,其中,车辆信息包括已知车辆的车辆识别信息、已知车牌、外形特征。本申请所述的方案,先进行车牌识别,在识别出车牌中的至少部分字符时,采用识别出的部分车牌字符以及预先存储的车辆识别信息进行车辆识别,能够提高车辆识别的准确度。
-
公开(公告)号:CN111325671B
公开(公告)日:2023-07-04
申请号:CN201811529196.8
申请日:2018-12-13
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06N3/094 , G06N3/0475 , G06N3/0464 , G06T5/00
摘要: 本发明涉及网络训练方法、装置、图像处理方法及电子设备。该方法应用于生成式对抗网络,生成式对抗网络包括:生成网络和对抗网络,该方法包括:获取当前迭代训练的样本图像;将样本图像输入到生成网络中,得到复原图像;根据复原图像以及样本图像对应的参考图像确定表征样本图像的难易程度的自步学习参数;在下一次迭代训练时,根据自步学习参数以及自步学习优化机制训练对抗网络和生成网络。通过在训练网络中加入自步学习参数来调节训练模式,在训练初期让模型优先自主学习简单样本,随着训练次数的增加,逐渐增加学习复杂样本的优先度,这样可以解决复杂样本(质量很低的图像)对生成网络的扰动,增强模型的泛化能力和自主学习能力。
-
公开(公告)号:CN115527055A
公开(公告)日:2022-12-27
申请号:CN202111459411.3
申请日:2021-12-01
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 公开了一种数据处理方法、装置、存储介质和电子设备。通过获取原始样本集合和验证样本集合,通过初始数据增广模型根据原始样本集合获取增广样本集合,通过初始业务处理模型根据原始样本集合和增广样本集合获取训练损失,并根据验证样本集合获取验证损失,根据训练损失和验证损失对初始数据增广模型进行调整以获取数据增广模型。由此,通过将数据增广与实际业务进行结合,可以降低增广样本的对模型训练带来的噪声数据,提升特定业务下业务处理模型的性能。
-
公开(公告)号:CN110782397B
公开(公告)日:2020-08-28
申请号:CN201811529114.X
申请日:2018-12-13
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本发明涉及图像处理方法、生成式对抗网络、电子设备及存储介质。该方法包括:通过初始特征提取层对待处理图像进行初始特征提取处理,获得初始特征;通过每个下采样特征提取层对输入到自身的输入特征进行浅层特征、深度特征以及下采样特征提取处理,获得浅层特征、深度特征以及下采样特征;通过每个上采样特征提取层对输入到自身的输入特征进行上采样特征提取处理,获得上采样特征;通过残差特征提取层对第M个上采样特征提取层输出的上采样特征进行残差特征提取处理,获得残差特征;将残差特征和待处理图像相加得到目标图像。该方法能够降低图像增强过程中的处理复杂度,得到高清晰度的图像。
-
-
-
-
-
-
-
-
-