基于多尺度融合的点云特征增强方法和装置

    公开(公告)号:CN114299243A

    公开(公告)日:2022-04-08

    申请号:CN202111531882.0

    申请日:2021-12-14

    摘要: 本发明提供一种基于多尺度融合的点云特征增强方法和装置。其中方法包括:基于目标对象的原始点云构建目标对象的至少一个不同尺度规模的子点云;其中不同尺度规模的子点云中点的数量小于原始点云中点的数量;基于预先设定的邻域点的数量分别确定至少一个不同尺度规模的子点云中每个点的邻域点;基于所确定的邻域点分别确定至少一个不同尺度规模的子点云中每个点的局部特征;基于至少一个不同尺度规模的子点云中每个子点云的所有点的局部特征,确定每个子点云的全局特征,基于所确定的至少一个不同尺度规模的子点云中每个子点云的全局特征,对原始点云中每个点的原始特征进行融合,得到更具有表现力的目标点云。本发明可以增强点云的特征描述能力。

    基于图卷积网络的视觉检索模型的无监督训练方法和装置

    公开(公告)号:CN113987236B

    公开(公告)日:2022-03-22

    申请号:CN202111594299.4

    申请日:2021-12-24

    摘要: 本发明提供一种基于图卷积网络的视觉检索模型的无监督训练方法和装置。其中方法包括:将图像样本集输入特征提取网络得到特征提取网络输出的目标特征信息;基于目标特征信息构建图像样本集的无向图,将无向图输入图卷积网络,将图像样本集输入特征提取网络,获取特征提取网络的中间层特征信息输入图卷积网络,得到图卷积网络输出第一概率分布信息和特征提取网络输出的目标特征信息;基于目标特征信息对图像样本集进行聚类,基于聚类的结果确定图像样本集的第二概率分布信息,基于第一概率分布信息和第二概率分布信息对特征提取网络和图卷积网络的参数进行调整。本发明可以提升样本的特征表达,从而提升特征提取网络的性能,提升视觉检索的效果。

    一种行车区域与车道线识别方法及系统

    公开(公告)号:CN114120289A

    公开(公告)日:2022-03-01

    申请号:CN202210083455.9

    申请日:2022-01-25

    摘要: 本发明提供一种行车区域与车道线识别方法及系统,该方法包括:获取待识别的结构化道路图像;将待识别的结构化道路图像输入到道路识别模型中,得到由道路识别模型中的基础网络输出的全局语义特征;通过道路识别模型的第一分支网络,对全局语义特征中的行车区域进行提取,得到行车区域语义特征;通过道路识别模型的第二分支网络,对全局语义特征中的车道线进行提取,得到车道线语义特征;通过道路识别模型中的预测层对融合特征进行分类预测,得到待识别的结构化道路图像中的行车区域与车道线,融合特征是由全局语义特征、行车区域语义特征和车道线语义特征进行融合得到的。本发明有效提高了行车区域与车道线识别精度。

    基于先验约束的人脸关键点检测方法及装置

    公开(公告)号:CN114118303A

    公开(公告)日:2022-03-01

    申请号:CN202210083501.5

    申请日:2022-01-25

    摘要: 本发明提供一种基于先验约束的人脸关键点检测方法及装置,该方法包括:获取待识别人脸图像;将待识别人脸图像输入至人脸关键点检测模型中,得到人脸关键点检测模型提取的自注意力特征,以及基于自注意力特征输出的人脸关键点位置信息;其中,人脸关键点检测模型为基于人脸样本图像、人脸关键点位置样本数据以及人脸样本图像的结构先验特征进行有监督训练得到的,人脸样本图像的结构先验特征为对人脸关键点位置样本数据进行结构先验生成运算得到的,人脸关键点位置样本数据为人脸样本图像对应的样本标签。本发明提供的基于先验约束的人脸关键点检测方法及装置,能够提高人脸关键点检测的准确率,抗干扰能力强,提升困难场景下的鲁棒性。

    一种文字识别方法及系统
    55.
    发明公开

    公开(公告)号:CN114092930A

    公开(公告)日:2022-02-25

    申请号:CN202210012962.3

    申请日:2022-01-07

    摘要: 本发明提供一种文字识别方法及系统,该方法包括:获取待识别的自然场景文字图像;将自然场景文字图像输入到文字识别模型中,得到文字内容;其中,文字识别模型是由视觉识别网络、视觉信息优化网络和语义信息优化网络构成的;视觉信息优化网络和语义信息优化网络,用于根据文字识别网络输出的字符特征,分别生成对应的文字识别补充信息,以供文字识别网络基于文字识别补充信息,对文字识别结果进行优化。本发明通过使用视觉信息优化网络和语义信息优化网络,在视觉特征和语言结果两个层面,获取全局信息,并将得到视觉和语义的线索,作为视觉识别网络迭代执行识别过程的补充信息,从而逐步获取更为鲁棒的识别结果,提高文字识别精度。

    语义分割方法、装置、电子设备及存储介质

    公开(公告)号:CN114092818A

    公开(公告)日:2022-02-25

    申请号:CN202210012546.3

    申请日:2022-01-07

    摘要: 本发明提供一种语义分割方法、装置、电子设备及存储介质,其中方法包括:获取待分割图像;将所述待分割图像输入至语义分割模型,得到所述语义分割模型输出的所述待分割图像的语义分割结果;其中,所述语义分割模型是基于样本图像,以及样本图像对应的样本语义分割结果训练得到的;所述语义分割模型基于级联区域分类层对所述待分割图像的增强图像特征进行像素分类特征提取和区域分类特征提取,并基于所述级联区域分类层提取的像素分类特征和区域分类特征对所述待分割图像进行语义分割;所述级联区域分类层包括多个串联的区域分类层。本发明提供的方法和装置,有效地减少图像中无关信息的干扰,提高了语义分割的准确率。

    人体姿态估计方法及装置
    57.
    发明公开

    公开(公告)号:CN114022684A

    公开(公告)日:2022-02-08

    申请号:CN202210003055.2

    申请日:2022-01-05

    IPC分类号: G06V10/46 G06V40/10

    摘要: 本发明提供一种人体姿态估计方法及装置,该方法包括获取待识别图像;将待识别图像输入姿态估计模型,获取姿态估计模型输出的待识别图像中每一人体实例的姿态;其中,姿态估计模型,用于从待识别图像中确定多个关键点,基于各关键点对应的身份信息和尺度信息对待识别图像进行人体姿态估计,尺度信息基于对应关键点在待识别图像对应的特征嵌入图中的嵌入向量确定,身份信息基于嵌入向量在所处空间中的位置确定。本发明提供的人体姿态估计方法及装置,能在待识别图像中至少一个人体实例被遮挡的情况下,更准确的获取待识别图像中每一人体实例的姿态,对待识别图像进行人体姿态估计的鲁棒性更强。

    人脸关键点检测方法、装置、电子设备及存储介质

    公开(公告)号:CN114005169A

    公开(公告)日:2022-02-01

    申请号:CN202111667944.0

    申请日:2021-12-31

    IPC分类号: G06V40/16 G06V10/774 G06K9/62

    摘要: 本发明提供一种人脸关键点检测方法、装置、电子设备及存储介质,其中方法包括:获取待检测人脸图;将所述待检测人脸图输入至人脸关键点检测模型,得到所述人脸关键点检测模型输出的关键点检测结果;其中,所述人脸关键点检测模型是基于样本人脸图,以及样本人脸图对应的样本脸部UV图、样本脸部掩模图和样本关键点的真实坐标训练得到的;所述人脸关键点检测模型用于基于所述待检测人脸图的脸部UV图和脸部掩模图对所述待检测人脸图的人脸特征进行空间自注意力增强得到人脸增强特征,并基于所述人脸增强特征进行人脸关键点检测。本发明提供的方法和装置,提高了人脸关键点检测的准确率。

    图像分类方法及装置
    59.
    发明公开

    公开(公告)号:CN113989577A

    公开(公告)日:2022-01-28

    申请号:CN202111594126.2

    申请日:2021-12-24

    摘要: 本发明提供一种图像分类方法及装置,该图像分类方法包括:获取图像数据;将图像数据输入至图像分类模型中,得到图像分类模型输出的类别信息;其中,图像分类模型为基于样本图像数据、样本图像数据的自注意力特征和教师类别信息进行蒸馏训练得到的,样本图像数据的自注意力特征和教师类别信息为教师模型基于样本图像数据得到的,教师模型用于从样本图像数据中提取出自注意力特征教师类别信息,并基于所述自注意力特征进行图像分类。本发明提供的图像分类方法及装置,采用了基于注意力驱动的蒸馏训练方法,能够对图像分类模型进行快速准确地训练,能够节省人工成本,能够避免漏检的问题,能够提高图像分类的准确率,提高图像分类的效率。

    图像语义分割方法、装置、电子设备和存储介质

    公开(公告)号:CN113989511A

    公开(公告)日:2022-01-28

    申请号:CN202111627261.2

    申请日:2021-12-29

    IPC分类号: G06V10/26 G06V10/80 G06V20/70

    摘要: 本发明提供一种图像语义分割方法、装置、电子设备和存储介质,所述方法包括:确定待分割的目标图像;基于目标图像的图像特征,对目标图像进行语义分割,得到目标图像中各像素的语义特征,并基于各像素的语义特征确定目标图像的全局分割结果;基于图像特征以及各像素的语义特征,确定目标图像中各切块图像的语义特征,并基于各切块图像的语义特征确定目标图像的局部分割结果;基于全局分割结果,以及局部分割结果,确定目标图像的语义分割结果。本发明提供的图像语义分割方法、装置、电子设备和存储介质,能够进一步提高图像语义分割的精度。