-
公开(公告)号:CN118942140B
公开(公告)日:2025-02-18
申请号:CN202411376935.X
申请日:2024-09-30
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种基于时间衰减机制的表情识别方法、装置、设备及介质。该方法包括:基于预设区域检测模型及预设表情识别模型分类处理当前标准化视频帧确定表情信息,并基于预设上肢体关键点检测模型及预设动作识别模型识别处理当前标准化视频帧确定动作信息;基于动作信息与对应表情信息的一致性关系,确定当前标准化视频帧对应的第一强信息度帧或第二强信息度帧;基于时间衰减机制及第一强信息度帧或第二强信息度帧对当前标准化视频帧进行置信度融合处理得到融合表情置信度值,并基于融合表情置信度值确定当前标准化视频帧对应的表情识别结果。通过本发明的技术方案,能够识别出视频序列中的表情类别,提高了表情识别的准确性和鲁棒性。
-
公开(公告)号:CN119314157A
公开(公告)日:2025-01-14
申请号:CN202411344158.0
申请日:2024-09-25
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种图像处理模型的训练方法、装置、设备及介质。该方法包括:将样本人脸数据输入待训练的图像处理模型中的人脸特征提取单元,得到样本人脸特征;所述图像处理模型还包括性别判断单元、风格特征提取单元、特征增强单元和年龄预测单元;将样本人脸特征输入性别判断单元进行性别判断;将年龄标签输入风格特征提取单元得到表征年龄的风格特征;将风格特征和样本人脸特征输入特征增强单元得到增强特征;将增强特征输入年龄预测单元进行年龄预测;根据真实年龄、性别判断结果和年龄预测结果,确定所述图像处理模型的最终损失,并根据所述最终损失对所述图像处理模型的参数进行更新。本发明实施例可以提高年龄预测的准确性。
-
公开(公告)号:CN119313758A
公开(公告)日:2025-01-14
申请号:CN202411344728.6
申请日:2024-09-25
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本申请提供一种多相机的实时建图方法、装置、电子设备及存储介质,其中,该方法包括:获取传感器数据和多相机数据;对传感器数据进行预积分处理,得到预积分数据;对多相机数据进行特征提取,得到特征点数据;对预积分数据和特征点数据进行初始化,得到初始化数据;对预积分数据和特征点数据进行融合,得到第一融合数据;根据初始化数据和第一融合数据获得建图结果。实施本申请,通过对传感器数据和多相机数据的多维度处理,可以全面覆盖自动驾驶过程中的实时建图,在减少传感器使用的前提下,减少了自动驾驶系统的构建成本,同时能够协调多个相机,避免外界环境对相机采集的影响,避免采集数据出现发散、模糊等问题,提高测量精度和建图精度。
-
公开(公告)号:CN115035189B
公开(公告)日:2024-12-31
申请号:CN202210615965.6
申请日:2022-05-31
Applicant: 中国第一汽车股份有限公司
IPC: G06T7/70 , G06T3/4038 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种图像处理方法、装置、电子设备及存储介质。该方法包括:采集当前时刻和上一时刻与目标主体相对应的待处理图像;基于目标姿态估计模型对各待处理图像进行处理,得到目标主体在下一时刻的姿态信息;其中,目标姿态估计模型中包括特征提取模型和目标姿势属性确定模型,目标姿态估计模型是基于预先构建的训练样本集确定的,训练样本集中包括多个训练样本,训练样本中包括拼接图像和姿态标签,拼接图像是基于当前视频帧与上一视频帧拼接而成的,姿态标签与下一视频帧相对应。解决了现有技术中基于几何算法从单帧图像中提取几何约束来估计姿态,导致姿态估计准确性低的问题,实现达到提高姿态估计准确性、便捷性的效果。
-
公开(公告)号:CN115027361B
公开(公告)日:2024-12-31
申请号:CN202210655254.1
申请日:2022-06-10
Applicant: 中国第一汽车股份有限公司
IPC: B60R1/07 , B60R16/023
Abstract: 本申请提供了一种盲区的确定方法、确定装置、处理器与车辆,该确定方法包括:确定驾驶员眼点在车辆坐标系中的坐标,得到第一目标坐标,车辆坐标系为以目标点为坐标原点而建立的坐标系,目标点为车辆的后轴的中心点;根据第一目标坐标和后视镜在车辆坐标系中的预设坐标,确定后视镜的偏转角度,并根据偏转角度对预设坐标进行调整,得到后视镜在车辆坐标系中的第二目标坐标,其中,后视镜安装在车辆上;至少根据第一目标坐标和第二目标坐标,确定车辆的目标盲区。本方案保证了确定出的车辆的目标盲区较为合理和准确,从而解决了现有技术中难以根据驾驶员的驾驶习惯,较为灵活地调整车辆的盲区监测范围的问题。
-
公开(公告)号:CN115437270B
公开(公告)日:2024-10-11
申请号:CN202211065401.6
申请日:2022-09-01
Applicant: 中国第一汽车股份有限公司
IPC: G05B17/02
Abstract: 本发明公开了一种汽车自动驾驶的仿真方法、装置、存储介质及设备。其中,该方法包括:获取服务器中存储的仿真数据,其中,上述仿真数据用于表征一次仿真实验的重要等级信息、场景信息和仿真轮次信息;控制客户端根据上述仿真数据进行仿真实验,得到初始仿真结果;采用上述客户端根据上述初始仿真结果修改本次上述仿真实验对应的上述重要等级信息,得到目标仿真结果;采用上述服务器汇总上述目标仿真结果。本发明解决了汽车自动驾驶仿真方法存在人工干预时间长、分类效果差的技术问题。
-
公开(公告)号:CN118570859A
公开(公告)日:2024-08-30
申请号:CN202410707012.1
申请日:2024-06-03
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V40/16 , G06V40/18 , G06V10/774 , G06V20/70 , G06V20/59
Abstract: 本申请实施例提供一种车辆座舱外视线估计方法、装置、设备和存储介质。该方法包括:获取所述第一摄像头采集的驾驶员图像和所述第二摄像头采集的车辆前视图像;确定所述驾驶员图像中的人脸图像以及所述车辆前视图像中的多个目标图像;针对每个目标图像,根据所述人脸图像、所述目标图像、所述车辆前视图像和预设视线估计模型,确定所述目标图像为所述车辆前视图像中驾驶员的注视目标的预测概率;根据各预测概率,确定所述车辆前视图像中驾驶员的注视目标。该方法提高了车辆座舱外驾驶员视线估计的准确率,且降低了驾驶员视线估计成本。
-
公开(公告)号:CN115035909B
公开(公告)日:2024-08-13
申请号:CN202210613329.X
申请日:2022-05-31
Applicant: 中国第一汽车股份有限公司
IPC: G10L21/12
Abstract: 本发明实施例公开了一种音乐可视化展示方法及装置。包括:获取可视化音乐界面的背景音乐,基于背景音乐的音频数据生成界面元素于可视化音乐界面的第一运动曲线;根据第一运动曲线确定界面元素的初始运动位置和运动变化位置,控制界面元素沿第一运动曲线从初始运动位置运动到运动变化位置;确定界面元素的运动结束位置,基于运动变化位置和运动结束位置生成界面元素的第二运动曲线,并控制界面元素沿第二运动曲线从运动变化位置运动至运动结束位置,解决了目前车载多媒体的音乐可视化展示方式存在表现形式过于单一,无法满足人们在音乐视觉方面上越来越高的需求问题,从而达到提升用户听音乐时的视觉感官体验和系统可玩性的技术效果。
-
公开(公告)号:CN116691667B
公开(公告)日:2024-07-26
申请号:CN202310912555.2
申请日:2023-07-24
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: B60W30/095 , B60W30/08
Abstract: 本发明公开了一种车辆的行驶轨迹规划方法、装置、车辆和存储介质,该方法包括:根据车辆的当前位置确定栅格地图的轨迹规划区域,并在轨迹规划区域内构建栅格地图;获取障碍物信息,并根据障碍物信息计算栅格地图中的各个栅格的障碍物静态势能和障碍物动态势能;根据障碍物静态势能和障碍物动态势能,确定栅格地图中的各个撒点的候选行驶轨迹得分;根据候选轨迹得分规划车辆在轨迹规划区域内的行驶轨迹。即本发明的技术方案,提高所规划的车辆的行驶轨迹的准确性,进而车辆按所规划的车辆的行驶轨迹行驶时,减少与障碍物发生碰撞的可能性,降低车辆的碰撞风险,增加车辆的智能性和安全性,更好地保障车辆的行驶安全。
-
公开(公告)号:CN116543758B
公开(公告)日:2023-09-15
申请号:CN202310762127.6
申请日:2023-06-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种语音唤醒模型的更新方法、系统和介质。该方法包括:获取计算节点集合中每个计算节点对应的私有模型和测试数据库;其中,所有计算节点位于同一个区域内;按照预设融合算法对私有模型进行融合,得到对应的目标增强模型;将测试数据库中的测试数据分别输入至每个私有模型和目标增强模型,得到对应的第一实际唤醒准确率和第二实际唤醒准确率;基于第一实际唤醒准确率、第二实际唤醒准确率和唤醒准确率差值阈值对每个计算节点的私有模型进行更新。本发明实现了通过处于同一个区域内的多个计算节点对自身实际工况下创建的私有数据库进行共享,并采用这些数据对基础模型进行增量训练,从而提升了在噪声环境下语音唤醒的准确率和稳定性。
-
-
-
-
-
-
-
-
-