-
公开(公告)号:CN116664979A
公开(公告)日:2023-08-29
申请号:CN202310654313.8
申请日:2023-06-02
Applicant: 科大讯飞股份有限公司
IPC: G06V10/774 , G06V10/25 , G06V10/764 , G06V10/74 , G06N3/0455 , G06N3/0895
Abstract: 本发明提供了一种伪标签生成方法、模型训练方法、目标检测方法和设备,方法包括:采用已标注的第一训练图像对构建的目标检测模型进行训练,得到第一目标检测模型,利用第一目标检测模型获取第一训练图像中已标注目标对应的目标特征,利用第一目标检测模型并辅以已标注目标对应的目标特征,生成未标注的第二训练图像的伪标签,在此基础上,采用已标注的训练图像和具有伪标签的训练图像训练得到最终的目标检测模型,进而,利用训练得到的目标检测模型对待检测图像进行目标检测。本发明针对未标注的训练图像可生成准确的伪标签,在此基础上可训练得到性能较佳的目标检测模型,进而,利用该模型对待检测图像进行目标检测,可获得较好的检测效果。
-
公开(公告)号:CN114419148A
公开(公告)日:2022-04-29
申请号:CN202111491453.5
申请日:2021-12-08
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种触碰检测方法、装置、设备和计算机可读存储介质,该方法包括:获取对触碰检测平面拍摄到的第一图像和第二图像;分别对第一图像和第二图像进行目标检测,得到目标对象的目标部位分别在第一图像中的第一图像位置和在第二图像中的第二图像位置;对第一图像位置和第二图像位置进行联合分析,得到触碰检测结果;其中,触碰检测结果包括目标部位是否触碰到触碰检测平面。上述方案,能够提高触碰检测结果的精度,且成本较低。
-
公开(公告)号:CN114415830A
公开(公告)日:2022-04-29
申请号:CN202111663557.X
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种隔空输入方法及设备、计算机可读存储介质。该隔空输入方法包括:获取手势信息,手势信息至少包括动笔关键点的位置信息;获取动笔关键点的位置关系;响应于动笔关键点的位置关系满足触发动笔指令条件,执行动笔指令。通过上述方式,本发明能够降低输入识别难度,还能够增强输入的连贯性,以有利于改善用户的使用体验。
-
公开(公告)号:CN119360417A
公开(公告)日:2025-01-24
申请号:CN202411459811.8
申请日:2024-10-18
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种单目手势识别方法及相关装置,涉及手势识别技术领域,单目手势识别方法包括:获取目标手部图像序列;基于预先训练得到的单目3D手部姿态估计模型,获取目标手部图像序列的每个目标手部图像对应的手部3D关键点位置信息,得到目标手部3D关键点位置信息序列,其中,单目3D手部姿态估计模型采用标注有手部3D关键点位置信息的训练手部图像,同时辅以训练手部图像的手部姿态描述文本和/或真实手部3D重建标签训练得到;根据目标手部3D关键点位置信息序列,进行手势识别,得到手势识别结果。本申请公开的单目手势识别方法具有较高的识别精度。
-
公开(公告)号:CN119252514A
公开(公告)日:2025-01-03
申请号:CN202411765514.6
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种健康监测方法、装置、电子设备和存储介质,其中方法包括:对当前采集的视频帧进行人脸检测,得到当前帧的人脸区域图像;对人脸区域图像进行关键点检测,得到人脸关键点;基于人脸关键点,从人脸区域图像中确定出人脸局部区域;基于人脸区域图像中的目标关键点,将当前帧的人脸局部区域与上一帧的人脸局部区域进行对齐,并应用对齐后的人脸局部区域进行健康监测,得到健康指标。本发明通过基于检测到的人脸关键点,从人脸区域图像中确定出人脸局部区域,可以抑制过多干扰像素对特征提取的影响,通过将当前帧的人脸局部区域与上一帧进行对齐,可以显著缓解像素错位带来的影响,从而提高健康监测的准确性。
-
公开(公告)号:CN118675089A
公开(公告)日:2024-09-20
申请号:CN202410847707.X
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V40/16 , G06V20/52 , G06F18/25 , G06N20/00 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/0442 , G16H50/30 , A61B5/0205 , A61B5/00 , A61B5/145
Abstract: 本发明提供一种生理健康监测方法、装置、车辆、电子设备和存储介质,方法包括获取包括待监测对象的视频,对所述视频中的各帧图像进行面部检测,得到所述各帧图像中的面部图块;预测所述面部图块对应的基本属性,提取包括所述基本属性的描述文本的文本特征,并提取各所述面部图块的图像时序特征;基于所述文本特征和所述图像时序特征,对所述待监测对象的生理健康进行监测。本发明提供的生理健康监测方法、装置、车辆、电子设备和存储介质,能够从复杂的视频信号中提取出微弱的生理指标信号,相比于传感器监测的方式更加便捷,能够提高监测效率的同时保证了监测精度。
-
公开(公告)号:CN117373076A
公开(公告)日:2024-01-09
申请号:CN202311149747.9
申请日:2023-09-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种属性识别方法、系统以及相关装置,该方法包括:获取待识别图像;其中,所述待识别图像属于预设对象;将所述待识别图像输入至训练后的学生模型进行属性识别,得到所述待识别图像中所述预设对象的属性识别结果;其中,所述学生模型及其对应的教师模型均包括属性预测网络,且所述学生模型还包括空间变换网络,所述教师模型是基于变换训练图像训练得到的,所述变换训练图像是基于原始训练图像进行仿射变换后得到的,训练后的所述教师模型用于指导所述学生模型对所述原始训练图像进行属性识别,得到训练后的所述学生模型。通过上述方式,本申请能够提高属性识别效率和准确性。
-
公开(公告)号:CN117173798A
公开(公告)日:2023-12-05
申请号:CN202311139689.1
申请日:2023-09-05
Applicant: 科大讯飞股份有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/80 , G06V10/44 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种活体识别方法、装置、电子设备及存储介质,该方法包括:获取目标用户在目标模态下的待识别图像;将待识别图像输入第一检测模型中,输出目标用户的活体检测结果,第一检测模型是基于第二检测模型确定的第一类别token对初始第一检测模型进行约束得到的,第二检测模型为基于多模态的图像样本训练得到的;第一类别token为第二检测模型对图像样本对应的用户进行活体检测时的参数。该方法中,第二检测模型能利用多模态图像样本中不同模态的数据特征,充分挖掘数据间的关系;通过第二检测模型确定的第一类别token对初始第一检测模型进行约束,使第一检测模型能对任意模态的图像进行活体识别,提高了活体识别的灵活度。
-
公开(公告)号:CN115565162A
公开(公告)日:2023-01-03
申请号:CN202211378229.X
申请日:2022-11-04
Applicant: 科大讯飞股份有限公司
IPC: G06V20/59 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种视线估计模型的训练方法及装置、视线估计方法及装置,涉及计算机视觉技术领域。该训练方法包括基于目标对象的双眼区域图像集合,确定目标对象的样本图像对,样本图像对中包括两幅样本图像;确定两幅样本图像各自对应的第一视线特征;基于两幅样本图像各自对应的第一视线特征,确定待训练神经网络模型的损失函数;基于损失函数训练待训练神经网络模型,得到视线估计模型。与现有视线估计模型训练方法相比,显著提升了视线特征的表示能力,扩大了视线估计模型的有效工作范围,提升了视线方向预测的精准度。此外,本申请实施例训练生成的视线估计模型能够为分析驾驶员的驾驶状态提供全面、准确的支持,从而提高车辆行驶的安全性。
-
公开(公告)号:CN115424356A
公开(公告)日:2022-12-02
申请号:CN202211381906.3
申请日:2022-11-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种座舱内手势交互方法及装置,座舱内手势交互方法包括:接收座舱内的实时图像;将实时图像输入手势识别模型,获得手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果;依据第一座舱位置上第一手势对应的控制指令控制座舱内的设备;其中,对于不同的第一座舱位置,相同的第一手势对应的控制指令不同。本发明通过手势识别模型直接获得手势类别检测结果,避免两阶段手势识别导致的车机工作压力,并通过识别手势动作人所在的座舱位置,为不同座舱位置上的相同手势配置不同的功能,提高了手势交互的丰富度。
-
-
-
-
-
-
-
-
-