-
-
公开(公告)号:CN119206676A
公开(公告)日:2024-12-27
申请号:CN202411392557.4
申请日:2024-10-08
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种疲劳检测方法、装置、电子设备和存储介质,其中方法包括:获取人脸图像,对所述人脸图像的眼部区域进行眼部关键点检测,得到所述眼部区域的关键点位置信息,并基于所述关键点位置信息,确定眼部开合度;对所述人脸图像进行头姿估计,得到所述人脸图像的头姿信息,并基于所述头姿信息,对所述眼部开合度进行校正,得到校正开合度;基于所述校正开合度,确定所述人脸图像的疲劳检测结果。本发明提供的方法、装置、电子设备和存储介质,头姿信息在眼部开合度校正中的应用,消除了头姿变化对于眼部开合度的影响,能够有效提升基于关键点检测得到的眼部开合度的可靠性,进而保证疲劳检测的可靠性和准确性。
-
公开(公告)号:CN114419148B
公开(公告)日:2024-12-17
申请号:CN202111491453.5
申请日:2021-12-08
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种触碰检测方法、装置、设备和计算机可读存储介质,该方法包括:获取对触碰检测平面拍摄到的第一图像和第二图像;分别对第一图像和第二图像进行目标检测,得到目标对象的目标部位分别在第一图像中的第一图像位置和在第二图像中的第二图像位置;对第一图像位置和第二图像位置进行联合分析,得到触碰检测结果;其中,触碰检测结果包括目标部位是否触碰到触碰检测平面。上述方案,能够提高触碰检测结果的精度,且成本较低。
-
公开(公告)号:CN118968558A
公开(公告)日:2024-11-15
申请号:CN202411120920.7
申请日:2024-08-15
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/764 , G06V10/766 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/098
Abstract: 本申请公开了一种学习专注度评估方法及相关装置,涉及计算机视觉技术领域,包括:利用预测模型分别确定学习者的待处理的学习视频中每帧原始图像中学习者与物品的交互关系,并根据各帧原始图像中学习者与物品的交互关系,确定学习者的学习专注度评估结果。预测模型是通过将目标检测分支和注视区域热图回归预测分支整合到一个统一的网络框架中,并通过对目标检测分支和注视区域热图回归预测分支进行联合训练得到的。由于这种联合训练不仅简化了预测模型的训练过程,还显著提升了预测模型的推理效率和效果,提升了学习者与物品的交互关系的确定效率和确定精度,因此,保证了学习专注度评估的效率和专注度评估结果的准确性。
-
公开(公告)号:CN118657930A
公开(公告)日:2024-09-17
申请号:CN202411040055.5
申请日:2024-07-31
Applicant: 科大讯飞股份有限公司
IPC: G06V10/25 , G06V10/26 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/80
Abstract: 本申请公开了一种目标检测方法、目标检测模型训练方法、装置及相关设备,目标检测模型在训练阶段与语义分割网络联合训练,语义分割网络以目标检测模型提取的隐层特征作为输入,用于预测语义分割结果,联合训练的总损失值包括目标检测模型的目标检测损失值和所述语义分割网络的语义分割损失值。采用联合训练策略后,可以使得目标检测模型在学习目标检测的同时,也能学习到语义分割信息,具备对局部细节刻画的能力,有助于提高对遮挡目标的检测效果。此外,本申请中的目标检测模型可以采用轻量化模型结构,实现提升对遮挡目标的检测效果。
-
公开(公告)号:CN117333514B
公开(公告)日:2024-04-16
申请号:CN202311636539.1
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06T7/246 , G06T7/223 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种单目标视频跟踪方法、装置、存储介质及设备,该方法包括:首先在获取到包含待跟踪的单目标对象的目标视频后,从目标视频中确定出包含第一帧图像对应的图像跟踪模板的M张图像跟踪模板,然后提取M张图像跟踪模板的模板图像特征,以及提取目标视频中每一帧搜索图像的搜索图像特征,并将模板图像特征和搜索图像特征输入预先构建的编码器网络进行编码,得到编码特征;接着将编码特征和开始标志位向量输入预先构建的解码器网络进行解码,预测出编码特征对应的搜索图像中单目标对象的位置和尺寸,从而能够提高目标视频中每一帧搜索图像中对于单目标视频跟踪结果的准确性。
-
公开(公告)号:CN117316158B
公开(公告)日:2024-04-12
申请号:CN202311599003.7
申请日:2023-11-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种交互方法、装置、控制设备及存储介质,交互方法包括:获取目标用户的手部图像序列和语音序列;识别语音序列中的指令词,并获取指令词对应的时间;根据手部图像序列以及指令词对应的时间,确定目标用户发出指令词时的手部指向区域;根据目标用户发出指令词时的手部指向区域,确定交互设备;控制交互设备执行指令词对应的操作。本发明提供的交互方法为结合语音的指向交互方法,该交互方法有效利用了不同模态信息的互补性,其不但能够实现丰富的交互功能,而且具有较好的交互稳定性,用户体验较好。
-
公开(公告)号:CN117608407A
公开(公告)日:2024-02-27
申请号:CN202311649601.0
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种交互方法、装置及存储介质、电子设备,该方法包括:获取手部图像;当检测到所述手部图像中存在多个交互手时,确定主交互手;识别所述主交互手的第一手指轨迹,并根据所述第一手指轨迹确定目标指令和目标对象;根据所述目标指令对所述目标对象进行控制。该方法在检测到手部图像中存在多个交互手时,通过确定主交互手,对主交互手的指尖轨迹进行追踪识别,确定目标指令和目标对象并根据目标指令对目标对象进行控制,实现主交互手的操作意图,具有识别准确,不易被干扰的优点。
-
公开(公告)号:CN117275094A
公开(公告)日:2023-12-22
申请号:CN202311320396.3
申请日:2023-10-11
Applicant: 科大讯飞股份有限公司
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0985 , G06N3/0464
Abstract: 本发明提供一种手势识别方法、装置、电子设备及存储介质,该方法包括:将至少一帧图像输入手势识别模型的编码模块中,输出各图像对应的编码特征;各图像包括至少一个对象;将各图像对应的编码特征和至少一个查询特征输入手势识别模型中与图像对应的解码模块中,输出解码特征;至少一个查询特征与解码模块对应;对象和查询特征一一对应,解码特征包括通过查询特征从编码特征中查询的对应对象的手势特征;将解码特征输入手势识别模型中与图像对应的识别模块中,基于手势特征确定图像中各对象的手势类别;基于各图像中各对象的手势类别,确定各对象的手势。基于此,通过一个模型同时识别多个对象的手势,能提高手势识别的效率。
-
公开(公告)号:CN117237989A
公开(公告)日:2023-12-15
申请号:CN202311244839.5
申请日:2023-09-25
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F16/33 , G06F16/35
Abstract: 申请公开了一种目标检测方法、装置、设备及存储介质,本申请将待检测图像切分为若干个子图像;利用图像编码器提取每一子图像的图像特征,利用文本编码器提取类别集合中每一候选类别标签的语义特征,图像编码器和文本编码器以学习图像和文本之间的对齐关系为训练目标,基于文本‑图像对训练数据训练得到;将每一子图像的图像特征分别与各个候选类别标签的语义特征计算相似度,取相似度最高的目标候选类别标签作为子图像的类别标签,最终得到待检测图像的目标检测结果。本申请方案对新增类别目标进行检测时,只需要将新增类别标签添加到类别集合中即可,无需对新增类别目标额外获取标注数据及重新训练神经网络模型,降低了人力和时间开销。
-
-
-
-
-
-
-
-
-