-
公开(公告)号:CN114360059A
公开(公告)日:2022-04-15
申请号:CN202111669916.2
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了导播系统的交互方法以及相关装置、设备,其中,导播系统的交互方法包括:采集目标对象的待识别图像;确定当前的任务类型;响应于基于待识别图像检测到目标对象的预设动作指令,基于预设动作指令利用导播系统显示与任务类型对应的目标区域的图像。上述方案,能够实现导播系统的自适应显示切换以及体感互动,进而提高导播系统的交互便捷度和操作简化性。
-
公开(公告)号:CN108256413A
公开(公告)日:2018-07-06
申请号:CN201711207223.5
申请日:2017-11-27
Applicant: 科大讯飞股份有限公司
Abstract: 本公开提供一种可通行区域检测方法及装置、存储介质、电子设备。该方法包括:获取车辆所在道路的道路图像,并将所述道路图像作为输入,经由可通行区域检测模型处理,确定出所述道路图像的可通行区域;其中,用于构建所述可通行区域检测模型的图像标注信息由样本障碍物信息和样本道路图像融合得到,所述样本障碍物信息为能够表示障碍物的障碍物点,所述图像标注信息用于标识所述样本道路图像的可通行区域和非可通行区域;基于所述道路图像的可通行区域,确定出所述车辆所在道路的可通行区域。如此方案,有助于降低图像标注消耗的时间,提高模型训练的效率。
-
公开(公告)号:CN119380207A
公开(公告)日:2025-01-28
申请号:CN202411212407.0
申请日:2024-08-30
Applicant: 科大讯飞股份有限公司
IPC: G06V20/13 , G06V20/17 , G06V10/143 , G06V10/82 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/0442
Abstract: 本申请公开了一种地块变化检测方法及相关装置、设备和存储介质,其中,地块变化检测方法包括:基于目标地块在不同时间的目标拍摄图像,生成第一编码特征,以及基于关于目标拍摄图像的目标问题语句,生成第二编码特征;其中,第一编码特征与第二编码特征两者的特征维度一致;基于第一编码特征和第二编码特征进行解码,得到用于回答目标问题语句的目标回答语句。上述方案,能够提升表征地块变化情况的目标回答语句的生成效果。
-
公开(公告)号:CN118618231B
公开(公告)日:2025-01-24
申请号:CN202411105233.8
申请日:2024-08-13
Applicant: 科大讯飞股份有限公司
IPC: B60R16/023 , B60W50/08 , G06N5/04 , G06N3/0455 , G06F18/241 , G06F18/25 , G06F18/27
Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。
-
公开(公告)号:CN118736648A
公开(公告)日:2024-10-01
申请号:CN202410927051.2
申请日:2024-07-11
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16 , G06V10/80 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本申请公开了一种人脸识别模型训练方法、人脸识别方法、装置、相关设备及计算机程序产品,对于获取的在通用人脸数据集上预训练后的通用人脸识别模型,在异质人脸数据集上进行部分参数的微调训练,提高异质人脸场景下的识别准确率。训练过程冻结了通用人脸识别模型中主干特征提取模块内主干网络的参数,对新增的微调分支网络等少量参数进行微调,提高模型的训练效率。同时,通过设置新增的微调分支网络与主干网络并行相连,训练过程既能保留通用人脸识别模型的核心参数,又实现了从通用人脸识别场景到异质人脸识别场景的迁移适应,确保训练后的模型在两种场景下具有较好的识别性能。
-
公开(公告)号:CN118618231A
公开(公告)日:2024-09-10
申请号:CN202411105233.8
申请日:2024-08-13
Applicant: 科大讯飞股份有限公司
IPC: B60R16/023 , B60W50/08 , G06N5/04 , G06N3/0455 , G06F18/241 , G06F18/25 , G06F18/27
Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。
-
公开(公告)号:CN118410345A
公开(公告)日:2024-07-30
申请号:CN202410436018.X
申请日:2024-04-11
Applicant: 科大讯飞股份有限公司
IPC: G06F18/22 , G06F18/25 , G06N3/0455
Abstract: 本申请提供一种数据匹配方法、装置、设备、存储介质及产品,该方法包括:分别获取第一模态数据的编码和第二模态数据的编码,通过对所述第一模态数据和所述第二模态数据进行联合编码,得到所述第一模态数据的共享编码和所述第二模态数据的共享编码;对所述第一模态数据的编码与所述第一模态数据的共享编码进行融合,得到所述第一模态数据的融合编码,对所述第二模态数据的编码与所述第二模态数据的共享编码进行融合,得到所述第二模态数据的融合编码;基于所述第一模态数据的融合编码和所述第二模态数据的融合编码,确定所述第一模态数据和所述第二模态数据的匹配结果。本申请可以更准确地度量不同模态数据之间的相似性,得到更准确的匹配结果。
-
公开(公告)号:CN118155275A
公开(公告)日:2024-06-07
申请号:CN202410155047.9
申请日:2024-02-02
Applicant: 科大讯飞股份有限公司
IPC: G06V40/20 , G06V40/10 , G06V10/774 , G06V10/82
Abstract: 本申请提出一种行人重识别模型的训练方法、行人重识别方法及相关装置,行人重识别模型的训练方法通过图像编码器提取样本人体图像的图像特征,通过文本编码器提取行人重识别提示词的文本特征;行人重识别提示词包括可学习特征,可学习特征通过对齐图像特征以及文本特征确定;以基于图像特征和文本特征确定的行人识别结果与样本人体图像对应的行人识别标签相一致为目标,对图像编码器的参数进行优化。如此设置,从文本和图像两个模态对模型进行训练,提高模型的特征提取能力,而且在行人重识别提示词中引入通过对齐图像特征以及文本特征得到的学习特征,使行人重识别提示词对应的文本特征更适用于行人重识别任务,提高行人重识别技术的识别精度。
-
公开(公告)号:CN117911321A
公开(公告)日:2024-04-19
申请号:CN202311685627.0
申请日:2023-12-04
Applicant: 科大讯飞股份有限公司
IPC: G06T7/00 , G06V30/413 , G06V30/162 , G06V30/18
Abstract: 本申请公开了一种图文混排图像的评测方法、装置、设备和存储介质,其中,图文混排图像的评测方法包括:基于图文混排图像进行文本检测,至少得到文本轮廓信息;基于文本轮廓信息,得到图像掩膜,并基于图像掩膜,确定图文混排图像中的图形区域和文本区域;基于由文本区域得到的识别文本、图形区域的原始图形分别进行评测,得到图文混排图像的评测结果。上述方案,能够提升图文混排图像的评测效率和评测准确率。
-
公开(公告)号:CN117765080A
公开(公告)日:2024-03-26
申请号:CN202311812674.7
申请日:2023-12-25
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种显示方法、装置、电子设备和存储介质,其中方法包括:获取相机当前视角下的图像;确定图像的感兴趣区域,并对感兴趣区域进行特征提取,得到当前视角下的特征向量;基于预设位置特征库,获取当前视角下的特征向量对应的目标变换矩阵,预设位置特征库基于各视角下的标定图像对应的特征向量和变换矩阵构建;基于目标变换矩阵,调整图像对应的视线数据,并应用调整后的视线数据进行抬头显示。本发明提供的方法、装置、电子设备和存储介质,可以在驾驶员位置固定但相机视角可手动调整的条件下,实现对抬头显示位置进行自适应矫正,提供稳定可靠的智能座舱抬头显示功能。
-
-
-
-
-
-
-
-
-