-
公开(公告)号:CN119559261A
公开(公告)日:2025-03-04
申请号:CN202311135155.1
申请日:2023-09-04
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本发明公开了一种室内空间尺寸计算方法、装置、设备及存储介质,方法包括:获取单目相机拍摄的室内图像和单目相机的内部参数,计算室内图像的深度图,从深度图中确定深度值大于目标值的目标区域,基于目标区域中各像素的深度值计算室内空间的第一维度尺寸,构建目标区域的外接矩形,并确定外接矩形的对角的图像坐标,基于外接矩形的对角的图像坐标、单目相机的内部参数和室内空间的第一维度尺寸,计算室内空间的第二维度尺寸和第三维度尺寸。本发明直接基于单目相机拍摄的室内图像,并结合图像处理方法和视觉几何方法获得室内空间的三维尺寸,无需深度传感器,降低了硬件成本。
-
公开(公告)号:CN119131105A
公开(公告)日:2024-12-13
申请号:CN202310703476.0
申请日:2023-06-13
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
IPC: G06T7/593 , G06T5/50 , G06N3/0464 , G06N3/045 , G06N3/086
Abstract: 本申请涉及计算机视觉技术领域,提供一种环视深度估计模型训练方法、装置、设备及存储介质,本申请训练得到的环视深度估计模型适配于鱼眼相机,能够从鱼眼相机拍摄得到的图像中估计深度信息。本申请通过利用稀疏点云和图像生成高精度的稠密深度图,得益于稀疏点云高精度且跨场景稳定的特性,使得模型在跨场景使用时,具有极高的鲁棒性。本申请通过直接对点云进行监督训练的方式获得深度图,而不是与现有技术一样对深度信息进行监督训练以获得深度图,提供了一种新的技术思路。本申请模型不仅预测多视角深度图,同时直接预测环视点云,使得点云的精度大大提高。
-
公开(公告)号:CN118096540A
公开(公告)日:2024-05-28
申请号:CN202211435052.2
申请日:2022-11-16
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本申请涉及图像处理技术领域,揭示了一种书写轨迹提取方法、装置、设备及介质,其中方法包括:获取目标摄像设备发送的第i个初始图像帧,其中,i是大于0的整数,所述目标摄像设备安装在黑板的背面;采用所述目标摄像设备对应的参考图像帧,对第i个所述初始图像帧进行残差滤波,得到第i个标准化图像帧;采用预设的时间窗和暗通道处理方法,对第i个所述标准化图像帧进行滤波,得到第i个书写轨迹图像帧。从而避免了红外传感器定位的不透明遮挡物体导致的确定的书写轨迹准确度不高的问题,提高了确定的书写轨迹准确度。
-
公开(公告)号:CN119295265A
公开(公告)日:2025-01-10
申请号:CN202310841835.9
申请日:2023-07-10
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
IPC: G06Q50/20 , G06Q10/0639 , G06F18/214 , G06N3/045 , G06N3/0895
Abstract: 本发明公开了一种教学数据测评方法、装置、设备和存储介质。该方法包括:获取待测评教学数据;根据所述待测评教学数据确定目标样本集;根据所述目标样本集训练初始VS‑GPT模型,得到目标VS‑GPT模型;对所述目标VS‑GPT模型进行测评,得到所述待测评教学数据对应的测评结果。通过本发明的技术方案,能够将收集到的教学数据作为输入,对GPT模型进行自监督训练,将训练好的VS‑GPT模型作为虚拟学生,通过对虚拟学生的测评来进行教学数据的评估,降低试错成本。
-
公开(公告)号:CN117475042A
公开(公告)日:2024-01-30
申请号:CN202210833670.6
申请日:2022-07-14
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Inventor: 刘宏波
IPC: G06T13/40 , G06V10/75 , G06V10/82 , G06V40/16 , G06N3/0464
Abstract: 本发明公开了一种虚拟形象的表情生成方法、装置、计算机设备和存储介质,涉及计算机视觉技术领域,本发明实施例预先根据样本人脸图像的基准表情编码向量与样本人脸图像对应的初始表情基的转换表情编码向量之间的语义误差对初始表情基进行调整,得到表情基,使得表情基与样本人脸图像之间更加切合,提高了表情基的逼真度,如此,在获取目标人脸图像以及目标人脸图像对应的目标表情系数后,可直接根据目标表情系数确定人脸表情基数据中与目标表情系数对应的目标表情基,然后根据目标表情系数和目标表情基,生成与目标人脸图像对应的虚拟形象的表情,使得虚拟形象的表情更加生动逼真。
-
公开(公告)号:CN117156288A
公开(公告)日:2023-12-01
申请号:CN202210546372.9
申请日:2022-05-18
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Inventor: 刘宏波
IPC: H04N23/88
Abstract: 本申请的一种白平衡计算方法,包括:获取初始图像,并根据预先设置的干扰色区域,计算所述初始图像的干扰色对应的第一占比;若所述第一占比大于预设的第一阈值,计算所述干扰色对应的类白区的第二占比;若所述第二占比大于预设的第二阈值,对所述初始图像中的所述干扰色进行抠除处理,得到目标图像;对所述目标图像进行白平衡计算,得到所述目标图像的白平衡增益参数,从而提高白平衡增益参数计算的准确性。
-
公开(公告)号:CN119068295A
公开(公告)日:2024-12-03
申请号:CN202310631349.4
申请日:2023-05-30
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本说明书实施例提供一种情绪监测方法、装置、设备与计算机存储介质,该方法包括:通过获取对象集合对应的课堂视频和课间视频,并对课间视频和课堂视频进行分析,获取目标对象的表情数据和行为数据,根据目标对象的表情数据和行为数据确认目标对象的个体情绪值,确认目标对象所属对象集合的群体情绪值,基于群体情绪值和个体情绪值确认目标对象的情绪监测结果。通过对课堂和课间的行为和表情的分析来进行情绪观察,实现对每个学生的情绪跟踪,并且将个体情绪和群体情绪进行比对,能够更好地对异常情绪进行监测,有效提高情绪识别准确率。
-
公开(公告)号:CN118154705A
公开(公告)日:2024-06-07
申请号:CN202211525194.8
申请日:2022-11-30
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本发明公开了一种卡通人像生成模型的构建及图像处理方法、装置和设备。该构建方法包括:将基准卡通人像输入至通用人像生成模型中,得到第一隐空间向量;将第一隐空间向量输入至通用人像生成模型,得到第一类型特征,以及将第二隐空间向量输入至原始卡通人像生成模型中,得到第二类型特征和实际卡通人像;基于评分值、第一类型特征和第二类型特征确定特征均值差异损失值,直至特征均值差异损失值达到最小差异损失值或模型迭代训练次数达到预设训练次数阈值为止,得到目标卡通人像生成模型。本发明解决了现有技术中人像卡通风格化任务中由于样本量小而无法基于模型参数微调获得高逼真图像的技术问题,实现了保护隐私的同时,增加了沟通的趣味性。
-
公开(公告)号:CN118135590A
公开(公告)日:2024-06-04
申请号:CN202211538981.6
申请日:2022-12-02
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本申请实施例提供一种笔迹提取方法、设备、存储介质及程序产品,该方法包括获取书写板中待拍摄区域的当前图像,对当前图像进行滤波,获得滤波后的图像,对滤波后的图像进行边缘检测,获得待拍摄区域内的笔迹。本实施例提供的笔迹提取方法,通过采用图像拍摄的方式,获取书写板上待拍摄区域的当前图像,并对当前图像进行滤波和边缘检测,获得待拍摄区域内的笔迹,能够避免受到遮挡物的干扰,提高了笔迹提取的准确度。
-
公开(公告)号:CN119169178A
公开(公告)日:2024-12-20
申请号:CN202310703496.8
申请日:2023-06-13
Applicant: 广州视源电子科技股份有限公司 , 广州视源人工智能创新研究院有限公司
Abstract: 本申请涉及计算机视觉技术领域,提供一种空间三维结构信息恢复方法、模型训练方法以及装置,空间三维结构恢复模型包括编码器、解码器以及反投影层,模型训练方法包括:通过编码器对彩色相机拍摄得到的待训练目标场景图像进行特征提取;通过解码器从提取的所述特征中估计得到由有尺度深度图以及实例分割图关联得到的关联图,通过反投影层将关联图反投影到点云空间,得到预测的空间三维结构信息;获取作为监督信号的空间三维结构信息;基于预测的空间三维结构信息和作为监督信号的空间三维结构信息确定空间三维结构恢复模型的损失函数的值并以此更新模型参数。本申请实现了输入一张彩色图像到模型便能恢复其三维空间结构信息,成本低。
-
-
-
-
-
-
-
-
-