-
公开(公告)号:CN116453158A
公开(公告)日:2023-07-18
申请号:CN202310339779.9
申请日:2023-03-24
申请人: 影石创新科技股份有限公司
IPC分类号: G06V40/10 , G06V10/764 , G06V10/82 , H04N23/695
摘要: 本申请涉及一种人物关系识别方法、装置、手持云台、系统、设备及介质。该方法包括:对多个图像帧进行人体检测处理,得到各图像帧的人体检测结果,从各图像帧的人体检测结果中分别筛选各目标图像帧的有效人体检测结果,并通过各目标图像帧的有效人体检测结果,对各目标图像帧中的人物特征进行分析,获得多个图像帧中的人物关系识别结果。上述方法通过人体检测处理得到各图像帧中的人体检测结果,并从所有图像帧的人体检测结果中筛选出目标图像帧的有效人体检测结果,进而通过目标图像帧的有效人体特征信息,即有效人体检测结果,对目标图像帧中的人物特征分析,从而能够提高确定的人物关系识别结果的准确性。
-
公开(公告)号:CN118426584A
公开(公告)日:2024-08-02
申请号:CN202410425499.4
申请日:2024-04-09
申请人: 影石创新科技股份有限公司
IPC分类号: G06F3/01 , G06V40/20 , H04N23/611
摘要: 本申请涉及一种手势控制方法和计算机设备。该方法包括:从目标图像中确定出目标对象的手势;目标对象为满足预设控制条件;根据目标对象的手势,执行手势对应的指令。采用本方法能够提高手势控制的精确度。
-
公开(公告)号:CN114187461A
公开(公告)日:2022-03-15
申请号:CN202111395373.X
申请日:2021-11-23
申请人: 影石创新科技股份有限公司
摘要: 本申请涉及一种行人重识别方法、装置、计算机设备、存储介质和计算机程序产品。方法通过获取待处理视频数据,提取待处理视频数据中包含待检测行人的检测框;获取检测框内待检测行人的特征视角以及待检测行人的第一行人特征;从预设视角特征库中提取与特征视角对应的行人视角,获取行人视角下各行人的第二行人特征,得到第二行人特征集;而后获取第一行人特征与第二行人特征之间的特征相似度与视角相似度;根据特征相似度与视角相似度,来确定待检测行人的行人重识别结果。本申请在进行行人重识别时,综合考虑特征相似度和视角相似度,额外引入视角相似度来衡量特征之间的视角差异,从而有效提高行人重识别过程的识别准确率。
-
公开(公告)号:CN118521762A
公开(公告)日:2024-08-20
申请号:CN202310188761.3
申请日:2023-02-17
申请人: 影石创新科技股份有限公司
摘要: 本申请实施例提供一种对象识别方法、装置、计算机设备及计算机可读存储介质,可以获取待识别对象的待识别图像;对待识别图像中待识别对象进行区域信息提取,得到待识别对象的对象区域信息;对待识别图像中待识别对象进行偏移信息提取,得到待识别对象的位置偏移信息;根据对象区域信息和位置偏移信息,确定待识别对象的对象特征信息;根据对象特征信息,对待识别对象进行识别处理,得到待识别对象的识别结果。由于本申请实施例可以从待识别图像中提取到对象区域信息和位置偏移信息,如此可以基于对象区域信息和位置偏移信息确定出对象特征信息,从而可以基于对象特征信息对待识别对象进行识别处理,以提高对待识别对象进行识别的准确性。
-
公开(公告)号:CN118314356A
公开(公告)日:2024-07-09
申请号:CN202211726254.2
申请日:2022-12-30
申请人: 影石创新科技股份有限公司
IPC分类号: G06V10/30 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/08 , G06T5/70
摘要: 本申请涉及一种目标网络结构的搜索方法、装置、计算机设备、存储介质。所述方法包括:从网络结构种群中获取两个不同的网络结构;将各所述网络结构编码成稀疏特征向量和稠密特征向量;对各所述网络结构的稀疏特征向量和稠密特征向量进行整合和解码,得到用于表示各所述网络结构的结构特征向量;对所述网络结构的结构特征向量进行分类处理,得到用于表征各所述网络结构性能差异的分类结果;循环执行上述各步骤,直至得到所述网络结构种群中所有网络结构性能差异的分类结果;将满足预设条件的所述分类结果对应的网络结构作为目标网络结构。采用本方法能够提高网络结构搜索的准确性和效率。
-
公开(公告)号:CN117768769A
公开(公告)日:2024-03-26
申请号:CN202311555098.2
申请日:2023-11-20
申请人: 影石创新科技股份有限公司
IPC分类号: H04N23/61 , H04N23/611
摘要: 本申请涉及一种控制信号识别方法和拍摄设备。该方法包括:基于状态选择策略,从候选状态中选择目标状态;进入目标状态,以在目标状态下识别第一目标图像中的控制信号;第一目标图像与目标状态对应;根据控制信号对应的指令,执行对应的预设操作。采用本方法能够提高控制信号分类的准确性。
-
公开(公告)号:CN117669646A
公开(公告)日:2024-03-08
申请号:CN202211089649.6
申请日:2022-09-07
申请人: 影石创新科技股份有限公司
摘要: 本申请涉及一种模型结构搜索方法,包括:获取待处理模型结构,待处理模型结构包括有多个嵌套的通用子结构,每个通用子结构包括有至少一个功能单元;随机选择目标尺度,从多个嵌套的通用子结构中随机选择目标通用子结构,从目标通用子结构的各功能单元中随机选择至少一个目标操作模块;根据目标尺度和目标操作模块,对待处理模型结构进行变异处理,得到对应的中间模型结构;基于中间模型结构确定下次迭代变异过程中的待处理模型结构,并返回至随机选择目标尺寸的步骤继续执行,直至达到预设停止条件时停止迭代变异的过程;根据多次变异所得到的多个中间模型结构分别对应的模型评价分数,确定出目标模型结构。采用本方法能够提高模型结构搜索效果。
-
公开(公告)号:CN114723989A
公开(公告)日:2022-07-08
申请号:CN202210307497.6
申请日:2022-03-25
申请人: 影石创新科技股份有限公司
摘要: 本申请实施例涉及图像处理技术领域,公开了一种多任务学习方法、装置及电子设备,该方法通过获取至少两个数据集,获取任务平衡因子和数据集平衡因子,其中,任务平衡因子用于调节不同任务之间的标签数量,数据集平衡因子用于调节每一任务在不同数据集中的标签数量,利用任务平衡因子和数据集平衡因子来确定每一任务在每一数据集中对应标签的采样率,以对每一数据集进行采样,得到每一任务用于训练的样本数据,进而进行多任务训练,得到多任务训练结果,本申请实施例能够解决在进行多任务单阶段训练时,存在多个数据集中不同任务的标签数量不同或者比例失衡或者数据分布不同而导致的标签不平衡的问题,从而平衡多任务学习中的不同任务的性能。
-
-
-
-
-
-
-