-
公开(公告)号:CN118741302A
公开(公告)日:2024-10-01
申请号:CN202410757864.1
申请日:2024-06-12
申请人: 影石创新科技股份有限公司
IPC分类号: H04N23/667 , H04N23/65 , H04N23/57 , H04M1/72454
摘要: 本申请涉及图像处理技术领域,特别是涉及一种电子设备控制方法、电子设备。所述控制方法包括:在检测到触发操作的情况下,根据电子设备在多个不同时刻采集的姿态信息,确认电子设备在目标时刻的姿态;其中,所述触发操作用于指示电子设备由第一状态切换至第二状态,所述第二状态的功耗大于所述第一状态的功耗;根据所述目标时刻的姿态,控制所述电子设备工作。本方案能够快速、准确地确定电子设备的初始姿态。
-
公开(公告)号:CN118694873A
公开(公告)日:2024-09-24
申请号:CN202310292317.6
申请日:2023-03-23
申请人: 影石创新科技股份有限公司
摘要: 本申请涉及一种图像的亮度调整方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:在目标图像中确定标签区域;确定所述标签区域按照颜色划分的颜色子区域的亮度,并将各所述颜色子区域的亮度转换为环境亮度;确定所述目标图像的全图亮度;基于所述环境亮度与所述全图亮度确定所述目标图像的亮度偏移值,并根据所述亮度偏移值调整所述目标图像的全图亮度。采用本方法可通过标签区域确定目标图像中各个位置的亮度,从而准确地计算出环境亮度,准确地反映拍摄环境的实际亮度;通过亮度偏移值将全图亮度调整到环境亮度,从而降低全图亮度与实际拍摄场景之间的亮度差距,进而使得全图亮度更贴近于实际拍摄场景的亮度。
-
公开(公告)号:CN118694870A
公开(公告)日:2024-09-24
申请号:CN202310320658.X
申请日:2023-03-23
申请人: 影石创新科技股份有限公司
摘要: 本申请涉及一种视频处理方法、装置、设备、存储介质和程序产品,该方法包括:先获取视频片段组中各候选视频片段的低层细节特征和高层语义特征,并根据各候选视频片段的低层细节特征和高层语义特征,去除各候选视频片段之间的冗余视频内容,得到视频片段组对应的至少一个目标视频片段,基于各目标视频片段,生成视频片段组的拼接视频。该方法能够在对多个视频片段进行去重时提高去重效果。
-
公开(公告)号:CN118675518A
公开(公告)日:2024-09-20
申请号:CN202310303618.4
申请日:2023-03-20
申请人: 影石创新科技股份有限公司
发明人: 请求不公布姓名
摘要: 本申请涉及一种语音识别方法、装置、智能设备及可读存储介质。该方法包括:响应于语音识别开始指令,若检测到语音输入数据中不存在用户语音,则以预设的标记值进行语音数据填充,直至语音识别结束,获取语音识别过程中采集到的用户语音输入数据,并对用户语音输入数据进行识别得到语音识别结果。采用上述方法在智能设备的语音识别功能开启的过程中,不局限于用户输入语音的时间,使用场景比较广泛,并且可以对语音识别功能开启过程中,用户随时输入的语音进行识别,解决了无法识别用户输入的非及时的语音指令的问题。
-
公开(公告)号:CN118612477A
公开(公告)日:2024-09-06
申请号:CN202410861549.3
申请日:2024-06-28
申请人: 影石创新科技股份有限公司
IPC分类号: H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402 , H04N21/472
摘要: 本申请涉及一种全景视频的处理方法、系统、装置、计算机设备和介质。方法包括:确定用户当前的观看区域,基于观看区域获取对应的目标视频流;将目标视频流解码渲染到观看区域;当检测到用户的观看区域发生变化时,确定发生变化后的观看区域对应的新的目标视频流,在更换新的目标视频流的过程中展示背景码流,背景码流为全景视频的低分辨率码流。采用本申请的方法能够在低带宽下保证全景视频的流畅高效传输和清晰度。
-
公开(公告)号:CN112233154B
公开(公告)日:2024-08-30
申请号:CN202011202954.2
申请日:2020-11-02
申请人: 影石创新科技股份有限公司
摘要: 本申请涉及一种拼接图像的色差消除方法、装置、设备和可读存储介质。所述方法包括:获取基于至少两张原始图像拼接所得的拼接图像;确定所述拼接图像中的过渡区域;所述过渡区域包含所述拼接图像中的重叠区域和至少一部分非重叠区域;基于所确定的过渡区域,对所述拼接图像进行色差消除处理,得到色差消除后的拼接图像,得到色差消除后的拼接图像。采用本方法能够消除拼接图像的色差。
-
公开(公告)号:CN118553262A
公开(公告)日:2024-08-27
申请号:CN202310207075.6
申请日:2023-02-24
申请人: 影石创新科技股份有限公司
发明人: 请求不公布姓名
IPC分类号: G10L21/0272 , G06F16/332 , G10L19/02 , G10L19/26 , G10L15/08 , G10L15/18 , G10L25/18 , G10L25/24
摘要: 本申请涉及一种语音流识别方法、装置、电子设备及可读存储介质。该方法包括:基于至少两个用户对话的目标语音场景中产生的语音流,提取各用户对应的语音频谱,通过各用户的语音频谱和语音流获取各用户的语音数据集,并通过各用户的语音数据集进行识别处理得到目标语音场景的语音流识别结果。采用上述方法可以通过各种语音场景中多用户对话时不同用户的语音频谱,对多用户对话产生的语音流进行准确识别,得到目标语音场景中多用户对话的语音流识别结果。
-
公开(公告)号:CN118553233A
公开(公告)日:2024-08-27
申请号:CN202310207161.7
申请日:2023-02-24
申请人: 影石创新科技股份有限公司
发明人: 请求不公布姓名
IPC分类号: G10L15/05 , G06F40/289 , G06F16/33 , G10L25/87 , G10L17/22
摘要: 本申请涉及一种语音流处理方法、装置、计算机设备及可读存储介质。该方法包括:获取根据用户的语音流创建的多种不同的语音帧生成的多个语音包,对各语音包进行识别确定语音流的当前语音场景信息,根据语音流的当前语音场景信息确定语音流的视频剪辑模板,并根据视频剪辑模板确定语音流的语音流识别结果。采用上述方法可以对整段语音流进行处理,获取语音流对应的视频剪辑模板。
-
公开(公告)号:CN113569843B
公开(公告)日:2024-08-23
申请号:CN202110684113.8
申请日:2021-06-21
申请人: 影石创新科技股份有限公司
发明人: 骆天骄
摘要: 本申请涉及一种角点检测方法、装置、计算机设备和存储介质。方法包括:基于角点集合,确定待检测的目标图像帧中的标定板区域,并作为检测区域,角点集合是基于标定板中的角点所确定的,目标图像帧是为视频流中的图像帧,视频流是由处于运动状态下的拍摄设备对标定板进行拍摄得到的。由于在进行角点检测时,不是对图像帧整个全部区域进行检测,也即非全局角点检测,而是仅检测全部区域中的标定板区域,从而检测范围缩小了,进而可以降低耗费的计算资源。同时,由于检测范围缩小了,整体检测的工作量也相应减少了,从而也能提高检测效率,也有利于批量化标定作业及提高标定产线产能。
-
公开(公告)号:CN118521762A
公开(公告)日:2024-08-20
申请号:CN202310188761.3
申请日:2023-02-17
申请人: 影石创新科技股份有限公司
摘要: 本申请实施例提供一种对象识别方法、装置、计算机设备及计算机可读存储介质,可以获取待识别对象的待识别图像;对待识别图像中待识别对象进行区域信息提取,得到待识别对象的对象区域信息;对待识别图像中待识别对象进行偏移信息提取,得到待识别对象的位置偏移信息;根据对象区域信息和位置偏移信息,确定待识别对象的对象特征信息;根据对象特征信息,对待识别对象进行识别处理,得到待识别对象的识别结果。由于本申请实施例可以从待识别图像中提取到对象区域信息和位置偏移信息,如此可以基于对象区域信息和位置偏移信息确定出对象特征信息,从而可以基于对象特征信息对待识别对象进行识别处理,以提高对待识别对象进行识别的准确性。
-
-
-
-
-
-
-
-
-