-
公开(公告)号:WO2023080762A1
公开(公告)日:2023-05-11
申请号:PCT/KR2022/017477
申请日:2022-11-08
Applicant: 삼성전자 주식회사
IPC: H04N21/4363 , H04N21/439 , H04N21/4788 , H04N21/488 , H04N5/60
Abstract: 개시된 실시예에 따른 디스플레이 장치의 동작 방법은, 재생 중인 컨텐츠에 포함되는 제1 오디오 데이터에 대응되는 스테레오 데이터를 제1 오디오 전송 프로파일을 통하여 상기 외부 오디오 장치로 전송하는 단계; 상기 제1 오디오 전송 프로파일로 상기 스테레오 데이터를 전송하는 동안에 발생하는 오디오 관련 이벤트에 근거하여, 오디오 전송 프로파일을 상기 제1 오디오 전송 프로파일에서 제2 오디오 전송 프로파일로 변경하는 단계; 및 상기 스테레오 데이터에 포함되는 제1 사운드 데이터 및 제2 사운드 데이터 중 어느 하나를 선택하여 제1 모노 오디오 데이터를 획득하고, 상기 제1 모노 오디오 데이터 및 상기 오디오 관련 이벤트에 대응되는 제2 오디오 데이터에 근거하여 생성되는 제2 모노 오디오 데이터를, 상기 제2 오디오 전송 프로파일을 통하여 상기 외부 오디오 장치로 전송하는 단계를 포함한다.
-
公开(公告)号:WO2023077980A1
公开(公告)日:2023-05-11
申请号:PCT/CN2022/119703
申请日:2022-09-19
Applicant: 深圳TCL新技术有限公司
IPC: H04N21/439
Abstract: 本申请公开了一种音效调节方法、装置、存储介质及电子设备,包括:获取第一音频信号,以及第一音频信号经环境反射后的第二音频信号;计算第一音频信号和第二音频信号之间的信号差异信息;根据信号差异信息,从多个预设音效模式中确定出目标音效模式。
-
3.
公开(公告)号:WO2023069456A2
公开(公告)日:2023-04-27
申请号:PCT/US2022/047048
申请日:2022-10-18
Applicant: APPRENTICE FS, INC. , MAGGIORE, Frank
Inventor: MAGGIORE, Frank
IPC: H04N21/454 , H04N21/439
Abstract: One variation of the method for distributing censored videos of manufacturing procedures performed within a facility includes: accessing a video feed captured by a local device interfacing with a local operator during performance of a procedure within the facility; interpreting a set of objects depicted in the video feed based on features extracted from the video feed; accessing a minimum censorship specification for the procedure, the minimum censorship specification defining a set of object types corresponding to a first degree of censorship; identifying a subset of objects, in the set of objects, depicted in the video feed related to the procedure based on the set of object types defined in the minimum censorship specification; fogging the subset of objects in the video feed to generate a censored video feed; and serving the censored video feed to a remote viewer portal accessed by a remote viewer.
-
公开(公告)号:WO2023061159A1
公开(公告)日:2023-04-20
申请号:PCT/CN2022/119695
申请日:2022-09-19
Applicant: 腾讯科技(深圳)有限公司
IPC: H04N21/439
Abstract: 一种视频播放方法、装置、终端、存储介质及程序产品,涉及人机交互技术领域。该方法包括:在局外场景界面中存在第一视频的视频播放资源的情况下,在局外场景界面中显示窗口化播放控件,局外场景界面是对局之外的场景界面(101);响应于对局外场景界面中窗口化播放控件的触发操作,在局外场景界面的上层显示视频播放窗口,视频播放窗口中播放有第一视频(102);在由局外场景界面切换至对局界面的情况下,关闭视频播放窗口(103)。
-
公开(公告)号:WO2023036275A1
公开(公告)日:2023-03-16
申请号:PCT/CN2022/117971
申请日:2022-09-09
Applicant: 北京字跳网络技术有限公司
IPC: H04N21/439 , H04N17/00
Abstract: 本申请涉及一种视频处理方法、装置、电子设备、介质及程序产品,应用于视频处理技术领域,所述方法包括:获取音画同步的原始视频,以及在原始视频的基础上进行视频处理而生成的待处理视频;基于原始视频和待处理视频中任一相同的目标视频帧/目标音频频谱点,确定目标视频帧/目标音频频谱点在待处理视频中出现的第一时刻;根据原始视频中目标视频帧/目标音频频谱点对应的音频频谱点/视频帧,确定音频频谱点/视频帧在待处理视频中出现的第二时刻;根据第二时刻和第一时刻之间的差值,判断待处理视频是否音画同步。本申请可以提高音画同步判断的效率和准确性。
-
公开(公告)号:WO2023035969A1
公开(公告)日:2023-03-16
申请号:PCT/CN2022/114952
申请日:2022-08-25
Applicant: 马上消费金融股份有限公司
Abstract: 本申请提供一种语音与图像同步性的衡量方法、模型的训练方法及装置,语音与图像同步性的衡量方法包括:获取视频中的语音片段和图像片段,语音片段和图像片段在所述视频中具有对应关系;执行以下操作中的任意一项:将语音片段转换为特定信号并通过预先训练的语音与图像同步性衡量模型获得特定信号的语音特征以及图像片段的视觉特征,特定信号与语音片段中说话人的个人特征无关;或,根据图像片段生成目标人物的轮廓图并通过预先训练的语音与图像同步性衡量模型获得轮廓图的视觉特征以及语音片段的语音特征,轮廓图与所述目标人物的个人特征无关;或,将语音片段转换为特定信号,根据图像片段生成目标人物的轮廓图,并通过预先训练的语音与图像同步性衡量模型获得特定信号的语音特征以及轮廓图的视觉特征;根据语音特征以及所述视觉特征,确定语音片段与所述图像片段是否具有同步性,同步性用于表征语音片段中的声音与图像片段中目标人物的运动相匹配。
-
公开(公告)号:WO2023029984A1
公开(公告)日:2023-03-09
申请号:PCT/CN2022/112842
申请日:2022-08-16
Applicant: 腾讯科技(深圳)有限公司
Inventor: 康洪文
IPC: H04N21/439 , H04N21/44 , G06F16/783
Abstract: 一种视频生成方法、装置、终端、服务器及存储介质,涉及视频处理技术领域。该方法包括:响应于音频输入界面内的音频输入操作,基于获取到的第一音频,显示关键词选择界面,关键词选择界面中包含至少一个推荐关键词,推荐关键词通过对第一音频进行语音识别得到(201);响应于对关键词选择界面中推荐关键词的编辑操作,确定至少一个目标关键词(202);响应于关键词选择界面内的视频合成操作,显示视频展示界面,视频展示界面中包含有合成视频,合成视频由视频片段合成得到,视频片段基于目标关键词匹配得到(203)。本申请实施例实现在视频生成场景中,用户可以通过输入一段语音,得到与语音相关的视频,提高了视频生成效率。
-
公开(公告)号:WO2023025004A1
公开(公告)日:2023-03-02
申请号:PCT/CN2022/113065
申请日:2022-08-17
Applicant: 维沃移动通信有限公司
Inventor: 李俊潓
IPC: H04N5/232 , H04N21/44 , H04N21/439
Abstract: 本申请公开了一种视频拍摄方法、装置、电子设备和可读存储介质。视频拍摄方法包括:在视频拍摄预览界面包括至少一个声音采集区域的情况下,根据每个所述声音采集区域对应音频的音频参数,显示每个所述声音采集区域的音频质量提示信息;接收用户对目标声音采集区域对应的音频质量提示信息的第一输入;响应于所述第一输入,调整所述目标声音采集区对应音频的音频参数,生成视频文件。
-
公开(公告)号:WO2023015404A1
公开(公告)日:2023-02-16
申请号:PCT/CN2021/111435
申请日:2021-08-09
Applicant: 深圳TCL新技术有限公司
Inventor: 张金梁
IPC: H04N21/439 , H04N5/06
Abstract: 本申请实施例公开了一种音频播放方法、装置、电子设备及存储介质,包括:对终端设备上待播放的音频数据集进行解码处理,音频数据集包括至少一帧音频数据;记录每帧音频数据解码处理的开始解码参考时间和实际解码处理时间;获取音频数据所对应的基准偏移时间和期望播放时间;针对每帧音频数据,根据基准偏移时间对开始解码参考时间进行调整,得到开始解码调整时间;根据开始解码调整时间和实际解码处理时间确定音频数据的参考播放时间;根据时间变化对参考播放时间进行调整;当调整后的参考播放时间达到期望播放时间后,根据终端设备对音频数据进行播放;使调整后音频数据的音频播放时间小于或者等于期望播放时间,使音频数据能够同步播放。
-
公开(公告)号:WO2023284436A1
公开(公告)日:2023-01-19
申请号:PCT/CN2022/096940
申请日:2022-06-02
Applicant: 北京字节跳动网络技术有限公司
Inventor: 陈映宜
IPC: H04N21/2187 , H04N21/233 , H04N21/439 , H04N21/4788
Abstract: 本公开实施例提供一种音频处理方法、直播设备、以及直播系统,该方法包括:获取输入直播设备的音频信息,并确定音频信息的来源属性,根据来源属性确定接收音频信息的接收对象,将音频信息传输给接收对象的接收设备,避免了音频信息传输的单一性,实现了针对性地传输音频信息,提高了音频信息传输的灵活性和多样性的技术效果,从而提高了直播的可靠性,满足了观众的观看体验。
-
-
-
-
-
-
-
-
-