-
公开(公告)号:CN117321680A
公开(公告)日:2023-12-29
申请号:CN202280035900.2
申请日:2022-05-16
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 一种用于处理音频的装置包括:至少一个处理器,该处理器被配置为从比特流获得下混合音频信号,从比特流获得下混合相关信息,通过使用下混合相关信息来对下混合相关信息进行解混合,以及基于解混合的音频信号来重建包括至少一帧的音频信号。下混合相关信息是通过使用音频场景类型以帧为单位生成的信息。
-
公开(公告)号:CN119234270A
公开(公告)日:2024-12-31
申请号:CN202380043652.0
申请日:2023-06-26
Applicant: 三星电子株式会社
IPC: G10L21/055 , G10L21/0272 , G06V10/40 , G06V10/25 , G06V40/16 , H04N21/43 , G10L21/10
Abstract: 公开了按照视频中所包括的对象匹配语音的方法,包括以下步骤:分离视频中所包括的多个语音;确定多个语音之间的相异性;在多个语音之间的相异性的基础上,选择视频的整个持续时间中的部分持续时间作为匹配持续时间;在匹配持续时间内,在视频中所包括的多个对象的嘴部移动的基础上,将多个语音与多个对象彼此进行匹配;以及根据在匹配持续时间内的多个语音与多个对象之间的匹配结果,在视频的整个持续时间内将多个语音与多个对象彼此进行匹配。
-
公开(公告)号:CN116917985A
公开(公告)日:2023-10-20
申请号:CN202280011393.9
申请日:2022-01-25
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 根据本公开的多种实施例,音频处理装置包括至少一个处理器,该处理器被配置为执行一个或多个指令以从至少一个第一音频信号获得下混的第二音频信号,获得与至少一个第一音频信号的误差消除相关的信息,从下混的第二音频信号解混至少一个第一音频信号,以及通过将与至少一个第一音频信号的误差消除相关的信息应用于从第二音频信号中解混的至少一个第一音频信号来重构至少一个第一音频信号。使用至少一个第一音频信号的原始信号功率或解码后的至少一个第一音频信号的第二信号功率中的至少一个来生成与误差消除相关的信息。
-
-
公开(公告)号:CN116762128A
公开(公告)日:2023-09-15
申请号:CN202280011465.X
申请日:2022-01-27
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 一种音频处理装置可以从与包括在第一声道组中的声道相对应的第一音频信号中获得与包括在第二声道组中的声道相对应的第二音频信号,通过使用人工智能(AI)模型对与基于与第二声道组的相关性从包括在第一声道组中的声道中识别的至少一个声道相对应的至少一个第三音频信号进行下采样,并且生成包括与包括在第二声道组中的声道相对应的第二音频信号和下采样的至少一个第三音频信号的比特流。第一声道组包括原始音频信号的声道组,并且第二声道组通过组合第一声道组中包括的声道中的至少两个声道来构建。
-
公开(公告)号:CN116210233A
公开(公告)日:2023-06-02
申请号:CN202180066099.3
申请日:2021-09-28
Applicant: 三星电子株式会社
IPC: H04S3/00
Abstract: 公开了一种根据实施例的视频处理装置,其包括至少一个处理器,其中所述至少一个处理器配置成通过基于第一深度神经网络(DNN)分析包括多个图像的视频信号,为每个时间和频率生成多个特征信息,基于第二DNN从所述视频信号中提取对应于视频中对象的运动的第一高度分量和第一平面分量,通过使用第三DNN从不具有高度分量的第一音频信号中提取对应于所述音频中声源的运动的第二平面分量,从所述第一高度分量、所述第一平面分量和所述第二平面分量生成第二高度分量,基于所述特征信息输出包括所述第二高度分量的第二音频信号,以及使所述第二音频信号与所述视频信号同步并输出所述信号。
-
-
-
-
-