-
公开(公告)号:CN110088799B
公开(公告)日:2023-10-27
申请号:CN201780079267.6
申请日:2017-11-08
Applicant: 三星电子株式会社
Abstract: 公开了一种图像处理设备。该图像处理设备包括:输入单元,用于输入图像;处理器,用于将输入的图像缩小到预定比率,从缩小的图像提取视觉特征,执行在输入的图像中反映提取的视觉特征的图像质量增强处理,对已经经历了所述图像质量增强处理的图像重复地执行预定次数的所述缩小、所述提取和所述图像质量增强处理。本公开涉及一种通过使用诸如深度学习等的机器学习算法来模拟人脑的诸如识别、判断等的功能的人工智能(AI)系统及其应用。
-
公开(公告)号:CN119234270A
公开(公告)日:2024-12-31
申请号:CN202380043652.0
申请日:2023-06-26
Applicant: 三星电子株式会社
IPC: G10L21/055 , G10L21/0272 , G06V10/40 , G06V10/25 , G06V40/16 , H04N21/43 , G10L21/10
Abstract: 公开了按照视频中所包括的对象匹配语音的方法,包括以下步骤:分离视频中所包括的多个语音;确定多个语音之间的相异性;在多个语音之间的相异性的基础上,选择视频的整个持续时间中的部分持续时间作为匹配持续时间;在匹配持续时间内,在视频中所包括的多个对象的嘴部移动的基础上,将多个语音与多个对象彼此进行匹配;以及根据在匹配持续时间内的多个语音与多个对象之间的匹配结果,在视频的整个持续时间内将多个语音与多个对象彼此进行匹配。
-
公开(公告)号:CN116917985A
公开(公告)日:2023-10-20
申请号:CN202280011393.9
申请日:2022-01-25
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 根据本公开的多种实施例,音频处理装置包括至少一个处理器,该处理器被配置为执行一个或多个指令以从至少一个第一音频信号获得下混的第二音频信号,获得与至少一个第一音频信号的误差消除相关的信息,从下混的第二音频信号解混至少一个第一音频信号,以及通过将与至少一个第一音频信号的误差消除相关的信息应用于从第二音频信号中解混的至少一个第一音频信号来重构至少一个第一音频信号。使用至少一个第一音频信号的原始信号功率或解码后的至少一个第一音频信号的第二信号功率中的至少一个来生成与误差消除相关的信息。
-
-
公开(公告)号:CN117321680A
公开(公告)日:2023-12-29
申请号:CN202280035900.2
申请日:2022-05-16
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 一种用于处理音频的装置包括:至少一个处理器,该处理器被配置为从比特流获得下混合音频信号,从比特流获得下混合相关信息,通过使用下混合相关信息来对下混合相关信息进行解混合,以及基于解混合的音频信号来重建包括至少一帧的音频信号。下混合相关信息是通过使用音频场景类型以帧为单位生成的信息。
-
公开(公告)号:CN109891459B
公开(公告)日:2023-06-30
申请号:CN201780066614.1
申请日:2017-10-26
Applicant: 三星电子株式会社
Abstract: 本发明涉及一种图像处理装置。本图像处理装置包括:输入部,接收输入的图像;以及处理器,缩小输入的图像并提取视觉特征,将提取的视觉特征反映于输入的图像而生成高画质图像。本发明涉及一种灵活运用深度学习等机器学习算法来模拟人脑认知、判断等功能的人工智能(AI)系统及其应用。
-
公开(公告)号:CN110088799A
公开(公告)日:2019-08-02
申请号:CN201780079267.6
申请日:2017-11-08
Applicant: 三星电子株式会社
Abstract: 公开了一种图像处理设备。该图像处理设备包括:输入单元,用于输入图像;处理器,用于将输入的图像缩小到预定比率,从缩小的图像提取视觉特征,执行在输入的图像中反映提取的视觉特征的图像质量增强处理,对已经经历了所述图像质量增强处理的图像重复地执行预定次数的所述缩小、所述提取和所述图像质量增强处理。本公开涉及一种通过使用诸如深度学习等的机器学习算法来模拟人脑的诸如识别、判断等的功能的人工智能(AI)系统及其应用。
-
公开(公告)号:CN119173944A
公开(公告)日:2024-12-20
申请号:CN202380039081.3
申请日:2023-04-17
Applicant: 三星电子株式会社
IPC: G10L21/0272 , G10L21/038 , G10L19/008 , G10L25/30
Abstract: 一种音频处理方法包括:获得与第一帧对应的第一音频信号;通过将第一音频信号输入到第一神经网络来提取第一特征向量;获得时间相关性向量,所述时间相关性向量表示第一特征向量和至少一个第二特征向量之间的相似性,所述至少一个第二特征向量是从与时间上在第一帧之前的至少一个第二帧对应的至少一个第二音频信号中提取的;以及通过将第一特征向量、至少一个第二特征向量和时间相关性向量输入到第二神经网络来对第一音频信号的场景进行分类。
-
公开(公告)号:CN116762128A
公开(公告)日:2023-09-15
申请号:CN202280011465.X
申请日:2022-01-27
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 一种音频处理装置可以从与包括在第一声道组中的声道相对应的第一音频信号中获得与包括在第二声道组中的声道相对应的第二音频信号,通过使用人工智能(AI)模型对与基于与第二声道组的相关性从包括在第一声道组中的声道中识别的至少一个声道相对应的至少一个第三音频信号进行下采样,并且生成包括与包括在第二声道组中的声道相对应的第二音频信号和下采样的至少一个第三音频信号的比特流。第一声道组包括原始音频信号的声道组,并且第二声道组通过组合第一声道组中包括的声道中的至少两个声道来构建。
-
公开(公告)号:CN116210233A
公开(公告)日:2023-06-02
申请号:CN202180066099.3
申请日:2021-09-28
Applicant: 三星电子株式会社
IPC: H04S3/00
Abstract: 公开了一种根据实施例的视频处理装置,其包括至少一个处理器,其中所述至少一个处理器配置成通过基于第一深度神经网络(DNN)分析包括多个图像的视频信号,为每个时间和频率生成多个特征信息,基于第二DNN从所述视频信号中提取对应于视频中对象的运动的第一高度分量和第一平面分量,通过使用第三DNN从不具有高度分量的第一音频信号中提取对应于所述音频中声源的运动的第二平面分量,从所述第一高度分量、所述第一平面分量和所述第二平面分量生成第二高度分量,基于所述特征信息输出包括所述第二高度分量的第二音频信号,以及使所述第二音频信号与所述视频信号同步并输出所述信号。
-
-
-
-
-
-
-
-
-