-
公开(公告)号:WO2023013041A1
公开(公告)日:2023-02-09
申请号:PCT/JP2021/029340
申请日:2021-08-06
Applicant: 日本電信電話株式会社
IPC: H04R1/02 , H04R1/40 , H04R3/00 , H04R5/027 , G10L19/008 , G10L21/0316
Abstract: アンビソニックス形式の音響信号と同等の情報を得るためのマイクロホンアレイを提供する。当該マイクロホンアレイは、ユーザの両耳に固定される2つの固定部と、固定部のそれぞれに少なくとも2つずつ保持されているマイクロホンと、を有し、固定部が両耳にそれぞれ固定された際、一方の耳側に配置されたマイクロホンの位置と、他方の耳側に配置されたマイクロホンの位置と、が非対称となるよう構成されている。
-
公开(公告)号:WO2022022647A1
公开(公告)日:2022-02-03
申请号:PCT/CN2021/109323
申请日:2021-07-29
Applicant: 维沃移动通信有限公司
Inventor: 史建兴
IPC: G10L21/0316 , G10L21/0356
Abstract: 一种电子设备的录音方法及录音装置,电子设备包括M个麦克风,且每个麦克风与一个第一语音通路和一个第二语音通路连接,录音方法包括:在处于视频拍摄状态的情况下,获取摄像头的拍摄焦距;若拍摄焦距由初始焦距变化为目标焦距,则根据初始焦距、目标焦距和初始增益,确定目标增益,并将与第i个麦克风连接的第二语音通路的增益调整为目标增益,初始增益为与第i个麦克风连接的第一语音通路的增益;对与第i个麦克风连接的第一语音通路输出的语音信号和第二语音通路输出的语音信号进行信号增强处理,得到第i语音增强信号;对M个语音增强信号进行信号融合处理,得到第一录音信号。
-
公开(公告)号:WO2021202956A1
公开(公告)日:2021-10-07
申请号:PCT/US2021/025507
申请日:2021-04-02
Applicant: DOLBY LABORATORIES LICENSING CORPORATION
Inventor: DARCY, Daniel, Paul , YU, Xuemei , VO, Clara Y-Phuong , MURRIE, Stewart , LUO, Libin
IPC: G10L21/003 , G10L21/0316 , G10L21/0364 , G10L21/02
Abstract: Novel methods and systems for creating and using user profiles for dialog boost and sound equalizer adjustment to compensate for various ambient sound situations. For creating profiles when not at the ambient sound, a synthesized/pre-recorded ambient noise can be mixed with the media to simulate the noise conditions.
-
公开(公告)号:WO2021099707A1
公开(公告)日:2021-05-27
申请号:PCT/FR2020/051927
申请日:2020-10-26
Applicant: PSA AUTOMOBILES SA
Inventor: BARAKAT, Fatimazahra
IPC: G10L15/20 , H04R3/00 , H03G3/02 , G10L15/32 , G10L15/08 , G10L21/0316 , B60R16/037
Abstract: Il est divulgué un dispositif et un procédé mis en œuvre dans un calculateur de véhicule automobile pour activer un assistant personnel virtuel dans un véhicule automobile par la voix d'un utilisateur. Les modes de réalisations permettent de calibrer un ou plusieurs dispositifs de commande automatique de gain (130i) respectifs de modules (10i) de détection d'un mot-clé d'activation de l'assistant personnel virtuel, avec des valeurs respectives de paramètres de fonctionnement de ces dispositifs qui sont fonction de l'utilisateur détecté. Cela permet d'adapter la sensibilité de la reconnaissance du mot-clé d'activation en fonction d'un paramétrage lié à l'utilisateur identifié, et ainsi d'améliorer les performances de la détection du mot-clé d'activation prononcé par un utilisateur quelconque du véhicule.
-
公开(公告)号:WO2021000389A1
公开(公告)日:2021-01-07
申请号:PCT/CN2019/101953
申请日:2019-08-22
Applicant: 平安科技(深圳)有限公司
Inventor: 王涛
IPC: G06F3/16 , G10L21/02 , G10L21/0316
Abstract: 本申请实施例公开了一种多媒体文件处理方法、装置及计算机可读存储介质,其中该方法包括:电子设备接收用户输入的音频调节指令,所述音频调节指令用于指示所述电子设备对第一多媒体文件的音频幅值进行调节;所述电子设备根据所述音频调节指令从所述第一多媒体文件中提取N段有话音频数据,所述N为大于等于1的整数;所述电子设备从所述N段有话音频数据中选取音频幅值满足预设条件的目标有话音频数据;所述电子设备按照预设规则将所述目标有话音频数据的音频幅值进行调节,得到处理后的音频数据。采用本申请实施例,可以提高对音视频的音量的调整效率。
-
公开(公告)号:WO2020200595A1
公开(公告)日:2020-10-08
申请号:PCT/EP2020/055271
申请日:2020-02-28
Applicant: SONY CORPORATION , SONY EUROPE B.V.
Inventor: DERUTY, Emmanuel
IPC: G10L21/003 , G10L21/0316 , G10L25/21 , H03G7/00 , H03G5/00 , H03G9/00 , G11B27/031
Abstract: A signal processing method comprises comparing a first frequency domain representation of a sequence of power values for respective windows of source input samples of a source input signal with a second frequency domain representation of a sequence of power values for respective windows of target input samples of a target input signal so as to generate a frequency domain difference representation; inverse-frequency-transforming the frequency domain difference representation to generate a modification indication; and applying the modification indication to the source input samples to generate respective output samples of an output signal.
-
公开(公告)号:WO2020145509A2
公开(公告)日:2020-07-16
申请号:PCT/KR2019/016347
申请日:2019-11-26
Applicant: 브레인소프트 주식회사
Inventor: 김동진
IPC: G10L21/0316
Abstract: 본 발명의 실시예에 따른, 각 단계가 컴퓨터에 의해 수행되며, 입력된 소리의 주파수를 추출하는 방법은, 각각이 상이한 고유 주파수를 가지며, 입력된 소리에 따라 진동 운동을 하는 복수의 용수철을 모델링하는 단계; 상기 모델링된 복수의 용수철의 시점별 전이 상태 순음 진폭을 계산하는 단계; 상기 모델링된 복수의 용수철의 안정 상태 예상 진폭을 계산하는 단계; 상기 안정 상태 예상 진폭에 기초하여 순음 예측 진폭을 계산하는 단계; 상기 시점별 전이 상태 순음 진폭과 상기 순음 예측 진폭을 곱함으로써 순음 여과 진폭을 계산하는 단계; 상기 순음 여과 진폭의 극댓값에 해당하는 용수철의 고유주파수를 추출하는 단계를 포함한다.
-
公开(公告)号:WO2019050646A1
公开(公告)日:2019-03-14
申请号:PCT/US2018/045405
申请日:2018-08-06
Applicant: CIRRUS LOGIC INTERNATIONAL SEMICONDUCTOR LTD. , HATAB, Ziad Ramez , LINDEMANN, Eric , MELANSON, John, L.
Inventor: HATAB, Ziad Ramez , LINDEMANN, Eric , MELANSON, John, L.
IPC: G10L21/0316 , G10L25/18
CPC classification number: H03G1/04 , G10L21/0316 , G10L25/18 , H03G3/32 , H04R3/00 , H04R3/002 , H04S2400/09 , H04S2400/13
Abstract: Audio distortion by a speaker may be reduced by detecting onset audio events within an audio signal and modifying the audio to reduce the audio distortion perceived by a listener. The onsets may be detected using a psych-acoustic model by determining critical sub-band powers and corresponding masking thresholds. When a loudness value calculated from the CSBs and masking thresholds exceeds a threshold level, certain frequency bands may be attenuated and other frequency bands may be amplified. The audio modification may be performed on a frame-by-frame basis and each frame may be processed multiple times until the onset is sufficiently masked or attenuated.
-
公开(公告)号:WO2017209838A1
公开(公告)日:2017-12-07
申请号:PCT/US2017/026526
申请日:2017-04-07
Applicant: QUALCOMM INCORPORATED
Inventor: ZHANG, Shuhua , VISSER, Erik , KIM, Lae-Hoon , PERI, Raghuveer , GUO, Yinyi
IPC: G10L21/0208 , G10L21/0316 , G10L21/0216
CPC classification number: H04R29/008 , G10L21/0208 , G10L21/0316 , G10L2021/02161 , H04R3/005 , H04R29/004 , H04R2410/07
Abstract: A method of operation of a device includes receiving an input signal at the device. The input signal is generated using at least one microphone. The input signal includes a first signal component having a first amount of wind turbulence noise and a second signal component having a second amount of wind turbulence noise that is greater than the first amount of wind turbulence noise. The method further includes generating, based on the input signal, an output signal at the device. The output signal includes the first signal component and a third signal component that replaces the second signal component. A first frequency response of the input signal corresponds to a second frequency response of the output signal.
Abstract translation: 设备的操作方法包括在设备处接收输入信号。 输入信号是使用至少一个麦克风生成的。 输入信号包括具有第一量的风湍流噪声的第一信号分量和具有大于第一量的风湍流噪声的第二量的风湍流噪声的第二信号分量。 该方法还包括基于输入信号在设备处生成输出信号。 输出信号包括第一信号分量和替换第二信号分量的第三信号分量。 输入信号的第一频率响应对应于输出信号的第二频率响应。 p>
-
公开(公告)号:WO2017119284A1
公开(公告)日:2017-07-13
申请号:PCT/JP2016/087968
申请日:2016-12-20
Applicant: 日本電気株式会社 , NECエンジニアリング株式会社
IPC: G10L21/0316 , G10L21/028 , H04R3/00 , H04S1/00
CPC classification number: G10L21/028 , G10L21/0316 , H04R3/00 , H04S1/00
Abstract: 所望の信号とそれ以外の信号とが混合された信号に対して、所望の信号とそれ以外の信号とを異なった割合で増幅または減衰するための信号処理装置であって、第1信号(例えば音声)と第2信号(例えば雑音)が混在した混在信号を受けて、第1信号と第2信号を推定して推定第1信号と推定第2信号を求める分離部を備えている。また、前記推定第1信号と前記推定第2信号を受けて利得調整混在信号を求める利得調整部を備えたことを特徴とする。
Abstract translation: 在用于放大或衰减期望信号和其他信号的信号处理设备中,信号处理设备相对于其中期望信号和其他信号被混合的信号以不同比例 存在用于接收其中第一信号(例如,语音)和第二信号(例如,噪声)被混合的混合信号并且估计第一信号和第二信号以获得估计的第一信号和估计的第二信号 它有一个部分。 以及增益调整单元,用于接收估计的第一信号和估计的第二信号以获得增益调整混合信号。 p>
-
-
-
-
-
-
-
-
-