ARRAY GEOMETRY AGNOSTIC MULTI-CHANNEL PERSONALIZED SPEECH ENHANCEMENT

    公开(公告)号:WO2023059402A1

    公开(公告)日:2023-04-13

    申请号:PCT/US2022/040979

    申请日:2022-08-22

    Abstract: Examples of array geometry agnostic multi-channel personalized speech enhancement (PSE) extract speaker embeddings, which represent acoustic characteristics of one or more target speakers, from target speaker enrollment data. Spatial features (e.g., inter-channel phase difference) are extracted from input audio captured by a microphone array. The input audio includes a mixture of speech data of the target speaker(s) and one or more interfering speaker(s). The input audio, the extracted speaker embeddings, and the extracted spatial features are provided to a trained geometry-agnostic PSE model. Output data is produced, which comprises estimated clean speech data of the target speaker(s) that has a reduction (or elimination) of speech data of the interfering speaker(s), without the trained PSE model requiring geometry information for the microphone array.

    TEXTUAL ECHO CANCELATION
    5.
    发明申请

    公开(公告)号:WO2021252039A1

    公开(公告)日:2021-12-16

    申请号:PCT/US2021/022008

    申请日:2021-03-11

    Applicant: GOOGLE LLC

    Inventor: WANG, Quan

    Abstract: A method (400) includes receiving an overlapped audio signal (202) that includes audio spoken by a speaker (10) that overlaps a segment (156) of synthesized playback audio (154). The method also includes encoding a sequence of characters that correspond to the synthesized playback audio into a text embedding representation (212). For each character in the sequence of characters, the method also includes generating a respective cancelation probability (222) using the text embedding representation. The cancelation probability indicates a likelihood that the corresponding character is associated with the segment of the synthesized playback audio overlapped by the audio spoken by the speaker in the overlapped audio signal.

    PROCEDE DE CONTROLE DU VOLUME SONORE
    6.
    发明申请

    公开(公告)号:WO2021244826A1

    公开(公告)日:2021-12-09

    申请号:PCT/EP2021/062372

    申请日:2021-05-10

    Applicant: RENAULT S.A.S

    Abstract: L'invention concerne un procédé de contrôle de volume sonore généré par un haut-parleur (HP) dans une cabine, caractérisé en ce qu'il comprend: - une première étape d'acquisition du son (Sb) dans la cabine, - une deuxième étape de filtrage par annulation dans le son (Sb) acquis à la première étape du son (Sg) généré par le haut-parleur (HP),- une troisième étape de classification de situation sonore (Css) cabine à partir du son filtré (Sn) à la deuxième étape, - une quatrième étape de détermination d'une intensité de communication visuelle (Icv) dans la cabine, - une cinquième étape de contrôle du volume sonore généré par le haut-parleur (HP) en fonction de la situation sonore classifiée (Css) à la troisième étape et de l'intensité de communication visuelle (Icv) déterminée à la quatrième étape.

    回声声场状态确定方法及装置、存储介质、终端

    公开(公告)号:WO2021190274A1

    公开(公告)日:2021-09-30

    申请号:PCT/CN2021/079181

    申请日:2021-03-05

    Inventor: 叶顺舟

    Abstract: 一种回声声场状态确定方法及装置、存储介质、终端,所述方法包括:获取待确定信号;确定所述待确定信号的远端信号X n(k)、近端信号D n(k)以及滤波器系数W n(k);至少根据所述远端信号X n(k)、近端信号D n(k)以及滤波器系数W n(k),确定滤波器更新度Cef update;至少根据滤波器更新度Cef update大于预设更新度阈值Thrd update,确定所述待确定信号的回声声场状态是否为回声路径变化状态。本发明可以有效提高对回声路径变化状态判断的准确性,并且有机会采用更多参数对更多回声声场状态进行判断,更有效地实现多特征检测,提高对回声声场状态判断的完整性。

Patent Agency Ranking