MANAGEMENT OF PROFESSIONALLY GENERATED AND USER-GENERATED AUDIO CONTENT

    公开(公告)号:WO2023018889A1

    公开(公告)日:2023-02-16

    申请号:PCT/US2022/040089

    申请日:2022-08-11

    Abstract: A system for managing user-generated content (UGC) and professionally generated content (PGC) is disclosed. The system is programmed to receive digital audio data having two channels from a social media platform. The system is programmed to extract spatial features that capture differences in the two channels from the digital audio data. The system is programmed to also extract temporal features, spectral features, and background features from the digital audio data. The system is programmed to then use the extracted features to determine whether to process the digital audio data as UGC or PGC before playback.

    VOICE MODIFICATION
    2.
    发明申请
    VOICE MODIFICATION 审中-公开

    公开(公告)号:WO2023288265A1

    公开(公告)日:2023-01-19

    申请号:PCT/US2022/073721

    申请日:2022-07-14

    Abstract: A computing system that receives an audio waveform representing speech from an individual and produces as output a. modified version of the audio waveform that maintains the speaker's speech characteristics as well as prosody for specific utterances (e.g., voice timbre, intonation, timing, intensity). The sy stem uses a bottleneck-based autoencoder with speech spectrograms as input and output. To produce the output audio waveform, the system includes a. reconstruction error-based loss function with two additional loss functions. The second loss function is speaker "real vs fake" discriminator that penalizes for the output not sounding like the speaker. The third loss function is a. speech intelligibility scorer that penalizes the output for speech that is difficult for the target population to understand. The produced modified audio waveform is an enhanced speech output that delivers speech m a target accent without sacrificing the personality of the speaker.

    基于语音的智能面试评估方法、装置、设备及存储介质

    公开(公告)号:WO2022179048A1

    公开(公告)日:2022-09-01

    申请号:PCT/CN2021/109701

    申请日:2021-07-30

    Inventor: 赵沁

    Abstract: 本申请涉及人工智能技术领域,提供一种基于语音的智能面试评估方法、装置、设备及存储介质,用于提高远程面谈评估的效率。基于语音的智能面试评估方法包括:对待处理的远程面试者语音信号进行端点检测,得到有效语音段落,将有效语音段落划分为待定标语音段落和待检测语音段落;提取待定标语音段落的定标语音特征和待检测语音段落的检测语音特征;计算定标语音特征的定标特征值和检测语音特征的检测特征值;将检测特征值与定标特征值进行对比分析得到面试者状况分析结果,生成面试者状况分析结果的评估报告。此外,本申请还涉及区块链技术,待处理的远程面试者语音信号可存储于区块链中。

    一种语音分析方法及其语音记录装置

    公开(公告)号:WO2022166220A1

    公开(公告)日:2022-08-11

    申请号:PCT/CN2021/120416

    申请日:2021-09-24

    Abstract: 一种语音分析方法及其语音记录设备。该方法包括:获取第一语音数据,其中,所述第一语音数据包括第一语音信息以及所述第一语音信息对应的标记声源;若未存储与所述标记声源对应的验证模型,采用预先存储的基础验证模型对所述第一语音信息进行适配,并将适配后的模型参数集作为与所述标记声源对应的验证模型进行保存;若存储有与所述标记声源对应的验证模型,采用所述验证模型判断所述第一语音信息是否与所述标记声源对应,并对所述验证模型进行优化;当确定所述验证模型的验证准确率超过预设阈值时,采用所述验证模型确定第二语音数据中包含的第二语音信息对应的声源。该方法中的验证模型可不断获得优化,使用起来更为灵活、准确率更高。

    一种提取语音特征的方法、装置、终端及存储介质

    公开(公告)号:WO2022141868A1

    公开(公告)日:2022-07-07

    申请号:PCT/CN2021/084166

    申请日:2021-03-30

    Abstract: 本申请适用于计算机技术领域,提供了一种提取语音特征的方法、装置、终端及存储介质,包括:获取待处理的语音数据;将该语音数据输入到已训练的语音特征提取模型中进行处理,得到该语音数据对应的目标语音特征。上述方式中的语音特征提取模型是基于自监督学习,以每个样本语音数据对中的原始语音数据对应的样本语音特征为目标,对每个样本语音数据对中的原始语音数据和增强语音数据之间的差异性进行训练得到的。基于该语音特征提取模型可以提取到有效地、信息丰富、表达准确的目标语音特征,进而使该目标语音特征应用于智能语音任务处理场景时,处理结果更准确。

    语音转换方法、装置、计算机设备及计算机可读存储介质

    公开(公告)号:WO2021120145A1

    公开(公告)日:2021-06-24

    申请号:PCT/CN2019/126865

    申请日:2019-12-20

    Abstract: 一种语音转换方法、装置、计算机设备及计算机可读存储介质,该方法包括:获取待转换语音和原始转换模型,原始转换模型的格式为在线格式(202);将原始转换模型进行格式转换,得到离线格式的目标转换模型(204);对待转换语音进行特征提取,得到待转换特征(206);将待转换特征输入目标转换模型,得到目标转换模型输出的目标特征(208);根据目标转换模型输出的目标特征得到目标语音,目标语音的语音内容和待转换语音相同,目标语音的声音与待转换语音不同(210)。该语音转换方法不仅可以在离线状态下高质量进行语音转换,而且运行速度快,可以实现语音的实时转换。

    到站提醒方法、装置、终端及存储介质

    公开(公告)号:WO2021115232A1

    公开(公告)日:2021-06-17

    申请号:PCT/CN2020/134351

    申请日:2020-12-07

    Inventor: 刘文龙

    Abstract: 一种到站提醒方法、装置、终端及存储介质,属于人工智能领域。到站提醒方法包括:当处于交通工具时,通过麦克风采集环境音(201);对环境音对应的音频数据进行时频域特征提取,得到时频域特征矩阵(202);将时频域特征矩阵输入声音识别模型,得到声音识别模型输出的目标警铃声识别结果(203);当识别出环境音中包含目标警铃声时,更新已行驶站数(204);当已行驶站数达到目标站数时,进行到站提醒(205)。通过实时采集环境音,并在识别出目标警铃声时,更新已行驶站数,在已行驶站数达到目标站数时,进行到站提醒,终端对环境音进行时频域特征提取,并将得到的时频域特征矩阵输入声音识别模型,提高了到站提醒的准确率和有效性。

Patent Agency Ranking