语音对比方法、终端及计算机可读存储介质

    公开(公告)号:WO2019136811A1

    公开(公告)日:2019-07-18

    申请号:PCT/CN2018/077626

    申请日:2018-02-28

    CPC classification number: G06F16/683 G06K9/6223 G10L17/02 G10L25/51

    Abstract: 一种语音对比方法,应用于终端,包括步骤:计算注册语音的第一特征语音向量(S401);利用K-means聚类将第一特征语音向量聚类为K类(S402);获取K类中每一类的质心,该质心为其所属类中的一个第一特征语音向量(S403);获取用户的验证语音并计算验证语音的第二特征语音向量(S404);将第二特征语音向量分别与每一类的质心进行比对(S405);根据比对结果判断该验证语音所属的类别(S406);当判断出该验证语音所属的类别后,将该第二特征语音向量分别与该验证语音所属的类别中的所有第一特征语音向量进行比对;输出比对结果(S407)。还提供了一种终端及计算机可读存储介质。通过上述方式,可以大幅度减少语音比对的计算时间,使终端能够实时返回结果。

    基于人脸识别和声纹识别的交互式认证系统及方法

    公开(公告)号:WO2018113526A1

    公开(公告)日:2018-06-28

    申请号:PCT/CN2017/114928

    申请日:2017-12-07

    Abstract: 本发明涉及认证技术。本发明是要解决现有人脸识别认证其检测结果易被冒名顶替的问题,提供了一种基于人脸识别和声纹识别的交互式认证系统及方法,其技术方案可概括为:基于人脸识别和声纹识别的交互式认证系统,包括终端及服务器,终端与服务器通过网络连接,其中,终端用于获取被检测用户的面部视频及采集用户输入的语音音频数据将其发送至服务器,且显示服务器发送来的显示提示信息;服务器用于进行用户面部特征参数进行匹配和用户声纹特征向量进行匹配,并将声纹识别结果与人脸识别结果进行集合取交集,若交集中只有一个结果,则认为验证成功,返回终端验证成功信息。本发明的有益效果是,提升安全性,适用于认证系统。

    一种音频数据的自动增益控制方法与装置

    公开(公告)号:WO2018107874A1

    公开(公告)日:2018-06-21

    申请号:PCT/CN2017/104796

    申请日:2017-09-30

    Inventor: 雷延强 程雪峰

    CPC classification number: G10L21/0272 G10L25/03 G10L25/51

    Abstract: 一种音频数据自动增益控制方法与装置,该方法包括:对音频数据进行分帧处理,并提取各帧数据的特征参数(S1);根据当前帧数据的特征参数与语音类别高斯混合模型得到当前帧数据的语音类条件概率,以及根据当前帧数据的特征参数与预先配置的噪声类别高斯混合模型,得到当前帧数据的噪声类条件概率(S2);根据当前帧数据的语音类条件概率与当前帧的噪声类条件概率计算当前帧数据属于语音帧的概率以及属于噪声帧的概率(S3);当当前帧数据属于语音帧的概率大于属于噪声帧的概率时,将当前帧音频数据判定为语音帧,当当前帧数据属于语音帧的概率小于噪声帧的概率时,将当前帧数据判定为噪声帧(S4);当当前帧数据被判定为语音帧时,按照预先配置的语音帧增益控制规则控制其增益,当前帧数据被判定为噪声帧时,按照预先配置的噪声帧增益控制规则控制其增益(S5)。该方法能提高语音与噪声的识别水平,并依此进行自动增益控制,有效改善使用者的体验。

    認証システム、認証管理サーバ、方法およびプログラム

    公开(公告)号:WO2018101317A1

    公开(公告)日:2018-06-07

    申请号:PCT/JP2017/042780

    申请日:2017-11-29

    CPC classification number: G06F21/32 G10K15/00 G10L25/51

    Abstract: 本発明の認証システムは、予めユーザを識別する識別情報と対応づけて、ユーザの頭部を伝搬した音響信号から算出される音響特性に基づく特徴量である音響特徴量を記憶する特徴量記憶部501と、認証対象とされるユーザの頭部に2つの異なる音響信号を送出する音響信号送出部502と、送出された2つの音響信号の頭部伝搬後の音響信号を観測する音響信号観測部503と、観測された音響信号の各々から音響特徴量を抽出する特徴量抽出部504と、ユーザの識別情報と、抽出された2つの音響特徴量とを受信すると、一方の音響特徴量と記憶されている音響特徴量とを用いて個人認証を行い、個人認証が成功した場合に、記憶されている音響特徴量を他方の音響特徴量に更新する照合部とを備える。

    ELECTRONIC DEVICE AND CONTROL METHOD THEREOF
    7.
    发明申请
    ELECTRONIC DEVICE AND CONTROL METHOD THEREOF 审中-公开
    电子装置及其控制方法

    公开(公告)号:WO2018056624A1

    公开(公告)日:2018-03-29

    申请号:PCT/KR2017/009942

    申请日:2017-09-11

    Abstract: An electronic device providing a smart sound mode is provided. The electronic device includes: a user command receiver; an inputter; an outputter; and a processor configured to: in response to a predetermined event occurring, provide a user interface (UI) for guiding setting of a smart sound mode; in response to the smart sound mode being selected according to a user command input through the user command receiver, individually render a first sound signal which is a common component among a plurality of channels forming the sound signal and a second sound signal which is a differential component among the plurality of channels based on whether the first sound signal comprises a voice and whether the second sound signal comprise a sound effect, mix the first and second sound signals which are rendered into a multi-channel sound signal and control the outputter to output the multi-channel sound signal.

    Abstract translation: 提供了提供智能声音模式的电子设备。 该电子设备包括:用户命令接收器; 一个输入器; 输出器; 以及处理器,被配置为:响应于预定事件发生,提供用于指导设置智能声音模式的用户界面(UI) 响应于根据通过用户命令接收器输入的用户命令而选择的智能声音模式,单独地呈现作为形成声音信号的多个声道中的公共分量的第一声音信号和作为差分的第二声音信号 基于第一声音信号是否包括语音以及第二声音信号是否包括声音效果,将多个声道中的第一和第二声音信号混合,并且控制输出器输出以输出 多声道声音信号。

    出力制御装置、出力制御方法、およびプログラム
    9.
    发明申请
    出力制御装置、出力制御方法、およびプログラム 审中-公开
    输出控制装置,输出控制方法和程序

    公开(公告)号:WO2017163719A1

    公开(公告)日:2017-09-28

    申请号:PCT/JP2017/006351

    申请日:2017-02-21

    Abstract: 出力装置に複数の種類の情報を含む、第1の情報を出力させる制御部と、前記出力装置が出力した前記第1の情報と、前記第1の情報に対する人物の反応とに基づいて、前記人物に提示すべき種類を特定し、前記特定された種類の第2の情報を決定する情報決定部とを備え、前記制御部が、前記出力装置または他の出力装置に前記情報決定部が決定した前記第2の情報を出力させる出力制御装置。

    Abstract translation: 控制单元,用于使输出装置输出包括多种类型的信息的第一信息,第二单元,用于输出由输出装置输出的第一信息, 以及信息确定单元,其基于输出装置的响应或输出装置的另一输出来识别要呈现给人的类型,并确定指定类型的第二信息, 并输出设备中由信息确定单元确定的第二信息。

    SYSTEM AND METHOD FOR ASSOCIATING MESSAGES WITH MEDIA DURING PLAYING THEREOF
    10.
    发明申请
    SYSTEM AND METHOD FOR ASSOCIATING MESSAGES WITH MEDIA DURING PLAYING THEREOF 审中-公开
    用于在媒体播放期间将消息与媒体相关联的系统和方法

    公开(公告)号:WO2017145144A1

    公开(公告)日:2017-08-31

    申请号:PCT/IL2016/050918

    申请日:2016-08-24

    CPC classification number: H04L51/046 G10L25/51 H04R29/00

    Abstract: A method for associating messages with media, including multiple media elements, during playing thereof, the method including sensing at least one media element currently being played by a user during playing of the media and based on the sensing of the at least one media element currently being played by a user, playing at least one message in time synchronization with playing of the at least one media element.

    Abstract translation: 一种用于在其播放期间将消息与包括多个媒体元素的媒体相关联的方法,所述方法包括在播放媒体期间感测用户当前正在播放的至少一个媒体元素,并且基于感测 用户当前正在播放的至少一个媒体元素中的至少一个媒体元素,与至少一个媒体元素的播放时间同步地播放至少一个消息。

Patent Agency Ranking