Patent search cpc:"G10L25/51" Page 1

1.

发明申请
语音对比方法、终端及计算机可读存储介质审中-公开

公开(公告)号：WO2019136811A1

公开(公告)日：2019-07-18

申请号：PCT/CN2018/077626

申请日：2018-02-28

Applicant: 平安科技(深圳)有限公司

Inventor： 王健宗 , 黄章成 , 吴天博 , 肖京

IPC: G10L17/04 , G10L15/07 , G10L25/51

CPC classification number: G06F16/683 , G06K9/6223 , G10L17/02 , G10L25/51

Abstract: 一种语音对比方法，应用于终端，包括步骤：计算注册语音的第一特征语音向量（S401）；利用K-means聚类将第一特征语音向量聚类为K类（S402）；获取K类中每一类的质心，该质心为其所属类中的一个第一特征语音向量（S403）；获取用户的验证语音并计算验证语音的第二特征语音向量（S404）；将第二特征语音向量分别与每一类的质心进行比对（S405）；根据比对结果判断该验证语音所属的类别（S406）；当判断出该验证语音所属的类别后，将该第二特征语音向量分别与该验证语音所属的类别中的所有第一特征语音向量进行比对；输出比对结果（S407）。还提供了一种终端及计算机可读存储介质。通过上述方式，可以大幅度减少语音比对的计算时间，使终端能够实时返回结果。

2.

发明申请
CONTENT-BASED AUDIO STREAM SEPARATION 审中-公开

公开(公告)号：WO2019133732A1

公开(公告)日：2019-07-04

申请号：PCT/US2018/067721

申请日：2018-12-27

Applicant: KNOWLES ELECTRONICS, LLC

Inventor： WOODRUFF, John , PARVAIX, Mathieu , SHAH, Pratik

IPC: G10L25/30 , G10L21/038

CPC classification number: G10L21/028 , G10L21/038 , G10L25/30 , G10L25/51 , H04R1/406 , H04R3/005

Abstract: A method for separating audio signals based on categories is disclosed herein. The method includes receiving an audio signal; generating a plurality of filters based on the audio signal, each of the filters corresponding to one of a plurality of sound content categories; and separating the audio signal into a plurality of content-based audio signals by applying the filters to the audio signal, each of the content-based audio signals contains a content of a corresponding sound content category among the plurality of sound content categories.

3.

发明申请
SYSTEMS AND METHODS FOR DETECTING OPERATION OF A BRAKING SYSTEM OF A VEHICLE 审中-公开

公开(公告)号：WO2019057382A1

公开(公告)日：2019-03-28

申请号：PCT/EP2018/071246

申请日：2018-08-06

Applicant: ROBERT BOSCH GMBH

Inventor： HERRERA LOPEZ, Eduardo , NESBITT, Richard

IPC: B60T17/22 , B60T8/176 , F16D65/00

CPC classification number: B60T17/22 , B60T7/12 , B60T8/172 , B60T8/176 , B60T2270/10 , B60T2270/406 , F16D65/0006 , G01H17/00 , G10L25/51 , H04R29/00 , H04R2499/13

Abstract: System and method for detecting operation of a braking system (150) of a vehicle (100). A system for detecting operation (105) of a braking system (150) of a vehicle (100) comprises a microphone (120, 121, 122, 123), and an electronic controller (110), configured to receive an audio signal from the microphone (120, 121, 122, 123), wherein the audio signal is comprised of a sound caused by contact between at least one tire of the vehicle (100) and a driving surface, generate a noise characteristic from the audio signal, compare the generated noise characteristic to a known noise characteristic, and generate a notification based upon the comparison of the generated noise characteristic to the known noise characteristic.

4.

发明申请
基于人脸识别和声纹识别的交互式认证系统及方法审中-公开

公开(公告)号：WO2018113526A1

公开(公告)日：2018-06-28

申请号：PCT/CN2017/114928

申请日：2017-12-07

Applicant: 四川长虹电器股份有限公司

Inventor： 刘东 , 李晓冬 , 杨震泉 , 彭世伟 , 孙云松 , 孟庆康

IPC: H04L29/06 , G06K9/00

CPC classification number: G06K9/00221 , G10L15/22 , G10L15/26 , G10L25/51 , H04L63/0861

Abstract: 本发明涉及认证技术。本发明是要解决现有人脸识别认证其检测结果易被冒名顶替的问题，提供了一种基于人脸识别和声纹识别的交互式认证系统及方法，其技术方案可概括为：基于人脸识别和声纹识别的交互式认证系统，包括终端及服务器，终端与服务器通过网络连接，其中，终端用于获取被检测用户的面部视频及采集用户输入的语音音频数据将其发送至服务器，且显示服务器发送来的显示提示信息；服务器用于进行用户面部特征参数进行匹配和用户声纹特征向量进行匹配，并将声纹识别结果与人脸识别结果进行集合取交集，若交集中只有一个结果，则认为验证成功，返回终端验证成功信息。本发明的有益效果是，提升安全性，适用于认证系统。

5.

发明申请
一种音频数据的自动增益控制方法与装置审中-公开

公开(公告)号：WO2018107874A1

公开(公告)日：2018-06-21

申请号：PCT/CN2017/104796

申请日：2017-09-30

Applicant: 广州视源电子科技股份有限公司

Inventor： 雷延强 , 程雪峰

IPC: G10L21/0272 , G10L25/03 , G10L25/51

CPC classification number: G10L21/0272 , G10L25/03 , G10L25/51

Abstract: 一种音频数据自动增益控制方法与装置，该方法包括：对音频数据进行分帧处理，并提取各帧数据的特征参数（S1）；根据当前帧数据的特征参数与语音类别高斯混合模型得到当前帧数据的语音类条件概率，以及根据当前帧数据的特征参数与预先配置的噪声类别高斯混合模型，得到当前帧数据的噪声类条件概率（S2）；根据当前帧数据的语音类条件概率与当前帧的噪声类条件概率计算当前帧数据属于语音帧的概率以及属于噪声帧的概率（S3）；当当前帧数据属于语音帧的概率大于属于噪声帧的概率时，将当前帧音频数据判定为语音帧，当当前帧数据属于语音帧的概率小于噪声帧的概率时，将当前帧数据判定为噪声帧（S4）；当当前帧数据被判定为语音帧时，按照预先配置的语音帧增益控制规则控制其增益，当前帧数据被判定为噪声帧时，按照预先配置的噪声帧增益控制规则控制其增益（S5）。该方法能提高语音与噪声的识别水平，并依此进行自动增益控制，有效改善使用者的体验。

6.

发明申请
認証システム、認証管理サーバ、方法およびプログラム审中-公开

公开(公告)号：WO2018101317A1

公开(公告)日：2018-06-07

申请号：PCT/JP2017/042780

申请日：2017-11-29

Applicant: 日本電気株式会社

Inventor： 山口　僚太 , 大杉　孝司

IPC: G06F21/32 , G10K15/00 , G10L25/51

CPC classification number: G06F21/32 , G10K15/00 , G10L25/51

Abstract: 本発明の認証システムは、予めユーザを識別する識別情報と対応づけて、ユーザの頭部を伝搬した音響信号から算出される音響特性に基づく特徴量である音響特徴量を記憶する特徴量記憶部５０１と、認証対象とされるユーザの頭部に２つの異なる音響信号を送出する音響信号送出部５０２と、送出された２つの音響信号の頭部伝搬後の音響信号を観測する音響信号観測部５０３と、観測された音響信号の各々から音響特徴量を抽出する特徴量抽出部５０４と、ユーザの識別情報と、抽出された２つの音響特徴量とを受信すると、一方の音響特徴量と記憶されている音響特徴量とを用いて個人認証を行い、個人認証が成功した場合に、記憶されている音響特徴量を他方の音響特徴量に更新する照合部とを備える。

7.

发明申请
ELECTRONIC DEVICE AND CONTROL METHOD THEREOF 审中-公开
Title translation: 电子装置及其控制方法

公开(公告)号：WO2018056624A1

公开(公告)日：2018-03-29

申请号：PCT/KR2017/009942

申请日：2017-09-11

Applicant: SAMSUNG ELECTRONICS CO., LTD.

Inventor： CHO, Jae-youn , KIM, Sun-min , KIM, Ki-beom , KANG, Ki-woong , LIM, Dong-hyun , HWANG, In-woo

IPC: H04N21/439 , H04N21/233 , H04N21/485 , H04N5/60 , G10L19/008

CPC classification number: H04S7/307 , G06F3/0482 , G06F3/165 , G10L25/51 , G10L25/78 , H04N5/60 , H04N21/4394 , H04N21/4398 , H04N21/4852 , H04R5/02 , H04R2499/15 , H04S3/008 , H04S5/00 , H04S2400/01 , H04S2400/03 , H04S2400/05 , H04S2420/01 , H04S2420/07

Abstract: An electronic device providing a smart sound mode is provided. The electronic device includes: a user command receiver; an inputter; an outputter; and a processor configured to: in response to a predetermined event occurring, provide a user interface (UI) for guiding setting of a smart sound mode; in response to the smart sound mode being selected according to a user command input through the user command receiver, individually render a first sound signal which is a common component among a plurality of channels forming the sound signal and a second sound signal which is a differential component among the plurality of channels based on whether the first sound signal comprises a voice and whether the second sound signal comprise a sound effect, mix the first and second sound signals which are rendered into a multi-channel sound signal and control the outputter to output the multi-channel sound signal.

Abstract translation: 提供了提供智能声音模式的电子设备。该电子设备包括：用户命令接收器; 一个输入器; 输出器; 以及处理器，被配置为：响应于预定事件发生，提供用于指导设置智能声音模式的用户界面（UI）响应于根据通过用户命令接收器输入的用户命令而选择的智能声音模式，单独地呈现作为形成声音信号的多个声道中的公共分量的第一声音信号和作为差分的第二声音信号基于第一声音信号是否包括语音以及第二声音信号是否包括声音效果，将多个声道中的第一和第二声音信号混合，并且控制输出器输出以输出多声道声音信号。

8.

发明申请
对象监控方法及装置审中-公开

公开(公告)号：WO2017181545A1

公开(公告)日：2017-10-26

申请号：PCT/CN2016/091863

申请日：2016-07-27

Applicant: 北京小米移动软件有限公司

Inventor： 贾伟光 , 马娜 , 侯恩星

IPC: H04N7/18

CPC classification number: H04N5/23222 , G08B13/19663 , G08B13/19682 , G08B13/19684 , G08B13/19689 , G08B13/19697 , G08B21/0208 , G08B25/08 , G10L15/02 , G10L15/063 , G10L25/51 , H04N5/23206 , H04N5/23293 , H04N7/188 , H05K999/99

Abstract: 本公开实施例是关于一种对象监控方法及装置，其中，对象监控方法包括：当采集到的声音中存在目标声音时，判断目标声音的发声原因；向移动终端推送发声信息，该发声信息携带有发声原因。

9.

发明申请
出力制御装置、出力制御方法、およびプログラム审中-公开
Title translation: 输出控制装置，输出控制方法和程序

公开(公告)号：WO2017163719A1

公开(公告)日：2017-09-28

申请号：PCT/JP2017/006351

申请日：2017-02-21

Applicant: 日本電気株式会社

Inventor： 小林　準 , 斎藤　志傑

IPC: G06Q30/02

CPC classification number: G10L15/18 , G06F16/583 , G06Q30/0269 , G10L15/005 , G10L17/005 , G10L25/51

Abstract: 出力装置に複数の種類の情報を含む、第１の情報を出力させる制御部と、前記出力装置が出力した前記第１の情報と、前記第１の情報に対する人物の反応とに基づいて、前記人物に提示すべき種類を特定し、前記特定された種類の第２の情報を決定する情報決定部とを備え、前記制御部が、前記出力装置または他の出力装置に前記情報決定部が決定した前記第２の情報を出力させる出力制御装置。

Abstract translation: 控制单元，用于使输出装置输出包括多种类型的信息的第一信息，第二单元，用于输出由输出装置输出的第一信息，以及信息确定单元，其基于输出装置的响应或输出装置的另一输出来识别要呈现给人的类型，并确定指定类型的第二信息，并输出设备中由信息确定单元确定的第二信息。

10.

发明申请
SYSTEM AND METHOD FOR ASSOCIATING MESSAGES WITH MEDIA DURING PLAYING THEREOF 审中-公开
Title translation: 用于在媒体播放期间将消息与媒体相关联的系统和方法

公开(公告)号：WO2017145144A1

公开(公告)日：2017-08-31

申请号：PCT/IL2016/050918

申请日：2016-08-24

Applicant: SECOND SCREEN VENTURES LTD.

Inventor： WEINSTEIN, Larry , VAKNIN, Ofer , MOR, Yoav , FELDBLUM, Alon

IPC: G06F17/00

CPC classification number: H04L51/046 , G10L25/51 , H04R29/00

Abstract: A method for associating messages with media, including multiple media elements, during playing thereof, the method including sensing at least one media element currently being played by a user during playing of the media and based on the sensing of the at least one media element currently being played by a user, playing at least one message in time synchronization with playing of the at least one media element.

Abstract translation: 一种用于在其播放期间将消息与包括多个媒体元素的媒体相关联的方法，所述方法包括在播放媒体期间感测用户当前正在播放的至少一个媒体元素，并且基于感测用户当前正在播放的至少一个媒体元素中的至少一个媒体元素，与至少一个媒体元素的播放时间同步地播放至少一个消息。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification