专利检索 cpc:"G10L17/00" 第 1 页

1.

发明申请
情報処理装置、情報処理方法、及び、プログラム审中-公开

公开(公告)号：WO2019142664A1

公开(公告)日：2019-07-25

申请号：PCT/JP2019/000049

申请日：2019-01-07

申请人： ソニー株式会社

发明人： 井原　圭吾

IPC分类号： G06F16/00 , G10L13/00 , G10L17/00

CPC分类号： G06F16/00 , G10L13/00 , G10L17/00

摘要： 本技術は、相手に応じて開示する個人情報の内容を制限することができるようにする情報処理装置、情報処理方法、及び、プログラムに関する。応答する応答相手に応じて、ユーザに関する個人情報を開示する程度を表すプライバシーレベルであって、応答相手に対する応答時のプライバシーレベルである応答プライバシーレベルが設定される。そして、マイクにより集音された応答相手の発話に応答する応答メッセージであって、応答プライバシーレベルに応じた応答メッセージが生成されて出力される。本技術は、例えば、ユーザの代わりに応答を行うエージェントロボットに適用できる。

2.

发明申请
음성인식 기반의 사진 공유 방법, 장치 및 시스템 审中-公开

公开(公告)号：WO2019112145A1

公开(公告)日：2019-06-13

申请号：PCT/KR2018/009228

申请日：2018-08-10

申请人： 라이브픽쳐스(주)

发明人： 이석희

IPC分类号： G06F3/16 , G06F3/00 , G06F17/30 , G10L17/00 , H04N5/92

CPC分类号： G06F3/00 , G06F3/16 , G06F16/00 , G10L17/00 , H04N5/92

摘要： 본 발명의 일 양태는 음성인식 기반의 사진 공유 방법을 개시하고 있다. 상기 방법은, 카메라를 통해 사진을 촬영함에 따라 촬영된 사진에 대한 이미지를 획득하는 단계, 상기 획득된 이미지와 연관된 음성데이터를 획득하는 단계, 상기 획득된 음성데이터를 인식하여 텍스트를 생성하는 단계, 상기 획득된 이미지, 상기 획득된 음성데이터 및 상기 생성된 텍스트를 연관시켜 저장하는 단계 및 상기 저장된 이미지를, 상기 저장된 음성데이터 및 상기 저장된 텍스트 중 적어도 하나와 함께 출력하는 단계를 포함한다.

3.

发明申请
一种智能终端的启动控制方法及启动控制系统审中-公开

公开(公告)号：WO2019051668A1

公开(公告)日：2019-03-21

申请号：PCT/CN2017/101570

申请日：2017-09-13

申请人： 深圳传音通讯有限公司

发明人： 王周丹 , 杨康 , 夏相声

IPC分类号： H04M1/725 , G10L17/00 , G10L15/00

CPC分类号： G10L15/00 , G10L17/00 , H04M1/725

摘要： 本发明提供了一种智能终端的启动控制方法及启动控制系统，用户在智能终端内录入语音指令，当用户需要开机或关机时，向智能终端输入该语音指令，通过语音识别技术，依次与智能终端内预设的语音指令的声纹特征及特定关键字进行匹配，当两者依次匹配成功时，即可启动或关闭智能终端。通过上述启动控制方法及启动控制系统，可省去智能终端的电源键，使智能终端总体布局更叫轻便、小巧、美观，使得智能终端更加科技化，提高用户的使用体验；而且可以更好的保护智能终端内用户的隐私信息，防止智能终端内用户隐私信息的泄露。

4.

发明申请
DYNAMIC IMAGE RECOGNITION SYSTEM FOR SECURITY AND TELEMEDICINE 审中-公开

公开(公告)号：WO2019014521A1

公开(公告)日：2019-01-17

申请号：PCT/US2018/041958

申请日：2018-07-13

申请人： PEYMAN, Gholam, A.

发明人： PEYMAN, Gholam, A.

IPC分类号： A61B5/00 , G06K9/00 , G06K9/20 , G10L15/00 , G10L15/01 , G10L15/02

CPC分类号： A61B5/0077 , A61B5/1176 , G06K9/00255 , G06K9/00315 , G06K9/209 , G10L17/00

摘要： A dynamic imaging system is disclosed herein. The dynamic imaging system includes an imaging device configured to capture images of a body portion of a person so that a displacement of the body portion of the person is capable of being tracked; and a data processing device coupled to the imaging device, and being programmed to determine the displacement of the body portion of the person using the captured images, and to compare the displacement of the body portion of the person to a reference displacement of the body portion of the person acquired prior to the displacement so that dynamic changes in the body portion of the person are capable of being assessed for identifying the person or evaluating physical and physiological changes in the body portion. The dynamic imaging system may be a standalone system or provided as a part of a telemedicine system.

5.

发明申请
声纹识别方法、装置、电子设备及介质审中-公开

公开(公告)号：WO2018107810A1

公开(公告)日：2018-06-21

申请号：PCT/CN2017/099707

申请日：2017-08-30

申请人： 平安科技(深圳)有限公司

发明人： 王健宗 , 郭卉 , 肖京

IPC分类号： G10L17/00

CPC分类号： G10L17/00 , G10L17/02 , G10L17/04 , G10L17/18 , G10L17/20 , G10L25/24 , G10L25/30

摘要： 提供了适用于身份认证技术领域的声纹识别方法、装置、电子设备及介质。方法包括：对输入的语音进行预处理，获取语音中的有效语音；提取语音的MFCC声学特征，输出包含MFCC维度及语音分帧数的第一和第二特征矩阵；构建长短时递归神经网络模型，并将第一特征矩阵作为输入；利用神经网络模型的训练参数及语音的说话人特征训练特征提取矩阵，每个特征提取矩阵对应一个说话人模型；选取出匹配第二特征矩阵的说话人模型，匹配的说话人模型对应的说话人输出为声纹识别结果。能够从训练语音中挖掘出更合适的声学特征，从而能够更准确地辨别说话人的差异性特征，学习到鲁棒性更强的说话人模型，获取更好的声纹识别效果。

6.

发明申请
収音機器、コンテンツ再生機器、及びコンテンツ再生システム审中-公开

公开(公告)号：WO2018101458A1

公开(公告)日：2018-06-07

申请号：PCT/JP2017/043269

申请日：2017-12-01

申请人： ヤマハ株式会社

发明人： 須山　明彦 , 田中　克明

IPC分类号： G06F3/16 , G06F3/01 , G10L15/00 , G10L17/00

CPC分类号： G06F3/01 , G06F3/16 , G10L15/00 , G10L17/00

摘要： 本開示にかかる収音機器は、動作指示情報とユーザー固有情報とを含む音声情報を取得する収音部と、前記ユーザー固有情報に関するユーザー判別結果を取得する制御部と、前記ユーザー判別結果をコンテンツ再生機器に送信し、且つ前記動作指示情報を直接的又は間接的にコンテンツ再生機器に送信する通信部と、を含む。このような構成により、収音機器よりユーザー判別結果を受信したコンテンツ再生機器が、各ユーザーに適した動作遂行を行うことができる。

7.

发明申请
DEVICE LEADERSHIP NEGOTIATION AMONG VOICE INTERFACE DEVICES 审中-公开
标题翻译：语音界面设备中的设备领导协商

公开(公告)号：WO2018067528A1

公开(公告)日：2018-04-12

申请号：PCT/US2017/054887

申请日：2017-10-03

申请人： GOOGLE LLC

发明人： MIXTER, Kenneth , MELENDO CASADO, Diego , GRUENSTEIN, Alexander, Houston , TAI, Terry , HUGHES, Christopher, Thaddeus , SHARIFI, Matthew, Nirvan

IPC分类号： G06F3/16 , G10L17/10

CPC分类号： G06F3/167 , G06F3/165 , G10L15/22 , G10L17/00 , G10L17/10 , G10L25/60 , G10L2015/088

摘要： A method at a first electronic device of multiple electronic devices, each electronic device of the plurality of electronic devices including one or more microphones and a speaker, includes detecting a voice input; determining a quality score for the detected voice input; communicating the quality score to the other devices of the plurality of electronic devices; receiving quality scores generated by the other devices for detection of the voice input by the other devices; if the quality score generated by the first electronic device is the highest amongst the quality scores, outputting an audible and/or visual response to the detected voice input, where the other devices of the plurality of electronic devices forgo outputting an audible response to the detected voice input; and if the quality score generated by the first electronic device is not the highest amongst the quality scores, forgoing outputting a response to the detected voice input.

摘要翻译： 一种在多个电子设备的第一电子设备处的方法，所述多个电子设备中的每个电子设备包括一个或多个麦克风和扬声器，所述方法包括：检测语音输入; 确定检测到的语音输入的质量分数; 将质量分数传送给多个电子设备中的其他设备; 接收由其他设备生成的用于检测其他设备的语音输入的质量分数; 如果第一电子设备生成的质量分数在质量分数中最高，则向检测到的语音输入输出可听和/或可视的响应，其中多个电子设备中的其他设备不允许向检测到的可听响应输出语音输入; 并且如果由第一电子设备生成的质量分数在质量分数中不是最高的，则放弃对检测到的语音输入输出响应。

8.

发明申请
ユーザ認証システム、ユーザ認証方法及びプログラム审中-公开
标题翻译：用户认证系统，用户认证方法和程序

公开(公告)号：WO2018003911A1

公开(公告)日：2018-01-04

申请号：PCT/JP2017/023892

申请日：2017-06-29

申请人： 大日本印刷株式会社

发明人： 佐藤　菜美子

IPC分类号： G06F21/32 , G06F21/31 , G10L17/00

CPC分类号： G06F21/31 , G06F21/32 , G10L17/00

摘要： 声紋認証によりユーザ認証がなされ、登録したユーザであれば確実にユーザ認証がなされ、ユーザがパスワードを忘れてもユーザ認証がなされてアクセス（ログイン）等ができるようにする。　入力選択部が音声データの入力とパスワードの入力のいずれかを選択し、入力選択部が音声データの入力を選択した場合、音声データ入力部がユーザが発したユーザ音声データを入力し、声紋データ生成部がその声紋データを生成し、声紋データ判定部がその声紋データからユーザの正当性を判定して声紋判定結果を出力し、入力選択部がパスワードの入力を選択した場合、パスワード入力部がパスワードを入力し、パスワード判定部が、そのパスワードからユーザの正当性を判定してパスワード判定結果を出力するユーザ認証システム。

摘要翻译： 用户认证是由
声纹认证，确保如果用户已注册，则执行用户认证以使得用户可制成甚至用户认证忘记密码的用户访问（登录）等进行到。输入选择单元选择的语音数据的口令的输入中的一个，如果输入选择单元选择所述输入的语音数据，并输入用户的语音数据的音频数据输入单元已经发出用户，声纹数据生成单元生成声纹数据，并输出该语音的打印确定结果声纹数据确定单元确定从所述声纹数据的用户的有效性，如果输入选择单元选择所述密码的输入，密码输入单元输入密码的用户认证系统和密码判断单元从密码中判断用户的有效性并输出密码判断结果。

9.

发明申请
HEARING ASSISTANCE WITH AUTOMATED SPEECH TRANSCRIPTION 审中-公开
标题翻译：用自动语音转录听取帮助

公开(公告)号：WO2017142775A1

公开(公告)日：2017-08-24

申请号：PCT/US2017/017094

申请日：2017-02-09

申请人： MICROSOFT TECHNOLOGY LICENSING, LLC

发明人： MENEZES, Arul , LEWIS, William , WANG, Yi-Min

IPC分类号： H04R25/00

CPC分类号： G10L15/26 , G10L13/033 , G10L13/0335 , G10L17/00 , H04R25/353 , H04R25/505 , H04R2225/43

摘要： The assistive hearing device implementations described herein assist hearing impaired users of the device by using automated speech transcription to generate text representing speech received in audio signals which can then be read in a synthesized voice tailored to overcome a user's hearing deficiencies. A speech recognition engine recognizes speech in received audio and converts the speech of the received audio to text. Once the speech is converted to text, a text-to-speech engine can convert the text to synthesized speech that can be enhanced and output in a voice that compensates for the hearing loss profiles of a user of the assistive hearing device. By transcribing received speech into text the assistive hearing device implementations described herein eliminate background noise from the audio signal. By converting the transcribed text into a synthesized voice that is easier to understand to hearing impaired persons, their hearing deficiencies can be remedied.

摘要翻译： 通过使用自动语音转录来生成表示在音频信号中接收到的语音的文本，然后可以用合成的语音来读取文本，所述语音被定制以克服用户的语音信号，从而辅助听力受损设备的用户。听力缺陷。语音识别引擎识别接收到的音频中的语音并将接收到的音频的语音转换为文本。一旦语音被转换为文本，文本到语音引擎可以将文本转换为合成语音，该合成语音可以增强并以语音输出，以补偿助听器的用户的听力损失分布。通过将接收到的语音转录成文本，本文描述的辅助听力设备实现消除了来自音频信号的背景噪声。通过将转录的文本转换为对听力受损的人更容易理解的合成语音，可以弥补他们的听力缺陷。

10.

发明申请
AMBIENT AWARENESS IN VIRTUAL REALITY 审中-公开
标题翻译：虚拟现实中的环境意识

公开(公告)号：WO2017112277A1

公开(公告)日：2017-06-29

申请号：PCT/US2016/063460

申请日：2016-11-23

申请人： INTEL CORPORATION

发明人： BEGUM, Shamim , WHITNEY, Kofi C.

IPC分类号： H04N5/445 , H04R3/00 , G10L21/10 , G02B27/01

CPC分类号： A63F13/217 , A63F13/215 , A63F13/25 , A63F13/5255 , A63F13/65 , A63F2300/8082 , G06T19/006 , G10L15/20 , G10L17/00 , G10L25/51 , G10L25/72

摘要： Systems, apparatus and methods may provide for audio processing of received user audio input from a microphone that may optionally be a tissue conducting microphone. Audio processing may be further conducted on received ambient audio from one or more additional microphones. A translator may translate the ambient audio into content to be output to a user. In an embodiment, ambient audio is translated into visual content to be displayed on a virtual reality device.

摘要翻译： 系统，设备和方法可以提供从麦克风接收的用户音频输入的音频处理，该麦克风可以可选地是组织传导麦克风。可以对来自一个或多个附加麦克风的接收到的环境音频进一步进行音频处理。翻译器可以将环境音频转换成内容以输出给用户。在一个实施例中，环境音频被转换成可视内容以显示在虚拟现实设备上。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类