-
公开(公告)号:CN113168837B
公开(公告)日:2024-12-06
申请号:CN201980076729.8
申请日:2019-11-22
Applicant: 三星电子株式会社
IPC: G10L17/14 , G16H50/30 , G10L17/02 , G10L17/18 , G10L17/08 , G10L15/02 , G10L17/00 , G10L17/04 , G10L15/04 , G10L17/26 , G10L25/15
Abstract: 提供了一种用于处理从说话者接收的语音的人声数据的方法和设备。所述方法包括:从接收自说话者的语音的人声数据提取说话者特征向量,通过将提取的说话者特征向量定位在多维向量空间上的特定位置处来生成说话者特征图,通过对位于说话者特征图上的至少一个说话者特征向量进行分组来形成指示多个说话者的人声的特征的多个集群,以及根据所述多个集群对所述多个说话者进行分类。
-
-
公开(公告)号:CN111418008B
公开(公告)日:2023-10-13
申请号:CN201880077091.5
申请日:2018-11-29
Applicant: 三星电子株式会社
Abstract: 提供了一种语音辨识设备。语音辨识设备包括:至少一个麦克风,其被配置为从第一声源接收声音信号;以及至少一个处理器,其被配置为基于声音信号来确定第一声源的方向,确定第一声源的方向是否位于登记的方向上,以及基于第一声源的方向是否位于登记的方向上,从声音信号中辨识语音,而不管声音信号是否包括唤醒关键字。
-
-
公开(公告)号:CN113841196A
公开(公告)日:2021-12-24
申请号:CN202080037110.9
申请日:2020-05-15
Applicant: 三星电子株式会社
IPC: G10L15/22 , G10L21/02 , G10L21/0216
Abstract: 一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,获取语音信号特性或噪声信号特性中的至少一个;通过基于语音信号特性、噪声信号特性以及在获取第一多声道音频信号的特定时间之前获取的且针对先前帧获取的语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。
-
公开(公告)号:CN112889023A
公开(公告)日:2021-06-01
申请号:CN201980070207.7
申请日:2019-10-23
Applicant: 三星电子株式会社
Abstract: 提供一种电子装置。该电子装置包括:麦克风,接收音频;通信器;存储器,被配置为存储计算机可执行指令;以及处理器,被配置为执行计算机可执行指令。处理器被配置为确定所接收的音频是否包括预先确定的触发字;基于确定预先确定的触发字被包括在所接收的音频中;激活电子装置的语音识别功能;在语音识别功能被激活时检测用户的移动;以及基于检测用户的移动,向第二电子装置发送控制信号,以激活第二电子装置的语音识别功能。
-
公开(公告)号:CN112867987A
公开(公告)日:2021-05-28
申请号:CN201980068526.4
申请日:2019-10-11
Applicant: 三星电子株式会社
IPC: G06F3/16 , G06F3/0481 , G06F3/0488 , G06N3/08 , G10L15/22
Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。
-
公开(公告)号:CN112789628A
公开(公告)日:2021-05-11
申请号:CN201980065502.3
申请日:2019-10-04
Applicant: 三星电子株式会社
Abstract: 提供了一种电子装置及其控制方法。电子装置的控制方法包括:分别从第一外部电子装置和第二外部电子装置接收第一外部电子装置和第二外部电子装置所使用的第一人工智能模型和第二人工智能模型,以及存储在第一外部电子装置和第二外部电子装置中的多个学习数据;在从第一外部电子装置接收的学习数据之中识别与从第二外部电子装置接收的第二学习数据对应的第一学习数据;基于第一学习数据训练第二外部电子装置所使用的第二人工智能模型;以及并将训练后的第二人工智能模型发送至第二外部电子装置。
-
公开(公告)号:CN103544955B
公开(公告)日:2018-09-25
申请号:CN201310301732.X
申请日:2013-07-15
Applicant: 三星电子株式会社
CPC classification number: G10L15/18 , G10L15/05 , G10L15/142
Abstract: 提供一种识别语音的方法及其电子装置。所述方法包括:以预设时间间隔将语音信号分段为多个片段;通过使用第一声学模型来执行针对语音信号的多个片段中的一个片段的音素识别;通过使用音素识别结果来提取所述语音信号的多个片段中的所述一个片段的候选词语;通过使用候选词语来执行针对所述语音信号的多个片段中的所述一个片段的语音识别。
-
公开(公告)号:CN107112010A
公开(公告)日:2017-08-29
申请号:CN201580073696.3
申请日:2015-01-16
Applicant: 三星电子株式会社
IPC: G10L15/197 , G10L15/28
CPC classification number: G10L15/063 , G10L15/02 , G10L15/14 , G10L15/187 , G10L15/197 , G10L2015/025 , G10L2015/0633 , G10L2015/0635
Abstract: 本申请公开了一种更新包括用于语音识别的语言模型的语音识别数据的方法,所述方法包括:获取包括至少一个字的语言数据;从至少一个字当中检测不存在于语言模型中的字;获取关于检测到的字的至少一个音素序列;通过将至少一个音素序列划分成预定单元分量来获取构成至少一个音素序列的分量;确定关于在语音识别期间构成至少一个音素序列中的每一个的各个分量出现的概率的信息;以及基于所确定的概率信息来更新语言模型。
-
-
-
-
-
-
-
-
-