-
公开(公告)号:CN111650560A
公开(公告)日:2020-09-11
申请号:CN201910159607.7
申请日:2019-03-04
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G01S5/22
摘要: 本申请实施例公开了声源定位方法和装置。该方法的一具体实施方式包括:对回声消除后的目标音频进行波束形成处理,确定各个方向波束的高频差分能量和低频差分能量;基于各个方向波束的高频差分能量和低频差分能量,确定各个方向波束的能量和;将能量和最高的波束的方向作为声源方向。本申请实施例基于差分能量,提供了一种全新的声源定位方式。
-
公开(公告)号:CN112102821A
公开(公告)日:2020-12-18
申请号:CN201910530553.0
申请日:2019-06-18
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
摘要: 本公开提供一种应用于电子设备的数据处理方法,包括:获取多个第一历史语音数据;确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值;获取当前阈值条件,所述当前阈值条件用于所述电子设备是否响应当前语音数据进行操作的条件;以及基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件。本公开还提供一种应用于电子设备的数据处理装置、一种数据处理系统以及一种计算机可读存储介质。
-
公开(公告)号:CN111624554A
公开(公告)日:2020-09-04
申请号:CN201910146086.1
申请日:2019-02-27
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G01S5/28
摘要: 本申请实施例公开了声源定位方法和装置。该方法的一具体实施方式包括:对回声消除后的目标音频进行波束形成处理,统计所形成的各个方向波束的高频能量和低频能量;将各个方向的波束表示于同一个圆中;利用预先设置的区域波束数量和区域间隔,在该圆中确定多个扇形区域;基于扇形区域中各个方向波束的高频能量和低频能量,确定各个扇形区域的能量和,将能量和最大的扇形区域的对称轴自圆心向外延伸的延伸方向作为声源方向。本申请实施例能够确定出各个扇形区域的高频能量和低频能量,以得到各个扇形区域的能量和从而定位出声源位置。该方法不需要很高的信号采样频率,具有较高的定位精度。
-
公开(公告)号:CN111768771B
公开(公告)日:2023-08-04
申请号:CN201910462512.2
申请日:2019-05-30
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
发明人: 白二伟
IPC分类号: G10L15/22
摘要: 本申请实施例公开了用于唤醒电子设备的方法和装置。该方法的一具体实施方式包括:获取用于设置自定义唤醒词的第一音频数据,以及对该第一音频数据进行时频变换生成第一频谱数据;根据该第一频谱数据和预先生成的频谱转换参数集合,生成第二频谱数据,其中,频谱转换参数用于表征指示相同语义的不同频谱数据之间的转换关系;对该第二频谱数据进行时频逆变换,生成该第二音频数据;基于该第二音频数据,建立该自定义唤醒词对应的音频数据集合,其中,该音频数据集合用于确定是否唤醒电子设备。该实施方式实现了用户自定义设置唤醒词,从而可以提供新的唤醒电子设备的方式。
-
公开(公告)号:CN111667843B
公开(公告)日:2021-12-31
申请号:CN201910165320.5
申请日:2019-03-05
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
发明人: 白二伟
IPC分类号: G10L21/0208 , G10L21/0216 , G10L15/22 , G10L15/26 , G10L15/06 , G01S5/18 , G10L25/30
摘要: 本发明公开了一种终端设备的语音唤醒方法、系统、电子设备、存储介质。其中,语音唤醒方法包括:预设相对于所述终端设备的麦克风阵列的M个基准方向;利用所述麦克风阵列采集音频信号;将所述音频信号分解成与M个基准方向对应的M个波束信号;从M个波束信号中选择N个方向特征最强的波束信号作为候选信号;判断是否有至少一个候选信号的内容包括唤醒词,若是,则根据所述唤醒词唤醒所述终端设备。本发明并未采用声源定位算法,而是通过将采集到的音频信号分解为几个基准方向上的波束信号,进而根据各波束信号的方向特征来近似推断可能的声源方向,能够提高唤醒词的识别精度,极大限度地排除干扰信号对唤醒终端设备的影响。
-
公开(公告)号:CN112086096B
公开(公告)日:2024-04-05
申请号:CN201910519091.2
申请日:2019-06-14
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
摘要: 本公开提供一种数据处理方法,包括:获取当前语音数据;根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值,所述历史语音数据包括至少一个语音子数据;基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,其中,所述目标语音子数据包括用于控制电子设备失败的语音数据;以及响应于所述历史语音数据包括至少一个目标语音子数据,存储所述至少一个目标语音子数据,以便将所述至少一个目标语音子数据作为训练用于控制所述电子设备的语音模型的样本数据。本公开还提供一种数据处理装置、一种数据处理系统以及一种计算机可读存储介质。
-
公开(公告)号:CN112102821B
公开(公告)日:2024-01-12
申请号:CN201910530553.0
申请日:2019-06-18
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
摘要: 本公开提供一种应用于电子设备的数据处理方法,包括:获取多个第一历史语音数据;确定所述多个第一历史语音数据中的至少一个第一目标语音数据,其中,所述至少一个第一目标语音数据的每个第一目标语音数据的第一分值大于或等于预设阈值;获取当前阈值条件,所述当前阈值条件用于所述电子设备是否响应当前语音数据进行操作的条件;以及基于所述至少一个第一目标语音数据的数量,调整所述当前阈值条件。本公开还提供一种应用于电子设备的数据处理装置、一种数据处理系统以及一种计算机可读存储介质。
-
公开(公告)号:CN111624554B
公开(公告)日:2023-05-02
申请号:CN201910146086.1
申请日:2019-02-27
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G01S5/28
摘要: 本申请实施例公开了声源定位方法和装置。该方法的一具体实施方式包括:对回声消除后的目标音频进行波束形成处理,统计所形成的各个方向波束的高频能量和低频能量;将各个方向的波束表示于同一个圆中;利用预先设置的区域波束数量和区域间隔,在该圆中确定多个扇形区域;基于扇形区域中各个方向波束的高频能量和低频能量,确定各个扇形区域的能量和,将能量和最大的扇形区域的对称轴自圆心向外延伸的延伸方向作为声源方向。本申请实施例能够确定出各个扇形区域的高频能量和低频能量,以得到各个扇形区域的能量和从而定位出声源位置。该方法不需要很高的信号采样频率,具有较高的定位精度。
-
公开(公告)号:CN111650560B
公开(公告)日:2023-04-07
申请号:CN201910159607.7
申请日:2019-03-04
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G01S5/22
摘要: 本申请实施例公开了声源定位方法和装置。该方法的一具体实施方式包括:对回声消除后的目标音频进行波束形成处理,确定各个方向波束的高频差分能量和低频差分能量;基于各个方向波束的高频差分能量和低频差分能量,确定各个方向波束的能量和;将能量和最高的波束的方向作为声源方向。本申请实施例基于差分能量,提供了一种全新的声源定位方式。
-
公开(公告)号:CN112086096A
公开(公告)日:2020-12-15
申请号:CN201910519091.2
申请日:2019-06-14
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
摘要: 本公开提供一种数据处理方法,包括:获取当前语音数据;根据历史语音数据处理所述当前语音数据以得到所述当前语音数据的当前分值,所述历史语音数据包括至少一个语音子数据;基于所述当前分值和所述历史语音数据中的至少一个确定所述历史语音数据是否包括至少一个目标语音子数据,其中,所述目标语音子数据包括用于控制电子设备失败的语音数据;以及响应于所述历史语音数据包括至少一个目标语音子数据,存储所述至少一个目标语音子数据,以便将所述至少一个目标语音子数据作为训练用于控制所述电子设备的语音模型的样本数据。本公开还提供一种数据处理装置、一种数据处理系统以及一种计算机可读存储介质。
-
-
-
-
-
-
-
-
-