一种模型训练和语音合成方法、装置、设备及介质

    公开(公告)号:CN115294955B

    公开(公告)日:2024-08-16

    申请号:CN202110419495.1

    申请日:2021-04-19

    IPC分类号: G10L13/02 G10L13/08 G10L25/24

    摘要: 本发明公开了一种模型训练和语音合成方法、装置、设备及介质。在本发明实施例中,获取第一样本集中采用第一语言的第一语音样本的第一文本特征、以及采用第二语言的第二语音样本的第二文本特征之后,确定第一文本特征对应的第一声学特征以及第二语音样本的第二声学特征,该第一声学特征与第二声学特征为同一发音人的声学特征,且第一语言和第二语言不同,实现了获取同一发音人不同语言的声学特征,有利于后续基于该第一文本特征及其对应的第一声学特征、第二文本特征及其对应的第二声学特征,对原始语音合成模型进行训练,得到目标语音合成模型,使得通过该目标语音合成模型可以实现第一样本集中每个发音人的第一语言和第二语言的语音合成。

    定位方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN113916213B

    公开(公告)日:2024-07-23

    申请号:CN202010650773.X

    申请日:2020-07-08

    发明人: 刘永光

    摘要: 本申请提出一种定位方法、装置、电子设备和计算机可读存储介质,涉及计算机视觉技术领域,其中,方法包括:获取激光雷达测量得到的点云图,从点云图中提取第一目标区,第一目标区与同步采集的视觉图像中的感兴趣区检测相同对象,根据第一目标区域携带的第一定位信息,确定第一目标区域中各像素点的深度,根据各像素点的深度,统计各设定深度对应的像素点个数指示值,根据像素点个数指示值的峰值,从各设定深度中确定目标深度,实现了通过激光雷达与视觉图像配准,进行对象位置预测,降低了成本,提高了定位准确度,解决现有技术中采用深度传感器进行位置预测,成本高,准确度低的技术问题。

    一种智能设备的控制方法及装置

    公开(公告)号:CN114067792B

    公开(公告)日:2024-06-14

    申请号:CN202010790911.4

    申请日:2020-08-07

    发明人: 冯诚

    IPC分类号: G10L15/22

    摘要: 本申请公开一种智能设备的控制方法及装置,属于人工智能技术领域,该方法包括:获取到智能设备采集的目标自然语言指令后,对目标自然语言指令进行自然语言分析处理,得到目标自然语言指令对应的目标ECA规则信息,进而根据目标ECA规则信息,生成目标自然语言指令对应的目标工作流,并控制智能设备执行目标工作流。这样,使用自然语言指令即可轻松建立一个工作流,用户不需了解利用IFTTT工具建立工作流的编程思想、了解规范的ECA规则,也不需要掌握编程语言的基本语法知识,因此,可降低用户使用IFTTT工具建立工作流的门槛。

    定位方法、装置、自移动设备和存储介质

    公开(公告)号:CN113984081B

    公开(公告)日:2024-05-03

    申请号:CN202111257931.6

    申请日:2020-10-16

    发明人: 张彦刚 高梓翔

    IPC分类号: G01C21/34 G01C21/00

    摘要: 本申请提出一种定位方法、装置、自移动设备和存储介质,涉及定位领域,其中,方法包括:获取图像传感器采集的图像;其中,图像中展示有多个第一标记点,以及多个第二标记点;根据图像中各第一标记点,在图像中确定候选坐标系;根据各第二标记点在候选坐标系中的坐标位置,解码得到目标编码;根据目标编码,查询得到各第二标记点在世界坐标系中的坐标位置;根据各第二标记点在世界坐标系中的坐标位置,以及在图像中的坐标位置,确定搭载图像传感器的自移动设备在世界坐标系下的位姿。由此,能够实现即使自移动设备所处空间内的陈设位置发生变化,或者人员移动干扰激光雷达扫描周围环境,也能够有效定位自移动设备的位置,提升该定位方法的适用性。

    设备定位方法、装置、移动设备和存储介质

    公开(公告)号:CN117849710A

    公开(公告)日:2024-04-09

    申请号:CN202410018778.9

    申请日:2024-01-05

    发明人: 李茂全

    IPC分类号: G01S5/16

    摘要: 本申请提供了一种设备定位方法、装置、移动设备和存储介质,其中,该方法包括:获取预设范围内的红外信号和红外图像,根据红外信号,确定至少一个目标红外发射源及其亮灭变化时间,根据各目标红外发射源的亮灭变化时间,在红外图像中确定具有同样亮灭变化时间的亮点的位置,根据至少一个亮点的位置以及移动设备的姿态,计算移动设备的位置。利用目标红外发射源确定移动设备的位置,避免出现定位丢失或误差过大,提高了自主导航成功率和可靠性。

    多轮对话处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111753061B

    公开(公告)日:2024-03-12

    申请号:CN201910236199.0

    申请日:2019-03-27

    IPC分类号: G06F16/332

    摘要: 本发明公开了一种多轮对话处理方法、装置、电子设备及存储介质,所述方法包括:获取到对话信息后,根据多轮对话状态参数,从数据库包含的决策树中选取候选节点;其中,每个决策树对应一个多轮对话的业务场景,决策树中的任一个节点对应业务场景中的一个对话进程,决策树用于描述一个业务场景中各个节点对应的对话进程间的跳转关系,多轮对话状态参数用于表征上一次获取到的对话信息对应的激活节点;根据对话信息,从候选节点中,选择满足激活条件的候选节点确定为对话信息对应的激活节点;控制智能设备执行激活节点对应的操作。本发明提供的技术方案,通过决策树来配置多轮对话的业务场景,配置方式更加简单、灵活、高效,具备很强的可操作性。

    一种语义识别方法、装置、设备及介质

    公开(公告)号:CN113779975B

    公开(公告)日:2024-03-01

    申请号:CN202010525122.8

    申请日:2020-06-10

    发明人: 刘太路

    IPC分类号: G06F40/253

    摘要: 本发明公开了一种语义识别方法、装置、设备及介质,用以解决现有没有考虑槽位填充和意图识别之间的相关性,从而使意图识别和槽位填充结果的准确率低的问题。由于本发明实施例中在确定待识别文本的语义识别结果的过程中,确定了第一特征矩阵对应的交互门矩阵,其中,该第一特征矩阵包括意图表示特征矩阵,和/或槽位表示特征矩阵,并基于该第一特征矩阵对应的交互门矩阵,来确定相互关联的目标意图和目标槽位,从而提高了确定的目标意图,和/或目标槽位的准确率,有利于准确地确定待识别文本的语义识别结果。

    语音信号处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112509570B

    公开(公告)日:2024-02-13

    申请号:CN201910810339.0

    申请日:2019-08-29

    摘要: 本发明公开了一种语音信号处理方法、装置、电子设备及存储介质,该方法包括:对基于智能设备实时采集到的音频流数据得到的临时识别结果进行分词处理,得到若干分词片段;将若干分词片段组成的第一分词序列输入到已训练的断句模型中,根据断句模型的输出确定所述第一分词序列之后能够进行断句的第一预测概率;以及获取第二分词序列之后的下一个分词片段为结束字符的第二预测概率,第二预测概率为根据词频数据确定的;若根据第一预测概率和第二预测概率确定的第三预测概率大于概率阈值,对临时识别结果进行语义解析。本发明实施例的技术方案,能够及时准确地对音频流数据进行截断

    一种信息推荐方法、装置、设备及介质

    公开(公告)号:CN112182046B

    公开(公告)日:2023-12-08

    申请号:CN201910606163.7

    申请日:2019-07-05

    IPC分类号: G06F16/2457

    摘要: 本发明实施例公开了一种信息推荐方法、装置、设备及介质,用以实现更精细的信息推荐控制。所述信息推荐方法,包括:接收中控设备发送的请求数据,所述请求数据包括智能设备的设备标识、基于智能设备的服务请求获取到的语义数据和技能数据;根据所述设备标识,从用于记录智能设备状态的状态数据库中,获取所述智能设备的状态信息;基于所述语义数据、所述技能数据和所述智能设备的状态信息,在预先存储的信息推荐策略集合中确定目标信息推荐策略;基于所述语义数据和所述目标信息推荐策略生成推荐信息,并将所述推荐信息发送至所述中控设备。

    模型更新方法、装置、电子设备及存储介质

    公开(公告)号:CN111583910B

    公开(公告)日:2023-09-26

    申请号:CN201910093092.5

    申请日:2019-01-30

    IPC分类号: G10L15/06

    摘要: 本发明涉及语音识别技术领域,公开了一种模型更新方法、装置、电子设备及存储介质,所述方法包括:确定语言模型需要更新,语言模型对应的解码网络是基于全量词典构建得到的;根据语料库中的语料,更新语言模型,并确定解码网络中各词节点之间的路径对应的最新概率得分;根据最新概率得分,更新解码网络中对应的词节点之间的路径的概率得分。本发明实施例提供的技术方案,实现了语言模型的在线更新,保证用户能不间断地获取到语音识别服务,提高用户体验。