-
公开(公告)号:CN107943834A
公开(公告)日:2018-04-20
申请号:CN201711008491.4
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/22 , G06F17/30654 , G10L15/1815 , H04L67/42
Abstract: 本发明公开了人机对话的实现方法、装置、设备及存储介质,其中方法包括:客户端获取用户的语音数据,将语音数据发送给语音识别服务器,以便语音识别服务器对语音数据进行语音识别,并将语音识别结果发送给语义理解服务器进行语义理解;客户端获取语音合成服务器根据获取到的回复内容生成的语音信息,并将语音信息播报给用户,回复内容为语义理解服务器根据语义理解结果生成的。应用本发明所述方案,能够提升语音交互的响应速度。
-
公开(公告)号:CN107590252A
公开(公告)日:2018-01-16
申请号:CN201710847084.6
申请日:2017-09-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请实施例公开了用于信息交互的方法及装置。该方法的一具体实施方式包括:获取待处理信息,上述待处理信息包括文字信息和图像;提取上述待处理信息的文字信息的特征词,基于上述特征词查找上述待处理信息的图像的描述信息,其中,上述特征词用于表征对上述图像的查找请求,上述描述信息用于表征对上述图像的文字描述;通过上述描述信息构建上述待处理信息的应答信息。该实施方式通过描述信息构建应答信息,实现了与待处理信息之间的信息交互,提高了信息交互的效率。
-
公开(公告)号:CN113936668B
公开(公告)日:2025-04-08
申请号:CN202111188936.8
申请日:2021-10-12
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G10L17/26 , G10L17/18 , G06V40/16 , G10L13/047 , G10L13/04 , G10L21/043
Abstract: 本公开提供了一种用于智能语音设备的方法、装置、设备和介质,涉及计算机技术领域,尤其涉及人工智能和语音技术。实现方案为:基于用户的生物特征,确定用户的年龄区间;基于年龄区间,选择预设的第一语速参数用于播报语音;响应于识别出用户的身份,基于用户的历史语速记录,调整第一语速参数,以确定第二语速参数,其中,历史语速记录包括智能语音设备在与用户的至少一次交互中,从用户的声纹特征中提取的特定于用户的语速参数;以及基于第二语速参数播报语音。
-
公开(公告)号:CN107943834B
公开(公告)日:2021-06-11
申请号:CN201711008491.4
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/332 , G10L15/18 , G10L15/22 , H04L29/06
Abstract: 本发明公开了人机对话的实现方法、装置、设备及存储介质,其中方法包括:客户端获取用户的语音数据,将语音数据发送给语音识别服务器,以便语音识别服务器对语音数据进行语音识别,并将语音识别结果发送给语义理解服务器进行语义理解;客户端获取语音合成服务器根据获取到的回复内容生成的语音信息,并将语音信息播报给用户,回复内容为语义理解服务器根据语义理解结果生成的。应用本发明所述方案,能够提升语音交互的响应速度。
-
公开(公告)号:CN111276139A
公开(公告)日:2020-06-12
申请号:CN202010015663.6
申请日:2020-01-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G06F9/4401
Abstract: 本申请公开了语音唤醒方法及装置,涉及人机交互技术领域。具体实现方案为:采集用户的唤醒语音,根据唤醒语音以及当前智能设备的状态信息,生成当前智能设备的唤醒信息;接收组网内的非当前智能设备发送的唤醒信息;结合组网内各个智能设备的唤醒信息,确定当前智能设备是否为目标语音交互设备;在当前智能设备为目标语音交互设备时,控制当前智能设备与用户进行语音交互,该方法由智能设备结合各个智能语音设备的唤醒信息,确定最优的智能语音设备,并由最优的智能语音设备对用户的唤醒词进行响应,避免多个智能设备同时响应对用户造成干扰,使得用户能够很明确的了解哪个设备是与用户进行语音交互的设备,语音交互效率高。
-
公开(公告)号:CN111276139B
公开(公告)日:2023-09-19
申请号:CN202010015663.6
申请日:2020-01-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G06F9/4401
Abstract: 本申请公开了语音唤醒方法及装置,涉及人机交互技术领域。具体实现方案为:采集用户的唤醒语音,根据唤醒语音以及当前智能设备的状态信息,生成当前智能设备的唤醒信息;接收组网内的非当前智能设备发送的唤醒信息;结合组网内各个智能设备的唤醒信息,确定当前智能设备是否为目标语音交互设备;在当前智能设备为目标语音交互设备时,控制当前智能设备与用户进行语音交互,该方法由智能设备结合各个智能语音设备的唤醒信息,确定最优的智能语音设备,并由最优的智能语音设备对用户的唤醒词进行响应,避免多个智能设备同时响应对用户造成干扰,使得用户能够很明确的了解哪个设备是与用户进行语音交互的设备,语音交互效率高。
-
公开(公告)号:CN114005444A
公开(公告)日:2022-02-01
申请号:CN202111269084.5
申请日:2021-10-29
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本公开提供了一种语音控制方法、装置及电子设备,涉及智能语音设备技术领域,尤其涉及语音交互技术领域。具体实现方案为:第一设备接收用户的语音指令,所述语音指令包括设备标签及设备控制指令;确定与所述设备标签对应的第二设备,向所述第二设备发送所述设备控制指令,所述设备控制指令用于控制所述第二设备执行目标操作,或者用于控制所述第一设备和所述第二设备执行目标操作。
-
公开(公告)号:CN113936668A
公开(公告)日:2022-01-14
申请号:CN202111188936.8
申请日:2021-10-12
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G10L17/26 , G10L17/18 , G06V40/16 , G10L13/047 , G10L13/04 , G10L21/043
Abstract: 本公开提供了一种用于智能语音设备的方法、装置、设备和介质,涉及计算机技术领域,尤其涉及人工智能和语音技术。实现方案为:基于用户的生物特征,确定用户的年龄区间;基于年龄区间,选择预设的第一语速参数用于播报语音;响应于识别出用户的身份,基于用户的历史语速记录,调整第一语速参数,以确定第二语速参数,其中,历史语速记录包括智能语音设备在与用户的至少一次交互中,从用户的声纹特征中提取的特定于用户的语速参数;以及基于第二语速参数播报语音。