-
公开(公告)号:CN111966773B
公开(公告)日:2024-09-06
申请号:CN202010825236.4
申请日:2020-08-17
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06F16/29 , G06F16/9537 , G06T17/05
摘要: 本公开涉及用于管理地图数据的方法、装置、电子设备和存储介质。在一种方法中,针对地理区域的地图数据创建索引,地图数据包括分别在地理区域中的多个位置处采集的多个点云数据,索引包括表示地图数据的根节点、子节点以及叶节点。基于地理区域包括的多个区块中的区块,向根节点添加表示区块的至少一个子节点。向至少一个子节点中的子节点添加分别表示多个点云数据中的一组点云数据的一组叶节点,一组点云数据是在多个位置中的位于区块内的一组位置处采集的。进一步,提供了相应的装置、电子设备和存储介质。利用上述实现方式,可以以更为方便和有效的方式管理地图数据,进而便于地图数据的版本管理。
-
公开(公告)号:CN117238282A
公开(公告)日:2023-12-15
申请号:CN202210633679.2
申请日:2022-06-06
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G10L15/20 , G10L15/06 , G10L15/16 , G10L21/0216
摘要: 本公开的实施例涉及语音数据增强系统、方法、设备和存储介质。语音数据增强系统包括:m个扬声器,其中m是大于或等于2的整数,m个扬声器的位置彼此不同,其中m个扬声器播放与原始音频数据相对应的音频信号;音频信号接收模块,接收由m个扬声器播放的音频信号,从而获得与原始音频数据相对应的m项对应音频数据;以及语音数据增强模块,语音数据增强模块被配置为基于原始音频数据和m项对应音频数据,来训练语音数据增强模型。通过这种方式训练的语音数据增强模型可以在空间位置方面实现数据增强,从而提升语音识别系统对不同位置处声源的语音识别准确度。
-
公开(公告)号:CN110767222B
公开(公告)日:2021-03-09
申请号:CN201910532906.0
申请日:2019-06-19
申请人: 北京嘀嘀无限科技发展有限公司
发明人: 李杨 , 赵帅 , 史耀云 , 彭静 , 王姝懿 , 石浩言 , 吕诚 , 周庭乔 , 胡刚涛 , 刘阳 , 宋辉 , 王飞 , 袁龙 , 张同新 , 代东锋 , 张啸虎 , 张市理 , 李玉泊 , 李燕 , 吕冉 , 邹伟
摘要: 本申请实施例提供了一种接单方法及装置,其中,该接单方法包括:在接收到服务器发送的订单信息后,通过听单服务页面展示语音输入提示信息,所述语音输入提示信息用于提示服务提供方录入指示接单的目标语音内容;检测是否在预设时间长度内接收到所述服务提供方确认接单的目标语音内容;若接收到所述目标语音内容,则向所述服务器反馈接单确认信息。本申请实施例能够通过语音接单,降低服务提供方在接单时存在的驾驶安全隐患。
-
公开(公告)号:CN110797015B
公开(公告)日:2020-09-29
申请号:CN201811544376.3
申请日:2018-12-17
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供了一种语音唤醒方法、装置、电子设备及存储介质,其中,该方法包括:获取待识别语音数据,对所述待识别语音数据进行识别,获取所述待识别语音数据的识别结果,若所述识别结果包括多个预设唤醒词中的至少一个,则从待机状态切换至唤醒状态。本申请实施例能够通过多个预设唤醒词唤醒电子设备,提高了语音唤醒的灵活性和效率。
-
公开(公告)号:CN111415654A
公开(公告)日:2020-07-14
申请号:CN201910013485.0
申请日:2019-01-07
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供了一种音频识别方法和装置、以及声学模型训练方法和装置,涉及音频处理技术领域;其中,上述音频识别方法包括:获取用户输入的待识别音频数据;提取所述待识别音频数据中的音频特征;将所述音频特征输入到预先训练好的声学模型中,得到与所述待识别音频数据对应的音频识别结果;其中,所述声学模型以音节信息作为建模单元训练得到的,所述音节信息包括单个文字的声母和韵母。本申请中,在音频识别过程中使用的声学模型是以音节信息作为建模单元训练得到的,该声学模型的资源空间占用量小,能够节省移动终端的资源空间,加速移动终端的音频识别速度,实现了在移动终端上的快速语音识别。
-
公开(公告)号:CN111326147A
公开(公告)日:2020-06-23
申请号:CN201811519005.X
申请日:2018-12-12
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G10L15/197 , G10L15/02 , G10L15/26 , G10L15/06
摘要: 本申请提供了一种语音识别方法、装置、电子设备及存储介质,包括:接收用户输入的语音信息;将语音信息转换成至少一个文本信息;将至少一个文本信息输入动态语言模型,获得动态语言模型输出的每个文本信息的第一命中概率;获得第一命中概率最高的文本信息。本申请实施例可以先将用户的语音信息转换成至少一个文本信息,然后将文本信息输入到动态语言模型中,由动态语言模型来获得每个文本信息的命中概率,然后选出命中概率最高的文本信息。由于动态语言模型是根据同一用户的历史数据信息作为样本训练获得的,因此,该动态语言模型输出的概率更贴近用户的使用习惯,从而有利于提高语音识别的准确率。
-
公开(公告)号:CN112889041B
公开(公告)日:2024-06-21
申请号:CN202080005629.9
申请日:2020-04-21
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 用于确定二维地图的系统(100)和方法。所述方法可以包括获取地区的位姿图。位姿图可以包括地区中的两个或以上路径追踪数据集。每个路径追踪数据集可以包括两个或以上节点(710,720)。所述方法还可以包括基于两个或以上路径追踪数据集确定地区包括的至少一个交叠子地区。两个或以上路径追踪数据集中的至少两个数据集可以在至少一个交叠子地区中的一个子地区交叠,并且两个或以上路径追踪数据集中的至少两个数据集可以满足条件。所述方法可以进一步包括基于至少一个交叠子地区,确定地区的两个或以上道路图层。所述方法还可以包括基于两个或以上道路图层和位姿图,确定目标地图。
-
公开(公告)号:CN117636872A
公开(公告)日:2024-03-01
申请号:CN202210951620.8
申请日:2022-08-09
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请实施例提供了一种音频处理方法、装置、电子设备和可读存储介质,涉及计算机技术领域。当用户授权开启语音唤醒目标设备的功能后,本申请实施例可以直接根据采集音频和预先录制的唤醒音频之间的匹配程度来判断是否唤醒目标设备。在此过程中,无需将采集音频转换为文本,也无需将采集音频与文本进行比对。因此,通过本申请实施例,避免了音频转换为视频过程中所产生的误差,提高唤醒目标设备的准确性。
-
公开(公告)号:CN111415654B
公开(公告)日:2023-12-08
申请号:CN201910013485.0
申请日:2019-01-07
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供了一种音频识别方法和装置、以及声学模型训练方法和装置,涉及音频处理技术领域;其中,上述音频识别方法包括:获取用户输入的待识别音频数据;提取所述待识别音频数据中的音频特征;将所述音频特征输入到预先训练好的声学模型中,得到与所述待识别音频数据对应的音频识别结果;其中,所述声学模型以音节信息作为建模单元训练得到的,所述音节信息包括单个文字的声母和韵母。本申请中,在音频识别过程中使用的声学模型是以音节信息作为建模单元训练得到的,该声学模型的资源空间占用量小,能够节省移动终端的资源空间,加速移动终端的音频识别速度,实现了在移动终端上的快速语音识别。
-
公开(公告)号:CN113012697A
公开(公告)日:2021-06-22
申请号:CN202110246012.2
申请日:2021-03-05
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本发明实施例公开了一种信息交互方法、装置及电子设备。本发明实施例通过接收音频信息,并根据预先训练的至少一个唤醒词模型确定该音频信息对应的唤醒词,根据该唤醒词对应的行程信息创建任务,向目标用户终端发送任务创建结果。由此,用户可以通过唤醒词实现一键式创建任务,简化了任务创建的操作复杂度,提高了用户体验感。
-
-
-
-
-
-
-
-
-