-
公开(公告)号:CN111899759B
公开(公告)日:2021-09-03
申请号:CN202010733155.1
申请日:2020-07-27
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供一种音频数据的预训练、模型训练方法、装置、设备及介质,涉及音频处理技术领域。该方法包括:预训练模型包括:掩码层、第一编码层以及第一前馈层,所述方法包括:采用所述掩码层,对样本音频数据进行掩码处理,得到掩码声学特征;采用所述第一编码层对所述掩码声学特征进行所述第一编码层对应音频任务的编码处理;采用所述第一前馈层对所述编码处理后的声学特征进行掩码重构处理,得到重构预测结果;根据所述重构预测结果,对所述掩码层的掩码参数进行更新,得到目标预训练模型。相对于现有技术,避免了由于样本音频数据质量不高等问题,导致学习到的音频表示的鲁棒性不足的问题。
-
公开(公告)号:CN111899759A
公开(公告)日:2020-11-06
申请号:CN202010733155.1
申请日:2020-07-27
申请人: 北京嘀嘀无限科技发展有限公司
摘要: 本申请提供一种音频数据的预训练、模型训练方法、装置、设备及介质,涉及音频处理技术领域。该方法包括:预训练模型包括:掩码层、第一编码层以及第一前馈层,所述方法包括:采用所述掩码层,对样本音频数据进行掩码处理,得到掩码声学特征;采用所述第一编码层对所述掩码声学特征进行所述第一编码层对应音频任务的编码处理;采用所述第一前馈层对所述编码处理后的声学特征进行掩码重构处理,得到重构预测结果;根据所述重构预测结果,对所述掩码层的掩码参数进行更新,得到目标预训练模型。相对于现有技术,避免了由于样本音频数据质量不高等问题,导致学习到的音频表示的鲁棒性不足的问题。
-
公开(公告)号:CN111859096B
公开(公告)日:2024-04-19
申请号:CN201910319748.0
申请日:2019-04-19
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06F16/9535 , G06F16/332 , G06F40/284
摘要: 本申请实施例提供了一种信息推送装置、方法、电子设备及计算机可读存储介质,该方法包括:获取模块,用于获取用户端的请求信息;生成模块,用于对所述获取模块获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;预测模块,将所述生成模块生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;推送模块,用于将所述预测模块输出的响应信息推送给所述用户端。本申请实施例可以提高用户端与自助服务平台之间的交互效率,节省网络资源。
-
公开(公告)号:CN111859905B
公开(公告)日:2024-08-20
申请号:CN201910266360.9
申请日:2019-04-03
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06F40/211 , G06F40/284 , G06N3/0442
摘要: 本申请提供了一种数据确定方法、装置、电子设备和计算机存储介质,其中,该方法包括:根据构成预设文本的各个词语,对所述词语之间的句法结构进行解析,以得到所述预设文本的句法树;根据所述句法树,确定各个所述词语的包含词性、词义和句法关系的特征向量;对各个所述词语的特征向量进行解码,以得到构成目标内容的目标词语,通过上述方法,确定出来的目标词语不仅与预设文本要表达的内容贴合度高,而且通过连接词将关键词连接后的语句符合语法要求,从而有利于使生成的简要说明的通顺度较高。
-
公开(公告)号:CN111859096A
公开(公告)日:2020-10-30
申请号:CN201910319748.0
申请日:2019-04-19
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06F16/9535 , G06F16/332 , G06F40/284
摘要: 本申请实施例提供了一种信息推送装置、方法、电子设备及计算机可读存储介质,该方法包括:获取模块,用于获取用户端的请求信息;生成模块,用于对所述获取模块获取的所述请求信息进行词汇切割,为得到的各个切割后的请求词汇分别生成特征向量;预测模块,将所述生成模块生成的各个所述特征向量按照对应的请求词汇在所述请求信息中的上下文关系,输入到预先设置的响应信息预测模型中,输出所述请求信息对应的响应信息;推送模块,用于将所述预测模块输出的响应信息推送给所述用户端。本申请实施例可以提高用户端与自助服务平台之间的交互效率,节省网络资源。
-
公开(公告)号:CN111859905A
公开(公告)日:2020-10-30
申请号:CN201910266360.9
申请日:2019-04-03
申请人: 北京嘀嘀无限科技发展有限公司
IPC分类号: G06F40/211 , G06F40/284 , G06N3/04
摘要: 本申请提供了一种数据确定方法、装置、电子设备和计算机存储介质,其中,该方法包括:根据构成预设文本的各个词语,对所述词语之间的句法结构进行解析,以得到所述预设文本的句法树;根据所述句法树,确定各个所述词语的包含词性、词义和句法关系的特征向量;对各个所述词语的特征向量进行解码,以得到构成目标内容的目标词语,通过上述方法,确定出来的目标词语不仅与预设文本要表达的内容贴合度高,而且通过连接词将关键词连接后的语句符合语法要求,从而有利于使生成的简要说明的通顺度较高。
-
-
-
-
-