-
公开(公告)号:CN112116916B
公开(公告)日:2024-06-14
申请号:CN201910478562.X
申请日:2019-06-03
Applicant: 北京小米智能科技有限公司
Abstract: 本文公开了一种确定语音增强算法的性能参数的方法、装置、介质及设备,此方法包括:获取N个增强带噪语音数据的第一验证集合中每个语音数据的识别结果值;根据N个第一验证集合中的T个第二验证集合,获取T个第三验证集合;根据N‑T个第四验证集合获取N‑T个第一训练集合;通过将N‑T个第一训练集合中每个增强带噪语音数据的语音特征和相应的无噪语音数据的语音特征组合成组合式语音特征;根据N‑T组合式语音特征集合和相应的目标值,训练有参考的质量评价网络模型;根据有参考的质量评价网络模型和T个第三验证集合获取语音增强算法的性能参数。本文可以准确的评价应用于唤醒的语音增强算法的性能,提高移动终端的智能性,提高用户的使用体验。
-
公开(公告)号:CN110795938B
公开(公告)日:2023-11-10
申请号:CN201911097121.1
申请日:2019-11-11
Applicant: 北京小米智能科技有限公司
IPC: G06F40/289 , G06F40/216 , G06F18/25
Abstract: 本公开揭示了一种文本序列分词方法,属于自然语言处理技术领域。所述方法包括:获取文本序列的n个分词子结果,所述n个分词子结果是通过n个分词模型分别对所述文本序列进行分词处理获得的;通过结果合并模型中的概率确定模型分支对所述n个分词子结果进行处理,获取所述各个分词位置的分词概率;通过所述结果合并中的激活函数对所述各个分词位置处的分词概率进行处理,获取所述文本序列的分词结果。本公开以文本序列中的每个分词位置为单位,对多个分词模型的分词结果进行合并,从而提高了对新出现的文本序列进行分词的准确性。
-
公开(公告)号:CN111126079B
公开(公告)日:2023-11-07
申请号:CN201911167600.6
申请日:2019-11-25
Applicant: 北京小米智能科技有限公司
Abstract: 本公开是关于一种用于机器翻译的神经网络模型压缩方法、装置及存储介质。机器翻译的神经网络模型压缩方法中,基于N个训练样本,获得训练后的第一教师模型以及训练后的第二教师模型,所述N为大于1的正整数;对于所述N个训练样本中的每一个分别确定所述第一教师模型的第一指导分量,以及所述第二教师模型的第二指导分量,根据所述第一指导分量和所述第二指导分量,确定与该训练样本对应的用于优化学生模型的子优化目标,并基于所述N个训练样本中的每一个以及与其对应的子优化目标,确定联合优化目标;基于所述联合优化目标训练学生模型。本公开可以更有效的将教师模型的知识迁移到学生模型中,改进学生模型的翻译质量。
-
公开(公告)号:CN110781674B
公开(公告)日:2023-10-27
申请号:CN201910888623.X
申请日:2019-09-19
Applicant: 北京小米智能科技有限公司
Inventor: 吴晓琳
IPC: G06F40/58 , G06F40/284 , G06F40/289 , G06N3/0455 , G06N3/08
Abstract: 本公开是关于一种信息处理方法、装置、计算机设备及存储介质,所述方法包括:利用机器翻译模型的编码器对待翻译词句进行编码,得到编码信息;保存所述全局注意力参数;利用所述机器翻译模型的解码器,在所述待翻译词句中每一个词语的所述编码信息的解码循环中,根据所述全局注意力参数确定所述解码器的全局注意力;根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。由于会将解码时需要用到的全局注意力参数保存起来,因此,在解码器需要利用全局注意力参数确定全局注意力时可以直接调取存储的全局注意力参数,而不需要再次通过处理编码信息得到全局注意力参数,减少解码过程中的计算量;从而提高机器翻译模型的推理效率。
-
公开(公告)号:CN110991195B
公开(公告)日:2023-09-29
申请号:CN201911281744.4
申请日:2019-12-13
Applicant: 北京小米智能科技有限公司
IPC: G06F40/58 , G06F18/24 , G06F18/214
Abstract: 本公开揭示了一种机器翻译模型训练方法、装置及存储介质,属于自然语言处理技术领域。该方法包括:获取包含多个训练数据对的多领域混合的训练数据集;对多个训练数据对进行数据领域分类,以获得至少两个领域数据子集;确定每个领域数据子集的至少两个候选优化目标,并基于至少两个候选优化目标分别训练每个领域数据子集对应的至少两个候选单领域模型;分别测试每个领域数据子集对应的至少两个候选单领域模型,选择准确性最高的候选单领域模型对应的候选优化目标作为领域数据子集的指定优化目标;基于训练数据集中的每个领域数据子集及其对应的指定优化目标,训练混合领域模型。可以提高混合领域模型对各个领域的语言数据翻译结果的质量。
-
公开(公告)号:CN111079421B
公开(公告)日:2023-09-26
申请号:CN201911168682.6
申请日:2019-11-25
Applicant: 北京小米智能科技有限公司
IPC: G06F40/284
Abstract: 本公开是关于一种文本信息分词处理的方法、装置、终端及存储介质,所述方法包括:获取文本信息以及配置信息,其中,所述配置信息包括至少两条第一分词规则;按照预定规则,将所述第一分词规则转换成第二分词规则;当利用任意两条所述第二分词规则匹配到的文本信息的字符串存在交集时,确定存在交集的任意两条所述第二分词规则对应的两条所述第一分词规则存在冲突;按照所述配置信息处理所述文本信息,输出所述文本信息的分词结果。由于通过了将所述第一分词规则转换成第二分词规则,使得第二分词规则可以成为一个确定性的规则,从而可以通过这些确定的分词规则,快速和准确地排查出配置信息中存在冲突的分词规则。
-
公开(公告)号:CN110765758B
公开(公告)日:2023-08-04
申请号:CN201911063958.4
申请日:2019-11-04
Applicant: 北京小米智能科技有限公司
IPC: G06F40/205 , G06F40/30
Abstract: 本文公开了一种同义句生成模型的生成方法、装置及介质,此方法包括:使用第一集合训练得到一生成模型和一判别模型;所述第一集合包括多个同义句组,每个同义句组包括至少两个同义句;对所述生成模型和所述判别模型进行迭代处理直至所述生成模型收敛。本文使用了大量的单句,充分利用了单句的成本低和无需人工标注的优点。在对模型的训练过程中,结合了大量的单句和强化学习方式,单句的使用极大的增加了语义的丰富性,强化学习方式可以使模型在迭代过程中不断优化,从而完全无需依赖大量的平行语料便可以训练出优质的同义句生成模型。
-
公开(公告)号:CN110827219B
公开(公告)日:2023-04-07
申请号:CN201911054263.X
申请日:2019-10-31
Applicant: 北京小米智能科技有限公司
Inventor: 张亮
IPC: G06T5/00 , G06V10/774
Abstract: 本公开是关于一种图像处理模型的训练方法、装置和介质。该方法包括:对于N个训练场景中的每一个训练场景,分别获取M帧远距拍摄图像,其中N和M均为大于1的正整数;对于每一个训练场景,获取该训练场景的近距标准图像;对于每一个训练场景,将所述M帧远距拍摄图像裁剪为具有与所述近距标准图像相同的视场,并基于所述近距标准图像对齐裁剪后的所述M帧远距拍摄图像;每一个训练场景的对齐后的所述M帧远距拍摄图像和所述近距标准图像形成该训练场景的训练样本对,将分别对应于所述N个训练场景的N个训练样本对组成训练样本集;基于所述训练样本集,对所述图像处理模型进行训练。采用该方法,在有效的提高了数字变焦效果同时,实现了去噪的目的。采用本方法,可以让用户在拍摄远处文字或者其他物体时,可以看得更加清楚。
-
公开(公告)号:CN111009257B
公开(公告)日:2022-12-27
申请号:CN201911302532.X
申请日:2019-12-17
Applicant: 北京小米智能科技有限公司
Inventor: 侯海宁
IPC: G10L21/0216 , G10L21/0232 , G10L21/0264 , G10L21/0272 , G10L21/0308
Abstract: 本公开是关于一种音频信号处理方法、装置、终端及存储介质,所述方法包括:由至少两个麦克风获取至少两个声源各自发出的音频信号,以获得至少两个麦克风各自在时域上的多帧原始带噪信号;对于时域上的每一帧,根据至少两个麦克风各自的原始带噪信号,获取至少两个声源各自的频域估计信号;对于至少两个声源中的每个声源,将频域估计信号在频域上划分为多个频域估计分量,其中,每个频域估计分量对应一个频域子带并且包含多个频点数据;在每个频域子带内,确定频域子带所包含的每个频点的加权系数,并根据加权系数更新每个频点的分离矩阵;基于更新后的分离矩阵及原始带噪信号,获得至少两个声源各自发出的音频信号。
-
公开(公告)号:CN110196747B
公开(公告)日:2022-09-30
申请号:CN201910472124.2
申请日:2019-05-31
Applicant: 北京小米智能科技有限公司
Inventor: 卢山
IPC: G06F9/451
Abstract: 本公开是关于一种信息处理方法及装置。该方法包括:接收第一即时信息,所述第一即时信息为会话过程中接收的信息;在所述第一即时信息中检测第二即时信息,所述第二即时信息为满足预设条件的信息,所述满足预设条件的信息包括以下至少一项:被重复查看的信息、被标定的信息;响应于检测到所述第二即时信息,显示提示信息,所述提示信息包括以下至少之一:所述第二即时信息、所述第二即时信息的摘要信息、所述第二即时信息的链接。本公开可方便的显示关键信息以提升查看效率,同时还能提升聊天工具的易用性。
-
-
-
-
-
-
-
-
-