-
公开(公告)号:CN112259122B
公开(公告)日:2024-07-19
申请号:CN202011126396.6
申请日:2020-10-20
申请人: 北京小米松果电子有限公司
IPC分类号: G10L25/03 , G10L25/18 , G10L25/51 , G06N3/0464 , G06N3/08
摘要: 本公开涉及一种音频类型识别方法、装置及存储介质,所述方法包括:获取待识别的音频数据;将所述音频数据输入至目标音频类型识别模型,得到所述音频数据的类型信息;其中,所述目标音频类型识别模型由基于训练得到的超网络生成,所述超网络中属于同一层网络的多个子结构具有不同尺寸的卷积核。上述技术方案可以基于训练得到的超网络确定精度更高的网络结构作为目标音频类型识别模型。由此,可以将待识别的音频数据作为输入,通过所述目标音频类型识别模型确定所述音频数据的类型信息,从而起到提升音频分类精度的效果。
-
公开(公告)号:CN111968635A
公开(公告)日:2020-11-20
申请号:CN202010790157.4
申请日:2020-08-07
申请人: 北京小米松果电子有限公司
摘要: 本公开涉及一种语音识别的方法、装置及存储介质。该方法包括:当接收到语音信息时,将语音信息输入到生成的语音识别模型;通过语音识别模型输出识别结果;其中,生成语音识别模型,包括:对超网络进行训练,其中,所述超网络包括多层网络层,每一所述网络层包括M个子结构,所述M个子结构中的至少一个所述子结构包括时序卷积网络模块,M为大于或等于2的正整数;根据训练结果,分别从每一所述网络层的M个子结构中确定与所述网络层对应的目标子结构;根据每一所述网络层对应的所述目标子结构,生成所述语音识别模型。通过上述技术方案,提高语音识别模型的性能,保证语音识别的准确性,并且提高对语音信息的识别速度和响应速度。
-
公开(公告)号:CN111753895A
公开(公告)日:2020-10-09
申请号:CN202010538271.8
申请日:2020-06-12
申请人: 北京小米松果电子有限公司
摘要: 本公开是关于一种数据处理方法、装置及存储介质。该方法可以包括:将训练集中的各个已标注训练数据输入待训练的预定模型,更新预定模型的模型参数;将验证集中的各个已标注验证数据输入模型参数更新后的预定模型,得到第一预测标签;根据第一预测标签与已标注验证数据的标注标签的差异得到验证损失值;根据预定模型当前的结构参数,确定辅助损失值;根据验证损失值和辅助损失值,确定是否停止训练预定模型,基于训练后的预定模型所包括的网络结构构建的目标网络模型对待分类数据进行分类,得到分类结果。这样,在增加辅助损失值后,能使输出结果的取值向辅助损失值的导数方向移动,使各输出结果趋近设定参数值,进而减小输出结果的离散化偏差。
-
公开(公告)号:CN111753917A
公开(公告)日:2020-10-09
申请号:CN202010608235.4
申请日:2020-06-29
申请人: 北京小米松果电子有限公司
摘要: 本公开是关于一种数据处理方法、装置及存储介质。该方法可以包括:将训练集中的各个已标注训练数据输入待训练的预定模型,得到第一预测标签;根据所述第一预测标签与所述已标注训练数据的标注标签的差异,得到训练损失值;基于所述训练损失值,更新所述预定模型的模型参数;基于训练后的预定模型所包括的网络结构构建的目标网络模型,对待分类数据进行分类,得到分类结果。由于模型参数可以包括网络参数和结构参数,在对预定模型进行优化的过程中,能够对网络参数和结构参数进行优化,得到精确度更高的目标网络模型,这样,基于该模型所得到的分类结果更准确。
-
公开(公告)号:CN111968635B
公开(公告)日:2024-03-05
申请号:CN202010790157.4
申请日:2020-08-07
申请人: 北京小米松果电子有限公司
IPC分类号: G10L15/22 , G06N3/0464 , G10L15/06 , G10L15/16
摘要: 本公开涉及一种语音识别的方法、装置及存储介质。该方法包括:当接收到语音信息时,将语音信息输入到生成的语音识别模型;通过语音识别模型输出识别结果;其中,生成语音识别模型,包括:对超网络进行训练,其中,所述超网络包括多层网络层,每一所述网络层包括M个子结构,所述M个子结构中的至少一个所述子结构包括时序卷积网络模块,M为大于或等于2的正整数;根据训练结果,分别从每一所述网络层的M个子结构中确定与所述网络层对应的目标子结构;根据每一所述网络层对应的所述目标子结构,生成所述语音识别模型。通过上述技术方案,提高语音识别模型的性能,保证语音识别的准确性,并且提高对语音信息的识别速度和响应速度。
-
公开(公告)号:CN112259122A
公开(公告)日:2021-01-22
申请号:CN202011126396.6
申请日:2020-10-20
申请人: 北京小米松果电子有限公司
摘要: 本公开涉及一种音频类型识别方法、装置及存储介质,所述方法包括:获取待识别的音频数据;将所述音频数据输入至目标音频类型识别模型,得到所述音频数据的类型信息;其中,所述目标音频类型识别模型由基于训练得到的超网络生成,所述超网络中属于同一层网络的多个子结构具有不同尺寸的卷积核。上述技术方案可以基于训练得到的超网络确定精度更高的网络结构作为目标音频类型识别模型。由此,可以将待识别的音频数据作为输入,通过所述目标音频类型识别模型确定所述音频数据的类型信息,从而起到提升音频分类精度的效果。
-
公开(公告)号:CN111553464B
公开(公告)日:2023-09-29
申请号:CN202010338426.3
申请日:2020-04-26
申请人: 北京小米松果电子有限公司
IPC分类号: G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
摘要: 本公开是关于一种基于超网络的图像处理方法、装置及智能设备。所述方法包括:将预先训练的主干网与目标检测网络的后端进行合并,对合并后得到的超网络进行训练,基于训练后的超网络进行神经网络结构搜索,得到目标检测神经网络架构,利用所述目标检测神经网络架构对待处理图像进行处理,得到图像处理结果,由于将预先训练的主干网与目标检测网络的后端进行合并,并对合并得到的超网络进行训练以及神经网络结构搜索,因而可以提高超网络的训练效率,并且由于是对训练后的超网络进行神经网络结构搜索,因而可以保证有足够丰富的搜索空间进行神经网络结构搜索,进而可以提高搜索出的网络结构的图像处理性能。
-
公开(公告)号:CN111553464A
公开(公告)日:2020-08-18
申请号:CN202010338426.3
申请日:2020-04-26
申请人: 北京小米松果电子有限公司
摘要: 本公开是关于一种基于超网络的图像处理方法、装置及智能设备。所述方法包括:将预先训练的主干网与目标检测网络的后端进行合并,对合并后得到的超网络进行训练,基于训练后的超网络进行神经网络结构搜索,得到目标检测神经网络架构,利用所述目标检测神经网络架构对待处理图像进行处理,得到图像处理结果,由于将预先训练的主干网与目标检测网络的后端进行合并,并对合并得到的超网络进行训练以及神经网络结构搜索,因而可以提高超网络的训练效率,并且由于是对训练后的超网络进行神经网络结构搜索,因而可以保证有足够丰富的搜索空间进行神经网络结构搜索,进而可以提高搜索出的网络结构的图像处理性能。
-
-
-
-
-
-
-