-
公开(公告)号:CN115938351A
公开(公告)日:2023-04-07
申请号:CN202111069758.7
申请日:2021-09-13
申请人: 北京数美时代科技有限公司
IPC分类号: G10L15/06 , G10L15/26 , G06F40/216 , G06F40/289
摘要: 本发明涉及模型建立领域,尤其涉及ASR语言模型的构建方法、系统、存储介质及电子设备。该方法包括:步骤1,获取语音样本数据;步骤2,对所述语音样本数据进行基础处理,得到样本数据;步骤3,对所述样本数据进行字符清洗,得到清洗后的第一样本数据;步骤4,对所述第一样本数据进行变体替换,得到本体数据;步骤5,对所述本体数据进行频数统计,根据统计结果生成训练样本;步骤6,根据所述训练样本对ASR语言模型进行构建。通过该方法可以获取高质量的ASR语言模型的训练样本,基于训练样本得出的ASR语言训练模型可以更加精确,同时能够快速使用到相关领域。
-
公开(公告)号:CN113948065A
公开(公告)日:2022-01-18
申请号:CN202111020788.9
申请日:2021-09-01
申请人: 北京数美时代科技有限公司
IPC分类号: G10L15/06 , G10L15/22 , G10L15/26 , G06F40/211 , G06F40/216
摘要: 本发明公开了基于n‑gram模型的错误拦截词筛选方法及系统,涉及网络安全技术领域。该方法包括:获取基于特定标签下的拦截词拦截的音频转译文本数据;通过n‑gram模型对文本数据进行处理,从文本数据中筛选出特定标签中没有存储的数据作为回退信息;根据回退信息确定包含错误拦截词的句子。本发明适用于违禁词和敏感词的拦截,尤其是音频转译文本数据的违禁词和敏感词拦截,能够快速找到拦截错误的句子和错误的拦截词,后续可根据得到的错误拦截词对违禁词库进行完善和优化,从而提高对应拦截词的拦截准确率和整体的拦截准确率。
-
公开(公告)号:CN113793602A
公开(公告)日:2021-12-14
申请号:CN202110984799.2
申请日:2021-08-24
申请人: 北京数美时代科技有限公司
摘要: 本发明公开了一种未成年人的音频识别方法和系统,涉及人工智能领域。该方法包括:对待识别音频片段进行预处理,获得频谱数据,通过fbank算法对所述频谱数据转换成多维数组数据,将所述多维数组数据输入第一CNN模型提取音频特征数据,提取所述音频特征数据中的高维音频数据,通过第二CNN模型的深度可分离卷积模块对所述高维音频数据进行深度识别,可以有效识别出未成人音频和通过第二CNN模型的深度可分离卷积模块进行高维音频数据识别大大提升未成年人识别的准确率,识别精度高可以快速应用到相关领域。
-
公开(公告)号:CN113469290B
公开(公告)日:2021-11-19
申请号:CN202111017696.5
申请日:2021-09-01
申请人: 北京数美时代科技有限公司
摘要: 本发明涉及一种训练样本的选取方法、系统、存储介质和电子设备,将任一数据样本输入现有的已训练好的数据模型中,根据输出结果计算该数据样本的信息熵,并进行进行归一化,直至得到多个数据样本的归一化后的信息熵并按照从大到小顺序排列,前个归一化后的信息熵对应的数据样本均作为训练样本,也就是挑选出能够对模型训练起到的较大效果的数据样本作为训练样本,然后再进行新模型的训练,既保证新训练出的模型的精度,还能降低标注成本。
-
公开(公告)号:CN112422576A
公开(公告)日:2021-02-26
申请号:CN202011330353.X
申请日:2020-11-24
申请人: 北京数美时代科技有限公司
摘要: 本发明公开了一种支持实时反欺诈业务的分层在线架构装置、设备。其中,所述装置包括:接入层、业务逻辑层、决策引擎层、基础引擎层和存储层,该接入层、该业务逻辑层、该决策引擎层、该基础引擎层和该存储层之间采用分层的在线架构配置和采用注册订阅模式的发现模式以及二进制的通讯协议进行通信。通过上述方式,能够实现支持实时反欺诈业务的在线架构能够具备高扩展性和低延迟性,能够满足访问量日益增大的互联网业务需求。
-
公开(公告)号:CN112200598A
公开(公告)日:2021-01-08
申请号:CN202010932388.4
申请日:2020-09-08
申请人: 北京数美时代科技有限公司
摘要: 本发明公开了一种图片广告识别方法、装置、计算机设备。其中,所述方法包括:获取图片广告中的词嵌入特征,和提取该图片广告中的图嵌入特征,和基于该词嵌入特征和该图嵌入特征,采用多模态深度语义交互的神经网络方式,构建欺诈图片广告的二分类模型,以及根据该构建的欺诈图片广告的二分类模型,对图片广告进行是否是欺诈图片广告的识别。通过上述方式,能够实现提高对欺诈图片广告进行识别的准确率。
-
公开(公告)号:CN112183754A
公开(公告)日:2021-01-05
申请号:CN202010933073.1
申请日:2020-09-08
申请人: 北京数美时代科技有限公司
摘要: 本发明公开了一种稀少内容的分级深度学习模型检测方法、装置、计算机设备。其中,所述方法包括:采用分级深度学习模型方式,将推理模型配置为初筛模型和决策模型,其中,该初筛模型为满足预设性能阈值的模型,该决策模型为满足预设指标阈值的模型,和调节该初筛模型的初筛阈值为第一阈值,根据该第一阈值,从稀少内容中筛选出正常内容,以及调整该决策模型的决策阈值为第二阈值,根据该第二阈值,从该经筛选出正常内容后的稀少内容中决策出正常内容;其中,该第二阈值小于该第一阈值。通过上述方式,能够实现在维持足够的推理性能指标的同时,能够减少做推理计算所需的计算资源,降低机器成本。
-
公开(公告)号:CN112163462A
公开(公告)日:2021-01-01
申请号:CN202010932714.1
申请日:2020-09-08
申请人: 北京数美时代科技有限公司
IPC分类号: G06K9/00
摘要: 本发明公开了一种基于人脸的未成年人识别方法、装置、计算机设备。其中,所述方法包括:根据人脸图像,计算出关联该人脸图像的人脸区域,和对该人脸区域进行边缘扩展,增加预设的边缘区域作为上下文环境信息,和将该经增加预设的边缘区域后的人脸区域输入到配置了注意力机制的卷积神经网络中,以及通过该配置注意力机制后的卷积神经网络,对该经增加预设的边缘区域后的人脸区域对应的人脸是否是未成年人的概率进行评估。通过上述方式,能够实现提高基于人脸图像来识别未成年人的准确率。
-
公开(公告)号:CN113948087B
公开(公告)日:2023-01-17
申请号:CN202111068472.7
申请日:2021-09-13
申请人: 北京数美时代科技有限公司
IPC分类号: G10L15/26 , G10L15/08 , G10L25/51 , G06F40/216 , G06F16/683 , G06F16/65
摘要: 本发明涉及音频识别领域,尤其涉及一种语音标签判定方法、系统、存储介质及电子设备。该方法包括:获取开源词汇,形成开源词汇集;对相关场景下的文本进行切词处理,得到切词集;获取音频文件,对所述音频文件进行处理,得到高频词汇集;获取预设名单,对预设名单进行处理得到相关词汇集;对所述开源词汇集、切词集、高频词汇集以及所述相关词汇集进行并集处理,得到词汇表;根据所述词汇表对语音内容进行标签处理。本发明可操作性强,适用于冷启动阶段;可以有效的提升内容风控领域的ASR识别准确率,以及下游nlp分类任务和标签效果,并快速应用到相关领域。
-
公开(公告)号:CN113793602B
公开(公告)日:2022-05-10
申请号:CN202110984799.2
申请日:2021-08-24
申请人: 北京数美时代科技有限公司
摘要: 本发明公开了一种未成年人的音频识别方法和系统,涉及人工智能领域。该方法包括:对待识别音频片段进行预处理,获得频谱数据,通过fbank算法对所述频谱数据转换成多维数组数据,将所述多维数组数据输入第一CNN模型提取音频特征数据,提取所述音频特征数据中的高维音频数据,通过第二CNN模型的深度可分离卷积模块对所述高维音频数据进行深度识别,可以有效识别出未成人音频和通过第二CNN模型的深度可分离卷积模块进行高维音频数据识别大大提升未成年人识别的准确率,识别精度高可以快速应用到相关领域。
-
-
-
-
-
-
-
-
-