一种语种训练数据获得方法及装置

    公开(公告)号:CN109741731A

    公开(公告)日:2019-05-10

    申请号:CN201910015434.1

    申请日:2019-01-08

    Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

    一种语种训练数据获得方法及装置

    公开(公告)号:CN109741731B

    公开(公告)日:2020-12-29

    申请号:CN201910015434.1

    申请日:2019-01-08

    Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。

    一种基于5GSA网络的码流传输方法和装置

    公开(公告)号:CN112105056B

    公开(公告)日:2022-12-20

    申请号:CN202010768504.3

    申请日:2020-08-03

    Abstract: 本发明公开了一种基于5GSA网络的码流传输方法和系统,该方法包括:基于大区中心采集控制面原始码流;回传原始码流;采集数据面原始码流;从所述各个省公司传输所述控制面原始码流和所述数据面原始码流至所述各个省公司下属的相关系统。核心网NVF集中化后,核心网网元均以虚拟机方式部署在云平台上,本发明采用TOR镜像结合分光采集的方式解决传统3/4G基于物理端口分光方式不适用的问题,还采取对大区原始码流进行分发回传给省公司方式,解决了5G控制面数据采取大区制集中部署,控制面数据不在本地机房问题,最后,采用SDTP协议针对原始码流进行封装,根据省份标识将不同省份的原始码流通过IP网络回传至省公司,保证了数据流能够在网络中安全稳定传输。

    一种基于TCAM的报文关键字匹配方法和装置

    公开(公告)号:CN112131356B

    公开(公告)日:2022-06-07

    申请号:CN202010768507.7

    申请日:2020-08-03

    Abstract: 本发明公开了一种基于TCAM的报文关键字匹配方法和装置,该方法包括:基于关键字规则数据库和TCAM芯片生成规则索引数据库和规则全文数据库;将第一查询命令字符在所述规则索引数据库中进行匹配;若命中与所述第一查询命令字符相关的索引规则,将第二查询命令字符在所述规则全文数据库中进行匹配;若命中与所述第二查询命令字符相关的规则全文,则基于获取命中的所述规则全文,处理待处理的报文。本发明基于硬件TCAM芯片的匹配速度快但是容量有限的特点,将关键字规则分为长度较短的规则索引和较长的规则全文进行分阶段匹配,兼顾了TCAM芯片的利用率和匹配性能,同时方案无需更改或增加硬件设备,复杂度低,具有较强的实用性。

    基于K_means和KNN融合算法的网络流量分类方法

    公开(公告)号:CN108650194B

    公开(公告)日:2022-03-25

    申请号:CN201810454425.8

    申请日:2018-05-14

    Abstract: 本发明提出了基于K_means和KNN融合算法的网络流量分类方法。该方法的框架是针对每个应用协议构建一个二分类器,由决策规则将所有分类器的输出整合为最终输出。算法上融合了无监督的K_means算法和有监督的KNN算法,此外,该方法还提出了基于K_means迭代的特征选择算法,目的是选出高分离度的特征,以节省时间、空间和提高分类效果。实验结果表明,在真实流量数据上,本发明对流量识别的准确率和召回率可达90%以上,相比现有典型的流量分类方法效果更好;本发明还可识别出未登录流量,与典型的分类方法相比在功能上有了扩展。

    一种LTE多接口数据回填方法和装置

    公开(公告)号:CN106102090B

    公开(公告)日:2019-07-05

    申请号:CN201610421149.6

    申请日:2016-06-14

    Abstract: 本发明公开了一种LTE多接口数据回填方法,其特征在于,所述方法包括:采集S1‑MME或者S10接口消息,获取IMSI参数;采集所述S1‑MME接口消息中的至少一个全球唯一临时UE标识GUTI,并与所述IMSI参数建立UTI~IMSI映射表;获取所述S1‑MME接口消息中的会话参数,根据所述会话参数和所述GUTI~IMSI映射表关联所述S1‑MME接口与S6a接口;以及所述LTE中的至少一个接口根据共有关键参数与所述S1‑MME接口关联,回填数据。本发明公开的技术方案能够提高移动用户上网日志查询和网络安全事件追溯的准确性,而且可以提高身份信息的回填率和准确率,提高数据回填的效率。

Patent Agency Ranking