-
公开(公告)号:CN112966109B
公开(公告)日:2023-04-18
申请号:CN202110255154.5
申请日:2021-03-09
Applicant: 北京邮电大学 , 上海理想信息产业(集团)有限公司
IPC: G06F16/35 , G06F18/2431 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种多层级的中文文本的分类方法及其系统,其中多层级的中文文本的分类方法具体包括以下步骤:获取文本数据;对文本数据进行处理,得到特征库;响应于特征库构建完成,构建并训练粗分类模型;响应于完成粗分类模型的构建,进行细分类模型的构建;对训练好的粗分类模型和细分类模型进行测试。本申请结合分级结构的数据特点,利用深度学习方法进行粗分类,利用机器学习算法进行细分类,最终实现准确率较高的文本分类。
-
公开(公告)号:CN112966109A
公开(公告)日:2021-06-15
申请号:CN202110255154.5
申请日:2021-03-09
Applicant: 北京邮电大学 , 上海理想信息产业(集团)有限公司
Abstract: 本申请公开了一种多层级的中文文本的分类方法及其系统,其中多层级的中文文本的分类方法具体包括以下步骤:获取文本数据;对文本数据进行处理,得到特征库;响应于特征库构建完成,构建并训练粗分类模型;响应于完成粗分类模型的构建,进行细分类模型的构建;对训练好的粗分类模型和细分类模型进行测试。本申请结合分级结构的数据特点,利用深度学习方法进行粗分类,利用机器学习算法进行细分类,最终实现准确率较高的文本分类。
-
公开(公告)号:CN107423162A
公开(公告)日:2017-12-01
申请号:CN201710277039.1
申请日:2017-04-25
Applicant: 北京邮电大学 , 四川科瑞软件有限责任公司
IPC: G06F11/14
CPC classification number: G06F11/1448
Abstract: 本发明实施例提供了灾备系统与源系统间数据的同步方法及装置,其中一种方法及装置应用于源系统,另一种应用于灾备系统,应用于源系统的方法包括:获取目标数据、偏移地址、文件标识以及操作类型;确定所述操作类型对应的操作标识;将所述目标数据、所述偏移地址、所述文件标识以及所述操作标识发送至灾备系统,以使得:所述灾备系统根据所述操作标识,将本地的所述文件标识对应的文件中所述偏移地址对应的存储空间的数据修改为所述目标数据。通过实施本方案,可以避免不必要的重复信息的复制,以提高备份速度,进而提高数据备份的及时性,且可以削减对系统和带宽的消耗,并且降低存储冗余。
-
-