Invention Grant
- Patent Title: 数据处理方法、装置、服务器及存储介质
-
Application No.: CN202010868456.5Application Date: 2020-08-25
-
Publication No.: CN112036167BPublication Date: 2023-11-28
- Inventor: 唐亚腾
- Applicant: 腾讯科技(深圳)有限公司
- Applicant Address: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- Assignee: 腾讯科技(深圳)有限公司
- Current Assignee: 腾讯科技(深圳)有限公司
- Current Assignee Address: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- Agency: 广州三环专利商标代理有限公司
- Agent 熊永强; 杜维
- Main IPC: G06F40/279
- IPC: G06F40/279 ; G06F18/2411 ; G06F18/214
Abstract:
本发明实施例公开了一种数据处理方法、装置、服务器及存储介质,其中方法包括:获取第一样本集,第一样本集包括多个第一文本的标注信息,以及各个第一文本对应的第一词向量组,标注信息用于指示第一文本的类型,类型包括正常类型或异常类型;获取第二样本集,第二样本集包括多个第二文本中各个第二文本对应的第二词向量组,第二文本是对第一文本进行文本表现形式的转换得到的,文本表现形式包括以下任一种:中文表现形式、英文表现形式和拼音表现形式;采用第一样本集和第二样本集对初始识别模型进行训练,得到目标识别模型,目标识别模型用于识别文本的类型,可训练得到较高的识别准确度的文本识别模型。
Public/Granted literature
- CN112036167A 数据处理方法、装置、服务器及存储介质 Public/Granted day:2020-12-04
Information query