Invention Grant
CN110134947B 一种基于不平衡多源数据的情感分类方法及系统
失效 - 权利终止
- Patent Title: 一种基于不平衡多源数据的情感分类方法及系统
-
Application No.: CN201910307654.1Application Date: 2019-04-17
-
Publication No.: CN110134947BPublication Date: 2021-03-26
- Inventor: 李鹏霄 , 时磊 , 张琳 , 王海洋 , 程光 , 柳毅 , 赵媛 , 赵晓航 , 王元杰 , 王艳华 , 李雪梅
- Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
- Applicant Address: 北京市海淀区中关村科学院南路6号;
- Assignee: 中国科学院计算技术研究所,国家计算机网络与信息安全管理中心
- Current Assignee: 中国科学院计算技术研究所,国家计算机网络与信息安全管理中心
- Current Assignee Address: 北京市海淀区中关村科学院南路6号;
- Agency: 北京律诚同业知识产权代理有限公司
- Agent 祁建国; 梁挥
- Main IPC: G06F40/30
- IPC: G06F40/30 ; G06N3/08

Abstract:
本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
Public/Granted literature
- CN110134947A 一种基于不平衡多源数据的情感分类方法及系统 Public/Granted day:2019-08-16
Information query