- 专利标题: 跨域文本情绪分类模型的训练方法和分类方法
-
申请号: CN202111522655.1申请日: 2021-12-14
-
公开(公告)号: CN114186063B公开(公告)日: 2024-06-21
- 发明人: 卫星 , 王秀秀 , 赵冲 , 陆阳 , 赵明 , 刘玉洁 , 姚尚 , 虞浩 , 白婷
- 申请人: 合肥工业大学
- 申请人地址: 安徽省合肥市包河区屯溪路193号
- 专利权人: 合肥工业大学
- 当前专利权人: 合肥工业大学
- 当前专利权人地址: 安徽省合肥市包河区屯溪路193号
- 代理机构: 上海光华专利事务所
- 代理商 王积毅
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/30 ; G06N3/0464 ; G06N3/08
摘要:
本发明提供一种跨域文本情绪分类模型的训练方法和分类方法,训练方法包括:获取源域和目标域的文本数据,进行预处理得到词向量,并分为训练集和测试集;通过双向门限循环单元网络模型和自注意力机制提取训练集中的文本特征;在损失函数的约束下,根据文本特征分别同时训练第一神经网络模型、第二神经网络模型直至收敛;其中,根据互信息,构建第一神经网络模型的损失函数,并采用梯度反转实现第二神经网络模型和特征提取器的对抗学习训练;根据测试集中的词向量,得到跨域文本情绪分类模型。本发明能够有效将未标注的文本数据集进行分类,能够将其他领域的知识迁移到目标域来避免标注数据不足的问题,同时提高跨域文本情绪分类的准确性和可信度。
公开/授权文献
- CN114186063A 跨域文本情绪分类模型的训练方法和分类方法 公开/授权日:2022-03-15