发明授权
- 专利标题: 基于卷积神经网络的短文本分类方法
-
申请号: CN201510271672.0申请日: 2015-05-25
-
公开(公告)号: CN104834747B公开(公告)日: 2018-04-27
- 发明人: 徐博 , 王鹏 , 王方圆 , 郝红卫
- 申请人: 中国科学院自动化研究所
- 申请人地址: 北京市海淀区中关村东路95号
- 专利权人: 中国科学院自动化研究所
- 当前专利权人: 中国科学院自动化研究所
- 当前专利权人地址: 北京市海淀区中关村东路95号
- 代理机构: 中科专利商标代理有限责任公司
- 代理商 宋焰琴
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F3/02
摘要:
本发明是一种基于卷积神经网络的短文本分类方法,该卷积神经网络共分五层:第一层,获取短文本中的多尺度候选语义单元;第二层,计算每一个候选语义单元与向量空间中所有词表示向量的欧式距离并找出最近邻的词表示,选择所有满足欧式距离预设阈值的最近邻词表示构建语义扩展矩阵;第三层,用多个不同宽度、不同权值的核矩阵分别对短文本的映射矩阵和语义扩展矩阵进行二维卷积运算提取局部卷积特征并生成多层局部卷积特征矩阵;第四层,对多层局部卷积特征矩阵进行下采样并得到多层全局特征矩阵,将所述全局特征矩阵进行非线性正切变换并转换为定长的语义特征向量;第五层,将语义特征向量赋予分类器,对短文本的类别进行预测。
公开/授权文献
- CN104834747A 基于卷积神经网络的短文本分类方法 公开/授权日:2015-08-12