发明授权
- 专利标题: 一种基于潜在语义分析的迁移学习方法
-
申请号: CN201310069560.8申请日: 2013-03-05
-
公开(公告)号: CN103176961B公开(公告)日: 2017-02-08
- 发明人: 初妍 , 陈曼 , 夏琳琳 , 沈洁 , 张健沛 , 杨静 , 王勇 , 高迪 , 王兴梅 , 李丽洁
- 申请人: 哈尔滨工程大学
- 申请人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
- 专利权人: 哈尔滨工程大学
- 当前专利权人: 哈尔滨工程大学
- 当前专利权人地址: 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明的目的在于提供一种基于潜在语义分析的迁移学习方法,包括以下步骤:对训练数据做去停用词、词干化处理,分别计算源领域与目标领域词汇权重,得到词汇-文本矩阵M,对矩阵M进行奇异值分解,将M中词汇与文本映射到低维潜在语义空间,去除源领域中同义词噪音影响,调整矩阵M结构,从源领域中找出与目标领域文本关联度较大的词汇作为迁移词,再对矩阵M结构进行调整,分析调整后的矩阵M中目标领域词汇,得到目标领域数据新的特征表示,在训数据集中得到最终分类器,对测试数据集S进行分类。
公开/授权文献
- CN103176961A 一种基于潜在语义分析的迁移学习方法 公开/授权日:2013-06-26