发明授权
- 专利标题: 文本标签的提取方法和装置
-
申请号: CN201510197328.1申请日: 2015-04-23
-
公开(公告)号: CN106156204B公开(公告)日: 2020-05-29
- 发明人: 胡燊 , 刘安安 , 王迪
- 申请人: 深圳市腾讯计算机系统有限公司
- 申请人地址: 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼
- 专利权人: 深圳市腾讯计算机系统有限公司
- 当前专利权人: 深圳市腾讯计算机系统有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区高新南一路飞亚达大厦5-10楼
- 代理机构: 广州华进联合专利商标代理有限公司
- 代理商 何平; 邓云鹏
- 主分类号: G06F16/31
- IPC分类号: G06F16/31 ; G06F16/35
摘要:
本发明涉及一种文本标签的提取方法,包括:对待提取文本通过文本分类模型进行类别预测,得到所述文本的目标类别,对所述待提取文本通过主题聚类模型进行主题预测,得到预测主题,如果所述预测主题在预设主题集合中,则获取所述预测主题对应的目标主题,对所述待提取文本进行关键词提取,得到所述文本的目标关键词,将所述目标类别、目标主题和目标关键词作为所述文本的标签。文本的标签具有不同的层次,满足不同粒度的检索需求,也可以根据不同的标签,提供不同粒度的推荐文章。此外,还提供了一种文本标签的提取装置。
公开/授权文献
- CN106156204A 文本标签的提取方法和装置 公开/授权日:2016-11-23