Invention Publication
- Patent Title: 搜索词成分识别模型构建方法以及搜索词成分识别方法
-
Application No.: CN202210188760.4Application Date: 2022-02-28
-
Publication No.: CN116720517APublication Date: 2023-09-08
- Inventor: 易磊 , 黄泽谦 , 张伟 , 朱秀红 , 黄锦鸿
- Applicant: 腾讯科技(深圳)有限公司
- Applicant Address: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- Assignee: 腾讯科技(深圳)有限公司
- Current Assignee: 腾讯科技(深圳)有限公司
- Current Assignee Address: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- Agency: 华进联合专利商标代理有限公司
- Agent 黄晶晶
- Main IPC: G06F40/295
- IPC: G06F40/295 ; G06F40/216 ; G06F16/335 ; G06F16/35 ; G06N3/04 ; G06N3/08

Abstract:
本申请涉及一种搜索词成分识别模型构建方法以及搜索词成分识别方法。所述搜索词成分识别模型构建方法包括:对获取的行业内搜索词样本进行成分识别预测,得到每一个搜索词样本各自对应的成分识别预测结果;从搜索词样本中,筛选出成分识别预测结果符合标注条件的待标注样本;对待标注样本进行标注,得到标注搜索词样本;根据标注搜索词样本进行模型训练,得到行业对应的用于对待识别搜索词进行成分识别的搜索词成分识别模型。采用本方法能够通过利用主动学习来大量减少人工标注的样本数量,以通过简化数据标注操作来提高搜索词成分识别模型构建效率,得到支持高效成分识别的搜索词成分识别模型。
Public/Granted literature
- CN116720517B 搜索词成分识别模型构建方法以及搜索词成分识别方法 Public/Granted day:2024-10-15
Information query