发明公开
- 专利标题: 特征提取模型的训练方法以及特征提取方法
-
申请号: CN202410781102.5申请日: 2024-06-17
-
公开(公告)号: CN118690169A公开(公告)日: 2024-09-24
- 发明人: 庞宇嘉 , 王天祺 , 徐世界 , 童厚杰 , 田建
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 王达佐; 王艳春
- 主分类号: G06F18/213
- IPC分类号: G06F18/213 ; G06F18/214 ; G06F40/289 ; G06F16/35 ; G06N3/09 ; G06N3/045
摘要:
本公开提供了一种特征提取模型的训练方法以及特征提取方法,涉及自然语言处理、深度学习、智慧金融、大模型等技术领域。该方法包括:获取初始训练样本;确定初始训练样本的目标特征,其中,目标特征包括分词特征和分类特征,分词特征用于表征初始训练样本对应的分词的特征信息,分类特征用于表征初始训练样本对应于预设的分类类别的特征信息;利用初始训练样本的目标特征对初始模型进行训练,得到训练完成的特征提取模型。该方法大幅提升了特征挖掘的深度和广度,提升了特征提取模型提取特征的全面性。