- 专利标题: 模型训练方法、装置、计算机设备及存储介质
-
申请号: CN202210375330.3申请日: 2022-04-11
-
公开(公告)号: CN114861671B公开(公告)日: 2024-11-05
- 发明人: 张旭 , 文博 , 刘云峰
- 申请人: 深圳追一科技有限公司
- 申请人地址: 广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B
- 专利权人: 深圳追一科技有限公司
- 当前专利权人: 深圳追一科技有限公司
- 当前专利权人地址: 广东省深圳市南山区粤海街道科技园社区科苑路8号讯美科技广场3号楼23A、23B
- 代理机构: 华进联合专利商标代理有限公司
- 代理商 方高明
- 主分类号: G06F18/214
- IPC分类号: G06F18/214 ; G06F18/22 ; G06F40/30 ; G06F40/279 ; G06N3/0442 ; G06N3/045 ; G06N3/042 ; G06N3/096
摘要:
本申请涉及模型训练方法、装置、计算机设备、存储介质和计算机程序产品。该方法包括:将文本样本数据输入第一模型中,根据得到的第一样本特征数据确定第一损失;将文本样本数据输入第二模型中,根据得到的第二样本特征数据和第一样本特征数据确定第二损失;将文本样本数据输入第三模型中,得到第三样本特征数据,基于预设条件,确定以第一样本特征数据和第三样本特征数据的相似度得到第三损失,或以第三样本特征数据之间的相似度以及第一样本特征数据和第三样本特征数据之间的相似度得到第三损失;根据第一损失、第二损失和第三损失确定损失函数,损失函数用于对第一模型进行训练。本方案可使第一模型的收敛速度更快,文本识别的精确度更高。
公开/授权文献
- CN114861671A 模型训练方法、装置、计算机设备及存储介质 公开/授权日:2022-08-05