-
公开(公告)号:CN117216542A
公开(公告)日:2023-12-12
申请号:CN202310572666.3
申请日:2023-05-19
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/214 , G06F18/22 , G06F18/2415 , G06F18/25 , G06F16/35 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种模型训练方法和相关装置,基于确定实际类别的目标对象,根据该目标对象的表格类内容确定训练样本,训练样本包括N维特征。通过初始分类模型的注意力子模型,生成包括N个子波特征的样本波特征。从波相似度的角度衡量各个维度特征间的关联性和重要程度,从而确定样本波特征中每个子波特征的注意力权重。在基于该注意力权重得到待预测波特征后,通过初始分类模型确定对应的预测类别,并根据预测类别和训练样本的实际类别间的差异,调整该注意力权重得到可用于对表格类内容进行类别识别的分类模型。通过波形式来表示各维度特征,使得初始分类模型无需为了确定注意力权重设置复杂模型参数,提升了模型训练效率。