版面分析模型的确定方法、装置、电子设备和存储介质
摘要:
本申请实施例公开了一种版面分析模型的确定方法、装置、电子设备和介质。基于预训练版面分析模型,确定未标记版面样本的至少一种版面伪标签,得到具有版面伪标签的候选伪标签样本;针对每一种版面伪标签,基于该种版面伪标签的初始特征提取模型,确定该种版面伪标签对应的超球体球心,并根据该种版面伪标签对应的标记版面样本和超球体球心,确定该版面伪标签的目标超球体半径;根据该种版面伪标签的目标超球体半径,从该种版面伪标签对应的候选伪标签样本中筛选目标伪标签样本;根据各种版面伪标签的目标伪标签样本对预训练版面分析模型进行训练,得到目标版面分析模型。本申请实施例降低了对标签样本的依赖,提高了版面分析的准确率。
0/0