发明公开
- 专利标题: 一种半自动实体标注监督方法
-
申请号: CN202111399124.8申请日: 2021-11-19
-
公开(公告)号: CN113988064A公开(公告)日: 2022-01-28
- 发明人: 江明 , 单超 , 邹云峰 , 黄茜 , 朱峰 , 刘云鹏 , 蔡明明
- 申请人: 国网江苏省电力有限公司营销服务中心 , 国网江苏省电力有限公司
- 申请人地址: 江苏省南京市建邺区奥体大街9号;
- 专利权人: 国网江苏省电力有限公司营销服务中心,国网江苏省电力有限公司
- 当前专利权人: 国网江苏省电力有限公司营销服务中心,国网江苏省电力有限公司
- 当前专利权人地址: 江苏省南京市建邺区奥体大街9号;
- 代理机构: 北京智绘未来专利代理事务所
- 代理商 张红莲; 王萍
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06K9/62
摘要:
一种半自动实体标注监督方法及系统,方法包括以下步骤:步骤1,对第一设定数量的小样本进行标注;步骤2,训练标注模型;若标注模型质量满足要求,执行步骤4,若标注模型质量需要提升,执行步骤3;步骤3,迭代执行自动标注、标注质量监督、校对、更新训练集和训练模型,直至迭代次数达到最大迭代次数;若迭代结果标注模型的F1值不小于第一阈值,则执行步骤4;若迭代结果标注模型的F1值仍小于第一阈值,调整标签及标注规范并返回步骤1;步骤4,对剩余未标注的样本进行标注,并对标注进行监督,包括标注模型的质量监督和对标注人员的监督;步骤5,分析人工与标注的标注结果是否一致,如果不一致,整理分析所属类别。