- 专利标题: 基于篇章聚类和语句融合的标注一致性检验方法及介质
-
申请号: CN202211148111.8申请日: 2022-09-21
-
公开(公告)号: CN115249015B公开(公告)日: 2022-12-02
- 发明人: 张正义 , 林方 , 傅晓航 , 李一
- 申请人: 中科雨辰科技有限公司
- 申请人地址: 北京市海淀区清琴麓苑170号楼2层
- 专利权人: 中科雨辰科技有限公司
- 当前专利权人: 中科雨辰科技有限公司
- 当前专利权人地址: 北京市海淀区清琴麓苑170号楼2层
- 代理机构: 北京锺维联合知识产权代理有限公司
- 代理商 安娜
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06N3/04 ; G06N3/08 ; G06F16/33 ; G06F16/35 ; G06F40/211 ; G06F40/216 ; G06K9/62
摘要:
本申请涉及电数字数据处理技术领域,特别是涉及基于篇章聚类和语句融合的标注一致性检验方法及介质,所述方法包括以下步骤:获取未标注语料库的c个簇形成簇集合clu;遍历clu,得到cluj的edoj;获取notj=(nod1,nod2,…,nodm,…,nodE);更新clu为nclu={nclu1,nclu2,…,ncluj,…,ncluc},ncluj为利用notj中篇章替换cluj中对应篇章得到;遍历nclu,将conm=numm/len(esem)追加到con;根据mean(con)判断目标时间内的标注是否一致。本发明实现了对用户标注一致性的检验。
公开/授权文献
- CN115249015A 基于篇章聚类和语句融合的标注一致性检验方法及介质 公开/授权日:2022-10-28