发明公开
- 专利标题: 一种多次迭代对折词汇层级分类方法及系统
-
申请号: CN202110289396.6申请日: 2021-03-18
-
公开(公告)号: CN113032562A公开(公告)日: 2021-06-25
- 发明人: 肖栩豪 , 李晓军 , 姚俊萍 , 李少臣 , 沈涛 , 程开原
- 申请人: 中国人民解放军火箭军工程大学
- 申请人地址: 陕西省西安市灞桥区同心路2号
- 专利权人: 中国人民解放军火箭军工程大学
- 当前专利权人: 中国人民解放军火箭军工程大学
- 当前专利权人地址: 陕西省西安市灞桥区同心路2号
- 代理机构: 北京高沃律师事务所
- 代理商 韩雪梅
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/33 ; G06F16/335 ; G06F16/36
摘要:
本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。
公开/授权文献
- CN113032562B 一种多次迭代对折词汇层级分类方法及系统 公开/授权日:2024-02-02