一种多次迭代对折词汇层级分类方法及系统
摘要:
本发明涉及一种多次迭代对折词汇层级分类方法及系统,所述层级分类方法包括:计算各待分类词汇的使用频率;根据待分类词汇的使用频率对待分类词汇进行升序排列,并标注序号;根据待分类词汇的总数及待分类词汇的所属领域,确定层级级数及迭代阈值;初始化各层级的候选分界阈值;各层级的候选分界阈值为待分类词汇的总数量;根据各层级的候选分界阈值、待分类词汇的序号以及迭代阈值,对待分类词汇进行迭代查询,得到各层级的分界阈值;根据各层级的分界阈值,得到待分类词汇的层级分类。以词频为基准,利用大类词汇出现的频率高于小类词汇出现的频率,通过循环迭代对折的方式对词汇层级进行划分,提高了划分效率,且层级划分精准。
公开/授权文献
0/0