基于语义度量的行业安全词库扩展与分类分级方法及系统

    公开(公告)号:CN117932054A

    公开(公告)日:2024-04-26

    申请号:CN202311708904.5

    申请日:2023-12-13

    发明人: 王春生

    摘要: 本发明涉及一种基于语义度量的行业安全词库扩展与分类分级方法及系统,属于词汇扩展技术领域,所述方法包括:通过同义词或近义词对行业安全词库进行扩展;对行业安全词库对应的分类分级标准数据进行采集,并对采集的分类分级标准数据进行预处理;采用经过度量学习后的分类分级标准数据对映射至双曲空间中的经过扩展的行业安全词库中的词语进行分类分级。本申请提供的方法及系统,可去除经过扩展的行业安全词库的冗余信息,提升行业经过扩展的行业安全词库的数据质量;避免了经过扩展的行业安全词库在分类分级上可能和行业安全词库存在差异,而直接将经过扩展的行业安全词库划分成和行业安全词库相同的类别和级别将对词库引入大量噪声的问题。

    基于海量数据进行人民调解案件预警分析的方法及系统

    公开(公告)号:CN117974372A

    公开(公告)日:2024-05-03

    申请号:CN202311743141.8

    申请日:2023-12-18

    摘要: 本发明涉及一种基于海量数据进行人民调解案件预警分析的方法及系统,属于海量数据处理技术领域,该方法包括:采集多个历史人民调解案件中的当事人的信息,形成人民调解案件的当事人信息融合表;采集多个历史人民调解案件描述信息,根据历史人民调解案件描述信息构建第一词袋模型,根据当事人信息融合表形成第二词袋模型;基于第一词袋模型和第二词袋模型形成样本数据集;对样本数据集进行聚类分析,得到各个簇对应的标签;调整聚类簇数,生成聚类模型;基于聚类模型获取待分析的人民调解案件对应的预警风险等级。本申请提供的方法及系统解决了存在案件划分不准确及误归类的问题,针对重点人民调解案件,可及时干预,预防案件恶化。