关键词语料标注训练提取系统

    公开(公告)号:CN110298033B

    公开(公告)日:2022-07-08

    申请号:CN201910455064.3

    申请日:2019-05-29

    摘要: 本发明公开的一种关键词语料标注训练提取工具,旨在提供一种可降低人工标注过程繁复度,并能提高海量关键词语料标注效率和准确率的标注训练工具。本发明通过下述技术方案予以实现:关键词语料标注准备模块对不同来源的海量语料数据进行区分,半自动化语料关键词标注模块创建关键词标注任务,自主选择适配算法并开展基于算法模型的自动标注,通过集成CHI、LDA、TEXTRANK、TFIDF中至少一种关键词抽取算法,对待标注文本语料数据进行预标注处理,并对多种算法标注结果进行融合,当标注任务完成后,反馈式关键词标注模型学习训练模块对关键词标注算法模型进行训练;关键词标注模型效果评估模块对模型指标量化标注效果进行自动评估。

    文本分类语料标注训练系统

    公开(公告)号:CN110298032A

    公开(公告)日:2019-10-01

    申请号:CN201910455049.9

    申请日:2019-05-29

    IPC分类号: G06F17/27 G06K9/62

    摘要: 本发明公开的一种文本分类语料标注训练系统,旨在提供一种能够降低人工标注反复度,并能提升预标注结果准确性的半自动化标注训练装置。本发明通过下述技术方案予以实现:文本分类语料标注准备模块统计文本词频,去除文本的噪声信息;半自动化文本分类标注模块在分类标注任务中选择CNN、KNN、ANN、深度学习算法,把非结构化和半结构化的文本转换为向量空间模型,生成文本的词向量空间,抽取反映文档主题特征;当标注任务完成后,反馈式模型学习训练模块反馈分类标注模型完善更新;文本分类标注模型效果评估模块基于分类指标规则对评测指标进行量化,建立标注算法综合评估模型,分析测试结果,评价分类结果,对模型指标量化标注效果进行评估。

    文本分类语料标注训练系统

    公开(公告)号:CN110298032B

    公开(公告)日:2022-06-14

    申请号:CN201910455049.9

    申请日:2019-05-29

    IPC分类号: G06F40/289 G06K9/62

    摘要: 本发明公开的一种文本分类语料标注训练系统,旨在提供一种能够降低人工标注反复度,并能提升预标注结果准确性的半自动化标注训练装置。本发明通过下述技术方案予以实现:文本分类语料标注准备模块统计文本词频,去除文本的噪声信息;半自动化文本语料分类标注模块在分类标注任务中选择CNN、KNN、ANN、深度学习算法,把非结构化和半结构化的文本转换为向量空间模型,生成文本的词向量空间,抽取反映文档主题特征;当标注任务完成后,反馈式分类标注模型学习训练模块反馈分类标注模型完善更新;文本分类标注模型效果评估模块基于分类指标规则对评测指标进行量化,建立标注算法综合评估模型,分析测试结果,评价分类结果,对模型指标量化标注效果进行评估。

    识别不同电台个体种类的智能识别方法

    公开(公告)号:CN112529035A

    公开(公告)日:2021-03-19

    申请号:CN202011190513.5

    申请日:2020-10-30

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开的一种基于时序深度网络的智能个体识别方法,解决现有电台个体分类识别方法特征提取困难,泛化能力低的问题。其实现方案为:基于时序深度网络,将反映不同电台个体种类的电台个体时序信号输入深度网络,对原始电台个体数据进行补零处理,并按比例生成训练样本集和测试样本集;构建三个子网络及一维时序多子网络深度集成网络;用训练样本集训练三个子网络并将输出层并行连接获得训练后的一维时序多子网络深度集成网络;将电台原始时序数据直接输入训练后的深度集成网络对测试数据集进行预测,获得网络对电台时序数据预测的电台个体类别。本发明提高了深度网络在电台个体识别方面的泛化能力与鲁棒性,可用在电台个体分类识别技术领域中。

    关键词语料标注训练提取工具

    公开(公告)号:CN110298033A

    公开(公告)日:2019-10-01

    申请号:CN201910455064.3

    申请日:2019-05-29

    IPC分类号: G06F17/27 G06K9/62

    摘要: 本发明公开的一种关键词语料标注训练提取工具,旨在提供一种可降低人工标注过程繁复度,并能提高海量关键词语料标注效率和准确率的标注训练工具。本发明通过下述技术方案予以实现:关键词语料标注准备模块对不同来源的海量语料数据进行区分,半自动化语料关键词标注模块创建关键词标注任务,自主选择适配算法并开展基于算法模型的自动标注,通过集成CHI、LDA、TEXTRANK、TFIDF中至少一种关键词抽取算法,对待标注文本语料数据进行预标注处理,并对多种算法标注结果进行融合,当标注任务完成后,反馈式关键词标注模型学习训练模块对关键词标注算法模型进行训练;关键词标注模型效果评估模块对模型指标量化标注效果进行自动评估。