一种基于特征扩展的在线短文本数据流分类方法

    公开(公告)号:CN111026846B

    公开(公告)日:2021-08-17

    申请号:CN201911251229.1

    申请日:2019-12-09

    摘要: 本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构建在线深度学习网络;4对LSTM网络中神经元引入概念漂移信号量并检测短文本流的分布变化;5完成在线深度学习网络的模型更新与对短文本数据流的预测。本发明能够有效的提高短文本数据流分类准确率、正确地检测概念漂移并调整模型,从而达到快速适应短文本数据流环境的目的。

    试题难度预测方法
    22.
    发明公开

    公开(公告)号:CN113239669A

    公开(公告)日:2021-08-10

    申请号:CN202110559447.2

    申请日:2021-05-21

    摘要: 本申请公开了一种试题难度预测方法。其中,该方法包括:对目标试题进行文本分析,得到目标试题中考察的目标知识点;将目标知识点作为父节点,确定目标知识点对应的子知识点形成的树状结构;获取目标知识点在树状结构中的层次,以及该层次对应的第一关联系数;确定子知识点与目标知识点的第二关联系数;确定目标知识点对应的第一难度值与子知识点对应的第二难度值;至少根据第一关联系数、第二关联系数、第一难度值以及第二难度值确定目标试题的目标难度值。本申请解决了由于相关技术中将各个知识点当作独立的离散数据,并没有将各个知识点之间的关联性考虑进去造成的预测结果不准确,与试题实际难度存在较大偏差的技术问题。

    答题行为推荐方法
    23.
    发明公开

    公开(公告)号:CN113221007A

    公开(公告)日:2021-08-06

    申请号:CN202110563070.8

    申请日:2021-05-21

    摘要: 本申请公开了一种答题行为推荐方法。其中,该方法包括:获取目标对象在不同时刻作答与目标知识点相关联的习题的对应的得分;将得分输入至认知跟踪模型中,得到目标对象在不同时刻对目标知识点的目标认知状态值;将当前决策时间对应的目标认知状态值输入至目标知识点对应的目标模型中,得到推荐目标对象继续作答目标试题的次数,其中,当前决策时间为答题的开始时刻,目标模型包括:答题行为强化学习EBQ模型,本申请解决了由于相关技术中尚未有研究追踪学生的动态认知状态,并基于动态的认知状态,针对学生用户是否需要进行相关试题练习,并进行多少道相关习题练习的答题行为进行推荐的技术问题。

    学习对象的认知分析方法及认知分析装置、电子设备

    公开(公告)号:CN113129190A

    公开(公告)日:2021-07-16

    申请号:CN202110507262.7

    申请日:2021-05-10

    IPC分类号: G06Q50/20 G06N7/02

    摘要: 本发明公开了一种学习对象的认知分析方法及认知分析装置、电子设备。其中,该认知分析方法包括:获取所有学习对象在作答各类型习题时的多个连续得分集、多个模糊得分集以及多个模糊认知集,其中,每种类型习题对应一个知识点,每个连续得分集中包含有一个知识点的多个连续得分,模糊认知集包含有学习对象对知识点的掌握程度;分别基于每个连续得分集、多个模糊得分集以及多个模糊认知集,确定模糊隶属度分布图;基于多个模糊隶属度分布图,构建认知模型;采用认知模型,分析目标学习对象在作答同类知识点的习题时的得分。本发明解决了相关技术中的学生学习模型采用了二值化得分评估方式,对学生认知状态评估的准确性较低的技术问题。

    一种针对海量多词短文本的集成分类方法

    公开(公告)号:CN109657061B

    公开(公告)日:2020-11-27

    申请号:CN201811573390.6

    申请日:2018-12-21

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本发明公开了一种针对海量多词短文本的集成分类方法,包括:1获取多词短文本集合,并对多词短文本进行分词预处理;2在分词结果上利用Word2vec词向量表示方法中的CBOW连续词袋模型得到词向量表示模型;3基于词向量表示模型,利用Sentence2vec句向量表示方法中的PV‑DM模型,构建句向量表示;4在句向量表示模型基础上利用kNN分类器预测为标记数据的类别标签。本发明能解决传统表示学习方法的“维数灾难”问题,从而提高短文本表示学习的效果,提升文本分类的精度,具有较高的鲁棒性和实用性。

    基于双重自动编码器的半监督跨领域文本分类方法

    公开(公告)号:CN110119448B

    公开(公告)日:2020-11-06

    申请号:CN201910378359.5

    申请日:2019-05-08

    IPC分类号: G06F16/35 G06Q30/06

    摘要: 本发明公开了一种基于双重自动编码器的半监督跨领域文本分类方法,其步骤包括:采用双重自动编码器同时获取源领域文本数据集合和目标领域文本数据集合之间的全局和局部特征表示用于跨领域文本分类任务;第一重自动编码器为基于自适应分布的边缘降噪自动编码器,它主要用来学习源领域和目标领域文本数据集合的全局特征表示;第二重自动编码器为基于多类别的边缘降噪自动编码器,它以更细粒度方式学习源领域和目标领域文本数据集合的局部特征表示。本发明能更好地挖掘源领域文本数据集合和目标领域文本数据集合中特征之间的潜在关系,从而进一步提高文本分类的正确性。

    一种基于RBF神经网络的煤与瓦斯突出预测方法

    公开(公告)号:CN107194524B

    公开(公告)日:2020-05-22

    申请号:CN201710631202.X

    申请日:2017-07-28

    摘要: 本发明公开了一种基于RBF神经网络的煤与瓦斯突出预测方法,包括:1、对煤与瓦斯突出的特征数据进行维数约简,并对约简后的特征数据进行归一化处理,得到归一化特征数据;2、使用K‑均值算法对归一化特征数据进行聚类,计算出径向基函数的中心;3、在归一化特征数据上训练RBF神经网络,引入自适应差分进化算法确定隐含层神经元个数时的最优扩展因子和最优权重;4、增加隐含层神经元个数,重复步骤2‑3,得到RBF神经网络的全局最优参数,从而确定RBF神经网络的预测模型;5、使用RBF神经网络预测模型对测试数据进行预测。本发明能解决RBF神经网络的最优参数自适应问题,从而快速、准确地预测煤与瓦斯突出。

    一种基于特征扩展的在线短文本数据流分类方法

    公开(公告)号:CN111026846A

    公开(公告)日:2020-04-17

    申请号:CN201911251229.1

    申请日:2019-12-09

    摘要: 本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构建在线深度学习网络;4对LSTM网络中神经元引入概念漂移信号量并检测短文本流的分布变化;5完成在线深度学习网络的模型更新与对短文本数据流的预测。本发明能够有效的提高短文本数据流分类准确率、正确地检测概念漂移并调整模型,从而达到快速适应短文本数据流环境的目的。

    一种基于文本哈希向量化表示的海量极短文本分类方法

    公开(公告)号:CN109670182A

    公开(公告)日:2019-04-23

    申请号:CN201811573017.0

    申请日:2018-12-21

    IPC分类号: G06F17/27 G06K9/62

    摘要: 本发明公开了一种基于文本哈希向量化表示的海量极短文本分类方法,其步骤包括:1数据集向量化的前期分词预处理;2模型设计和实现;3应用Signed Hash Trick算法映射得到的包含文本词频特征的稀疏矩阵;4特征提取完后,用随机森林分类模型在训练集上训练分类器;5用训练集上的分类器在测试集上做分类预测;6完成在测试集上的分类,得到最终文本分类的准确度。本发明解决现有极短文本分类中存在的分类精度低、分类时间过长的问题,从而能提高极短文本的分类效果,并降低硬件的内存消耗,具有较高的鲁棒性和实用性。

    一种司法判决书案情信息结构化处理系统

    公开(公告)号:CN109344187A

    公开(公告)日:2019-02-15

    申请号:CN201810989323.6

    申请日:2018-08-28

    摘要: 本发明公开了一种司法判决书案情信息结构化处理系统,适用于信息抽取和自然语言处理领域;系统包括以下模块:司法判决书案情信息结构化表示模块、建立司法判决书案情信息序列标注模型模块、属性触发词管理模块和生成结构化司法判决书案情信息模块。根据用户给定的案件类型,建立司法判决书案情信息结构化数据表示框架,构建司法判决书案情信息序列标注训练集并训练序列标注模型,结合属性触发词集合,根据生成结构化司法判决书案情信息方法生成结构化的司法判决书案情信息。本发明根据用户提供的司法判决书案件类型和案情信息,实现司法判决书案情信息的结构化处理,其目的在于提供一种从无结构化司法判决书文本中抽取结构化信息的有效方式。