一种面向动态医疗数据的因果特征提取方法

    公开(公告)号:CN113921145B

    公开(公告)日:2024-12-13

    申请号:CN202111196507.5

    申请日:2021-10-14

    Abstract: 本发明公开了一种面向动态医疗数据的因果特征提取方法,包括:1对医疗数据集进行特征的提取,构建/更新医疗数据的特征集合;2根据提取的特征和当前的医疗数据,通过构建/更新全维树结构,将医疗数据信息以统计信息的形式进行汇总;3使用已有的关键特征(因素)集合赋值给本次因果特征提取的初始特征子集,即对最优子集进行初始化;4利用因果关系推断理论与算法,通过添加与删除操作的迭代,选择最优的特征子集,即得到当前医疗数据的关键特征信息;5当新的医疗数据到来后,重复步骤1‑4,即可在动态医疗数据中选择出实时的关键特征。本发明能实现从动态医疗数据中发现关键特征,并使关键特征的提取更具可解释性和鲁棒性。

    一种基于文本哈希向量化表示的海量极短文本分类方法

    公开(公告)号:CN109670182B

    公开(公告)日:2023-03-24

    申请号:CN201811573017.0

    申请日:2018-12-21

    Abstract: 本发明公开了一种基于文本哈希向量化表示的海量极短文本分类方法,其步骤包括:1数据集向量化的前期分词预处理;2模型设计和实现;3应用Signed Hash Trick算法映射得到的包含文本词频特征的稀疏矩阵;4特征提取完后,用随机森林分类模型在训练集上训练分类器;5用训练集上的分类器在测试集上做分类预测;6完成在测试集上的分类,得到最终文本分类的准确度。本发明解决现有极短文本分类中存在的分类精度低、分类时间过长的问题,从而能提高极短文本的分类效果,并降低硬件的内存消耗,具有较高的鲁棒性和实用性。

    文本查询方法、装置及电子设备
    13.
    发明公开

    公开(公告)号:CN115658849A

    公开(公告)日:2023-01-31

    申请号:CN202211422920.3

    申请日:2022-11-14

    Abstract: 本申请公开了一种文本查询方法、装置及电子设备。其中,该方法包括:接收客户端发送的文本查询指令,其中,文本查询指令中至少包括目标关键字;根据文本查询指令,从预设数据库中查询出包含目标关键字的多个第一文本;对多个第一文本进行去重处理,得到至少一个目标文本;对目标文本的分区等级信息以及目标文本对应的期刊信息进行补全,得到目标查询文本,其中,分区等级信息用于表征目标文本的重要程度;将目标查询文本返回至客户端。本申请解决了现有技术中论文查询效率低的技术问题。

    基于在线序列核极限学习机的高维多标签数据流分类方法

    公开(公告)号:CN112579741B

    公开(公告)日:2022-09-27

    申请号:CN202011551193.1

    申请日:2020-12-24

    Abstract: 本发明公开一种基于在线序列核极限学习机的多标签文本数据流分类方法,包括:1.根据外部语料库构建BoW模型和滑动窗口机制将多标签文本数据流划分为数据块后向量化;2.利用k‑1时刻的集成分类器模型对k时刻的文本数据块Dk进行预测,输出预测结果;3.对文本数据块Dk的文本特征集合进行特征选择,得到降维后的文本特征集合Mk;4.根据k时刻文本数据块Dk和k‑1时刻文本数据块Dk‑1的类标签空间之间的余弦相似度和降维后的特征集合之间的分布差异,判断是否发生概念漂移或特征漂移;5.根据漂移检测情况,利用文本数据块Dk中的所有文本构建在线序列核极限学习机,并更新至k时刻的集成分类器模型。本发明解决了带有特征漂移和概念漂移的多标签文本数据流分类问题。

    一种基于时间序列的机械故障早期诊断方法

    公开(公告)号:CN110097134B

    公开(公告)日:2021-03-09

    申请号:CN201910383794.7

    申请日:2019-05-08

    Abstract: 本发明公开了一种基于时间序列的机械故障早期诊断方法,包括:1、将机械故障监测序列数据的特征数据按照长度r截断为s个机械故障序列数据;2、选择一种机械故障分类器,在每个截断的训练样本上训练并给出所有机械故障特征数据的机械故障分类结果;3、统计每个截断的训练样本上的每一类的机械故障分类准确率,并计算机械故障分类结果的信任度;4、确定机械故障分类结果的信任度阈值θ;5、利用选择的机械故障分类器和信任度阈值θ对机械故障测试数据进行早期诊断。本发明既适用于等长的机械故障序列数据,又适用于不等长机械故障序列数据的故障诊断,而且在保证机械故障诊断准确率的条件下,能够预判机械故障类型。

    一种基于稀疏逆协方差的煤与瓦斯突出预测方法

    公开(公告)号:CN110222766A

    公开(公告)日:2019-09-10

    申请号:CN201910492856.8

    申请日:2019-06-06

    Abstract: 本发明公开了一种基于稀疏逆协方差的煤与瓦斯突出预测方法,其步骤包括:1、将煤与瓦斯突出数据处理成多变量时间序列数据;2、构建一种基于模型的方法来表征多变量煤与瓦斯突出时间序列数据;3、使用Graphical Lasso方法初始化煤与瓦斯突出数据集中每个类别的稀疏逆协方差;4、使用LogDet散度优化稀疏逆协方差;5、选择契合该模型的分类器——最大似然分类器对煤与瓦斯突出测试数据进行分类预测。本发明解决了煤与瓦斯突出数据的表示问题以及代表煤与瓦斯突出每个类别的逆协方差的稀疏性问题,从而能够快速且准确地对煤与瓦斯突出数据进行分类。

    一种基于数据融合的人体动作预判方法

    公开(公告)号:CN110210454A

    公开(公告)日:2019-09-06

    申请号:CN201910522350.7

    申请日:2019-06-17

    Abstract: 本发明公开了一种基于数据融合的人体动作预判方法,包括:1、将人体动作序列数据的特征数据截断为多段人体动作序列数据;2、选择一种人体动作概率分类器,在每个截断的训练样本上分别对每维人体关键部位的数据进行训练,并得到概率分类结果;3、将每个截断的训练样本上的概率分类结果进行数据融合;4、通过最小化目标函数确定人体动作预判规则中的参数;5、利用训练好的模型对人体动作测试数据进行预判。本发明通过数据融合方法综合考虑人体各关键部位数据间的相互关系,并构建有效的人体动作预判规则,能够在保证人体动作分类准确率的条件下进行动作预判。

    一种基于短文本扩展和概念漂移检测的短文本数据流分类方法

    公开(公告)号:CN107679228A

    公开(公告)日:2018-02-09

    申请号:CN201710994366.9

    申请日:2017-10-23

    Abstract: 本发明公开了一种基于主题模型和概念漂移检测的短文本数据流分类方法,包括:1从知识库中获取外部语料库构建LDA主题模型;2根据滑动窗口机制将短文本数据流划分成数据块,并用LDA主题模型扩展数据块中的短文本得到扩展后的数据流;3在扩展后的短文本数据流中对每个数据块构建online BTM主题模型,并获得每个短文本的主题表示;4选择Q个主题表示的数据块构建一个分类器,用于预测新到来数据块的类标签;5根据类标签分布将Q个主题表示的数据块划分成类别簇,计算类别簇与新到来数据块的语义距离以判断是否发生概念漂移;6根据概念漂移情况,更新分类器。本发明可用于类标签分布不断变化的短文本数据流分类问题。

    一种基于RBF神经网络的煤与瓦斯突出预测方法

    公开(公告)号:CN107194524A

    公开(公告)日:2017-09-22

    申请号:CN201710631202.X

    申请日:2017-07-28

    Abstract: 本发明公开了一种基于RBF神经网络的煤与瓦斯突出预测方法,包括:1、对煤与瓦斯突出的特征数据进行维数约简,并对约简后的特征数据进行归一化处理,得到归一化特征数据;2、使用K‑均值算法对归一化特征数据进行聚类,计算出径向基函数的中心;3、在归一化特征数据上训练RBF神经网络,引入自适应差分进化算法确定隐含层神经元个数时的最优扩展因子和最优权重;4、增加隐含层神经元个数,重复步骤2‑3,得到RBF神经网络的全局最优参数,从而确定RBF神经网络的预测模型;5、使用RBF神经网络预测模型对测试数据进行预测。本发明能解决RBF神经网络的最优参数自适应问题,从而快速、准确地预测煤与瓦斯突出。

    一种基于类与特征分布的多标签数据流中概念漂移检测方法

    公开(公告)号:CN106934035A

    公开(公告)日:2017-07-07

    申请号:CN201710151295.6

    申请日:2017-03-14

    CPC classification number: G06F16/951 G06K9/6267 G06Q30/0201

    Abstract: 本发明公开了一种基于类与特征分布的多标签数据流中概念漂移检测方法,包括:1、根据滑动窗口机制将多标签数据流划分成数据块;2、统计数据块的类标签数据分布,并根据余弦相似度函数与海明损失函数计算类标签分布差异度,用于判断数据块是否发生概念漂移;3、统计数据块的特征数据分布,计算特征向量与类标签向量的相关度、特征向量间的冗余度和类标签向量间的相关度,根据最大相关最小冗余的原则进行特征排序;4、选择前K个特征向量作为数据块的特征分布并计算特征分布差异度,用于判断数据块是否发生概念漂移。本发明可用于发现多标签数据流中基于类和特征分布变化引发的概念漂移,并根据类和特征分布的差异度判断漂移类型。

Patent Agency Ranking