-
公开(公告)号:CN103886108B
公开(公告)日:2017-09-01
申请号:CN201410149441.8
申请日:2014-04-13
Applicant: 北京工业大学
Inventor: 刘磊
Abstract: 本发明提出了一种不均衡文本集的特征选择和权重计算方法,属于文本信息处理领域,具体是涉及不均衡文本集的特征选择和权重计算方法。针对不均衡文本数据的分类问题,本发明提出一种特征选取和权重计算方法与系统。本发明结合类别区分度和平均词频因素,通过改进卡方统计量方法进行特征选取,同时对常用的特征权重计算方法进行改进,并在其基础上提出了TF‑IDF的权重计算方法,本发明提供的方法在处理不均衡数据集问题时效果要优于传统的特征选择方法,对于有效提高分类准确率是有效可行的。
-
公开(公告)号:CN105808711A
公开(公告)日:2016-07-27
申请号:CN201610126084.2
申请日:2016-03-04
Applicant: 北京工业大学 , 北京富雷姆科技有限公司
Abstract: 本发明提出了一种基于文本语义的概念生成模型的系统和方法,属于文本知识获取领域,具体涉及概念的特征分析、语境的获取、候选概念的聚类、模式泛化、相似度计算与加权方法及系统。本发明首先提取出中文语料库中的已有概念,然后去除其前部特征和后部特征得到候选概念词构件,并利用基于统计的方法和基于上下文语境的方法对候选概念词构件进行了相似度的计算,然后进行聚类,在已有概念的基础上生成新的概念,扩充构词规则库。并且通过实验,验证了该发明的有效性。
-
公开(公告)号:CN114118862A
公开(公告)日:2022-03-01
申请号:CN202111485406.X
申请日:2021-12-07
Applicant: 双良节能系统股份有限公司 , 北京工业大学
IPC: G06Q10/06 , G06Q50/06 , G06F30/27 , G06F16/215 , G06F16/25
Abstract: 本发明公开了一种换热站动态热负荷预测与调控方法及系统,方法包括:S1,获取待处理地区的气象数据与换热站运行数据;S2,清洗气象数据与换热站历史运行数据,将气象参数做归一化处理,将换热站逐时热量数据进行修正补充,获得处理后的数据;S3,根据处理后的数据构建并划分数据集,确定数据集中的各类参数,并在组合成数据组后划分数据集类别;S4,构建换热站动态热负荷预测模型作为SVR模型结构,利用处理后数据集训练SVR模型结构,并对SVR模型结构的运行效果进行评价;S5,将评价合格的SVR模型结构接入换热站后,预测并输出换热站实时热负荷变化。根据预测负荷值自动调整换热站运行状态,实现供给热量与需求热量的动态平衡。
-
公开(公告)号:CN110084303B
公开(公告)日:2022-02-15
申请号:CN201910347785.2
申请日:2019-04-28
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于CNN与RF高维多粒度特征选择方法,属于信息处理技术领域。本发明基于高纬多粒度特征数据集,结合深度学习算法和机器学习算法用于解决高纬多粒度特征提取的问题。首先利用深度学习算法CNN模型构建了一种FSelCNN模型,通过该模型将原有数据从多粒度转化为单一粒度,使得该数据成为机器学习算法所需的数据;最后利用机器学习算法RF从该高纬的数据中选择出影响实际问题的有效特征。本发明从高纬多粒度特征数据的单一特征层面出发,将其从多粒度维度转化为单一粒度维度,有效解决了运算复杂度;模型减少了参数量,能够在较短时间内训练完成;适用于各种高纬多粒度数据,自适应能力较强,并且具有较好的效果。
-
公开(公告)号:CN111061873A
公开(公告)日:2020-04-24
申请号:CN201911191475.2
申请日:2019-11-28
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明涉及一种基于Attention机制的多通道的文本分类方法,首先将由固定的预训练词向量和随机初始化的词向量构建的句子嵌入矩阵分别作为一个文本通道,其次在每层通道上单独引入Attention机制为每个词创建上下文向量,然后将上下文向量和词向量进行拼接,从而得到多通道的句子嵌入矩阵。最后使用不同尺寸的卷积核对多通道的句子嵌入矩阵在多个通道上进行卷积操作,得到卷积后的文本特征向量,再使用最大池化层从特征向量中提取文本主要特征,最后经过Softmax层输出所属类别的概率分布,从而构建基于Attention机制的多通道的文本分类模型。提高了模型的泛化能力和训练速度,解决了非连续词之间相关性的问题。
-
公开(公告)号:CN110784229A
公开(公告)日:2020-02-11
申请号:CN201911058007.8
申请日:2019-11-01
Applicant: 北京工业大学
IPC: H03M7/30
Abstract: 一种基于快速傅里叶变换的带有模拟滤波器补偿的MWC后端信号重构方法属于高速模拟信息转换领域。由于MWC前端部分由多个通道组成,在假设前端系统中模拟低通滤波器的阻带增益完全为零的情况下,使用一个频率响应与模拟低通滤波器通带增益互为倒数的数字滤波器对前端产生的信号进行补偿。将前端产生的信号通过快速傅里叶变换转换到频域进行处理,补偿过程就变为各频点乘以一个补偿系数,在带有拓展系数的MWC结构中,解调的过程就转换为对信号的频域序列进行分段选取,避免了引入的乘法器以及数字滤波器。而从时域到频域的转换不会影响后续的压缩感知系数求解算法,在求解得到原始信号后,采用反傅里叶变换将频域信息转换回时域,完成重构。
-
公开(公告)号:CN110084303A
公开(公告)日:2019-08-02
申请号:CN201910347785.2
申请日:2019-04-28
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于CNN与RF高维多粒度特征选择方法,属于信息处理技术领域。本发明基于高纬多粒度特征数据集,结合深度学习算法和机器学习算法用于解决高纬多粒度特征提取的问题。首先利用深度学习算法CNN模型构建了一种FSelCNN模型,通过该模型将原有数据从多粒度转化为单一粒度,使得该数据成为机器学习算法所需的数据;最后利用机器学习算法RF从该高纬的数据中选择出影响实际问题的有效特征。本发明从高纬多粒度特征数据的单一特征层面出发,将其从多粒度维度转化为单一粒度维度,有效解决了运算复杂度;模型减少了参数量,能够在较短时间内训练完成;适用于各种高纬多粒度数据,自适应能力较强,并且具有较好的效果。
-
公开(公告)号:CN109670922A
公开(公告)日:2019-04-23
申请号:CN201811633423.1
申请日:2018-12-29
Applicant: 北京工业大学
IPC: G06Q30/06
Abstract: 本发明属于计算机软件技术领域,提出了一种基于混合特征的线上图书价值发现方法,本发明通过分析线上图书的各类特征指标,结合机器学习算法构建线上图书价值发现模型。首先,采集线上图书数据,利用统计方法对图书的评论、价格、出版时间等价值特征进行分析,确定出对图书价值影响较大的特征。其次,根据已确定特征对每类图书在时间维度上进行分析,建立图书价值发现模型。图书价值发现模型可用于线上图书在时间维度上的价值发现。实验分析以亚马逊图书网站为例,说明了方法的有效性。
-
-
公开(公告)号:CN104834632B
公开(公告)日:2017-09-29
申请号:CN201510243208.0
申请日:2015-05-13
Applicant: 北京工业大学
Abstract: 一种基于语义扩充的微博话题检测和热度评估方法,属于文本信息处理领域,具体涉及微博噪声数据过滤、基于语义扩充的微博话题检测和话题热度评估方法及系统。本发明首先给出了微博噪声数据过滤方法,用于低信息量微博的过滤,然后将微博评论中有效语义信息补充进微博语义,改善了微博话题检测的效果,最后进行了微博话题热度评估,进而获取热点话题。
-
-
-
-
-
-
-
-
-