-
公开(公告)号:CN109033307A
公开(公告)日:2018-12-18
申请号:CN201810783010.5
申请日:2018-07-17
申请人: 华北水利水电大学
CPC分类号: G06F17/2775 , G06F17/2785 , G06K9/6221
摘要: 本发明公开了一种基于CRP聚类的词语多原型向量表示及词义消歧方法,包括步骤一:对海量文本语料集中的文本进行提纯预处理获得纯文本,基于CRP算法聚类文本语料集中目标多义词语的上下文窗口表示,对文本语料集中目标多义词语按照聚类簇类别标记,在标记的文本语料集上训练获得多义词语的多原型向量表示;步骤二:对目标短文本预处理获得短文本词语序列,识别词语序列中目标多义词语,计算目标多义词语上下文窗口表示与文本语料集中该词语所对应的各个聚类簇质心间相似度,将相似度最大值聚类簇类别所对应词向量表示作为多义词语在上下文中特定词义的词向量表示,对多义词进行词义消歧。本发明解决了词语表示中一词多义表示问题及词义表示中歧义识别问题。
-
公开(公告)号:CN108875594A
公开(公告)日:2018-11-23
申请号:CN201810524777.6
申请日:2018-05-28
申请人: 腾讯科技(深圳)有限公司
发明人: 张子鋆
CPC分类号: G06K9/00281 , G06K9/00288 , G06K9/4652 , G06K9/6221 , G06K9/6288 , G06T3/0012 , G06T5/50 , G06T2207/10024 , G06T2207/30201
摘要: 本发明实施例公开了一种人脸图像的处理方法、装置以及存储介质,其中人脸图像的处理方法包括:获取人脸图像;根据预设映射关系对所述人脸图像进行预处理,得到预处理后图像;划分所述人脸图像,得到所述人脸图像的唇部区域;根据预设算法对所述唇部区域进行处理,得到所述唇部区域的唇彩模板;合成所述人脸图像、预处理后图像以及唇彩模板,得到合成后的人脸图像。通过对人脸图像处理,得到预处理图像以及唇彩模板,然后再合成人脸图像、预处理图像以及唇彩模板,因此提高了唇彩与唇部的贴合度,进而提高了人脸图像的美妆效果。
-
公开(公告)号:CN108768564A
公开(公告)日:2018-11-06
申请号:CN201810521498.4
申请日:2018-05-17
申请人: 广东工业大学
IPC分类号: H04B17/382 , H04B15/00 , G06K9/62
CPC分类号: H04B17/382 , G06K9/6221 , H04B15/005
摘要: 本申请公开了一种协作频谱感知方法,包括:对已知信号进行经验模态分解得到多个本征模态函数信号分量,去除所述多个本征模态函数信号分量的高频部分得到处理信号;对所述处理信号进行特征提取处理,得到信号特征;根据聚类算法对所述信号特征进行分类,根据分类结果进行训练得到分类模型;当接收到未知信号时,根据所述分类模型对所述未知信号进行分类。通过经验模态分解去除已知信号的噪声,降低噪声对特征提取的影响,提高频谱感知的精度和准确率。本申请还公开一种协作频谱感知系统、协作频谱感知装置以及计算机可读存储介质,具有上述有益效果。
-
公开(公告)号:CN107886115A
公开(公告)日:2018-04-06
申请号:CN201711027252.3
申请日:2017-10-27
申请人: 江苏大学
IPC分类号: G06K9/62 , G01N21/3563
CPC分类号: G06K9/6247 , G01N21/3563 , G06K9/6221 , G06K9/6272
摘要: 本发明公开了一种自适应可能C均值聚类的茶叶中红外光谱分类方法,包括步骤:(1)茶叶样本中红外光谱采集;(2)用多元散射矫正(MSC)进行茶叶样本中红外光谱的预处理;(3)对茶叶样本中红外光谱进行降维处理和鉴别信息提取;(4)用自适应可能C均值聚类方法鉴别茶叶品种。本发明解决了用基于欧氏距离的改进型可能C-均值(IPCM)聚类方法在聚类分析茶叶的中红外光谱数据时聚类效果不理想的问题,本发明采用基于模糊协方差矩阵的自适应距离测度来代替IPCM聚类方法中的欧氏距离测度。本发明具有检测速度快,检测准确率高,绿色无污染,所需茶叶样本少等优点。
-
公开(公告)号:CN107832775A
公开(公告)日:2018-03-23
申请号:CN201710934252.5
申请日:2017-10-09
申请人: 中国电子科技集团公司第二十八研究所
IPC分类号: G06K9/62
CPC分类号: G06K9/6265 , G06K9/6221
摘要: 本发明公开了一种城市弱势群体聚类和评价方法、系统,包括依照预设城市弱势群体分类画像模型,建立城市弱势群体聚类集合;对所述城市弱势群体聚类集合数据进行预处理,计算新的城市弱势群体聚类集合的中心点;判断所述城市弱势群体聚类集合的中心点与新的城市弱势群体聚类集合的中心点是否相同,若所述城市弱势群体聚类集合的中心点与新的城市弱势群体聚类集合的中心点不相同,采用改进的分组遗传算法得到城市弱势群体数据子集;对所述城市弱势群体数据子集进行综合分析,得到所述城市弱势群体数据子集中每个数据对象的综合评分。本发明不需要关于待分类数据的先验分布知识,也不会受初始解选择的影响而得到次优解。
-
公开(公告)号:CN107832456A
公开(公告)日:2018-03-23
申请号:CN201711192239.3
申请日:2017-11-24
申请人: 云南大学
CPC分类号: G06F17/30705 , G06K9/6215 , G06K9/6221
摘要: 本发明属于数据处理技术领域,公开了一种基于临界值数据划分的并行KNN文本分类方法,包括:训练集文本重定义,经过预处理后,训练集中的文本就会被处理成统一的格式,将通过词条将文本中的信息处理成键值对的形式;确定新文本的向量,使用TF-IDF方式处理新的文本;确定K个文本;文本的权重计算;比较类的权重值的大小,根据词条的权重将词条分到对应的中心点的集合中。本发明只需要和中心点集合中的数据进行相似度求解,然后进行分类减少分类时间开销;另外在对文本间的相似度计算的余弦定理上进行了改进,利用MapReduce的分布式编程优势处理文本相似度计算后的键值对,从而提高文本分类的效率。
-
公开(公告)号:CN107451612A
公开(公告)日:2017-12-08
申请号:CN201710638605.7
申请日:2017-07-31
申请人: 陕西识代运筹信息科技股份有限公司
IPC分类号: G06K9/62
CPC分类号: G06K9/6268 , G06K9/6221
摘要: 本发明提供了一种基于关注关系的用户兴趣处理方法和装置,涉及计算机技术领域,所述方法包括:通过获得N个用户,所述N个用户中的每个用户具有第一标签,所述第一标签用于表征所述N个用户的兴趣指标;根据所述N个用户中的每个用户的关注关系,获得P个用户;根据所述P个用户获得所述P个用户中M个用户的第二标签,其中,所述第二标签用于表征所述M个用户的兴趣指标,其中,第二标签不同于所述第一标签。解决了现有技术中由于各个社交网络关注关系形成了复杂的图谱关系,导致无法快速获得社交用户的兴趣分类,从而无法快速进行群体兴趣分析的技术问题。达到了简化群体兴趣计算分析、深入挖掘关系链的潜在价值的技术效果。
-
公开(公告)号:CN107368856A
公开(公告)日:2017-11-21
申请号:CN201710613473.2
申请日:2017-07-25
申请人: 深信服科技股份有限公司
CPC分类号: G06K9/6221 , G06F21/562
摘要: 本发明实施例公开了一种恶意软件的聚类方法及装置、计算机装置及可读存储介质,涉及网络安全领域,用于提高对恶意软件的聚类结果的准确性。本发明实施例方法包括:选取多个恶意软件作为样本;获取样本的威胁情报;从样本的威胁情报中提取样本的威胁情报特征;根据样本的聚类特征对样本进行聚类,样本的聚类特征包括样本的威胁情报特征。
-
公开(公告)号:CN107301434A
公开(公告)日:2017-10-27
申请号:CN201710633563.8
申请日:2017-07-28
申请人: 西安交通大学 , 中国人民解放军63729部队
CPC分类号: G06K9/6219 , G06K9/40 , G06K9/6221 , G06K9/624 , G06K2009/4695
摘要: 本发明公开了一种基于同步压缩短时傅里叶变换的盲分离混合矩阵估计方法,目的在于,提高观察信号时频域的稀疏性,提高有用信号的能量,进而减弱噪声的影响,正确估计混合矩阵,通过对观察信号进行STFT同步压缩变换,使之由时域变换到时频域,通过在频率上重排各时频点的能量,提高了待分析信号在时频平面的能量聚集性,从而提高时频域的稀疏性并减弱噪声的影响。在提取单源点的过程中,利用稀疏编码方法,寻找编码系数中只有一个元素非零对应的时频点,实现位于同一个1-D子空间的时频点的搜寻。通过最小化编码系数的l1范数构造误差最小目标函数实现单源点的提取,进一步增强了对噪声的抑制作用,最后通过层次聚类法实现混合矩阵的估计。
-
公开(公告)号:CN107017632A
公开(公告)日:2017-08-04
申请号:CN201710375578.9
申请日:2017-05-24
申请人: 广东电网有限责任公司电力调度控制中心 , 浙江大学
CPC分类号: H02J3/00 , G06K9/6221 , H02J2003/007 , H02J2003/388
摘要: 本发明提出一种电力系统主动解列断面搜索方法与孤岛调整策略。首先,电力系统主动解列断面搜索方法对在机器学习领域发展起来的谱聚类算法进行改进,提出含约束谱聚类算法,以计及发电机组的同调约束,从而将解列断面搜索问题转化为广义特征值求解问题。为克服在含约束谱聚类算法中采用传统k‑medoids算法存在的对初始中心点敏感,搜索效率低的缺点,提出改进k‑medoids算法并将其与约束谱聚类算法相结合,以求取最优解列断面。然后,对于每个不满足安全约束的孤岛,优化调整其发电机组出力,必要时也可削减一些负荷,以维持每个孤岛的安全运行。最后,以IEEE 118节点为例,说明本发明的可行性和有效性。
-
-
-
-
-
-
-
-
-