-
公开(公告)号:CN108073681A
公开(公告)日:2018-05-25
申请号:CN201711117115.9
申请日:2017-11-13
申请人: 发那科株式会社
IPC分类号: G06F17/30
CPC分类号: G06F17/3071 , G06F17/30011 , G06F17/30654 , G06F17/30663
摘要: 本发明提供可以提升文件的检索效率的检索装置、检索方法以及检索程序。检索装置(1)具有:分类部(11),其在积累了由多个项目构成的文件数据的数据库中,根据记载有一个以上的符号列的组合的第一项目的吻合度,将所述文件数据分类;提取部(12),其从由所述分类部分类而得的同一组内的文件数据中,提取第二项目所包含的关键字组作为检索用关联语。此外,通过将检索装置1实施为网络上的分散系统,能够实现与多种设备有关的关联语制作和其数据保存以及多用户利用。
-
公开(公告)号:CN107943791A
公开(公告)日:2018-04-20
申请号:CN201711192480.6
申请日:2017-11-24
申请人: 北京奇虎科技有限公司
CPC分类号: G06F17/2775 , G06F17/3071
摘要: 本发明公开了一种垃圾短信的识别方法、装置和移动终端,所述方法包括:获取终端设备接收到的待检测短信;根据预设分词词表对所述待检测短信进行最大匹配分词处理,得到待检测分词,所述预设分词词表中保存有预先根据训练短信进行分词处理的各个分词;通过将所述待检测分词输入到预先配置的短信识别模型进行分析,确定所述待检测短信是否为垃圾短信。通过上述方案,利用经过学习训练得到的短信识别模型,根据所有分词的整体分类情况识别整个短信的内容,来判断该短信是否是垃圾短信,有效提高垃圾短信识别的准确率,进而对垃圾短信进行全面的拦截处理。
-
公开(公告)号:CN104246775B
公开(公告)日:2018-04-17
申请号:CN201380021769.5
申请日:2013-04-24
申请人: 日本电气株式会社
IPC分类号: G06F17/30
CPC分类号: G06F17/3071 , G06F17/30737
摘要: 本发明涉及一种文本挖掘系统,包括:同义词聚类获取部,配置为从待分析的文本数据中的文本中获取同义词聚类,所述同义词聚类每个都是同义的文本的集合;隐含关系获取部,配置为获取所述同义词聚类之中的隐含关系;以及隐含图生成部,配置为根据所述同义词聚类之中的隐含关系而生成隐含图,所述隐含图包括同义词聚类的顶点和有向边,每个有向边指示从被隐含的同义词聚类到隐含同义词聚类的方向。
-
公开(公告)号:CN107908716A
公开(公告)日:2018-04-13
申请号:CN201711106044.2
申请日:2017-11-10
申请人: 国网山东省电力公司电力科学研究院 , 国家电网公司
CPC分类号: G06F17/3071 , G06F17/2775 , G06K9/6269
摘要: 本发明公开了一种基于词向量模型的95598工单文本挖掘方法和装置,获取95598工单文本,并对95598工单文本进行分词处理,得到电力工单语料库;采用Word2vec模型对电力工单语料库进行训练,得到词向量;将词向量输入Word2vec模型,构建电力工单词典,并调整电力工单语料库中分词;结合电力工单语料库,利用TF-IDF方法赋权得到段落向量;将段落向量输入SVM分类器进行训练,得到电力工单文本分类模型。本发明采用神经网络语言模型对工单文本进行训练,形成词向量,在词向量的基础上,作为其他模型的输入,实现进一步的文本挖掘分析,能够帮助客服人员了解客户诉求,提供更优质便捷的服务。
-
公开(公告)号:CN107844553A
公开(公告)日:2018-03-27
申请号:CN201711044663.3
申请日:2017-10-31
申请人: 山东浪潮通软信息科技有限公司
发明人: 王妍
CPC分类号: G06F17/3071 , G06F17/2715 , G06F17/277
摘要: 本发明提供了一种文本分类方法及装置,其中,所述方法,包括:确定至少两个分类类别所分别对应的至少一个特征词;利用每一个所述分类类别所分别对应的至少一个特征词训练初始分类器,以形成目标分类器;从待分类文本中提取至少一个特征分词;将所述至少一个特征分词输入所述目标分类器,并接收所述目标分类器根据所述至少一个特征分词输出的当前分类类别;将接收的所述当前分类类别确定为所述待分类文本所属的分类类别。通过本发明的技术方案,可更为快速的确定大量文本分别所属的分类类别。
-
公开(公告)号:CN107798113A
公开(公告)日:2018-03-13
申请号:CN201711063868.6
申请日:2017-11-02
申请人: 东南大学
IPC分类号: G06F17/30
CPC分类号: G06F17/3071
摘要: 本发明公开了一种基于聚类分析的文档数据分类方法,主要弥补在目前文档分类问题中,及现有技术使用相同的特征在不同的主题上进行预测而产生的性能不足问题。该方法包括以下步骤:(1)用户从已有的文档库中选择样例文档,其中每个文档都具备多个主题;(2)通过本发明提出的方法将选取的文档的初始特征针对每一种主题转化为新的特征;(3)对每一类主题,在新的特征上学习得到分类模型;(4)基于最终分类模型对文档存储设备中待分类文档进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从文档库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。
-
公开(公告)号:CN107451176A
公开(公告)日:2017-12-08
申请号:CN201710373689.6
申请日:2017-05-24
申请人: 恩芬森株式会社
发明人: 金成珍
IPC分类号: G06F17/30
CPC分类号: G06F17/30581 , G06F11/1471 , G06F17/303 , G06F17/30575 , G06F17/3071 , G06F17/30864
摘要: 揭示了一种数据复制方法及其装置。主节点或数据节点,在由多个数据区与多个索引区而成的数据表区存储数据与索引,并将多个索引区合并为一个索引区后,将由多个数据区与一个索引区而成的数据表区复制到其他节点。
-
公开(公告)号:CN103946840B
公开(公告)日:2017-09-05
申请号:CN201280055869.5
申请日:2012-11-09
申请人: 凯洛斯未来集团公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3053 , G06F17/30011 , G06F17/30687 , G06F17/30705 , G06F17/30707 , G06F17/3071 , G06F17/30713 , G06F17/30722 , G06F17/30731 , G06F17/30734
摘要: 一种从多个源获得的数据集分类的装置,包括:符号频率确定单元(24),其确定第一数据集集合中的符号的出现频率和第二数据集集合中的符号的出现频率;重要性确定单元(26),其基于第一集合中的出现频率和第二集合中的出现频率确定第二集合中的最高有效符号;分组单元(28),其根据这些最重要的符号在相同数据集中的出现而将这些最重要的符号分组成若干组,以及等级排列单元(30),其根据等级排列方案排列与符号组相关的数据集的等级。
-
公开(公告)号:CN103336786B
公开(公告)日:2017-05-24
申请号:CN201310221032.X
申请日:2013-06-05
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3071
摘要: 本发明公开了一种数据处理的方法,包括:对接收到的每个数据进行指纹计算,得到所述每个数据的指纹信息;按照所述指纹信息,将具有相同指纹信息的数据划分到同一数据组;从划分后的每一数据组中选择一个数据用于建模计算。本发明实施例还提供相应的装置。本发明技术方案由于可以减少用于建模计算的数据量,从而降低了数据处理的时间,提高了数据处理的效率。
-
公开(公告)号:CN106686064A
公开(公告)日:2017-05-17
申请号:CN201611116364.1
申请日:2016-12-07
申请人: 北京奇虎科技有限公司
发明人: 蔡胜
CPC分类号: H04L67/26 , G06F17/30684 , G06F17/30705 , G06F17/3071 , G06F17/30867
摘要: 本发明公开了一种控制智能终端中的应用消息推送的方法和装置。该方法包括:获取智能终端中的用户行为相关信息;从获取的所述用户行为相关信息中提取关键字;将所提取的关键字发送给所述智能终端上安装的一个或多个应用,使得所述一个或多个应用根据所接收的关键字推送消息。可见,本发明通过获取智能终端中的用户行为相关信息,实现了对用户需求的全面了解;同时从获取的所述用户行为相关信息中提取关键字,保证了应用消息推送的精确性;并将所提取的关键字发送给所述智能终端上安装的一个或多个应用,实现所述一个或多个应用根据所接收的关键字推送及时、有效、准确的消息,从而避免了应用软件全部同时推送信息的困扰,极大地增强了用户体验。
-
-
-
-
-
-
-
-
-