检索装置、检索方法以及检索程序

    公开(公告)号:CN108073681A

    公开(公告)日:2018-05-25

    申请号:CN201711117115.9

    申请日:2017-11-13

    IPC分类号: G06F17/30

    摘要: 本发明提供可以提升文件的检索效率的检索装置、检索方法以及检索程序。检索装置(1)具有:分类部(11),其在积累了由多个项目构成的文件数据的数据库中,根据记载有一个以上的符号列的组合的第一项目的吻合度,将所述文件数据分类;提取部(12),其从由所述分类部分类而得的同一组内的文件数据中,提取第二项目所包含的关键字组作为检索用关联语。此外,通过将检索装置1实施为网络上的分散系统,能够实现与多种设备有关的关联语制作和其数据保存以及多用户利用。

    一种垃圾短信的识别方法、装置和移动终端

    公开(公告)号:CN107943791A

    公开(公告)日:2018-04-20

    申请号:CN201711192480.6

    申请日:2017-11-24

    发明人: 郭祥 李强 周楠

    IPC分类号: G06F17/27 G06F17/30

    CPC分类号: G06F17/2775 G06F17/3071

    摘要: 本发明公开了一种垃圾短信的识别方法、装置和移动终端,所述方法包括:获取终端设备接收到的待检测短信;根据预设分词词表对所述待检测短信进行最大匹配分词处理,得到待检测分词,所述预设分词词表中保存有预先根据训练短信进行分词处理的各个分词;通过将所述待检测分词输入到预先配置的短信识别模型进行分析,确定所述待检测短信是否为垃圾短信。通过上述方案,利用经过学习训练得到的短信识别模型,根据所有分词的整体分类情况识别整个短信的内容,来判断该短信是否是垃圾短信,有效提高垃圾短信识别的准确率,进而对垃圾短信进行全面的拦截处理。

    文本挖掘系统、文本挖掘方法和程序

    公开(公告)号:CN104246775B

    公开(公告)日:2018-04-17

    申请号:CN201380021769.5

    申请日:2013-04-24

    IPC分类号: G06F17/30

    CPC分类号: G06F17/3071 G06F17/30737

    摘要: 本发明涉及一种文本挖掘系统,包括:同义词聚类获取部,配置为从待分析的文本数据中的文本中获取同义词聚类,所述同义词聚类每个都是同义的文本的集合;隐含关系获取部,配置为获取所述同义词聚类之中的隐含关系;以及隐含图生成部,配置为根据所述同义词聚类之中的隐含关系而生成隐含图,所述隐含图包括同义词聚类的顶点和有向边,每个有向边指示从被隐含的同义词聚类到隐含同义词聚类的方向。

    一种文本分类方法及装置

    公开(公告)号:CN107844553A

    公开(公告)日:2018-03-27

    申请号:CN201711044663.3

    申请日:2017-10-31

    发明人: 王妍

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明提供了一种文本分类方法及装置,其中,所述方法,包括:确定至少两个分类类别所分别对应的至少一个特征词;利用每一个所述分类类别所分别对应的至少一个特征词训练初始分类器,以形成目标分类器;从待分类文本中提取至少一个特征分词;将所述至少一个特征分词输入所述目标分类器,并接收所述目标分类器根据所述至少一个特征分词输出的当前分类类别;将接收的所述当前分类类别确定为所述待分类文本所属的分类类别。通过本发明的技术方案,可更为快速的确定大量文本分别所属的分类类别。

    一种基于聚类分析的文档数据分类方法

    公开(公告)号:CN107798113A

    公开(公告)日:2018-03-13

    申请号:CN201711063868.6

    申请日:2017-11-02

    申请人: 东南大学

    发明人: 张敏灵 詹望

    IPC分类号: G06F17/30

    CPC分类号: G06F17/3071

    摘要: 本发明公开了一种基于聚类分析的文档数据分类方法,主要弥补在目前文档分类问题中,及现有技术使用相同的特征在不同的主题上进行预测而产生的性能不足问题。该方法包括以下步骤:(1)用户从已有的文档库中选择样例文档,其中每个文档都具备多个主题;(2)通过本发明提出的方法将选取的文档的初始特征针对每一种主题转化为新的特征;(3)对每一类主题,在新的特征上学习得到分类模型;(4)基于最终分类模型对文档存储设备中待分类文档进行分类,并返回分类结果;(5)如果用户对分类结果满意,则执行步骤6,否则从文档库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。

    一种控制智能终端中的应用消息推送的方法及装置

    公开(公告)号:CN106686064A

    公开(公告)日:2017-05-17

    申请号:CN201611116364.1

    申请日:2016-12-07

    发明人: 蔡胜

    IPC分类号: H04L29/08 G06F17/30

    摘要: 本发明公开了一种控制智能终端中的应用消息推送的方法和装置。该方法包括:获取智能终端中的用户行为相关信息;从获取的所述用户行为相关信息中提取关键字;将所提取的关键字发送给所述智能终端上安装的一个或多个应用,使得所述一个或多个应用根据所接收的关键字推送消息。可见,本发明通过获取智能终端中的用户行为相关信息,实现了对用户需求的全面了解;同时从获取的所述用户行为相关信息中提取关键字,保证了应用消息推送的精确性;并将所提取的关键字发送给所述智能终端上安装的一个或多个应用,实现所述一个或多个应用根据所接收的关键字推送及时、有效、准确的消息,从而避免了应用软件全部同时推送信息的困扰,极大地增强了用户体验。