基于动态聚类的微博时间线生成方法及装置

    公开(公告)号:CN106294356A

    公开(公告)日:2017-01-04

    申请号:CN201510246678.2

    申请日:2015-05-14

    CPC classification number: G06F16/9535

    Abstract: 本发明提供了一种基于动态聚类的微博时间线生成方法,包括:获取与给定话题相关的多条微博;获得所述多条微博间的相似度,并根据所述多条微博间的相似度构建微博关系图;根据所述微博关系图,采用聚类算法对所述微博进行分类,并从每类微博中选取代表微博;根据发布时间的先后对所有代表微博进行排序,生成微博时间线。本发明提供了一种基于动态聚类的微博时间线生成装置,包括获取单元、微博关系图构建单元、动态聚类单元及时间线生成单元。能够有效过滤冗余微博及噪音微博,建立一个鲁棒性较强、检索效果较好的微博检索系统。

    关键词扩展方法和关键词扩展系统

    公开(公告)号:CN106294396A

    公开(公告)日:2017-01-04

    申请号:CN201510260688.1

    申请日:2015-05-20

    CPC classification number: G06F16/951

    Abstract: 本发明提出了一种关键词扩展方法和一种关键词扩展系统,其中,方法包括:通过关键词获取模块在当前数据中获取关键词;通过初始扩展模块对关键词进行初始扩展,以确定关键词的初始扩展词;通过候选词提取模块使用词权重计算公式计算样本数据库中的多个目标样本词的词权重,并根据词权重在多个目标样本词中提取候选词;通过匹配模块将每个候选词与关键词及初始扩展词进行匹配,以获取关键词的目标扩展词。通过本发明的技术方案,通过对关键词进行扩展,可以全面地检测出具有敏感信息但经过变异的词,并对具有敏感信息的词进行过滤,从而提高了对具有敏感信息的数据的监测效果。

    一种信息的检索方法及系统

    公开(公告)号:CN106294358A

    公开(公告)日:2017-01-04

    申请号:CN201510246802.5

    申请日:2015-05-14

    CPC classification number: G06F16/951

    Abstract: 本发明公开了一种信息的检索方法及系统,该方法包括:接收用户的输入指令,根据指令中的第一检索关键词信息在预设网络资源中获取与第一检索关键词信息对应的多条文本信息;识别多条文本信息中的关键词信息,获取与关键词信息对应的关键词类别,并将关键词信息对应的关键词类别以多个文本框的形式展示给用户,以使用户根据多个文本框选择与所述输入指令相对应的关键词信息;根据用户选择的关键词信息和第一检索关键词信息生成第二检索关键词信息;根据第二检索关键词信息,在预设语料库中选取符合预设条件的文本信息展示给用户。该方法通过多用户的原始查询指令进行扩展,并对检索结果进行优化,提高了信息检索的准确度,同时也提高了检索效率。

    检索方法和检索系统
    4.
    发明公开

    公开(公告)号:CN106294418A

    公开(公告)日:2017-01-04

    申请号:CN201510272225.7

    申请日:2015-05-25

    Abstract: 本发明提出了一种检索方法和一种检索系统,其中,所述方法包括:在接收到对微博语料集合中的微博文档进行检索的查询语句时,根据所述查询语句创建与所述查询语句相应的原始查询模型;识别所述查询语句中的目标实体;根据与所述目标实体相应的目标实体主题模型、所述原始查询模型和根据所述微博文档集合中的每条微博文档建立的微博文档语言模型,对所述原始查询模型进行扩展,以得到扩展查询模型;统计所述扩展查询模型与所述微博文档语言模型之间的相似度,以根据所述相似度确定所述查询语句的目标检索结果。通过本发明的技术方案,使用户可以准确地在微博文档中检索得到目标检索结果,从而提高了准确率,同时还可以增强检索的鲁棒性。

    信息处理方法和信息处理系统

    公开(公告)号:CN106294312A

    公开(公告)日:2017-01-04

    申请号:CN201510369322.8

    申请日:2015-06-29

    Abstract: 本发明提出了一种信息处理方法和一种信息处理系统,所述方法包括:获取当前文档中的文档语句和所述文档语句中的单词,并根据预设词典确定所述单词的单词极性值;根据所述文档语句中的每个所述单词、所述单词的所述单词极性值以及语句极性值计算模型计算所述文档语句的语句极性值;根据所述当前文档中的每个所述文档语句的所述语句极性值和特征词集合确定所述当前文档的情感倾向性。通过本发明的技术方案,可以准确地分析出当前文档针对当前话题的情感倾向性。

    一种确定服务方案的方法及装置

    公开(公告)号:CN106331000B

    公开(公告)日:2019-11-08

    申请号:CN201510346701.5

    申请日:2015-06-19

    Abstract: 本发明实施例公开了一种确定服务方案的方法及装置。本发明实施例通过获取租户的请求信息,根据租户请求消息获取与请求消息中包含的需求目标相匹配的第一目标服务;根据第一目标服务,查询第二服务粒度空间,获取第二服务粒度空间中与第一目标服务对应的第二目标服务;根据第二目标服务确定租户的服务方案;本发明实施例根据第二服务粒度空间中具有共同属性的服务来构建第一服务粒度空间,将第一服务粒度空间作为租户的访问的接口,根据用户的请求消息,先查询第一服务粒度空间,进而查询第二服务粒度空间,简化了具体服务的实现细节,提高了确定服务方案的效率和准确性。

    HEVC帧内预测编码方法
    7.
    发明授权

    公开(公告)号:CN106303548B

    公开(公告)日:2019-03-19

    申请号:CN201510268776.6

    申请日:2015-05-22

    Abstract: 本发明提供一种HEVC帧内预测编码方法,包括:对当前编码单元进行DCT变换,获得当前编码单元的DCT系数;根据DCT系数确定当前编码单元的图像复杂度,根据当前编码单元的块类型确定当前编码单元的划分深度;根据当前编码单元和与当前编码单元相邻的相邻编码单元的图像复杂度比较结果、划分深度比较结果,确定是否对当前编码单元进行划分;若确定不对当前编码单元进行划分,则根据DCT系数确定当前编码单元的纹理方向;根据纹理方向确定当前编码单元的预测模式类型和预测模式偏移度之后,确定当前编码单元的预测主模式,并根据预测主模式对当前编码单元进行编码。可以降低算法的复杂度,减少编码时间。

    搜索方法和搜索引擎
    10.
    发明授权

    公开(公告)号:CN104572643B

    公开(公告)日:2018-06-19

    申请号:CN201310470200.9

    申请日:2013-10-10

    Abstract: 本发明提供一种搜索方法和搜索引擎,通过接收用户终端发送的用于对网页进行搜索的关键字,利用各从节点的内存中存储的第一索引文件,进行搜索,获得与关键字相匹配的第一匹配网页后,若第一匹配网页的个数少于第一阈值,再利用各节点的磁盘中所存储的第二索引文件,进行搜索,获得与所述关键字相匹配的第二匹配网页,向用户终端发送包含第一匹配网页和第二匹配网页的搜索结果,由于首先利用内存中存储的第一索引文件进行搜索,不需要占用I/O接口,从而避免了由于全部将索引文件存储在磁盘所导致的检索速度下降,提高了检索效率。

Patent Agency Ranking