-
公开(公告)号:CN106303548A
公开(公告)日:2017-01-04
申请号:CN201510268776.6
申请日:2015-05-22
Applicant: 北大方正集团有限公司 , 北京大学北京北大方正电子有限公司
IPC: H04N19/625 , H04N19/11 , H04N19/593 , H04N19/176 , H04N19/91
Abstract: 本发明提供一种HEVC帧内预测编码方法,包括:对当前编码单元进行DCT变换,获得当前编码单元的DCT系数;根据DCT系数确定当前编码单元的图像复杂度,根据当前编码单元的块类型确定当前编码单元的划分深度;根据当前编码单元和与当前编码单元相邻的相邻编码单元的图像复杂度比较结果、划分深度比较结果,确定是否对当前编码单元进行划分;若确定不对当前编码单元进行划分,则根据DCT系数确定当前编码单元的纹理方向;根据纹理方向确定当前编码单元的预测模式类型和预测模式偏移度之后,确定当前编码单元的预测主模式,并根据预测主模式对当前编码单元进行编码。可以降低算法的复杂度,减少编码时间。
-
公开(公告)号:CN106294356A
公开(公告)日:2017-01-04
申请号:CN201510246678.2
申请日:2015-05-14
Applicant: 北京大学 , 北大方正集团有限公司北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F16/9535
Abstract: 本发明提供了一种基于动态聚类的微博时间线生成方法,包括:获取与给定话题相关的多条微博;获得所述多条微博间的相似度,并根据所述多条微博间的相似度构建微博关系图;根据所述微博关系图,采用聚类算法对所述微博进行分类,并从每类微博中选取代表微博;根据发布时间的先后对所有代表微博进行排序,生成微博时间线。本发明提供了一种基于动态聚类的微博时间线生成装置,包括获取单元、微博关系图构建单元、动态聚类单元及时间线生成单元。能够有效过滤冗余微博及噪音微博,建立一个鲁棒性较强、检索效果较好的微博检索系统。
-
公开(公告)号:CN106201706A
公开(公告)日:2016-12-07
申请号:CN201510218978.X
申请日:2015-04-30
Applicant: 北大方正集团有限公司 , 北京大学北京北大方正电子有限公司
Abstract: 本发明提供一种粒子群服务选择方法和系统,所述方法包括:构建云服务组合模型;根据所述云服务组合模型进行云服务的服务质量属性计算;基于所述云服务组合模型和所计算的服务质量进行粒子群服务选择,获取优化的服务组合。本发明能够快速、高效地从众多的服务中选择出满足用户QoS要求的优化服务组合,从而给用户提供所需要的服务。
-
公开(公告)号:CN106156192A
公开(公告)日:2016-11-23
申请号:CN201510191694.6
申请日:2015-04-21
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明提出了一种舆情数据聚类方法和一种舆情数据聚类系统,其中,所述舆情数据聚类方法包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。通过本发明的技术方案,通过对社交网站中的海量数据进行增量式的聚类,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,进而提高了聚类结果的准确性。
-
公开(公告)号:CN106033428A
公开(公告)日:2016-10-19
申请号:CN201510107097.0
申请日:2015-03-11
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提出了一种统一资源定位符的选择方法和一种统一资源定位符的选择装置,其中,方法包括:根据输入的关键词获取与关键词相关的至少一个统一资源定位符;根据至少一个统一资源定位符中的每个统一资源定位符的参数信息和/或至少一个统一资源定位符所使用的域名的权重比,统计每个统一资源定位符与关键词的相关度;根据每个统一资源定位符与关键词的相关度,从至少一个统一资源定位符中选择目标统一资源定位符,以将目标统一资源定位符作为与关键词相关的统一资源定位符的搜索结果。通过本发明的技术方案,可以有效地保证了获取统一资源定位符的覆盖率和准确率,从而可以根据统一资源定位符获取质量较高的网页内容以供满足舆情分析的需求。
-
公开(公告)号:CN103116591B
公开(公告)日:2016-04-20
申请号:CN201110366367.1
申请日:2011-11-17
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种论坛贴内容抽取方法,包括:由论坛贴的源代码生成HTML标签树;将HTML标签树中的文本率大于第一阈值的标签子树合并得到一颗最大候选子树;从最大候选子树中筛选得到所有具有相似结构的节点簇;从节点簇中筛选文本率大于第二阈值的节点簇;抽取筛选的节点簇中的文本内容。本发明还提供了一种论坛贴内容抽取装置。本发明实现了论坛贴内容的自动抽取。
-
公开(公告)号:CN103365924B
公开(公告)日:2016-04-06
申请号:CN201210102446.6
申请日:2012-04-09
Applicant: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明涉及通信领域技术,尤其涉及搜索信息的方法、装置和终端,用于从网页采集源采集网页信息;根据采集的网页信息,建立信息资料库;根据客户端发送的搜索请求,在所述信息资料库中进行搜索;将搜索结果推送到所述客户端进行显示。使用本发明实施例提供的搜索信息的方法、装置和终端,通过预先采集用户关注的网页信息,并使用该众多网页信息建立信息资料库,当接收到客户端发送的搜索请求时,在该信息资料库中进行搜索,可以提高搜索效率,并且提高搜索精度。
-
公开(公告)号:CN103164435B
公开(公告)日:2016-03-09
申请号:CN201110415356.8
申请日:2011-12-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: H04L43/06 , G06F17/30864
Abstract: 本发明公开了一种网络数据的采集方法和系统。该方法用于采集发布于一网站上的与M个主题分别相关的网络文档的数据,其中M为大于等于1的整数,所述方法包括:根据待采集链接地址所对应的类型,将所述待采集链接地址配置到对应类型的队列中,所述待采集链接地址为与所述M个主题分别相关的网络文档的数据所在页面的链接地址;获取所述对应类型的队列中的所述待采集链接地址对应的网页源代码;根据所述网页源代码对应的URL信息及所述URL的采集深度值抽取所述URL对应的网络文档的数据。
-
公开(公告)号:CN105183730A
公开(公告)日:2015-12-23
申请号:CN201410238900.X
申请日:2014-05-30
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种网页信息的处理方法和装置。本发明网页信息的处理方法,包括:根据待处理网页中的文本信息分布,建立所述待处理网页的文档对象模型Dom树,其中,所述Dom树包括一个以上的节点,所述节点与所述待处理网页中的文本信息分布相对应,对所述Dom树中的所有节点进行信息统计,确定所述Dom树的主题文本节点;将所述Dom树的主题文本节点对应的文本信息作为所述待处理网页的主题信息,可以提高网页信息处理的准确率和效率。
-
公开(公告)号:CN104778177A
公开(公告)日:2015-07-15
申请号:CN201410014401.2
申请日:2014-01-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供一种数据处理方法及装置,包括:接收请求设备发送的处理请求,所述处理请求包括目标网站的标识;根据采集到的历史原始数据,获得用户在预设的目标时间范围内,在所述目标网站中发布的各类型对应的信息的平均数量,所述历史原始数据包括各用户在各网站中发布的信息;针对每个所述类型对应的信息的平均数量,计算其与所述类型对应的预设权值的乘积,其中,所述各类型对应的权值之和为1;计算所述各类型对应的乘积之和,获得所述用户在所述目标时间范围内相对于所述目标网站的用户活跃度;向所述请求设备发送处理结果,所述处理结果包括所述用户活跃度。本发明提供的数据处理方法及装置,能够准确快捷地获取用户的用户活跃度。
-
-
-
-
-
-
-
-
-