-
公开(公告)号:CN103198079B
公开(公告)日:2016-04-20
申请号:CN201210004943.2
申请日:2012-01-06
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种相关搜索的实现方法,包括:获取用户输入的搜索需求字符串;将搜索需求字符串分词得到多个查询词;在倒排索引中得到各个查询词的有序相关搜索列表;将各个查询词的有序相关搜索列表返回给用户。本发明提供了一种相关搜索的实现装置,包括:获取模块,用于获取用户输入的搜索需求字符串;分词模块,用于将搜索需求字符串分词得到多个查询词;列表模块,用于在倒排索引中得到各个查询词的有序相关搜索列表;提交模块,用于将各个查询词的有序相关搜索列表返回给用户。本发明可以高效率地向用户提供相关搜索。
-
公开(公告)号:CN103186599B
公开(公告)日:2016-04-20
申请号:CN201110455183.2
申请日:2011-12-28
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种互联网新闻的监控方法,包括:获取互联网新闻的相关信息;以监管指令匹配互联网新闻的相关信息;提交匹配结果。本发明提供了一种互联网新闻的监控装置,包括:获取模块,用于获取互联网新闻的相关信息;匹配模块,用于以监管指令匹配互联网新闻的相关信息;提交模块,用于提交匹配结果。本发明提高了互联网新闻的监控效率。
-
公开(公告)号:CN105100155A
公开(公告)日:2015-11-25
申请号:CN201410204792.4
申请日:2014-05-15
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: H04L29/08
CPC classification number: Y02D50/10
Abstract: 本发明提出了一种动态部署下载机方法和一种动态部署下载机装置,其中动态部署下载机方法包括:监测下载任务状态;根据所述下载任务状态控制分布式系统中的下载机的开关状态。通过本发明的技术方案,根据下载情况来动态部署下载机,从而最大限度的节约资源和能耗。
-
公开(公告)号:CN105095270A
公开(公告)日:2015-11-25
申请号:CN201410197261.7
申请日:2014-05-12
Applicant: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种检索装置和检索方法,其中,检索方法包括:在接收到查询语句和微博文档时,对查询语句和微博文档进行预处理,并创建原始查询模型和原始文档模型;从外部知识数据库中获取与原始查询模型相关联的知识条目,并根据原始查询模型和知识条目确定知识查询语句;根据知识查询语句创建知识查询模型,并根据知识查询模型和原始查询模型确定扩展查询模型;在微博文档中包含社交标签时,根据社交标签从语料集中查找出微博文档对应的社交邻居文档,并创建社交邻居文档模型;根据社交邻居文档模型、原始文档模型和语料集得到扩展文档模型,并确定目标检索结果。通过本发明的技术方案,可以使用户在微博上快速地查询到大量准确的实时性信息。
-
公开(公告)号:CN105095211A
公开(公告)日:2015-11-25
申请号:CN201410163005.6
申请日:2014-04-22
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供了一种多媒体数据的获取方法和装置,该方法包括:接收用户输入的查询请求,该查询请求包括多媒体信息关键词;根据多媒体信息关键词,对数据库中的元数据进行检索,确定与多媒体信息关键词相匹配的文本信息对应的目的标识,该元数据包括多媒体文件的文本信息及其对应的标识;向用户输出与多媒体信息关键词相匹配的文本信息;接收用户对文本信息的确认响应;根据与确认响应相对应的文本信息的目的标识从服务器中获取多媒体数据;将多媒体数据向用户输出。本发明能够根据多媒体文件的文本信息快速和准确的获取多媒体数据,更能满足用户对多媒体数据个性化的需求,使用户获得更好的体验。
-
公开(公告)号:CN104579737A
公开(公告)日:2015-04-29
申请号:CN201310522792.4
申请日:2013-10-29
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明提供了一种分布式web系统的运行维护的方法及系统,预先设置故障信息与解决方案的对应关系,该方法包括:获取待测服务器的运行信息;从运行信息中提取所述待测服务器的故障信息;查找与待测服务器的故障信息对应的解决方案,输出所述解决方案。通过本发明提供的一种分布式web系统的运行维护的方法及系统,能够针对故障信息给出解决方案。
-
公开(公告)号:CN104572789A
公开(公告)日:2015-04-29
申请号:CN201310522789.2
申请日:2013-10-29
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30675
Abstract: 本发明提供了一种文本排序方法及设备,该方法包括:对每一个待排序文本,获取检索请求query中的每一个子词相对于在所述query与该子词相邻的子词的文本偏移差dpage,根据获取到的文本偏移差dpage确定所述query在该待排序文本中的子词偏离系数offset_ratio;根据各个待排序文本对应的子词偏离系数offset_ratio对各个待排序文本进行排序。本发明中,由于query中相邻的子词term在文本中位置关系更能够反映query与该文本的相关性,则根据子词偏离系数做出的排名能够将更为相关的网页优先推荐给用户,从而提升用户体验。
-
公开(公告)号:CN104572679A
公开(公告)日:2015-04-29
申请号:CN201310485075.9
申请日:2013-10-16
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明提供一种舆情数据存储方法和装置,通过利用哈希值算法对接收到的舆情数据进行计算,获得舆情数据的哈希值,根据该舆情数据的哈希值和计算获得的历史舆情数据的哈希值,从舆情数据中筛选出与历史舆情数据不重复的目标舆情数据,从而仅对目标舆情数据进行存储,解决了现有技术中由于将相互重复的舆情数据均保存到数据库中所导致的存储空间利用率低的技术问题。
-
公开(公告)号:CN104516677A
公开(公告)日:2015-04-15
申请号:CN201310445513.9
申请日:2013-09-26
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
CPC classification number: G06F3/0611
Abstract: 本发明提供一种磁盘数据读写方法及磁盘存储装置。其中,所述方法包括:获取时间周期内的所有读取指令和/或写入指令对应的操作位置;获取磁头当前位置;根据所述磁头当前位置以及所述时间周期内的所有操作位置,对所述时间周期内的所有读取指令和/或写入指令进行排序,以使所述磁头的寻道距离最短;根据排序结果,顺序执行相应的读取或存储操作。本发明实施例根据多进程读写指令对应的读取位置和/或写入位置,将多进程读写指令根据磁盘物理位置进行排序,以使所述磁头的寻道距离最短,进而缩短了磁头寻道时间,提高了数据存储的效率。
-
公开(公告)号:CN104462096A
公开(公告)日:2015-03-25
申请号:CN201310418664.5
申请日:2013-09-13
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明提供一种舆情监测分析方法和装置。其中方法包括:获取互联网中各网站服务器上的舆情数据,舆情数据包括至少一条资产信息;接收客户端发送的获取请求,获取请求中携带申请条件和客户端标识;根据申请条件对舆情数据所包括的资产信息进行筛选,获取与申请条件匹配的目标舆情数据;根据客户端标识将目标舆情数据发送给客户端,从而解决现有技术中的舆情监测分析系统硬件成本高,网络资源浪费大的问题。
-
-
-
-
-
-
-
-
-