-
公开(公告)号:CN105095271B
公开(公告)日:2019-04-05
申请号:CN201410197262.1
申请日:2014-05-12
Applicant: 北京大学 , 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC: G06F16/332
Abstract: 本发明提供了一种微博检索方法,包括:预处理步骤,对查询语句和微博文档进行预处理;第一模型创建步骤,根据预处理结果创建原始查询模型和原始文档模型;第二模型创建步骤,创建伪相关文档模型;模型更新步骤,将所述伪相关文档模型和所述原始查询模型进行线性叠加,得到扩展查询模型;文档确定步骤,确定候选结果文档;排序步骤,根据分解机排序模型公式计算所述候选结果文档中的每个文档的得分,并根据所述得分对所述候选结果文档进行排序,以得到最终检索结果。相应地,本发明还提出了一种微博检索装置。通过本发明的技术方案,可以解决微博检索中的词汇匹配不精准的问题,同时可以辨别微博的质量,过滤掉低质量的微博。
-
公开(公告)号:CN105095211B
公开(公告)日:2019-03-26
申请号:CN201410163005.6
申请日:2014-04-22
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F16/41 , G06F16/435
Abstract: 本发明实施例提供了一种多媒体数据的获取方法和装置,该方法包括:接收用户输入的查询请求,该查询请求包括多媒体信息关键词;根据多媒体信息关键词,对数据库中的元数据进行检索,确定与多媒体信息关键词相匹配的文本信息对应的目的标识,该元数据包括多媒体文件的文本信息及其对应的标识;向用户输出与多媒体信息关键词相匹配的文本信息;接收用户对文本信息的确认响应;根据与确认响应相对应的文本信息的目的标识从服务器中获取多媒体数据;将多媒体数据向用户输出。本发明能够根据多媒体文件的文本信息快速和准确的获取多媒体数据,更能满足用户对多媒体数据个性化的需求,使用户获得更好的体验。
-
公开(公告)号:CN107645515A
公开(公告)日:2018-01-30
申请号:CN201610575694.0
申请日:2016-07-20
Applicant: 北大方正集团有限公司 , 北京北大方正电子有限公司
Abstract: 本发明提出了一种网络信息的发布方法和网络信息的发布装置,其中,所述网络信息的发布方法包括:接收发布网络信息的请求,其中,所述请求包括:发布所述网络信息的网站和网页链接、登录所述网站的用户名和密码、以及所述网络信息的内容;根据所述网站的信息发布流程,生成多条操作指令;根据所述请求依次执行所述多个操作指令,以完成所述网络信息的发布。通过本发明的技术方案,可以将信息自动地发布到不同的网站上。
-
公开(公告)号:CN104216889B
公开(公告)日:2017-11-17
申请号:CN201310210101.7
申请日:2013-05-30
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明公开了一种基于云服务的数据传播性分析预测方法及系统,首先在需要进行数据分析预测的多个地点分别建立云端,并建立与云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集或接收到的网络数据进行数据分类,然后建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析,最后通过数据交互平台,展示数据模型库的分析和挖掘结果。通过本发明所述的方法及系统,能够提供有效的数据挖掘模型库,可以根据用户需要通过交互平台展示给用户最有效最关心的信息,并可监控分析信息的传播趋势,提供有效的数据传播性分析预测。
-
公开(公告)号:CN107220267A
公开(公告)日:2017-09-29
申请号:CN201610166717.2
申请日:2016-03-22
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种浏览器页面中文本的显示方法和装置,该方法包括:获取网页文件中待显示文本的文字的编码,根据文字的编码范围判断待显示文本中是否含有至少两种语言的文字;若待显示文本中含有至少两种语言的文字,则按每种语言文字的呈现形态为每种语言的文字设置字号,并将设置的字号添加到对应的标记符中;根据标记符,对待显示的文本进行显示。实现了不同呈现形态的语言文字以不同的字号显示,能够使每种语言的文字均能被用户准确的识别,提高用户的体验。
-
公开(公告)号:CN104615593B
公开(公告)日:2017-09-29
申请号:CN201310536067.2
申请日:2013-11-01
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种微博热点话题自动检测方法及装置,涉及互联网技术领域,本发明通过对待检测的微博文本依次进行关键词提取、关键词组获取及关键词组聚类,以获得候选关键词簇,最后计算各个候选关键词簇所对应话题的热度值并根据热度值选择热点话题,减小了热点话题检测的复杂度,并实现有效的热点话题检测。
-
公开(公告)号:CN106331000A
公开(公告)日:2017-01-11
申请号:CN201510346701.5
申请日:2015-06-19
Applicant: 北大方正集团有限公司 , 北京大学北京北大方正电子有限公司
IPC: H04L29/08
Abstract: 本发明实施例公开了一种确定服务方案的方法及装置。本发明实施例通过获取租户的请求信息,根据租户请求消息获取与请求消息中包含的需求目标相匹配的第一目标服务;根据第一目标服务,查询第二服务粒度空间,获取第二服务粒度空间中与第一目标服务对应的第二目标服务;根据第二目标服务确定租户的服务方案;本发明实施例根据第二服务粒度空间中具有共同属性的服务来构建第一服务粒度空间,将第一服务粒度空间作为租户的访问的接口,根据用户的请求消息,先查询第一服务粒度空间,进而查询第二服务粒度空间,简化了具体服务的实现细节,提高了确定服务方案的效率和准确性。
-
公开(公告)号:CN106294396A
公开(公告)日:2017-01-04
申请号:CN201510260688.1
申请日:2015-05-20
Applicant: 北京大学 , 北大方正集团有限公司北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明提出了一种关键词扩展方法和一种关键词扩展系统,其中,方法包括:通过关键词获取模块在当前数据中获取关键词;通过初始扩展模块对关键词进行初始扩展,以确定关键词的初始扩展词;通过候选词提取模块使用词权重计算公式计算样本数据库中的多个目标样本词的词权重,并根据词权重在多个目标样本词中提取候选词;通过匹配模块将每个候选词与关键词及初始扩展词进行匹配,以获取关键词的目标扩展词。通过本发明的技术方案,通过对关键词进行扩展,可以全面地检测出具有敏感信息但经过变异的词,并对具有敏感信息的词进行过滤,从而提高了对具有敏感信息的数据的监测效果。
-
公开(公告)号:CN106294358A
公开(公告)日:2017-01-04
申请号:CN201510246802.5
申请日:2015-05-14
Applicant: 北京大学 , 北大方正集团有限公司北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F16/951
Abstract: 本发明公开了一种信息的检索方法及系统,该方法包括:接收用户的输入指令,根据指令中的第一检索关键词信息在预设网络资源中获取与第一检索关键词信息对应的多条文本信息;识别多条文本信息中的关键词信息,获取与关键词信息对应的关键词类别,并将关键词信息对应的关键词类别以多个文本框的形式展示给用户,以使用户根据多个文本框选择与所述输入指令相对应的关键词信息;根据用户选择的关键词信息和第一检索关键词信息生成第二检索关键词信息;根据第二检索关键词信息,在预设语料库中选取符合预设条件的文本信息展示给用户。该方法通过多用户的原始查询指令进行扩展,并对检索结果进行优化,提高了信息检索的准确度,同时也提高了检索效率。
-
公开(公告)号:CN103198078B
公开(公告)日:2016-08-03
申请号:CN201210004878.3
申请日:2012-01-09
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种互联网新闻事件报道趋势分析方法及系统,涉及互联网信息分析领域。现有的新闻事件发展趋势的分析方法不能够了解新闻事件的主题信息或者不能够对其数据来源进行筛选。本发明所述方法及系统以用户所关心的新闻事件为起点,根据设置的新闻事件的特征信息对互联网中用户可能关心的新闻信息进行采集并进行初步筛选,然后分析得出新闻事件的主题,并根据不同周期内的主题及关联信息量得出转化主题,最后将各主题及其相关报道数量随时间发展的分布趋势进行展现。通过该方法及系统,用户可以更直观、方便地掌握互联网新闻事件的发展趋势和传播规律。
-
-
-
-
-
-
-
-
-