一种网页正文内容提取方法和装置

    公开(公告)号:CN103853760A

    公开(公告)日:2014-06-11

    申请号:CN201210508772.7

    申请日:2012-12-03

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了一种网页正文内容提取方法和装置,其中,该方法包括:将待提取的网页文档解析成文档对象模型树结构,将网页对应的文档对象模型树的叶子节点组成节点集合;查找节点集合中层数最深的叶子节点在文档对象模型树中对应的父节点;将叶子节点归并到所述父节点,将具有相同父节点的叶子节点归并;若归并后的节点集合中的叶子节点满足设定条件,将叶子节点所包含的区域确定为网页正文内容所在区域;在确定的网页正文内容所在区域中去除网页标签,提取网页正文内容。本发明能够迅速有效的定位HTML页面中正文所在的区域,并将其与噪音内容分离出来,提高获取正文内容信息的效率。

    信息搜索系统及搜索方法

    公开(公告)号:CN101083633B

    公开(公告)日:2010-05-26

    申请号:CN200610083678.6

    申请日:2006-06-02

    Abstract: 本发明提供了一种信息搜索方法,包括:接收到终端发送的搜索请求信息后,从订购关系服务器中获取与所述搜索请求信息中的用户标识对应的业务订购信息并生成用户简档;发送所述用户简档与所述搜索请求信息;根据所述搜索请求信息中的搜索条件进行搜索得到搜索结果信息;按照预先设定的参数,根据用户简档中的业务订购信息对搜索结果信息进行处理得到个性化信息并发送;将所述个性化信息转发给所述终端;本发明还提供了一种信息搜索系统。通过本发明的系统及方法,可将搜索结果信息中用户订阅的业务的信息优先排列,极大地方便了用户。

    二维码信息的移动处理系统及移动处理方法

    公开(公告)号:CN100548024C

    公开(公告)日:2009-10-07

    申请号:CN200610083551.4

    申请日:2006-06-05

    Abstract: 本发明涉及一种二维码信息的移动处理系统及移动处理方法,方法包括:移动终端获取二维码图片;所述移动终端生成并向信息处理服务器发送对所述二维码图片进行解析的请求信息,该请求信息中携带了所述二维码图片;所述信息处理服务器将所述请求信息转发给解析器;所述解析器对所述二维码图片进行解析,并将解析后得到的二维码图片的解析结果信息返回给所述信息处理服务器;所述信息处理服务器将所述二维码图片的解析结果信息转发给所述移动终端。本发明通过网络侧的解析器对二维码图片进行解析,有效解决了不具有二维码解析软件的移动终端无法识别二维码图片的问题,并可使移动终端用户获知二维码图片的相关信息,方便了移动终端用户。

    信息搜索系统及搜索方法

    公开(公告)号:CN101083633A

    公开(公告)日:2007-12-05

    申请号:CN200610083678.6

    申请日:2006-06-02

    Abstract: 本发明提供了一种信息搜索方法,包括:步骤1、接收到终端发送的搜索请求信息后,从订购关系服务器中获取与所述搜索请求信息中的用户标识对应的业务订购信息并生成用户简档;发送所述用户简档与所述搜索请求信息;根据所述搜索请求信息中的搜索条件进行搜索得到搜索结果信息;按照预先设定的参数,根据用户简档中的业务订购信息对搜索结果信息进行处理得到个性化信息并发送;将所述个性化信息转发给所述终端;本发明还提供了一种信息搜索系统。通过本发明的系统及方法,可将搜索结果信息中用户订阅的业务的信息优先排列,极大地方便了用户。

    一种移动终端广告投放方法和设备

    公开(公告)号:CN103905488B

    公开(公告)日:2018-10-12

    申请号:CN201210576781.X

    申请日:2012-12-26

    Inventor: 梁晓波 吴淑燕

    Abstract: 本发明公开了一种移动终端广告投放方法和设备,该设备包括:触发控制模块,用于在主叫移动终端向被叫移动终端发起呼叫的过程中,向广告匹配模块发送广告匹配请求;广告匹配模块,用于在收到广告匹配请求后,获得用户决策函数和广告属性效用函数,利用用户决策函数和广告属性效用函数确定被叫移动终端对应的广告信息,并将广告信息输出给广告信息推送模块;广告信息推送模块,用于在收到广告信息后,在主叫移动终端向被叫移动终端发起呼叫的过程中,将广告信息发送给被叫移动终端。本发明实施例中,可以在合适的展现时机向移动终端推送广告信息,提高用户的使用体验。

    基于个性化信息的搜索系统及搜索方法

    公开(公告)号:CN1811780A

    公开(公告)日:2006-08-02

    申请号:CN200610058348.1

    申请日:2006-03-03

    CPC classification number: G06F17/30867

    Abstract: 本发明提供了一种基于个性化信息的搜索系统及搜索方法,搜索系统包括设置在通信网络中的搜索引擎、信息服务器及用户信息库,还包括一搜索代理服务器,分别与所述搜索引擎及所述用户信息库连接,用于根据用户信息及地址信息建立用户简档;搜索方法包括:用户通过客户端向搜索代理服务器发送搜索请求信息;搜索代理服务器建立用户简档,并将该用户简档及请求信息发送给搜索引擎;搜索引擎进行搜索,并对搜索到的信息按照用户简档中的信息进行处理得到搜索结果信息,然后将该搜索结果信息通过搜索代理服务器发送给客户端。通过本发明实现了对信息的个性化搜索,极大地方便了用户。

    网页正文内容提取方法及装置

    公开(公告)号:CN102541874A

    公开(公告)日:2012-07-04

    申请号:CN201010591506.6

    申请日:2010-12-16

    Abstract: 本发明公开了一种网页正文内容提取方法及装置,该方法包括步骤:获得归属于同一站点下相同层级目录的两个网页;针对获得的每个网页,分别执行:将该网页划分成各内容块;确定划分出的每个内容块的标签密度和/或链接密度;并选择出标签密度和/或链接密度满足对应预设条件的内容块;在选择出的各内容块中,提取出文本内容和另一网页中选择出的各内容块的文本内容均不一致的内容块;将提取出的内容块,确定为该网页的正文内容。采用本发明技术方案,解决了现有技术中存在的提取网页正文内容的准确性较低的问题。

    基于个性化信息的搜索系统及搜索方法

    公开(公告)号:CN100421113C

    公开(公告)日:2008-09-24

    申请号:CN200610058348.1

    申请日:2006-03-03

    CPC classification number: G06F17/30867

    Abstract: 本发明提供了一种基于个性化信息的搜索系统及搜索方法,搜索系统包括设置在通信网络中的搜索引擎、信息服务器及用户信息库,还包括一搜索代理服务器,分别与所述搜索引擎及所述用户信息库连接,用于根据用户信息及地址信息建立用户简档;搜索方法包括:用户通过客户端向搜索代理服务器发送搜索请求信息;搜索代理服务器建立用户简档,并将该用户简档及请求信息发送给搜索引擎;搜索引擎进行搜索,并对搜索到的信息按照用户简档中的信息进行处理得到搜索结果信息,然后将该搜索结果信息通过搜索代理服务器发送给客户端。通过本发明实现了对信息的个性化搜索,极大地方便了用户。

    基于音频信号的搜索方法

    公开(公告)号:CN1859258A

    公开(公告)日:2006-11-08

    申请号:CN200610080689.9

    申请日:2006-05-29

    Abstract: 本发明涉及一种基于音频信号的搜索方法,该方法包括:终端通过选择音频搜索的链接向网络侧发起音频搜索请求,所述网络侧向所述终端发送音频输入类型的选择信息;所述终端选择音频输入类型,根据所选择的输入类型传输相应的音频信号给所述网络侧;所述网络侧对接收到的所述音频信号进行相应的处理;所述网络侧根据处理的结果进行搜索,得到超文本链接形式的结果,传递给所述终端。利用本发明,用户可以通过选择音频搜索的链接直接发起音频搜索请求,省去了记忆或存储搜索电话号码以及拨号的麻烦,并且能够通过终端上并行显示的所有超文本链接形式的结果,快速地找到所需的信息。

    一种网页正文内容提取方法和装置

    公开(公告)号:CN103853760B

    公开(公告)日:2017-05-03

    申请号:CN201210508772.7

    申请日:2012-12-03

    Abstract: 本发明公开了一种网页正文内容提取方法和装置,其中,该方法包括:将待提取的网页文档解析成文档对象模型树结构,将网页对应的文档对象模型树的叶子节点组成节点集合;查找节点集合中层数最深的叶子节点在文档对象模型树中对应的父节点;将叶子节点归并到所述父节点,将具有相同父节点的叶子节点归并;若归并后的节点集合中的叶子节点满足设定条件,将叶子节点所包含的区域确定为网页正文内容所在区域;在确定的网页正文内容所在区域中去除网页标签,提取网页正文内容。本发明能够迅速有效的定位HTML页面中正文所在的区域,并将其与噪音内容分离出来,提高获取正文内容信息的效率。

Patent Agency Ranking