话题关联词的获取方法和装置

    公开(公告)号:CN106708880B

    公开(公告)日:2020-05-22

    申请号:CN201510786309.2

    申请日:2015-11-16

    发明人: 贺达 李新国

    IPC分类号: G06F16/33

    摘要: 本申请公开了一种话题关联词的获取方法和装置。其中,该方法包括:利用预先提供的与目标话题关联的关键词查询得到与目标话题关联的词语和文章;统计出每个词语出现的总次数和查询到的文章的总篇数;统计出每个词语所从属的文章的篇数,其中,词语所从属的文章为出现该词语的文章;根据每个词语出现的总次数和出现的文章的总篇数以及每个词语所从属的文章的篇数计算得到每个词语与目标话题的关联度,其中,关联度为用于表示词语与目标话题的关联程度的值;利用关联度从词语中选择目标话题的关联词。本申请解决了现有技术中确定出的关联词与话题的关联性不强的技术问题。

    一种数据打通方法及系统
    62.
    发明公开

    公开(公告)号:CN111177593A

    公开(公告)日:2020-05-19

    申请号:CN201811348090.8

    申请日:2018-11-13

    发明人: 李新国

    IPC分类号: G06F16/955

    摘要: 本发明公开了一种数据打通方法及系统。方法包括:在检测到第一系统被触发时,第一系统获取第一目标页面的第一目标地址,并生成一个随机字符串;其中第一系统将基于第一目标地址跳转至第二系统,第二系统为第一目标页面所在的系统;第一系统将所述随机字符串拼接到第一目标地址中得到第一带参地址,并记录所述随机字符串与第一用户标识的第一对应关系;发生跳转后,第二系统从第一带参地址中获取所述随机字符串,并记录所述随机字符串与第二用户标识的第二对应关系,以使得第三系统基于第一对应关系以及第二对应关系,实现第一系统与第二系统间用户数据打通。本发明部署简单,提高了打通率,且不会泄露任何用户隐私数据,没有法律风险。

    提高网站站内搜索效率的方法和装置

    公开(公告)号:CN106611022B

    公开(公告)日:2020-03-03

    申请号:CN201510708722.7

    申请日:2015-10-27

    发明人: 李新国

    IPC分类号: G06F16/955

    摘要: 本申请公开了一种提高网站站内搜索效率的方法和装置。其中,该方法包括:从访问目标网站的访问日志中,提取表示目标网站的站内搜索结果页的统一资源定位符URL;根据目标网站的站内搜索结果页的URL,确定用于匹配目标网站的站内搜索结果页的匹配式;从访问日志中提取第一关键词、第二关键词、第一搜索结果页的URL、第一目标页面;利用匹配式对第一搜索结果页的URL进行匹配;以及在匹配式与第一搜索结果页的URL匹配成功的情况下,关联第二关键词和第一目标页面。本申请解决了现有技术中用户的搜索效率比较低的技术问题。

    一种确定网站可用性的方法及装置

    公开(公告)号:CN107544968B

    公开(公告)日:2019-12-24

    申请号:CN201610466058.4

    申请日:2016-06-23

    发明人: 王春侠 李新国

    IPC分类号: G06F16/955

    摘要: 本发明公开一种确定网站可用性的方法及装置,该方法包括:利用爬虫系统,对目标网站的各个页面上的网页链接进行扫描,获取目标网站中能够被正常访问的网页链接数量,以及目标网站中总的网页链接数量;将能够被正常访问的网页链接数量与总的网页链接数量的比值,作为第一可用性指标。采集目标网站的用户访问历史数据,并从中获取目标网站被访问的总页面数量,以及被访问时出现问题的页面数量;将被访问的总页面数量与被访问时出现问题的页面数量之差与被访问的总页面数量的比值,作为第二可用性指标。根据第一可用性指标与第二可用性指标,确定目标网站的网站可用性。本发明能够为用户提供一种网站可用性指标,为用户访问网站提供有效的参考。

    网站屏幕分辨率兼容性的分析方法及装置

    公开(公告)号:CN106897296B

    公开(公告)日:2019-12-24

    申请号:CN201510958289.2

    申请日:2015-12-17

    发明人: 李新国 吴茜

    IPC分类号: G06F16/958

    摘要: 本申请公开了一种网站屏幕分辨率兼容性的分析方法及装置。该方法包括:获取目标时间段内的目标访问日志,其中,目标访问日志为根据目标网站的访问信息生成的日志;按照预设条件从目标访问日志中提取目标访问信息,其中,目标访问信息中包括多个不同分辨率的终端设备访问目标网站的访问信息;根据目标访问信息统计目标比例,其中,目标比例为不同分辨率的终端设备各自访问目标网站占终端设备访问目标网站的比例;以及将目标比例与预设比例进行比较,分析目标网站屏幕分辨率兼容性。通过本申请,解决了相关技术中由于通过人工分析网站在不同分辨率下的兼容性,导致分析效率较低的问题。

    设置率确定方法和装置
    66.
    发明授权

    公开(公告)号:CN106874302B

    公开(公告)日:2019-12-24

    申请号:CN201510924249.6

    申请日:2015-12-14

    IPC分类号: G06F16/958 G06Q10/06

    摘要: 本申请公开了一种设置率确定方法和装置。其中,该方法包括:对目标网站的访问日志进行解析,确定出目标网站中被访问的网页;从被访问的网页中识别出目标网页,统计出第一网页数量;对被访问的网页中除目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,第二网页数量为存在返回首页链接的网页的数量;以及根据被访问的网页的网页总数、第一网页数量以及第二网页数量计算得到目标网站上的返回首页链接的设置率。本申请解决了现有技术中通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大的技术问题。

    网站访问数据的分析方法及装置

    公开(公告)号:CN106528556B

    公开(公告)日:2019-07-30

    申请号:CN201510573667.5

    申请日:2015-09-10

    发明人: 李新国

    IPC分类号: G06F16/955

    摘要: 本发明公开了一种网站访问数据的分析方法及装置,涉及信息技术领域,解决了无法根据归类的URL分析网站访问数据。本发明的主要技术方案为:首先获取统一资源定位符URL;然后将所述URL与配置信息中的匹配规则分别进行匹配,所述配置信息中至少包括一个匹配规则;若所述URL与所述配置信息中的任一匹配规则匹配成功,则从预置映射表中提取与所述配置信息对应的各个URL,最后将所述URL和从预置映射表中提取的各个URL进行归类分析网站访问数据。本发明主要用于分析网站访问数据。

    网页加载速度的确定方法和装置

    公开(公告)号:CN106610887B

    公开(公告)日:2019-02-22

    申请号:CN201510703022.9

    申请日:2015-10-26

    发明人: 李新国 周建涛

    IPC分类号: G06F11/34

    摘要: 本申请公开了一种网页加载速度的确定方法和装置。其中,该方法包括:对目标网站的访问数据进行解析,以获取在同一会话中同一来源访问同一网页超过预设访问次数的访问数据,从获取的访问数据中提取在同一会话中同一来源在同一网页的停留时间,根据停留时间确定访问的网页是否为加载速度慢的网页。本申请解决了对加载速度慢的网页判断不准确的技术问题。

    媒体数据访问方法及装置
    69.
    发明公开

    公开(公告)号:CN108270810A

    公开(公告)日:2018-07-10

    申请号:CN201611260028.4

    申请日:2016-12-30

    发明人: 李新国

    IPC分类号: H04L29/08

    CPC分类号: H04L67/32

    摘要: 本申请公开了一种媒体数据访问方法及装置,方法包括:基于预设的访问策略,确定目标账户的目标请求速率,所述目标请求速率为所述目标账户不被惩罚的最大请求速率,所述目标账户具有令牌集合,所述令牌集合具有令牌生成周期,在一个令牌生成周期内所述令牌集合中的访问令牌的生成量与所述目标请求速率在一个令牌生成周期内对应的请求的数量一致;在所述目标账户通过获取令牌集合中剩余的访问令牌访问媒体数据之后,获得所述目标账户访问媒体数据的访问结果;基于所述访问结果,调整所述目标账户的目标请求速率。

    一种确定网站可用性的方法及装置

    公开(公告)号:CN107544968A

    公开(公告)日:2018-01-05

    申请号:CN201610466058.4

    申请日:2016-06-23

    发明人: 王春侠 李新国

    IPC分类号: G06F17/30

    摘要: 本发明公开一种确定网站可用性的方法及装置,该方法包括:利用爬虫系统,对目标网站的各个页面上的网页链接进行扫描,获取目标网站中能够被正常访问的网页链接数量,以及目标网站中总的网页链接数量;将能够被正常访问的网页链接数量与总的网页链接数量的比值,作为第一可用性指标。采集目标网站的用户访问历史数据,并从中获取目标网站被访问的总页面数量,以及被访问时出现问题的页面数量;将被访问的总页面数量与被访问时出现问题的页面数量之差与被访问的总页面数量的比值,作为第二可用性指标。根据第一可用性指标与第二可用性指标,确定目标网站的网站可用性。本发明能够为用户提供一种网站可用性指标,为用户访问网站提供有效的参考。