一种基于Kubernetes的通用服务转换方法及系统

    公开(公告)号:CN110442421B

    公开(公告)日:2022-04-01

    申请号:CN201910578655.X

    申请日:2019-06-28

    Abstract: 本发明提出一种基于Kubernetes的通用服务转换方法和系统,包括:构建由多个节点构成的Kubernetes系统,其中节点的Pod设有用于提供服务的原服务容器,并通过在Pod中新添加容器的方式或通过原容器镜像的方式,在节点的Pod中加入转换程序;每当发生一次服务调用请求,转换容器或程序根据配置,将服务调用请求转换为原服务执行请求,通过调用原服务容器,提供相对应的服务,并转换成该服务调用请求所对应的服务结果。本发明可解决Kubernetes服务与调用者之间接口不一致的问题;并可减少转换程序与服务程序、调用程序之间的网络开销,同时结合Kubernetes特性,服务程序重新部署时,转换程序自动跟随部署。

    基于多通道代理的数据获取方法、系统及装置

    公开(公告)号:CN112528118A

    公开(公告)日:2021-03-19

    申请号:CN202011491957.2

    申请日:2020-12-17

    Abstract: 本申请提供了一种基于多通道代理的数据获取方法、系统及装置,数据获取方法包括以下步骤:获取所需数据中的关键词;根据获取的关键词调用分布式爬虫框架;所述分布式爬虫框架中设置有多个爬虫节点;改变所述爬虫节点的IP;接收不同IP的爬虫节点爬取的网页数据;对接收到的网页数据进行数据抽取、转换、装载处理,得到有效数据;对有效数据进行存储。本申请通过分布式爬虫框架中的多个爬虫节点形成多通道代理,通过在每次爬取信息前改变分布式爬虫框架中爬虫节点的IP,能够绕过数据提供网站的反爬虫检测手段,用爬虫节点达到多通道代理、发现情报以及清洗、转换等操作,保证数据的精准可靠。

    一种多渠道爬虫采集平台及其采集方法

    公开(公告)号:CN115473659A

    公开(公告)日:2022-12-13

    申请号:CN202110652291.2

    申请日:2021-06-11

    Inventor: 张凯

    Abstract: 本申请提供一种多渠道爬虫采集平台及其采集方法,采集平台包括数据库和集群主体;所述集群主体框架下至少包括一个爬虫集群,所述爬虫集群包括爬虫根节点以及由所述爬虫根节点延伸出的爬虫节点;所述爬虫节点包括采集模块、解析模块、提取模块以及网络访问模块;所述网络访问模块,包括基本网络访问模块和特殊网络访问模块;所述特殊网络访问模块用于通过Privoxy将收到的HTTP请求转给SOCKS5代理,由SOCKS5代理转发至ShadowSocks服务器,再转到网页进行访问;或者先通过Privoxy把收到的HTTP请求转给SOCKS5代理,再由所述SOCKS5代理转发到Tor代理服务器,所述Tor代理服务器再通过SOCKS5转发到ShadowSocks服务器,再通过所述ShadowSocks服务器通过Tor中继节点转到网页进行访问。本申请能够更高效获得网络数据。

Patent Agency Ranking