-
公开(公告)号:CN105095070A
公开(公告)日:2015-11-25
申请号:CN201510363954.3
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种基于浏览器测试组件的QQ群数据获取方法与系统,通过给予浏览器测试组件,实现用户行为模拟,由此方式实现Web端QQ等登陆操作,结合并行化设计,面向QQ群实现即时聊天信息和非即时信息的数据获取。本发明能够避免人工登陆操作,在快速获取数据的同时,兼顾了获取数据的完整性,同时在后期维护上成本投入更小,能够根据版本变化快速修改并投入使用。
-
公开(公告)号:CN105095070B
公开(公告)日:2017-12-19
申请号:CN201510363954.3
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种基于浏览器测试组件的QQ群数据获取方法与系统,通过给予浏览器测试组件,实现用户行为模拟,由此方式实现Web端QQ等登陆操作,结合并行化设计,面向QQ群实现即时聊天信息和非即时信息的数据获取。本发明能够避免人工登陆操作,在快速获取数据的同时,兼顾了获取数据的完整性,同时在后期维护上成本投入更小,能够根据版本变化快速修改并投入使用。
-
公开(公告)号:CN105162676B
公开(公告)日:2017-08-11
申请号:CN201510363826.9
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微信数据获取方法和系统,通过安卓平台应用测试组件和浏览器测试组件相结合来实现。基于安卓平台测试组件方式,可以模拟用户行为操作客户端,包括登陆、查看、滑屏等;由此方式获取的微信公众平台账号历史消息的网页地址结合主动采集技术,可获取微信公众账号完整的历史消息。采用安卓平台测试组件和浏览器测试组件相结合方式,通过监听浏览器DOM元素变化,能够自动化实现网页版微信登陆,全面和及时有效地获取微信数据。
-
公开(公告)号:CN105162676A
公开(公告)日:2015-12-16
申请号:CN201510363826.9
申请日:2015-06-26
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微信数据获取方法和系统,通过安卓平台应用测试组件和浏览器测试组件相结合来实现。基于安卓平台测试组件方式,可以模拟用户行为操作客户端,包括登陆、查看、滑屏等;由此方式获取的微信公众平台账号历史消息的网页地址结合主动采集技术,可获取微信公众账号完整的历史消息。采用安卓平台测试组件和浏览器测试组件相结合方式,通过监听浏览器DOM元素变化,能够自动化实现网页版微信登陆,全面和及时有效地获取微信数据。
-
公开(公告)号:CN105007297A
公开(公告)日:2015-10-28
申请号:CN201510275907.3
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: H04L67/02 , H04L63/0815
Abstract: 本发明提出了一种社交网络的交互方法及装置。该社交网络的交互方法包括:获取用户登录初始账号后的交互行为;通过浏览器测试组件启动浏览器,并且自动登录执行账号;基于服务器应答的条件下模拟所述交互行为。该社交网络的交互方法提高了社交网络用户的交互体验。
-
公开(公告)号:CN105045803A
公开(公告)日:2015-11-11
申请号:CN201510278653.0
申请日:2015-05-27
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/30864 , G06F17/30887 , G06Q50/01
Abstract: 本发明公开了一种社交网络关系的采集方法及系统,所述方法包括:根据预设微博用户信息,通过模拟移动终端浏览器登录预设微博;设置目标微博用户的粉丝URL和/或关注URL;在登录预设微博的所述模拟移动终端浏览器中,根据设置的URL向微博服务器发请求,获得所述微博服务器返回的HTML界面;根据获得的HTML界面,获取所述目标微博用户的粉丝信息和/或所述目标微博用户的关注用户信息。本发明消除了微博服务器的访问频率限制,可以无限制的向服务器发送数据请求;降低了实现难度,不需要逆向分析和大量的调试。
-
公开(公告)号:CN109213858B
公开(公告)日:2021-07-27
申请号:CN201710463010.2
申请日:2017-06-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/9536 , G06Q50/00 , H04L29/08
Abstract: 本发明提供一种网络水军的自动识别方法及系统,该方法步骤包括:1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;3)若上述账号的历史被删评论数满足预设条件,则该账号为网络水军。该方法及系统不仅免去了人工标注工作及模型训练,而且能够快速有效的识别社交网络中的网络水军,即当一个账号的评论信息的历史被删评论数满足预设条件,则判定该账号为网络水军。同时该方法及系统适用于多个社交网络,并且能够跨平台运行。
-
公开(公告)号:CN110362807A
公开(公告)日:2019-10-22
申请号:CN201810252275.2
申请日:2018-03-26
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于自编码器的变体词识别方法,其步骤包括:将与变体词有关的语料作为数据集,进行分词和向量化;从数据集中生成批量样本,输入到自编码器的各自编码单元中进行非监督的预训练,得到各自编码单元神经网络的神经元参数;从数据集中生成批量正样本和负样本,输入到基于上述各自编码单元神经网络的神经元参数的自编码器中进行监督训练,得到整个神经网络的各神经元参数;将文档中包含的某已知变体词及其上下文向量化,再输入到基于上述整个神经网络的各神经元参数的自编码器中,识别出与该已知变体词关联的候选词。本发明还提供一种基于自编码器的变体词识别系统。
-
公开(公告)号:CN110097074A
公开(公告)日:2019-08-06
申请号:CN201910207855.4
申请日:2019-03-19
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于序列相似度的车辆轨迹压缩方法。本方法为:1)将单位时间内同一标识ID的车辆的轨迹合成为一条长轨迹;该长轨迹为TrajectoryID={(l1,t1),(l2,t2),…,(ln,tn)},其中,第n次采集的信息包括位置ln、时间信息tn,记为采集点(ln,tn);2)根据设定的速度阈值对该长轨迹进行切割,得到多条分段轨迹;3)基于分段轨迹之间的序列相似度,对该长轨迹进行全局轨迹压缩。本发明大大节约了存储开销。
-
公开(公告)号:CN110097074B
公开(公告)日:2021-06-22
申请号:CN201910207855.4
申请日:2019-03-19
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明公开了一种基于序列相似度的车辆轨迹压缩方法。本方法为:1)将单位时间内同一标识ID的车辆的轨迹合成为一条长轨迹;该长轨迹为TrajectoryID={(l1,t1),(l2,t2),…,(ln,tn)},其中,第n次采集的信息包括位置ln、时间信息tn,记为采集点(ln,tn);2)根据设定的速度阈值对该长轨迹进行切割,得到多条分段轨迹;3)基于分段轨迹之间的序列相似度,对该长轨迹进行全局轨迹压缩。本发明大大节约了存储开销。
-
-
-
-
-
-
-
-
-