-
公开(公告)号:CN104965788B
公开(公告)日:2017-07-28
申请号:CN201510390576.8
申请日:2015-07-03
申请人: 电子科技大学
IPC分类号: G06F11/36
摘要: 本发明公开了一种代码静态检测方法,具体涉及一种基于LLVM IR的符号执行算法——利用给予程序变量符号初值技术领域,解决现在技术中的静态检测方法支持语言单一、不能较好的处理指针和别名问题,探测潜在的程序漏洞等问题。本发明的步骤:(1)获取源代码,并将源代码进行预处理转换为LLVM汇编程序;(2)将转换得到的LLVM汇编程序,运用符号执行算法模拟解释执行LLVM汇编程序,并记录各个变量在不同路径上的符号值和各条路径的约束条件;(3)根据记录各个变量在不同路径上的符号值和各条路径的约束条件,调用SMT求解器Z3检查变量的符号值是否满足路径约束和漏洞约束,判断程序是否存在潜在漏洞。本发明应用于源代码中的数组越界,除零错误和空指针引用。
-
公开(公告)号:CN103984749B
公开(公告)日:2017-10-20
申请号:CN201410227771.4
申请日:2014-05-27
申请人: 电子科技大学
IPC分类号: G06F17/30
摘要: 一种基于链接分析的聚焦爬虫方法,属于互联网信息检索、搜索引擎等领域,解决现有爬虫抓取准确率不高的问题,包括如下步骤:抓取网页,将网页和目标样本网页的结构进行比较,确定目标网页,从网站入口链接开始,记录爬虫到目标网页的每一条链接路径,建立目标网页链接树;分析目标网页链接树,归纳链接树中目标网页路径上的链接,替换链接树中的链接,形成链接模版树;爬虫使用链接模版树作为导航,抓取与链接模版树相匹配中的网页链接,直到整个抓取循环过程结束,最终抓取完所有目标网页。本发明的爬虫能够根据链接模版树的导航,在抓取网页的过程中,只抓取有效的链接,从而保证爬虫抓取网页的效率和准确率。
-
公开(公告)号:CN103984749A
公开(公告)日:2014-08-13
申请号:CN201410227771.4
申请日:2014-05-27
申请人: 电子科技大学
IPC分类号: G06F17/30
CPC分类号: G06F17/30873
摘要: 一种基于链接分析的聚焦爬虫方法,属于互联网信息检索、搜索引擎等领域,解决现有爬虫抓取准确率不高的问题,包括如下步骤:抓取网页,将网页和目标样本网页的结构进行比较,确定目标网页,从网站入口链接开始,记录爬虫到目标网页的每一条链接路径,建立目标网页链接树;分析目标网页链接树,归纳链接树中目标网页路径上的链接,替换链接树中的链接,形成链接模版树;爬虫使用链接模版树作为导航,抓取与链接模版树相匹配中的网页链接,直到整个抓取循环过程结束,最终抓取完所有目标网页。本发明的爬虫能够根据链接模版树的导航,在抓取网页的过程中,只抓取有效的链接,从而保证爬虫抓取网页的效率和准确率。
-
公开(公告)号:CN104965788A
公开(公告)日:2015-10-07
申请号:CN201510390576.8
申请日:2015-07-03
申请人: 电子科技大学
IPC分类号: G06F11/36
摘要: 本发明公开了一种代码静态检测方法,具体涉及一种基于LLVM IR的符号执行算法——利用给予程序变量符号初值技术领域,解决现在技术中的静态检测方法支持语言单一、不能较好的处理指针和别名问题,探测潜在的程序漏洞等问题。本发明的步骤:(1)获取源代码,并将源代码进行预处理转换为LLVM汇编程序;(2)将转换得到的LLVM汇编程序,运用符号执行算法模拟解释执行LLVM汇编程序,并记录各个变量在不同路径上的符号值和各条路径的约束条件;(3)根据记录各个变量在不同路径上的符号值和各条路径的约束条件,调用SMT求解器Z3检查变量的符号值是否满足路径约束和漏洞约束,判断程序是否存在潜在漏洞。本发明应用于源代码中的数组越界,除零错误和空指针引用。
-
-
-