基于分块的大规模代码静态分析方法和系统

    公开(公告)号:CN115080985A

    公开(公告)日:2022-09-20

    申请号:CN202210887831.X

    申请日:2022-07-27

    Abstract: 本发明涉及一种基于分块的大规模代码静态分析方法和系统。其中方法包括:将大规模工程程序按照工程粒度需求进行分块;针对各块,构建值依赖模型,将块对应的值依赖子图存储到数据库中作持久化保存;分析各块的值依赖子图中的程序漏洞,构建块漏洞表;遍历各块漏洞表,将漏洞表内的漏洞分类为可信漏洞和不可信漏洞;分析不可信漏洞,根据当前值依赖子图中的漏洞与数据库中其他值依赖子图之间的关联性对子图进行拓展,获得根据漏洞完整化的拓展子图;分析所有拓展子图,验证已发现漏洞并检测是否包含新漏洞,将获取的结果与可信漏洞合并后输出。本发明适用于上亿行代码的静态代码分析,可以实现准确有效的分析。

    软件源代码缺陷检测方法及装置

    公开(公告)号:CN114385512B

    公开(公告)日:2022-07-19

    申请号:CN202210284843.3

    申请日:2022-03-23

    Abstract: 本申请涉及一种软件源代码缺陷检测方法及装置,软件源代码缺陷检测方法包括获取源软件代码,根据源软件代码构造代码属性图,将代码属性图输入预设基于图神经网络的源代码缺陷检测模型,预设基于图神经网络的源代码缺陷检测模型用于生成自适应接收路径,并根据自适应接收路径输出检测结果,可以减少无关代码信息的影响,提高代码漏洞检测的效率。

    一种漏洞和软件对齐的方法、装置以及存储介质

    公开(公告)号:CN112579476B

    公开(公告)日:2021-05-18

    申请号:CN202110198625.3

    申请日:2021-02-23

    Abstract: 本发明实施例涉及软件测试领域,公开了一种漏洞和软件对齐的方法、装置以及存储介质,包括:抓取安全漏洞发布网站发布的漏洞信息,建立公开漏洞资源数据库;建立包含公开漏洞的软件信息数据库;以 的键值对为关键词,在指定网站范围内进行搜索,将对应键值对的搜索结果插入软件信息数据库;根据上一步得到的软件信息数据库进行过滤,筛选其中符合对齐要求的软件信息并设置为可信,标识其为对齐完成数据;每次更新漏洞数据库时查找并更新软件信息数据库;本发明基于搜索引擎的庞大搜索量所训练的推荐算法,能够获得较为准确的开源软件的源代码仓库地址,或者闭源软件的二进制下载链接。

    许可职权履责效果评估模型的构建方法、装置及系统

    公开(公告)号:CN111695797A

    公开(公告)日:2020-09-22

    申请号:CN202010490261.1

    申请日:2020-06-02

    Abstract: 本申请涉及一种许可职权履责效果评估模型的构建方法、装置及系统,属于评估技术领域,本申请许可职权履责效果评估模型的构建方法包括:基于对案件情况的相关性分析,确定评估模型的评价指标;确定所述评价指标的指标权重;基于所述评价指标和指标权重构建许可职权履责效果评估模型。本发明基于案件情况采取上述方法构建的许可职权履责效果评估模型,有利于客观地对许可职权履责的效果进行有效评估,进而在行政主体在做行政许可前可以提供参考建议,以对于具体行政许可申请部署更多人员或其他方式以加快审批时间,提升行政许可效率。

    一种指针修改影响的分析方法和系统

    公开(公告)号:CN107085533B

    公开(公告)日:2019-09-06

    申请号:CN201710189131.2

    申请日:2017-03-27

    Abstract: 本发明提供一种指针修改影响的分析方法和系统,所述方法包括:在程序代码中查找该语句中变量的等价变量,并查找该等价变量所有的定义点,构成分析结果集合;基于定义点、语句以及程序入口的关系,获得对应该定义点的多个路径条件;以及判断所有所述路径条件是否可同时满足,若不可同时满足,则将该定义点从所述分析结果集合中剔除。本发明提高结果的精度,做到了部分路径敏感以及流敏感,使采用该分析算法的静态代码缺陷检测结果更加精确。

    一种面向价格领域的大数据处理分析系统

    公开(公告)号:CN109523446A

    公开(公告)日:2019-03-26

    申请号:CN201811220594.1

    申请日:2018-10-19

    Abstract: 本发明实施例公开一种面向价格领域的大数据处理分析系统,包括:价格数据获取模块,用于利用预设数据获取方式,获取多源异构的价格数据;分布式处理模块,用于采用大数据分布式处理技术,对价格数据进行处理;大数据分析模块,用于对处理后的价格数据进行大数据分析;可视化展示模块,用于将大数据分析后得到的数据结果通过可视的、交互的方式进行展示。本发明实施例采用多样化的先进数据采集方式,能高效、准确的获取不同渠道多种复杂数据结构的价格数据,通过采用可靠、高效、高扩展性、高容错性的分布式数据处理方法,提高了数据处理效率,通过可视化展示模块可随时查看、监测和管理,能实现价格数据资源及时交换共享,大数据融合处理。

    一种指针修改影响的分析方法和系统

    公开(公告)号:CN107085533A

    公开(公告)日:2017-08-22

    申请号:CN201710189131.2

    申请日:2017-03-27

    Abstract: 本发明提供一种指针修改影响的分析方法和系统,所述方法包括:在程序代码中查找该语句中变量的等价变量,并查找该等价变量所有的定义点,构成分析结果集合;基于定义点、语句以及程序入口的关系,获得对应该定义点的多个路径条件;以及判断所有所述路径条件是否可同时满足,若不可同时满足,则将该定义点从所述分析结果集合中剔除。本发明提高结果的精度,做到了部分路径敏感以及流敏感,使采用该分析算法的静态代码缺陷检测结果更加精确。

    基于混合对比学习的关系抽取方法、装置、设备及介质

    公开(公告)号:CN119476206A

    公开(公告)日:2025-02-18

    申请号:CN202411294832.9

    申请日:2024-09-14

    Abstract: 本发明提供一种基于混合对比学习的关系抽取方法、装置、设备及介质,涉及人工智能技术领域,通过获取待抽取文本;将所述待抽取文本输入混合对比学习关系抽取模型,输出关系抽取结果,其中,所述混合对比学习关系抽取模型基于正样本以及混合负样本训练得到,所述混合负样本根据实体向量表示和上下文词向量表示构造。本发明通过引入混合对比学习策略,生成更具挑战性的负样本实例,从而提升关系抽取模型的关系抽取性能,不仅拓宽了负样本的选择范围,还提高了模型的泛化能力,可以实现各种复杂情况的文本关系抽取。

    基于序列生成的检索增强生成方法

    公开(公告)号:CN119396986A

    公开(公告)日:2025-02-07

    申请号:CN202411185369.4

    申请日:2024-08-27

    Applicant: 北京大学

    Inventor: 谢睿 张世琨 叶蔚

    Abstract: 本发明提供一种基于序列生成的检索增强生成方法,方法包括:对查询文本进行检索得到候选相关文本;基于初始化上下文序列和序列生成模型,生成当前预测文本块向量,以基于当前预测文本块向量,从候选相关文本中匹配得到最相关文本序列;基于当前最相关文本序列更新初始化上下文序列,基于更新的初始化上下文序列和序列生成模型,生成下一预测文本块向量,以得到下一轮次的最相关文本序列,直至得到的最相关文本序列满足预设条件;基于得到的最相关文本序列,确定目标提示词。本发明提供的方法,通过序列生成模型对检索得到的候选相关文本进行优化,实现生成连贯、高质量的提示词,进而提升基于提示词进行微调或者提示学习的下游任务的性能。

    代码漏洞检测大模型构建方法、装置和电子设备

    公开(公告)号:CN118171291A

    公开(公告)日:2024-06-11

    申请号:CN202410595002.3

    申请日:2024-05-14

    Applicant: 北京大学

    Inventor: 叶蔚 谢睿 张世琨

    Abstract: 本发明提供一种代码漏洞检测大模型构建方法、装置和电子设备,涉及计算机技术领域,该方法包括:基于漏洞修复信息对初始大语言模型进行第一轮训练,获得第一大语言模型;基于奖励函数对第一大语言模型进行优化,获得第二大语言模型;针对各预设代码,对预设代码对应的值依赖图进行分析,确定预设代码对应的初始漏洞检测结果;基于预设代码对应的初始漏洞检测结果和漏洞标注结果,确定初始漏洞检测结果到漏洞标注结果的噪音转移矩阵;基于各预设代码分别对应的初始漏洞检测结果和噪音转移矩阵生成各预设代码分别对应的第二提示词,基于各第二提示词对第二大语言模型进行训练,获得目标大语言模型。本发明技术方案能够降低计算的复杂度。

Patent Agency Ranking