-
公开(公告)号:CN115130480A
公开(公告)日:2022-09-30
申请号:CN202210405606.8
申请日:2022-04-18
申请人: 南通大学
IPC分类号: G06F40/58 , G06F40/30 , G06F40/289 , G06F40/211
摘要: 本发明属于机器翻译质量检测技术领域,公开了一种基于辅助翻译软件和双粒度替换的英中翻译软件测试方法。针对需要测试的一系列英文源句,首先借助辅助翻译软件,通过计算主英中机器翻译软件和辅助英中机器翻译软件的翻译结果间的余弦相似度,识别出错误候选句子。随后对英文源句进行双粒度替换,以生成替换后的英文源句。并基于成分句法分析和依存句法分析,通过对比原始英文源句和替换后的英文源句在主英中机器翻译软件的翻译结果的结构表征来进一步识别出错误候选句子。最后通过分析被归为错误候选句子的英文源句,尝试定位并修复英中翻译软件测试方法的实现代码,以提高英中翻译软件的翻译质量。
-
公开(公告)号:CN114491540B
公开(公告)日:2024-09-10
申请号:CN202210161142.0
申请日:2022-02-22
申请人: 南通大学
IPC分类号: G06F21/56 , G06F21/57 , G06N3/0442
摘要: 本发明提供了一种基于GraphCodeBERT的安全漏洞检测方法,其技术方案为:首先对源代码进行预处理,得到数据流词元、源代码词元和注释词元,作为安全漏洞检测模型的输入,模型采用编码器‑解码器框架,编码器端使用预训练的GraphCodeBERT,解码器端使用双向长短期记忆(BiLSTM)模型作为分类模型,最终输出一个二分类结果,用来判断代码是否包含安全漏洞。本发明的有益效果为:基于函数粒度,将安全漏洞检测问题建模为二分类问题;与传统的词向量方法不同,通过在编码器端考虑数据流信息,使得模型更容易学到漏洞模式。
-
公开(公告)号:CN114491540A
公开(公告)日:2022-05-13
申请号:CN202210161142.0
申请日:2022-02-22
申请人: 南通大学
摘要: 本发明提供了一种基于GraphCodeBERT的安全漏洞检测方法,其技术方案为:首先对源代码进行预处理,得到数据流词元、源代码词元和注释词元,作为安全漏洞检测模型的输入,模型采用编码器‑解码器框架,编码器端使用预训练的GraphCodeBERT,解码器端使用双向长短期记忆(BiLSTM)模型作为分类模型,最终输出一个二分类结果,用来判断代码是否包含安全漏洞。本发明的有益效果为:基于函数粒度,将安全漏洞检测问题建模为二分类问题;与传统的词向量方法不同,通过在编码器端考虑数据流信息,使得模型更容易学到漏洞模式。
-
-