基于信息增强调用序列的API推荐方法及装置

    公开(公告)号:CN114416159B

    公开(公告)日:2022-07-22

    申请号:CN202210335647.4

    申请日:2022-04-01

    IPC分类号: G06F8/70 G06N3/08

    摘要: 本发明公开了一种基于信息增强调用序列的API推荐方法及装置,方法包括解析源代码提取得到原始API调用序列,根据原始API调用序列获取用户自定义API和非自定义API的对应关系,得到增强API调用序列;将原始API调用序列和增强API调用序列分别放入神经网络嵌入层,得到原始序列表示向量和第一增强序列表示向量,将第一增强序列表示向量输入神经网络第一编码器,得到第二增强序列表示向量,并和原始序列表示向量进行信息融合得到API新向量表示;将API新向量表示输入神经网络第二编码器中,得到API序列向量并输入相似度计算模块,得到每一个候选API的概率。本发明可解决原始API调用序列信息不足和用户自定义API携带信息过少影响推荐准确率的问题。

    基于信息增强调用序列的API推荐方法及装置

    公开(公告)号:CN114416159A

    公开(公告)日:2022-04-29

    申请号:CN202210335647.4

    申请日:2022-04-01

    IPC分类号: G06F8/70 G06N3/08

    摘要: 本发明公开了一种基于信息增强调用序列的API推荐方法及装置,方法包括解析源代码提取得到原始API调用序列,根据原始API调用序列获取用户自定义API和非自定义API的对应关系,得到增强API调用序列;将原始API调用序列和增强API调用序列分别放入神经网络嵌入层,得到原始序列表示向量和第一增强序列表示向量,将第一增强序列表示向量输入神经网络第一编码器,得到第二增强序列表示向量,并和原始序列表示向量进行信息融合得到API新向量表示;将API新向量表示输入神经网络第二编码器中,得到API序列向量并输入相似度计算模块,得到每一个候选API的概率。本发明可解决原始API调用序列信息不足和用户自定义API携带信息过少影响推荐准确率的问题。

    一种基于遗传算法的自动标注方法

    公开(公告)号:CN112988981B

    公开(公告)日:2021-10-15

    申请号:CN202110525248.X

    申请日:2021-05-14

    IPC分类号: G06F16/33 G06F16/31 G06N3/12

    摘要: 本发明提供了一种基于遗传算法的自动标注方法,包括依次执行以下步骤:步骤1,预处理:获取评论,从评论中删除长度小于两个单词的评论和所有非字母数字字符,然后取小写字母,在标记化后剔除存在于NLTK语料库中的终止词,接下来,将单词简化为词根形式;步骤2,主题建模:采用LDA主题建模方法,给定一个评论列表R={r1,r2,…,rn},获得相应的词汇D={ω1,ω2,...,ωd},话题β={β1,β2,...,βk};步骤3,基于遗传算法的主题标注:设计适合该主题标注场景的染色体结构、适应度参数以及遗传算子。本发明的有益效果是:利于开发者和用户了解应用评论。