一种基于极坐标系的时序网络安全知识图谱链接预测方法

    公开(公告)号:CN115456175A

    公开(公告)日:2022-12-09

    申请号:CN202211058684.1

    申请日:2022-08-31

    Abstract: 本发明属于网络安全知识表示和知识图谱补全技术领域,具体涉及一种基于极坐标系的时序网络安全知识图谱链接预测方法。本发明将知识图谱时间格式统一为开始时间和结束时间,通过时序知识图谱嵌入模型时间变化表示为极坐标系统中实体的缩放和旋转,解决了知识图谱的时间格式不一致和重复嵌入的问题;采用极坐标系统中映射嵌入模型,使用系数和角度来区分不同时间约束实体的嵌入,以避免在单一维度中嵌入产生相似的时间约束实体,以解决时序嵌入的相似性问题。本发明通过将安全事件分割成五元组并映射到极坐标向量当中去,使得模型能更加充分的捕捉实体和关系之间的交互信息,从而达到更准确的实体链接预测效果。

    一种知识图谱自动补全和更新的方法

    公开(公告)号:CN115033706A

    公开(公告)日:2022-09-09

    申请号:CN202210541065.1

    申请日:2022-05-17

    Abstract: 本发明公开了一种知识图谱自动补全和更新的方法,涉及了人工智能以及自然语言处理领域。本发明通过处理原始数据构建知识图谱和用于文本生成的神经网络模型,将知识图谱中相近的实体和关系或者知识图谱中缺失的三元组作为模型的输入,利用神经网络模型的输出更新存储到图数据库中达到知识图谱自动补全和更新的目的。本发明实现了智能问答领域的知识图谱中的三元组信息的补全和自动更新,可以为应用知识图谱的后续分析提供支撑。

    一种面向特定领域开放网络问句的文本分类方法

    公开(公告)号:CN111046179B

    公开(公告)日:2022-07-15

    申请号:CN201911222868.5

    申请日:2019-12-03

    Abstract: 本发明属于文本分类处理技术领域,具体涉及一种面向特定领域开放网络问句的文本分类方法。本发明克服了在执行一些特定领域的网络开放文本分类任务的情况下,缺乏足够可用的带类别标记的语料集,且网络文本信息量低、噪音大的问题,并为该领域的开放网络问句的层次分类提供了新方法。本发明利用了特定领域的开放网络问句及书面文本使领域的词嵌入表示更符合领域知识特征,同时,使用半监督方法加速分类模型训练并减少所需的标记样本。此外,还结合了条件概率实现了在多粒度层级的类别划分。本发明可以在问答系统、情感分析、领域知识库等领域辅助数据的提取、判别和构建。

    一种基于特征融合的静态恶意代码分类方法

    公开(公告)号:CN114510721A

    公开(公告)日:2022-05-17

    申请号:CN202210151968.9

    申请日:2022-02-18

    Abstract: 一种基于特征融合的静态恶意代码分类方法,它属于静态恶意代码特征提取和融合领域。本发明解决了传统静态恶意代码检测和分类方法仅考虑了单一维度特征的问题。本发明将hash值转换成像素矩阵生成灰度图像,再提取图像纹理全局特征和局部特征,并将全局特征和局部特征融合,在获取恶意代码图像全局特征信息的前提条件下突出局部特点。基于控制流程图的n‑gram方法对操作码进行特征提取,这种方法的检测颗粒度较小,与控制流程图相结合会得到代码上下文之间的关联,从而将操作码转换成特征向量形式。将两种特征向量融合成一个向量,弥补了在单一层面提取特征的局限性。本发明方法可以应用于对静态恶意代码进行分类。

    一种领域文本主题抽取方法

    公开(公告)号:CN112836507A

    公开(公告)日:2021-05-25

    申请号:CN202110039892.6

    申请日:2021-01-13

    Abstract: 本发明属于文本主题抽取技术领域,具体涉及一种领域文本主题抽取方法。本发明应用了统计学习方法中的LDA主题模型,并在LDA主题模型三层贝叶斯网络基础上提出增加审计方法层,形成四层贝叶斯网络。该模型认为文本由审计方法的多项分布构成,审计方法由主题的多项分布构成。首先分别生成审计方法、文本主题和词语的多项分布,然后由狄利克雷分布为主题的多项分布,审计方法的多项分布和词语的多项分布分配参数,利用吉布斯抽样计算得到真实的包含审计方法的主题分布参数。该方法相较于LDA主题模型,在提取出的主题中加入了审计方法的信息,降低了主题间重叠度过高的问题,同时也可以为四险一金领域知识图谱的审计工具集提供支持。

    一种基于机器学习的从半结构化文档中提取问答对的方法

    公开(公告)号:CN111078875A

    公开(公告)日:2020-04-28

    申请号:CN201911222877.4

    申请日:2019-12-03

    Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于机器学习的从半结构化文档中提取问答对的方法。本发明应用机器学习的方法,通过应用Apriori进行特征选择和朴素贝叶斯分类方法进行分类,得到半结构化文本中的答案句。本发明结合命名实体识别和依存句法分析理论,将答案句转为对应的问句。命名实体识别采用crf+BiLstm神经网络模型,识别答案句中的实体,补充到网络爬取的实体中。句法分析通过揭示句子中各个词之间的依存关系,从而在问句生成时替换依存于实体的词,得到合理的问句。本发明通过从半结构化文档中提取高质量的问答对,为以后构建问答系统奠定了良好的基础。

    一种基于结构化查询语言语句的源信息追踪方法

    公开(公告)号:CN102402615A

    公开(公告)日:2012-04-04

    申请号:CN201110434707.X

    申请日:2011-12-22

    Abstract: 本发明提供了一种基于结构化查询语言语句的源信息追踪方法。首先将SQL语句按其不同的结构进行分类,之后对不同类型的SQL语句进行逆向处理,在得到源信息后将源信息进行存储,并在源信息上再次执行原SQL语句,与之前得到的结果集进行对比,得出结论。该源信息查询方法已经通过实际数据进行了验证,验证结果证明该方法与其他数据血缘方法相比,可以在原有SQL的基础上,直接对SQL语句进行处理,将其有效的转化成源信息查询语句,并成功查找到对应的源信息。本发明提供的数据追踪方法适用于关系数据库中源信息的查询,可应用在各领域中对源信息进行的查询和存储。

    一种融合特征金字塔和自适应原型选择的图像分类方法

    公开(公告)号:CN118097216A

    公开(公告)日:2024-05-28

    申请号:CN202311760397.X

    申请日:2023-12-20

    Inventor: 申林山 冯祥 徐丽

    Abstract: 一种融合特征金字塔和自适应原型选择的图像分类方法,它属于深度学习和图像分类领域。本发明解决了在小样本图像分类任务中,由于难以学习到丰富的知识以及易出现过拟合导致分类效果差的问题。本发明方法为:步骤一、搭建FResNet网络,将训练集中的图像依次输入到FResNet网络内,利用训练集中的图像对FResNet网络进行训练;直至对训练集中图像的分类准确率达到设定的阈值时停止训练,获得训练好的FResNet网络;步骤二、将待分类图像输入训练好的FResNet网络,利用训练好的FResNet网络输出待分类图像的特征向量,再根据待分类图像的特征向量确定待分类图像所属的类别。本发明可以应用于小样本图像分类。

    一种基于Harris的数据增强图像分类方法及系统

    公开(公告)号:CN114022714B

    公开(公告)日:2024-04-16

    申请号:CN202111333621.8

    申请日:2021-11-11

    Abstract: 一种基于Harris的数据增强图像分类方法及系统,它属于数据处理技术与计算机视觉技术相结合的学科交叉领域。本发明解决了采用现有的数据增强方法获得的图像分类准确率低的问题。本发明通过采用Harris算法进行数据增强,使训练好的卷积神经网络提取图像信息特征的强大功能得以充分利用,提高了对图像分类的准确率、鲁棒性以及泛化性能;与现有的数据增强算法相比,在相同难度的图像分类任务中,本发明方法的收敛速度较快,算法的运行效率更高,总回报增多,能够有效进行训练数据集的遮挡,加大训练难度,使分类算法的准确率上升了3.86%,从而提高了算法的性能。本发明可以应用于图像分类领域。

    一种汉语自然语言文本的词语切分方法

    公开(公告)号:CN110969009B

    公开(公告)日:2023-10-13

    申请号:CN201911223545.8

    申请日:2019-12-03

    Abstract: 本发明属于自然语言文本处理技术领域,具体涉及一种汉语自然语言文本的词语切分方法。本发明基于无监督学习中的基于良好度量的方法设计,在其中加入了少量工作量的人工的步骤,即需要人工整理中心词,人工整理中心词的优点是使词表的质量和词语类别更加可控,进一步地,可以降低对语料词语分布特征的需求,特别适用于语料的词语分布不理想以及领域合成词的中心词数量较少的情况。本发明的词语切分方法适用于领域的自然语言文本,特别地,最适用于在领域合成词和非标准词较多的领域,其分词效果好于通用的开放域分词工具的效果,结果有益于进一步在相关领域自然语言处理的后续步骤,特别是在知识抽取或知识图谱中的应用中。

Patent Agency Ranking