一种基于新词识别的化工领域分词方法

    公开(公告)号:CN115146632B

    公开(公告)日:2024-07-19

    申请号:CN202210716224.7

    申请日:2022-06-23

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于新词识别的化工领域分词方法,通过结合内部凝固度、聚集性规则以及新词识别模型来构建新词集合,将得到的新词集合对一次分词结果进行细化分词,获得最后的分词结果。包括下列步骤:S1、对获取的化工文本进行预处理操作获得切分词语集;S2、根据内部凝固度和预设的阈值,从多个切分词语集中获取预设数目的切分词语,采用符合聚集性规则构建候选新词集;S3、将候选新词语的统计量特征作为自变量进行训练新词识别模型;S4、将候选新词集中的候选新词语输入模型,进行成词判断,返回新词集合;S5、利用新词集合对一次分词结果进行细化分词,得到分词结果。本发明提出的构建新词集合方法以及细化分词模块能进一步提高分词准确率。

    一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法

    公开(公告)号:CN110287334B

    公开(公告)日:2023-12-01

    申请号:CN201910511427.0

    申请日:2019-06-13

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于实体识别和属性抽取模型的学校领域知识图谱构建方法。首先对学校领域问答对数据集预处理得到实体识别模型标注数据集EntityData;利用数据集EntityData训练基于BERT‑BiLSTM‑CRF的实体识别模型,得到学校领域实体识别模型SchoolEntityModel;然后对学校领域问答对数据集预处理得到属性抽取模型标注数据集AttributeData;利用数据集AttributeData训练基于BERT的属性抽取模型 ,得 到 学 校 领 域 属 性 抽 取 模 型SchoolAttributeModel;最后分别通过SchoolEntityModel和SchoolAttributeModel抽取出问句对数据集中的实体、属性和属性值,从而建立知识三元组,构建学校领域知识图谱。本发明方法可有效构建学校领域知识图谱。

    一种基于VGG16的CNN-SVM手写签名识别方法

    公开(公告)号:CN110399815B

    公开(公告)日:2023-09-26

    申请号:CN201910629487.2

    申请日:2019-07-12

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于VGG16的CNN‑SVM手写签名识别方法,步骤一:标签化处理手写签名图像数据集;步骤二:对数据集依次通过图像灰度化、二值化和尺寸归一化进行预处理;步骤三:采用Kaggle公司的公用数据集ImageNet训练神经网络模型VGG16得到权重集;步骤四:将权重集迁移至CNN并训练,得到初始特征矩阵;步骤五:将初始特征矩阵经过PCA降维后输入SVM进行训练,得到手写签名图像识别结果。本发明基于VGG16改进了CNN‑SVM,有效的提升了手写签名识别效果,增加了图纸签名的使用价值。

    基于BiLSTM与知识图谱的建筑规范审查方法与系统

    公开(公告)号:CN114880468A

    公开(公告)日:2022-08-09

    申请号:CN202210421056.9

    申请日:2022-04-21

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于BiLSTM与知识图谱的建筑规范审查方法与系统,其中方法包括:1、对标准施工图审查规范条文进行规范预处理和BIO标注,获取标注数据集StandData;2、使用StandData训练基于BERT嵌入BiLSTM‑CRF神经网络模型,得到施工图审查规范实体属性识别模型SubModle;3、对待审查施工图的规范约束条文进行处理后输入SubModle;经viterbi解码并进行实体属性抽取,构成实体属性集EnityData;4、对EnityData进行关系抽取,建立规范约束文本的三元组列表,使用Neo4j建立施工图审查规范知识图谱;5、将待审查BIM施工图文件与施工图审查规范知识图谱进行规范匹配得到审查结果。该审查方法能够实现智能审查,提高了建筑施工图的审查效率。

    一种基于全局信息和位置嵌入的场景图生成方法

    公开(公告)号:CN113836339A

    公开(公告)日:2021-12-24

    申请号:CN202111021629.0

    申请日:2021-09-01

    申请人: 淮阴工学院

    摘要: 本发明涉及计算机视觉技术领域,公开了一种基于全局信息和位置嵌入的场景图生成方法,基于大型数据集中的图像,由Faster‑RCNN得到高级特征图和每个实体信息并且对目标位置编码;将特征图和实体信息拼接的特征通过基于自注意力机制的网络得到节点间与其他目标的信息连接;利用LSTM的注意力网络得到目标上下文信息;构建边上下文生成的解码信息和目标图关系的生成融合方式;通过关系计算得到最终场景图。与现有技术相比,本发明将目标特征融入原始图像的视觉信息的方法,加入位置编码信息,连接全局信息和加权信息,提升整体视觉特征对于单一目标的影响,提高了模型推理时对于场景中主要目标的关注度和主宾分类的合理性,召回率有明显提升。

    一种基于SSD模型的建筑图纸非构件识别方法

    公开(公告)号:CN109117715A

    公开(公告)日:2019-01-01

    申请号:CN201810685551.4

    申请日:2018-06-27

    申请人: 淮阴工学院

    IPC分类号: G06K9/00 G06K9/66

    摘要: 本发明公开了一种基于SSD模型的建筑图纸非构件识别方法,首先使用Python的渲染库MuPDF将建筑图纸从PDF格式转为JPG格式,同时通过灰度化、膨胀腐蚀等方法对建筑图纸进行预处理。然后按照不同的衰减学习率,采用SSD算法对预处理后的建筑图纸进行训练,比较不同衰减学习率下模型的收敛速度及识别准确率,获得最优非构件检测模型集。本发明方法有效的改进了建筑图纸的非构件检测方法,使得训练的收敛速度加快,同时提高了建筑图纸中非构件的识别准确率,增加非构件检测模型的使用价值。

    一种基于知识图谱的专家组合推荐方法

    公开(公告)号:CN109062961A

    公开(公告)日:2018-12-21

    申请号:CN201810677224.4

    申请日:2018-06-27

    申请人: 淮阴工学院

    IPC分类号: G06F17/30 G06K9/62

    CPC分类号: G06K9/6217

    摘要: 本发明公开了一种基于知识图谱的专家组合推荐方法,本发明主要是基于已经构建好的领域知识图谱,结合了相似思想和关联挖掘。对历史专家审查数据进行处理,首先使用FP‑Growth得到概率逻辑数据制定知识图谱,再通过相似度算法排除差异项,提取与推荐内容相近项,然后提取专家并根据规则进行组合,根据关系知识设计了一种通过频繁项和置信度来评估组合的优异的方法。本发明方法有效的推荐了一种评分最高的图审专家组合,使得专家协同审查效率提高,并增加了历史项目审查专家集数据的使用价值。

    一种基于自编码机和聚类的混合推荐方法

    公开(公告)号:CN108491431A

    公开(公告)日:2018-09-04

    申请号:CN201810135027.X

    申请日:2018-02-09

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于自编码机和聚类的混合推荐方法,本发明将用户评分数据和用户人口统计学数据结合,经过归一化处理,再利用自编码机提取用户特征数据,接着使用K-means++聚类方法对用户聚类,当用户有推荐需求时,将待推荐用户的评分数据和人口统计学数据结合,归一化处理后再利用自编码机提取待推荐用户特征,再使用K-means++聚类方法对待推荐用户分类,最后使用最适合该类别的推荐方法对用户进行推荐。本发明弥补了现有推荐方法在稀疏矩阵上表现不佳的状况,有效的提高了推荐的准确性。