一种基于主题标签的跨域推荐方法

    公开(公告)号:CN113761389A

    公开(公告)日:2021-12-07

    申请号:CN202110947405.6

    申请日:2021-08-18

    申请人: 淮阴工学院

    IPC分类号: G06F16/9536 G06F16/955

    摘要: 本发明公开了一种基于主题标签的跨域推荐方法,适用于普遍的跨域场景下用户推荐问题。包括如下步骤:输入用户标签数据集并提取所需集合;过滤标签集合T中低相关标签得到Ts;将标签信息进行低维下特征向量的融合得到Ts_model;通过LDA主题模型聚类Ts得到TFs_model;引入多域标签的依赖关系映射,生成跨域模型CTFs_model;加载CTFs_model,开放接口CTFs API处理终端请求,得到跨域行为特征处理结果集存于Web服务器并将相关推荐预测信息返回给调用终端。本发明结合改进的跨域场景下用户以及物品的属性特征信息识别技术,可有效获取一种准确度最高的目标用户对物品评分预测的结果集,使在跨域场景下对目标用户的评分预测结果更加准确,增加了对目标用户跨域推荐的使用价值。

    基于HDFS的分布式智慧校园文件管理系统优化方法及装置

    公开(公告)号:CN113760822A

    公开(公告)日:2021-12-07

    申请号:CN202110917880.9

    申请日:2021-08-11

    申请人: 淮阴工学院

    IPC分类号: G06F16/11 G06F9/48 G06F16/182

    摘要: 本发明公开了一种基于HDFS的分布式智慧校园文件管理系统构建方法及装置,本发明使用小文件合并关联算法,通过分析用户的操作日志信息,根据文件关联算法,计算得出不同文件之间关联的概率,并将符合条件的小文件进行合并;并采用数据封装方式,向智慧校园文件管理系统提供Web服务调用的接口,改变了传统高校存储海量数据的方式。本发明解决了学校教育资源小文件的规模越来越庞大,存储在HDFS中时,对NameNode的负载压力越来越大,导致文件存储、访问效率降低的问题;同时为智慧校园的研究和开发提供保证;减少了存储大量小文件后,文件元数据信息所占用的内存空间;提高了系统在存取小文件时的效率。

    一种基于数据挖掘的工程国家标准数据库自适应构建方法

    公开(公告)号:CN111931021A

    公开(公告)日:2020-11-13

    申请号:CN202010439242.6

    申请日:2020-05-22

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于数据挖掘的工程国家标准数据库自适应构建方法,使用网络爬虫技术与BloomFilter自适应算法相结合,通过选取最优的哈希函数个数,从获取到的国家规范链接数据集standard_URL中,快速判断链接是否已被爬取,找出新增的国家规范链接数据集update_URL。同时在网络爬虫技术的基础上,对非结构化建筑规范数据进行采集,其中包含文本数据集text和“图像”形式的“文本+表格”混合数据集img,然后利用图像识别技术,对混合数据集img中文本数据与表格数据分别处理,得到文本数据集Text与表格数据集table。本发明改变了传统查询国家标准规范的方式,方便审图专家快速查阅相关国家标准规范和建筑强条,可有效减少审图人员的工作量,节约大量时间。

    一种基于改进的卷积神经网络的施工图图元自适应识别方法

    公开(公告)号:CN111914612A

    公开(公告)日:2020-11-10

    申请号:CN202010436478.4

    申请日:2020-05-21

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于改进的卷积神经网络的施工图图元自适应识别方法,包括:采集施工图图纸文件D1,构成施工图图像数据集D4,进行预处理,得到数据集D5;对D5进行数据增强,使用LabelImg对数据增强后的数据集D6进行标注,将标注后的数据集D7分为训练集D8与测试集D9;使用BN算法和PReLU激活函数改进卷积神经网络,将D8输入预训练模型中进行训练,得到施工图图元自适应识别模型ARM;将D9输入ARM,输出图元识别结果集PT Result;开放施工图图元自适应识别接口ARM API,用户通过Web平台上传施工图图纸Drawing,ARM API对Drawing进行图元自适应识别,将识别出的图元信息Primitive Info返回Web平台。本发明可对施工图中的图元进行自适应识别,可识别多个目标,精准度高,提高了施工图图元的识别率。

    一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法

    公开(公告)号:CN111813950B

    公开(公告)日:2024-02-27

    申请号:CN202010429933.8

    申请日:2020-05-20

    申请人: 淮阴工学院

    摘要: 比传统人工设定更有效构建建筑领域知识图谱。发明公开了一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法,首先采集建筑领域实体、实体属性及语料,然后进行预处理,得到建筑实体识别模型标注数据集EntityData;利用数据集EntityData训练基于BERT‑BiLSTM‑CRF的自适应实体识别模型,得到建筑领域实体识别模型EntityModel;对建筑领域关系数据集预处理得到数据集RelationData;利用RelationData训练基于GRU的自适应关系抽取模型,得到建筑领域关系抽取模型RelationModel;最后分别通过EntityModel和RelationModel抽取出建筑领域文本数据集中的实体和属性,构建建筑领域知识图谱;用户通过Web平台输入施工(56)对比文件穆磊 等.基于BIM和知识图谱的消防智能审图研究.消防科学与技术.2019,第38卷(第12期),1765-1768.王磊 等.基于关系触发词与单层GRU模型的关系抽取方法.吉林大学学报(理学版).2020,第58卷(第01期),95-103.

    一种基于区块链互证和卷积神经网络的凭证式记账方法

    公开(公告)号:CN110188787B

    公开(公告)日:2020-11-03

    申请号:CN201910289748.0

    申请日:2019-04-11

    申请人: 淮阴工学院

    摘要: 本专利公开发明了一种基于区块链互证和卷积神经网络的凭证式记账方法,基于卷积神经网络来进行特征抽取并利用传统机器学习算法进行分类,最后使用区块链互证方式进行数据的整合并分布式存储。具体地,首先通过微信端接收用户发来的需要进行识别的照片信息,而后调用目标检测算法对图片中的人体进行识别和切割,随后通过训练好的神经网络进行特征提取并分类,最后利用互证投票的方式进行识别结果的二次验证,并将验证结果分布式存储在每个员工的手机内。本发明可以有效收集并识别人体的照片,并通过互证的方式准确地进行凭证式记账。

    一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法

    公开(公告)号:CN111813950A

    公开(公告)日:2020-10-23

    申请号:CN202010429933.8

    申请日:2020-05-20

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于神经网络自适应寻优调参的建筑领域知识图谱构建方法,首先采集建筑领域实体、实体属性及语料,然后进行预处理,得到建筑实体识别模型标注数据集EntityData;利用数据集EntityData训练基于BERT-BiLSTM-CRF的自适应实体识别模型,得到建筑领域实体识别模型EntityModel;对建筑领域关系数据集预处理得到数据集RelationData;利用RelationData训练基于GRU的自适应关系抽取模型,得到建筑领域关系抽取模型RelationModel;最后分别通过EntityModel和RelationModel抽取出建筑领域文本数据集中的实体和属性,构建建筑领域知识图谱;用户通过Web平台输入施工图审查点,根据用户输入的施工图审查点挖掘知识库中的隐藏关系,并将挖掘出的专家意见信息Recom返回Web平台。本发明采用自适应调参,相比传统人工设定更有效构建建筑领域知识图谱。

    一种基于数据挖掘的工程国家标准数据库自适应构建方法

    公开(公告)号:CN111931021B

    公开(公告)日:2024-07-16

    申请号:CN202010439242.6

    申请日:2020-05-22

    申请人: 淮阴工学院

    摘要: 发明公开了一种基于数据挖掘的工程国家标准数据库自适应构建方法,使用网络爬虫技术与BloomFilter自适应算法相结合,通过选取最优的哈希函数个数,从获取到的国家规范链接数据集standard_URL中,快速判断链接是否已被爬取,找出新增的国家规范链接数据集update_URL。同时在网络爬虫技术的基础上,对非结构化建筑规范数据进行采集,其中包含文本数据集text和“图像”形式的“文本+表格”混合数据集img,然后利用图像识别技术,对混合数据集img中文本数据与表格数据分别处理,得到文本数据集Text与表格数据集table。本发明改变了传统查询国家标准规范的方式,方便审图专家快速查阅相关国家标准规范和建筑强条,可有效减少审图人员的工作量,节约大量时间。