-
公开(公告)号:CN118864016A
公开(公告)日:2024-10-29
申请号:CN202411337985.7
申请日:2024-09-25
Applicant: 厦门众联世纪股份有限公司 , 福州大学
IPC: G06Q30/0251 , G06F16/36 , G06F16/335
Abstract: 本发明公开一种用于广告推荐的知识图谱构建方法,包括以下步骤:S10、获取广告的历史投放数据,形成数据集,数据集中包含能够反映广告投放信息的多种广告特征;S20、本体构建,定义广告特征之间存在的链接关系;S30、区分定长特征、变长特征和混合特征;定长特征是,该广告特征在一种链接关系下只能链接到唯一的另一广告特征;变长特征是,该广告特征在一种链接关系下能够链接到多个不同的广告特征;混合特征是,该广告特征与其他广告特征之间存在约束关系;S40针对定长特征、变长特征和混合特征的特点分别采用不同方式进行知识抽取;S50、将各三元组构建形成知识图谱。本发明实现合理提取广告数据到知识图谱。
-
-
公开(公告)号:CN112348190B
公开(公告)日:2022-06-21
申请号:CN202011159784.4
申请日:2020-10-26
Applicant: 福州大学
IPC: G06N5/02
Abstract: 本发明涉及一种基于改进的嵌入模型SUKE的不确定知识图预测方法。基于已有的确定性嵌入模型DistMult提出SUKE模型。SUKE保留了知识的结构信息和不确定性信息,其内部包括评估器和置信度生成器两个组件,前者依据事实的结构特征和不确定特征评估事实的合理性,筛选出不合理的事实,从而获得候选事实。后者为候选事实生成置信度,表示实体发生特定关系的概率。评估器为每个三元组定义结构得分和不确定得分,用于事实合理性评估任务。此外,评估器引入了未知事实参与训练。置信度生成器为每个三元组生成置信度,用于置信度预测任务。本发明能够有效的完成不确定知识图的链路预测任务。
-
公开(公告)号:CN109783628B
公开(公告)日:2022-06-21
申请号:CN201910039057.5
申请日:2019-01-16
Applicant: 福州大学
IPC: G06F16/332 , G06F16/36
Abstract: 本发明涉及一种结合时间窗口和关联规则挖掘的关键词搜索KSAARM算法。考虑到知识图谱蕴含丰富的语义信息并且具有时效特性,所以该算法结合时间窗口挖掘出当前数据中蕴含的语义强关联,即实体间的强关联规则和属性间的强关联规则;在关键词检索阶段,首先根据这两类强关联规则对查询关键词进行扩展,接着将扩展后的查询关键词映射到模式层上,再次结合两类关联规则扩充查询类图,形成候选种子模型,通过评分函数对候选种子模型进行排序,然后将高评分的候选种子作为查询种子,并以此为指引在数据层上进行分布式搜索,得到查询结果。
-
公开(公告)号:CN112685609A
公开(公告)日:2021-04-20
申请号:CN202110001290.1
申请日:2021-01-04
Applicant: 福州大学
IPC: G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种结合平移机制与卷积神经网络的知识图谱补全方法,包括以下步骤:步骤S1:获取一个确定性知识库,并进行预训练或者随机初始化;步骤S2:结合平移机制与卷积神经网络,构建CTKE模型并训练;步骤S3:根据CTKE模型得到实体向量和关系向量,将CTKE模型学习到的实体向量和关系向量,在向量空间进行计算完成实体预测或关系预测,以完成知识库补全。本发明能够应对具有复杂关系的知识图谱,并且表现出强大的学习能力。
-
公开(公告)号:CN112541589A
公开(公告)日:2021-03-23
申请号:CN202011520861.4
申请日:2020-12-21
Applicant: 福州大学
Abstract: 本发明涉及一种基于AHE对齐超平面的文本知识嵌入方法,包括以下步骤:步骤S1:对数据集进行预训练词向量,获得文本描述的精确表示;步骤S2:采用AHE对齐超平面策略,将文本向量与内部向量对齐为统一的隐含层维度,并分别对头尾实体进行文本超平面投影,获得交互增强的表示向量,并将其应用至知识库基础模型中。解决了传统文本联合学习模型对文本描述引入的不精确性和不灵活性,进一步有效提高知识图谱补全效果。
-
公开(公告)号:CN111160536A
公开(公告)日:2020-05-15
申请号:CN202010002425.1
申请日:2020-01-02
Applicant: 福州大学
Abstract: 本发明涉及一种基于碎片化知识下的卷积嵌入表示推理方法,包括以下步骤:获取事实三元组;判断事实三元组中实体和关系是否已经训练;去掉头实体或者尾实体,使完整的事实三元组破坏并形成缺失事实三元组,并将其放入CE-RCF模型中计算得到评估结果,如果该评估结果大于设定阈值,则将事实三元组标记为已训练事实三元组;判断未训练事实三元组数量是否大于阈值,如果大于阈值则将全部事实三元组放入CE-RCF模型中进行参数训练,否则将当前事实三元组标记为未训练事实三元组;将未训练的事实三元组和已训练事实三元组共同取出并合并,输入CE-RCF模型进行训练或重新训练;将合并后的全部事实三元组标记为已训练事实三元组并存储,得到完善后的事实三元组。
-
公开(公告)号:CN111144570A
公开(公告)日:2020-05-12
申请号:CN201911372727.1
申请日:2019-12-27
Applicant: 福州大学
IPC: G06N5/02
Abstract: 本发明涉及一种联合逻辑规则和置信度的知识表示方法,针对实时流入的动态知识碎片,若其已经存在于现有知识库中,则利用知识库训练好的模型进行知识推理;否则将其存入缓存区;当缓存区内数据满足预设条件时,将缓存区内的知识碎片加入知识库中,并对知识库重新进行模型训练。其训练包括在知识库上使用规则挖掘算法挖掘出知识库的Horn逻辑规则,为每条规则计算规则PCA置信度;根据规则的置信度结合概率软逻辑计算新推出的事实三元组的置信度;将融合逻辑规则语义信息的三元组联合置信度共同嵌入,提高知识表示的性能。本发明实现了不确定推理在动态知识图谱下的知识推理。
-
公开(公告)号:CN106874426B
公开(公告)日:2019-12-31
申请号:CN201710057433.4
申请日:2017-01-23
Applicant: 福州大学
IPC: G06F16/22 , G06F16/2455 , G06F16/2453 , G06F16/2458
Abstract: 本发明涉及一种基于Storm的RDF流式数据关键词实时搜索方法,其特征在于:包括Storm实时处理、Redis分布式存储和Storm实时查询;Storm实时处理的具体内容为:Storm的Spout组件接收并处理RDF本体和实例数据文件流,将处理后的RDF本体和实例数据文件流分布式存储至Redis哈希表中;所述Storm实时查询的具体内容为:客户端发送实时查询请求,服务端接收客户端的查询请求后,先检查查询缓存中是否已存在该查询请求的查询结果,若存在,则复用缓存历史查询结果,执行增量更新查询算法,返回查询结果;若不存在,则服务端对查询请求进行实时计算,并返回查询结果。本发明支持对连续RDF数据流的进行实时查询,满足用户对RDF数据流实时查询的应用需求。
-
公开(公告)号:CN106528648B
公开(公告)日:2019-10-15
申请号:CN201610897778.6
申请日:2016-10-14
Applicant: 福州大学
IPC: G06F16/2458
Abstract: 本发明涉及一种结合Redis内存数据库的分布式RDF关键词近似搜索方法:首先结合RDF本体信息构建关键词集合对应的本体子图,利用语义评分函数对生成的本体子图进行排序;接着利用MapReduce计算框架实现分布式搜索,进行连接操作后返回Top‑k结果;如果返回的结果没有达到Top‑k,则对本体子图进行扩展,得到近似本体子图,再用语义相似度函数对近似本体子图进行排序,然后进行分布式近似搜索,直到返回Top‑k结果为止。本文算法解决了海量数据无法快速搜索和搜索效果不理想的问题,并且支持返回用户可能感兴趣的结果,具有深远的理论和实际意义。
-
-
-
-
-
-
-
-
-