一种基于内容地图的科技文献内容深度揭示方法

    公开(公告)号:CN111651562B

    公开(公告)日:2023-03-21

    申请号:CN202010504233.0

    申请日:2020-06-05

    Abstract: 本发明公开了一种基于内容地图的科技文献内容深度揭示方法,包括:对文本数据进行知识对象及其语义关系提取;多篇科技文献内容地图的构建;科技文献内容知识深度聚合。本发明的方法,能够将科技文献内容知识的组织方式由文献外部特征深入到内部特征,能够进行文献间隐性知识发现和知识间的推理,同时,能够在在平面空间和立体空间中,生成跨文献的知识簇和知识链,将文献间“游离态”的知识串联组织起来,实现知识间的有效协作和深度聚合,有助于解决科技文献查阅时的“信息迷航”以及科技文献间存在的“知识游离”问题。

    融合关联信息的程式语识别系统及方法

    公开(公告)号:CN114330338A

    公开(公告)日:2022-04-12

    申请号:CN202210037262.X

    申请日:2022-01-13

    Abstract: 本发明公开了融合关联信息的程式语识别系统及方法,其中的系统包括:基本特征提取模块,用于使用Torch中的embedding层生成词嵌入向量作为词性特征、GloVe词向量技术训练的特征向量作为语义特征,经过晚融合的词性特征和语义特征作为该模型的基本特征;关联信息提取模块,用于采用单词间的互信息和句子的依存句法关系作为识别程式语的关联信息;标签表示模块,用于表示标签。本发明通过词嵌入技术来表示特征向量,并融合了能够代表程式语特征的关联信息,使用图卷积神经网络获取更深层次的语义特征,最后考虑到标签之间含有依存关系,使用条件随机场模型进行标签解码,达到识别程式语的目的。

    一种基于滚动式协同训练的虚假评论识别方法

    公开(公告)号:CN111666480A

    公开(公告)日:2020-09-15

    申请号:CN202010523660.3

    申请日:2020-06-10

    Abstract: 本发明公开了一种基于滚动式协同训练的虚假评论识别方法,涉及虚假评论识别技术领域,该方法包括:获取评论文本,根据所述评论文本确定评论文本内容特征;获取评论文本对应的评论者信息,根据所述评论者信息确定评论者行为特征;根据评论文本内容特征和评论者行为特征进行虚假评论识别;输出虚假评论识别结果。本申请的虚假评论识别方法有效利用未标注样本辅助模型学习,同时融合情感及文本表征等多个特征,通过多特征融合协同训练来提高模型的识别性能,较传统虚假评论识别方法准确率提升了3.5%。

    一种制造企业多价值链协同数据空间集可信信息细化方法

    公开(公告)号:CN115375106A

    公开(公告)日:2022-11-22

    申请号:CN202210907018.4

    申请日:2022-07-29

    Abstract: 本发明实施例提供了一种制造企业多价值链协同数据空间集可信信息细化方法,包括以下步骤:获取制造企业多价值链协同数据空间集;根据制造企业多价值链协同数据空间集,进行可信信息细化流程分析;根据可信信息细化流程分析的结果,计算制造企业多价值链协同数据空间集可信信息细化收益;根据可信信息细化收益得到收益模型;根据收益模型得到制造企业多价值链协同数据空间集可信信息细化效用;利用可信信息细化效用构建效用模型;确定制造企业多价值链协同数据空间集可信信息细化效用约束;根据可信信息细化效用约束和效用模型建立最优效用模型;若效用不是最优,则重复以上步骤。为智能工厂数字集管理、知识服务、智能决策等提供有效支撑。

    一种网络舆情危机等级评价方法和装置

    公开(公告)号:CN111753093A

    公开(公告)日:2020-10-09

    申请号:CN202010627031.5

    申请日:2020-07-02

    Abstract: 本发明公开了一种网络舆情危机等级评价方法和装置,涉及网络信息技术领域,该方法包括:根据网络资源库中的网络资源进行舆情数据采集;得到相关舆情数据;针对获取的舆情数据建立评价指标体系,并对所述舆情数据进行量化处理,得到舆情数据的指标值;对评价指标体系中的评价指标进行筛选,去除重复的评价指标;通过危机等级评价模型对筛选后的舆情数据指标值进行分析确定舆情事件的危机等级。与现有的指标体系相比,本发明的指标体系更加的全面,并且,所有的指标都经过了相关性分析和主成分分析方法的筛选,从而保证整个指标体系中没有信息重叠问题。

    一种电力设备故障知识图谱构建方法

    公开(公告)号:CN111737496A

    公开(公告)日:2020-10-02

    申请号:CN202010604650.2

    申请日:2020-06-29

    Abstract: 本发明公开了一种电力设备故障知识图谱构建方法,包括:电力文本预处理;命名实体识别,对电力领域实体进行识别与抽取,通过CRF模型,在全局特征上获取局部特征,准确获取文本的最优序列标注;关系识别,通过分析句子间各成分间的依存关系来分析句子结构,通过对句子中的语法关系进行识别与定位,对句子依存关系进行分析;知识存储与可视化,通过将已识别的实体与关系进行知识聚合,构成RDF三元形式,并将知识导入图形数据库Neo4j中,进行知识储存与知识可视化。本发明的方法能够实现电力设备故障知识的提取与聚合,有助于快速、全面地构建电力设备故障知识图谱,有利于提高电力设备故障诊断的智能化水平。

    一种电网故障诊断中的数据流快速约简方法

    公开(公告)号:CN102279905B

    公开(公告)日:2014-11-12

    申请号:CN201110071071.7

    申请日:2011-03-19

    CPC classification number: Y04S10/522

    Abstract: 本发明是一种电网故障诊断中的数据流快速约简方法,其特点是包含有:对数据流数据进行预处理,利用模糊集理论对不同类型的数据进行模糊化,将属性值都转变为[0,1]之间的数值,然后通过阈值判断对数据流的节点进行约简,形成压缩距离差值表,并且对压缩距离差值表中的节点进行两两做差,将所得的差值进行与运算,得出约简后的属性,最后将约简后的节点数据送入故障分离器中,定位故障节点。通过对电网数据流的预处理和约简,能够有效的提高电网海量数据的实时故障诊断效率。

    低资源场景下基于稳健自学习策略的跨语言抽象摘要方法

    公开(公告)号:CN117271761A

    公开(公告)日:2023-12-22

    申请号:CN202311126324.5

    申请日:2023-09-01

    Inventor: 王敬东 常铎

    Abstract: 本发明涉及低资源场景下基于稳健自学习策略的跨语言抽象摘要方法,属于自然语言处理技术领域。本发明包括:构建汉语‑俄语跨语言文本摘要数据集;对汉语‑俄语语料进行数据预处理;利用Transformer框架的编码端得到初步的两种语言的嵌入矩阵;提出一种无监督的稳健自学习策略,可以显式地利用嵌入的结构相似性,不断迭代优化,学习到线性变换矩阵;采用曼哈顿范数(l1范数)进行优化,得到最优的映射矩阵,来形成更加细化与稳健的同一语义空间的跨语言词嵌入表示;将对齐后的信息送入Transformer的解码器端进行训练来生成目标语言的摘要。本发明可以更好表示两种语言文本间关系,帮助模型生成质量较高的摘要,同时由于此方法是完全无监督的,可以更好的应用于低资源语言或资源较少的语言,来提升他们跨语言摘要的效果。本发明在构建的中‑俄数据集上分别对不同的低资源场景和完整的数据场景下进行了实验,结果表明模型效果要优于基线方法,生成的摘要也更加精准和流利。

Patent Agency Ranking