基于多粒度采样的算力网络多维资源联合预测方法及系统

    公开(公告)号:CN118555216A

    公开(公告)日:2024-08-27

    申请号:CN202411008898.7

    申请日:2024-07-26

    IPC分类号: H04L41/147 H04L41/16

    摘要: 本发明提供一种基于多粒度采样的算力网络多维资源联合预测方法及系统,涉及算力网络技术领域,该方法包括以下步骤:对于算力网络中的每个算力节点,基于各项资源在多个历史时间点历史状态数据,构建每项资源的历史状态信息序列;对每项资源的历史状态信息序列采用多个采样间隔进行采样,对于每项资源构建多个采样序列;对于同种资源的采样序列进行注意力聚合,得到每个采样序列的第一聚合向量;对于相同采样间隔进行采样的不同种资源的采样序列对应的第一聚合向量进行注意力聚合,得到对应每个第一聚合向量的第二聚合向量;将同种资源的采样序列对应的第二聚合向量输入到预设的预测模型中,得到该种资源预测的资源状态。

    多源社交媒体自然灾害知识图谱实时构建方法及装置

    公开(公告)号:CN116737944A

    公开(公告)日:2023-09-12

    申请号:CN202310520479.0

    申请日:2023-05-09

    发明人: 邵蓥侠 王海江

    摘要: 本发明提供一种多源社交媒体自然灾害知识图谱实时构建方法及装置,包括:获取多源社交媒体自然灾害本体;基于定时技术实时爬取多源社交媒体中的灾害数据,并进行数据清洗和预处理;利用序列标注模型识别灾害数据中的实体,根据灾害属性特点采用规则化方法提取用户发表的灾害信息;采用TF‑IDF的方法提取灾害发生时的热议词;通过余弦相似度进行聚类,提取灾害发生时的热议话题和灾害科普信息;将提取得到的灾害实体、关系和属性与灾害官网得到的灾害实体与属性进行知识融合,得到多源社交媒体自然灾害知识图谱并存入Neo4j图数据库进行展示。本发明方法构建的知识图谱可以展示灾害之间、灾害内部以及灾害相关的社会舆情,数据来源多元且实时性高。

    一种基于图卷积网络和信息融合的实体对齐方法及装置

    公开(公告)号:CN116561346A

    公开(公告)日:2023-08-08

    申请号:CN202310819919.2

    申请日:2023-07-06

    摘要: 本发明提供一种基于图卷积网络和信息融合的实体对齐方法及装置,所述方法的步骤包括:获取文献基础数据,文献基础数据包括文献中的实体之间的关系、实体对应的属性和实体在文献中的描述语句;基于文献中的实体之间的关系构建第一输入矩阵,将第一输入矩阵输入到预设的第一模型中,第一模型输出第一嵌入矩阵;基于实体对应的属性构建第二输入矩阵,将第二输入矩阵输入到预设的第二模型中,第二模型输出第二嵌入矩阵;将实体在文献中的描述语句输入到第三模型中,第三模型输出第三嵌入矩阵;基于第一嵌入矩阵、第二嵌入矩阵和第三嵌入矩阵构建联合矩阵;将联合矩阵中的每一行构建为对应一个实体的实体向量,基于实体向量之间的距离进行实体对齐。

    用于流处理系统的算子并发度调优方法及装置

    公开(公告)号:CN116225696A

    公开(公告)日:2023-06-06

    申请号:CN202310068747.X

    申请日:2023-02-06

    IPC分类号: G06F9/50

    摘要: 本申请提供一种用于流处理系统的算子并发度调优方法及装置,所述方法包括:对处于背压状态的流处理任务进行超量扩容调优处理,以使各个所述流处理任务当前均处于待缩容状态并作为目标流处理任务;根据历史调优信息对所述流处理系统中的抽象算子进行训练以生成GP模型,根据所述GP模型中的历史估计负载和所述目标流处理任务的当前工作负载计算得到工作负载适应性得分和自设计WOP采集函数;根据所述GP模型和所述自设计WOP采集函数确定所述抽象算子的最优并发度。本申请能够不依赖调优内置规则,充分利用过往调优经验,同时通过超量分配计算资源以解除数据堆积再缩容的策略有效地提升了资源重部署的效率,从而能够在生产环境中真正地落地实现。

    文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254655B

    公开(公告)日:2021-09-17

    申请号:CN202110757754.1

    申请日:2021-07-05

    摘要: 本发明提供了一种文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取多个话题类别及其对应的多个词和多个文档;统计每个话题类别的所有文档中包含该话题类别对应的每个词的第一文档数量和所有话题类别的所有文档中包含每个话题类别的每个词的第二文档数量;计算每个话题类别的每个词的第一文档数量与第二文档数量的比值,作为词对话题覆盖率;若词的词对话题覆盖率大于设定阈值,将该词选作相应话题类别的特征词,得到相应类别特征词袋;对待分类文档分词,以得到待分类文档的词袋模型;计算待分类文档的词袋模型与各类别特征词袋的相似度;根据各相似度确定该待分类文档的类别。通过上述方案能够利用较少标注完成文本分类任务。

    专利文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254656A

    公开(公告)日:2021-08-13

    申请号:CN202110763595.6

    申请日:2021-07-06

    摘要: 本发明提供了一种专利文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取专利文本的字向量表示;利用卷积神经网络提取字向量表示中的短语特征;利用长短时记忆网络提取字向量表示中的上下文特征;利用注意力层为长短时记忆网络输出的隐层特征向量添加不同权重,以突出区分度较大部分并降低文本结构和重复度较高结构权重,得到第一注意力层的输出;利用全连接层将第一注意力层的输出压缩为与短语特征的维度匹配的特征向量;将专利文本的短语特征和上下文特征连接得到输入向量,利用第二注意力层为输入向量添加注意力权重,以减少融合过程信息损失,得到融合特征向量,用于对专利文本分类。通过上述方案能够提高专利文本分类准确性。

    文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254655A

    公开(公告)日:2021-08-13

    申请号:CN202110757754.1

    申请日:2021-07-05

    摘要: 本发明提供了一种文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取多个话题类别及其对应的多个词和多个文档;统计每个话题类别的所有文档中包含该话题类别对应的每个词的第一文档数量和所有话题类别的所有文档中包含每个话题类别的每个词的第二文档数量;计算每个话题类别的每个词的第一文档数量与第二文档数量的比值,作为词对话题覆盖率;若词的词对话题覆盖率大于设定阈值,将该词选作相应话题类别的特征词,得到相应类别特征词袋;对待分类文档分词,以得到待分类文档的词袋模型;计算待分类文档的词袋模型与各类别特征词袋的相似度;根据各相似度确定该待分类文档的类别。通过上述方案能够利用较少标注完成文本分类任务。

    一种基于语义增强机制的关系抽取方法及系统

    公开(公告)号:CN117195895A

    公开(公告)日:2023-12-08

    申请号:CN202311115750.9

    申请日:2023-08-31

    摘要: 本发明提供一种基于语义增强机制的关系抽取方法及系统,所述方法的步骤包括:基于预设的编码模型对检测语句进行编码,得到初始语句向量,所述初始语句向量中包括对应检测语句中的每个词语的初始词向量;基于预设的主体识别模块识别初始语句向量中的可能主体词向量,并输入到语义增强模块中;基于语义增强模块的分类层对可能主体词向量进行预分类,并构建对于每个可能主体词向量的相似词表;基于可能主体词向量的预分类结果和相似词表构建对于每个主体词向量的增强词向量;基于可能主体词向量构建主体语句向量,基于增强词向量构建增强语句向量,将初始语句向量、主体语句向量和增强语句向量输入到预设的客体与关系识别模块,得到关系分类结果。

    科技论文数据文本语义特征提取方法、系统及存储介质

    公开(公告)号:CN114818737B

    公开(公告)日:2022-11-18

    申请号:CN202210745539.4

    申请日:2022-06-29

    摘要: 本发明提供一种科技论文数据文本语义特征提取方法、系统及存储介质,所述方法包括:获取科技论文的文本信息,并基于获取到的科技论文的文本信息构建实体关系图,所述文本信息包括论文标题以及关键词,实体关系图中的节点为论文标题或关键词,实体关系图中的边为节点之间的关联关系;基于获取到的科技论文的文本信息提取语义特征,得到语义特征矩阵;基于实体关系图确定原始邻接矩阵,将语义特征矩阵及所述原始邻接矩阵输入至图网络模型,得到空间特征矩阵;将语义特征矩阵与空间特征矩阵进行特征融合,得到科技论文的最终语义特征。该特征提取方法在提取科技论文语料的语义特征的基础上,利用知识图谱的空间关联,可较好的提取到科技论文的语义特征。