一种知识图谱嵌入方法
    1.
    发明公开

    公开(公告)号:CN117744777A

    公开(公告)日:2024-03-22

    申请号:CN202311744192.2

    申请日:2023-12-15

    Abstract: 本发明属于计算机存储技术领域,具体涉及一种知识图谱嵌入方法,包括:计算三元组集合中各节点的重要性评估指标的取值,并基于每种评估指标在各节点上的取值计算该评估指标的信息熵,以用于计算该评估指标的权重;将每个节点的各评估指标取值分别与对应权重做内积,计算该节点对应的各内积加和,作为该节点的重要性得分;根据重要性得分降序遍历节点,根据锚点分布密度确定预设数目的锚点;初始化编码参数,对每个节点的多维标记信息进行编码,包括最近锚点序列、锚点距离、上下文关系和一跳邻居对每个节点进行标记;之后对三元组集合中每个实体节点对应构建三元组负样本集合,进行节点嵌入向量编码训练。本发明在保证精度的同时减少存储开销。

    一种基于RDMA的非易失内存系统的通信方法及服务器

    公开(公告)号:CN112667416B

    公开(公告)日:2024-02-27

    申请号:CN202011564580.9

    申请日:2020-12-25

    Abstract: 本发明公开了一种基于RDMA的非易失内存系统的通信方法及服务器,即提供一种基于RDMA技术和NVM的数据通信方法,该方法包括:服务器以日志结构的方式在非易失内存中维护数据的多个版本,对象的多个版本组成链表,链表头结点被哈希表索引。客户端使用RDMA write写数据,服务器使用后台线程进行数据完整性验证和持久化,通过一致性感知的持久化保证数据在读之前完整持久化,进而保证强一致性。本发明还提供了实现上述方法的系统。本发明有效地保证了基于RDMA的非易失内存系统的数据强一致性,同时保证在写为主的场景下的高性能和高可扩展,避免了数据较大时CRC校验引起的读性能降级。

    基于图表示学习的目标特征信息提取方法及系统

    公开(公告)号:CN117272016A

    公开(公告)日:2023-12-22

    申请号:CN202311002507.6

    申请日:2023-08-08

    Abstract: 本发明提供一种基于图表示学习的目标特征信息提取方法及系统,方法应用于NUMA架构,包括:确定包含目标信息的图数据;按照图数据顶点度的降序重新组织图数据,再合并相同顶点度的顶点以得到对应的顶点块,记录每个度数对应顶点块的起始偏移量和顶点块内每个顶点的一阶邻居顶点,以压缩稀疏块的格式将图数据存储到内存中;在当前NUMA节点读取本地和/或远端内存存储的稀疏矩阵,将读取的稀疏矩阵与本地内存存储的稠密矩阵相乘,并将相乘得到的中间矩阵写入本地内存,最后将各节点上存储的中间矩阵合并得到目标的特征信息;通过熵感知的线程分配策略为稀疏矩阵与稠密矩阵乘法的并行计算进行任务分配。本发明提高了图表示学习目标特征提取效率。

    实现固态硬盘公平性的请求处理方法、装置及电子设备

    公开(公告)号:CN116643693A

    公开(公告)日:2023-08-25

    申请号:CN202310515667.4

    申请日:2023-05-09

    Abstract: 本发明提供一种实现固态硬盘公平性的请求处理方法、装置及电子设备,包括:确定I/O序列;根据I/O序列的强度、写请求比率以及重访问率确定当前到达SSD的请求被旁路至SSD后端的概率,以确定是否将当前到达SSD的请求旁路至SSD后端,若被旁路至SSD后端,设置其在SSD后端中的优先级,使其优先被执行,从而最大化利用SSD的空间资源和带宽资源,保障SSD公平性;I/O序列强度与I/O序列的各个请求大小和到达时间有关,表示请求在预设时间内的数据量,重访问率反映I/O序列内所有请求在一段时间内重新访问相同地址的比率。本发明让缓存和TSU之间学会相互“取舍”和“牺牲”,从而实现SSD内端到端延迟上公平性的持续保障。

    一种基于I/O调度的多任务外存模式图处理方法

    公开(公告)号:CN109522102B

    公开(公告)日:2022-12-02

    申请号:CN201811053424.9

    申请日:2018-09-11

    Abstract: 本发明公开了一种基于I/O调度的多任务外存模式图处理方法,包括:将图数据进行流式分区得到图分区,将图分区均衡地置于多个外存设备中,基于I/O调度从多个外存设备中选取目标外存设备,并将目标外存设备中图处理任务尚未访问的图分区作为指定分区;根据指定分区的同步字段判断其是否未被映射到内存中,若是,则将指定分区从外存设备映射到内存中,并更新指定分区的同步字段;否则,直接通过指定分区映射到内存的地址信息进行图分区数据的访问。本发明通过I/O调度,选择任务数最少的外存设备访问,以此控制访问外存图分区数据的顺序,平衡I/O压力;通过设置同步字段实现图分区数据的共享,减少相同图分区的重复加载,以此减少I/O总带宽量,提升I/O效率。

    基于差量压缩的重删系统中的碎片重写方法及控制器

    公开(公告)号:CN115328703A

    公开(公告)日:2022-11-11

    申请号:CN202211034878.8

    申请日:2022-08-26

    Abstract: 本发明公开了一种基于差量压缩的重删系统中的碎片重写方法及控制器,属于数据存储技术领域,包括:对于存储数据块的每一个内存分段,统计各容器被其中重复数据块和差量数据块引用的次数,以筛选出被引用次数最大的T个容器,将当前内存分段中引用所筛选容器的重复数据块和差量数据块标记为非碎片化数据块,将引用其余容器的自重复数据块和差量数据块标记为碎片化数据块;进一步结合容器的稀疏性、模拟恢复缓存和滑动窗口识别数据块是否为碎片;遍历数据块,若为非碎片化的重复数据块,则进行去重;若为非碎片化的差量数据块,则进行差量压缩;若为碎片化数据块或非重复数据块,则重写。本发明能够在保证去重率的情况下提高系统恢复性能。

    一种分布式存储系统及其副本选择方法

    公开(公告)号:CN115190135A

    公开(公告)日:2022-10-14

    申请号:CN202210768871.2

    申请日:2022-06-30

    Abstract: 本发明公开了一种分布式存储系统及其副本选择方法,属于分布式存储技术领域,在每个边缘服务器中设置Actor网络来快速计算每个边缘服务器的评分,在云端部署Critic网络以综合考虑所有Actor网络的信息进行联合的动作评价;且Actor网络基于对应的Critic网络输出的评价结果进行训练,Critic网络基于从经验池中随机采样得到的数据进行训练;Actor网络和Critic网络的训练过程相互独立且持续进行,从而能够在每一时刻均对各边缘服务器的服务质量进行准确评分,并通过在服务器之间维护一份服务器排名并分发给客户端的方式,使得副本选择具有完整的服务器状态信息且没有转发延迟开销,能够更好地适应边缘环境中的副本选择,降低边缘环境中请求处理延迟,实现性能和可靠性的兼顾。

    卷积神经网络加速引擎、卷积神经网络加速系统及方法

    公开(公告)号:CN111178519B

    公开(公告)日:2022-08-02

    申请号:CN201911377012.5

    申请日:2019-12-27

    Abstract: 本发明公开了一种卷积神经网络加速引擎、卷积神经网络加速系统及方法,属于异构计算加速领域,引擎包括:全局缓存和物理PE矩阵;物理PE矩阵包括多个物理PE单元,物理PE单元用于执行行卷积操作以及相关的部分和累加操作;XY互联总线用于将输入特征图像数据、输出特征图像数据和卷积核参数从全局缓存传输到物理PE矩阵上,或者将物理PE矩阵产生的操作结果传输到全局缓存中;邻接互联总线用于在同一列物理PE单元之间传输中间结果;系统包括:3D‑Memory,其中每个Vault单元的内存控制器中集成了卷积神经网络加速引擎,用于完成卷积神经网络计算任务的一个子集;方法在系统的基础上进行逐层优化。本发明能够提高卷积神经网络的性能和能耗。

    一种基于BFS森林的社交网络中的知识图谱数据布局方法

    公开(公告)号:CN109271478B

    公开(公告)日:2021-07-27

    申请号:CN201811082264.0

    申请日:2018-09-17

    Abstract: 本发明公开了一种基于BFS森林的社交网络中的知识图谱数据布局方法,包括:对社交网络中的知识图谱进行一次全图的全局BFS遍历,得到全局BFS序列;将当前限长BFS子树的起始点初始化为全局BFS序列的起始序号;从起始点出发,使用限长BFS遍历社交网络中的知识图谱,直至图中所有节点都被遍历,最终得到BFS森林序列;利用所述BFS森林序列对社交网络中的知识图谱的节点进行更新,知识图谱数据布局结束。本发明使用BFS森林去遍历全图,限长BFS子树的局部性已经符合限长图遍历算法需求;以全局BFS序列作为“BFS森林”起始点选择依据,使BFS子树起始点的选择更加符合限长图遍历的需求,使多个BFS子树组成的序列满足整体顺序性,提高了算法执行效率。

    一种基于索引定位的图计算系统的外存访问方法

    公开(公告)号:CN109522428B

    公开(公告)日:2020-11-24

    申请号:CN201811082365.8

    申请日:2018-09-17

    Abstract: 本发明公开了一种基于索引定位的图计算系统的外存访问方法,包括:将完整的图数据分割成多个子图;对各个子图的边分别按照源顶点编号和目标顶点编号进行排序;将排序后的各个子图写入外存文件中,并分别为源顶点编号和目标顶点编号建立索引;从索引定位的载入方式和访问完整数据的载入方式中选择最优载入方式;以最优载入方式,将外存中各个子图载入内存。本发明对外存数据结构重新设计,改进数据加载方式,使系统能够在载入之前分析外存中的有效数据,显著减少I/O数据量和随机访问次数;分析访问完整数据方式与索引定位方式的时间开销,动态判断系统的最优数据载入方式,降低数据加载的时间开销。

Patent Agency Ranking