-
公开(公告)号:CN114679184A
公开(公告)日:2022-06-28
申请号:CN202210373970.0
申请日:2022-04-11
Applicant: 哈尔滨工业大学 , 北京诺司时空科技有限公司
Abstract: 一种时序数据库的数据压缩方法及系统,具体涉及一种时序数据库内的数据压缩方法及系统,本发明为解决时序数据库中压缩算法效率低的问题,利用时序数据库的压缩算法提取原始时序数据,原始时序数据包括整型数据和浮点数据;计算整型数据的delta数组;建立回归模型,设置权重因子为10,将delta数组输入回归模型内进行训练,得到训练好的回归模型;再将delta数组输入训练好的回归模型内,得到整型数据数值预测值;将整型数据数值预测值与真实值作差,得到误差结果;采用ZigZag变换对误差结果进行变换,并利用哈夫曼编码将变换后的误差结果进行保存;对浮点数据进行精度缩减,并采用异或运算进行压缩。属于计算机技术领域。
-
公开(公告)号:CN114637775A
公开(公告)日:2022-06-17
申请号:CN202210319758.6
申请日:2022-03-29
Applicant: 哈尔滨工业大学
IPC: G06F16/2453 , G06N5/00 , G06N7/00 , G06N3/08
Abstract: 基于蒙特卡洛树搜索和强化学习的查询优化系统、方法及设备,属于计算机技术领域。为了解决现有的NEO查询优化方法存在兼容性弱和稳定性差的问题,本发明的系统采用与NEO查询优化模型相同的框架,其中价值模型单元:基于价值模型利用查询计划对应的特征预测查询计划的开销;价值模型为神经网络模型;价值模型的输入为一棵向量树,用于表示需要估计开销的查询计划,向量树的拓扑结构为二叉树结构,各节点编码按照树的层序遍历顺序依次拼接;节点的节点特征由节点信息的编码组成;查询计划搜索单元采用蒙特卡洛树搜索方法,根据查询计划‑>时间开销的预测做查询计划搜索,从搜索空间中生成一个执行计划。主要用于计算机中的查询优化。
-
公开(公告)号:CN116841987A
公开(公告)日:2023-10-03
申请号:CN202310830704.0
申请日:2023-07-07
Applicant: 哈尔滨工业大学
IPC: G06F16/21 , G06F16/2455 , G06F16/25 , G06F9/50 , G06F9/54
Abstract: 多嵌入式数据库缓冲区大小协调优化方法及系统,涉及数据库技术领域,针对现有技术中对嵌入式数据库优化时,往往是逐个进行优化,这一过程在同一个系统中重复执行多次,不但浪费时间且使每一个数据库的缓存大幅增长,导致其他程序运行时,由于内存不足,使得其他程序无法运行的问题,本申请针对嵌入式数据库轻量级的特点,对所有的嵌入式数据库进行统一的优化而不是每个数据库分别优化,提升了优化效率,避免了逐个优化导致的时间浪费。并且本申请通过缩小子函数,将缓冲区按排序恢复到默认大小,以此帮助系统渡过内存使用的高峰期,进而解决了数据库的缓存大幅增长,导致其他程序运行时,由于内存不足,使得其他程序无法运行的问题。
-
公开(公告)号:CN116450608A
公开(公告)日:2023-07-18
申请号:CN202310399085.4
申请日:2023-04-14
Applicant: 哈尔滨工业大学
IPC: G06F16/21 , G06F16/22 , G06F16/2455 , G06N3/0442
Abstract: 一种基于缓存与深度学习的索引推荐方法及系统,具体涉及一种基于缓存数据库与深度学习的计算机数据库的索引推荐方法及系统,为解决数据查询时计算机数据库的索引推荐方法未利用历史数据,且索引推荐算法无法判断计算机某个列表中特定列是否需要创建索引,导致查询准确率比较低的问题。将编码后的计算机数据库的工作负载和索引配置合并,得到特征向量;将计算机数据库对应的列和数据插入建立的缓存数据库内进行存储;将特征向量输入基于长短期记忆网络建立的数据库调优模型中,结合缓存数据库,输出向量B,若向量B中第i位元素为1,则在计算机数据库列表第i列创建索引,否则不创建索引,根据创建索引的列完成数据查询。属于索引推荐领域。
-
公开(公告)号:CN116345469A
公开(公告)日:2023-06-27
申请号:CN202310386777.5
申请日:2023-04-12
Applicant: 哈尔滨工业大学
Abstract: 一种基于图神经网络的电网潮流调整方法,属于电网控制技术领域。为了解决目前的人工调整电网潮流的方式存在耗费人力资源且速度很慢的问题。本发明利用图神经网络模型对电网异构图节点的电网数据进行图嵌入处理;然后针对图嵌入处理后不收敛的电网数据,基于强化学习的方式进行电网参数调整;图神经网络模型进行图嵌入处理时,利用重启随机游走的方式进行电网的节点采样,先将同一节点的不同参数转化成维度相同的特征,再对转换后的不同参数对应的特征进行不分先后顺序的聚合,然后针对目标节点选择将相同类型的邻居节点进行聚合,最后有权重地聚合不同类型邻居节点和目标节点参数。主要用于电网潮流调整。
-
公开(公告)号:CN116304589A
公开(公告)日:2023-06-23
申请号:CN202310156625.6
申请日:2023-02-17
Applicant: 国网浙江省电力有限公司 , 国网浙江省电力有限公司信息通信分公司 , 哈尔滨工业大学
IPC: G06F18/15 , G06F18/241 , G06N20/00 , G06F123/02
Abstract: 本申请公开了一种基于多约束协同的异常数据检测并修复的方法及相关产品,可应用于数据修复技术领域。该方法包括:确定多元时间序列中的待修复时间区间;根据所述待修复时间区间建立依赖网络;根据所述依赖网络获取可变特征预测顺序以及对应的预测模型字典;根据所述可变特征预测顺序和所述预测模型字典确定可变特征对应的候选修复值;根据所述候选修复值更新所述多元时间序列,实现时序数据的修复。因此,本申请对多元时间序列进行划分,并采用上类约束的算法对多元时间序列进行修复从而保证在修复过程中不引入新的约束的违规,在提高了错误数据修复结果的准确率和可靠度的前提下提高了错误数据的修复速度。
-
公开(公告)号:CN114218287B
公开(公告)日:2022-11-04
申请号:CN202111662253.1
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/2455 , G06F16/2458 , G06F16/28 , G06K9/62
Abstract: 一种面向时序数据库的查询时间预测方法,涉及计算机技术领域,针对现有技术中查询时间预测速度慢的问题,包括:步骤一:读取时序数据;步骤二:将时序数据写入CnosDB,CnosDB使用CnoSQL查询语句对时序数据进行查询检索,并记录查询时间;步骤三:将查询语句编码为向量化数据;步骤四:对向量化数据提取数据分布特征;步骤五:使用PCA对数据分布特征进行降维;步骤六:利用向量化数据和降维后的数据分布特征作为输入,查询时间作为输出,训练梯度提升回归树模型;步骤七:利用训练好的梯度提升回归树模型进行查询时间预测。本申请在预测时间上,在上述实验中本模型都能在几十毫秒内给出预测结果,具有非常可观的响应速度。
-
公开(公告)号:CN114665884A
公开(公告)日:2022-06-24
申请号:CN202210318623.8
申请日:2022-03-29
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
Abstract: 时序数据库自适应有损压缩方法、系统及介质,涉及计算机技术领域,针对现有技术中缺少提高数据压缩比的方法的问题,本申请自适应用户的压缩精度需求。用户可以确定压缩精度,通过存储数据段的基和部分偏差来确保压缩在相应的精度内。数据库的数据压缩比高,节省存储空间。有损压缩降低精度,在保持基的同时将部分偏差丢弃,降低存储空间。使用类似Huffman编码的思想进行编码,进一步提升压缩比。编码方式灵活。可以更换编码方式,Huffman编码需要整段全解压缩才能够查询,查询效率低时可以选择更换不同的编码方式来提升效率。
-
公开(公告)号:CN114328669A
公开(公告)日:2022-04-12
申请号:CN202111662250.8
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/22 , G06F16/25 , G06N3/04 , G06N3/08
Abstract: 基于深度学习的自动化时序数据库索引推荐方法、存储介质及设备,属于数据库技术领域。为了目前针对时序数据库还没有有效可行的自动化索引推荐方法的问题。本发明所述方法通过强化学习模型进行时序数据库的索引推荐,强化学习模型的代理负责决策的过程;代理与数据库的环境模型进行交互,环境模型计算代理因其决策而获得的状态转换和代价;DBMS接口负责执行数据库的创建、升级或删除动作并获取当前的索引配置的统计信息。本发明主要用于时序数据库的索引推荐。
-
公开(公告)号:CN109543712A
公开(公告)日:2019-03-29
申请号:CN201811200645.4
申请日:2018-10-16
Applicant: 哈尔滨工业大学
IPC: G06K9/62
Abstract: 本发明涉及计算机技术领域,提供一种时态数据集上的实体识别方法。该方法主要包括以下步骤:S1:基于规则对数据进行预处理;S2:框架聚类;S3:类融合。本发明首次针对无时间戳的时态数据集合上实体识别问题上提出了解决方法,定义了时态数据集上属性的不确定性,并相应地对记录之间的相似度计算采用了动态权重的计算方法,这种动态权重计算方法的效果是明显优于固定权重的。本发明有效地结合了否定匹配依赖规则和时序约束规则,减少了算法运行的时间并保证了算法输出的结果,对于实体识别中的聚类分析阶段,提出了新颖的时态聚类算法。
-
-
-
-
-
-
-
-
-