-
公开(公告)号:CN117349772A
公开(公告)日:2024-01-05
申请号:CN202311319647.6
申请日:2023-10-12
Applicant: 哈尔滨工业大学
IPC: G06F18/2433 , G06F18/214 , G06N3/0495 , G06N3/084 , G06F17/16
Abstract: 基于稀疏神经网络的引风机运行异常检测方法,解决了如何利用有限标签的引风机异常运行数据实现异常检测的问题,属于引风机运行状态检测领域。本发明包括:获取引风机有标签的异常运行数据集;建立异常检测模型,采用有标签的异常运行数据集对异常检测模型进行训练,确定初始权重;将无标签的引风机运行数据输入至异常检测模型中,异常检测模型输出数据的异常特征参数矩阵和各个数据的异常分数,根据异常分数挑选出模糊数据,并对异常特征参数矩阵中的参数进行排序,根据靠前的异常特征参数对模糊数据进行人工标注,并计算损失,更新权重;完成训练后可对引风机的实时运行数据进行异常检测。本发明减少对应的人工标注成本,获得较好的检测性能。
-
公开(公告)号:CN116841973A
公开(公告)日:2023-10-03
申请号:CN202310830705.5
申请日:2023-07-07
Applicant: 哈尔滨工业大学
IPC: G06F16/174 , G06F16/17 , G06F16/18 , G06F11/30 , G06F11/34
Abstract: 面向嵌入式数据库的数据智能化压缩方法及系统,涉及数据压缩技术领域,针对现有技术中嵌入式数据库无法适配不同环境,导致压缩速度慢的问题,本申请能对不同场景和系统状况进行分类和识别,并在这之后自动选择需要的压缩算法,并在需要时自动解压缩,可以适应多种使用环境,提高了嵌入式数据库针对不同环境下的压缩速度,并能后智能化判断压缩时机,如物联网设备、手机、个人电脑等设备环境,并根据这些环境下的资源数量进行适配调整,以实现嵌入式数据库的智能化压缩和解压缩,最终达到节约存储资源空间、提高资源利用率、加快网络传输速度的目的。
-
公开(公告)号:CN114328669B
公开(公告)日:2023-05-16
申请号:CN202111662250.8
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/22 , G06F16/25 , G06N3/045 , G06N3/08
Abstract: 基于深度学习的自动化时序数据库索引推荐方法、存储介质及设备,属于数据库技术领域。为了目前针对时序数据库还没有有效可行的自动化索引推荐方法的问题。本发明所述方法通过强化学习模型进行时序数据库的索引推荐,强化学习模型的代理负责决策的过程;代理与数据库的环境模型进行交互,环境模型计算代理因其决策而获得的状态转换和代价;DBMS接口负责执行数据库的创建、升级或删除动作并获取当前的索引配置的统计信息。本发明主要用于时序数据库的索引推荐。
-
公开(公告)号:CN114884515A
公开(公告)日:2022-08-09
申请号:CN202210372728.1
申请日:2022-04-11
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
Abstract: 时序数据库中的自适应数据压缩系统、方法及设备,属于计算机技术领域。为了解决目前针对时序数据库的压缩算法存在的不能对数据进行针对性选择处理及无法同时兼顾轻量化要求的问题。本发明系统包括时序数据库插件和基于配置信息通过接口调用不同的压缩算法进行压缩的数据压缩子系统;其中,时序数据库插件为分类决策模型,分类决策模型包括特征提取单元和利用神经网络模型进行压缩算法自动选择的分类决策单元;数据压缩子系统包括将选出数据压缩算法反馈给用户并将压缩策略写入配置中心的压缩策略配置单元,以及创建新活动来执行数据压缩任务,并定期被唤醒来执行数据整理压缩任务的自适应数据压缩单元。主要用于时序数据库中数据的自适应压缩。
-
公开(公告)号:CN114665885A
公开(公告)日:2022-06-24
申请号:CN202210330862.5
申请日:2022-03-29
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
Abstract: 一种时序数据库自适应数据压缩方法,涉及数据压缩领域。本发明是为了解决目前时序数据压缩方法还存在无法对时序数据的特征和模式自适应压缩以及压缩率低造成内存空间浪费的问题。本发明包括:获取时序数据中的时间戳和Field Value;获取待压缩的时间戳每个时间点的delta‑of‑delta值;根据每个时间点的delta‑of‑delta值进行压缩获得每个时间点的压缩结果;以时间戳每个时间点为间隔将Field Value分为Field Value数据段,利用时间戳时间点的delta‑of‑delta值对Field Value数据段划分,获得Field Value数据小段;将Field Value数据小段输入训练好的神经网络分类器中,获得Field Value数据小段压缩结果;将时间戳压缩结果和Field Value压缩结果存储到内存中,获得时间序列数据压缩结果。本发明用于时序数据的压缩。
-
公开(公告)号:CN114329155A
公开(公告)日:2022-04-12
申请号:CN202111682432.1
申请日:2021-12-30
Applicant: 北京诺司时空科技有限公司 , 哈尔滨工业大学
IPC: G06F16/953 , G06F16/9538 , G06F16/2455 , G06F16/2458
Abstract: 一种包含时序数据库的多模态存储缓存系统及查询方法,涉及计算机技术领域。本发明是为了解决目前数据库在时间片的统计分析查询需求下添加对非时间类数据的常规查询的方法还存在由于数据库不够成熟稳定导致存储风险大的问题。本发明包括:交互层、控制层、服务层、数据访问对象层、缓存层、存储层;交互层用于接收用户输入的数据、显示查询结果数据和启动控制层;控制层用于校验接口参数并调度服务层;服务层用于实现数据查询业务逻辑;数据访问对象层用于利用数据访问函数调用缓存层或存储层进行数据查询并返回给服务层;缓存层用于缓存数据访问对象层从存储层库中读取的数据;存储层用于存储数据;本发明用于多模态数据查询。
-
公开(公告)号:CN110996144B
公开(公告)日:2021-10-08
申请号:CN201911314363.1
申请日:2019-12-19
Applicant: 哈尔滨工业大学
IPC: H04N21/258 , H04N21/25
Abstract: 本发明涉及一种电视用户收视偏好分析方法,包括:获取数据,进行格式整理及清洗,得到清洗后的数据条目;提取数据条目中的频道名称、节目名称,并对节目进行分类;将数据条目按频道名称分别存储,并根据时段归类;选定时段,对数据条目分类,统计所选时段内频道名称、节目名称、节目类别出现频次,得到热点词统计报告;抽选用户;将数据条目按照用户CA卡号分别存储,根据时段对数据条目归类,并按照时间顺序对事件标识排序,得到用户在各时段内的时序事件序列;生成行为模式图;提取体现偏好倾向的用户行为模式;进行用户行为识别,根据识别结果分析所选用户偏好,得到用户收视偏好报告。该方法能够更为准确、全面的分析用户收视偏好。
-
公开(公告)号:CN111352928A
公开(公告)日:2020-06-30
申请号:CN202010124832.X
申请日:2020-02-27
Applicant: 哈尔滨工业大学
IPC: G06F16/215 , G06F16/2458
Abstract: 本发明涉及一种使用CFDs的数据清洗方法、计算机设备和可读存储介质,该方法包括:从待清洗的大数据集中进行抽样,在一次扫描中获得训练集;基于训练集发现常量CFD和变量CFD,求得初步CFD集;寻找初步CFD集中无冲突的最大相容规则子集;根据最大相容规则子集对待清洗的大数据集进行清洗。本发明提供的方法适用于大于内存的大数据集清理,能够在一次扫描数据过程中,选择一个小型但有代表性的训练集,计算效率更高,并在发现规则的过程里容忍训练集中的脏的记录,实用性好。
-
公开(公告)号:CN111241079A
公开(公告)日:2020-06-05
申请号:CN202010016926.5
申请日:2020-01-08
Applicant: 哈尔滨工业大学
IPC: G06F16/215
Abstract: 本发明涉及一种数据清洗方法、装置及计算机可读存储介质;该方法包括获取结构化数据和时效约束,对所有元组建立时序图,并经传递规约后得到时效子图;基于时序子图计算每条元组的时效值;以时效性-一致性联合修复距离作为指标,计算错误元组和高质量元组之间的编辑距离,选择满足一致性规则约束,且与该错误元组时效值最为接近的修复模式对错误元组进行一致性修复;利用贝叶斯填充方法,将元组的时效值作为该元组的新增属性参与贝叶斯的训练过程,实现对缺失值的填充;得到清洗后的数据集。本发明能够对数据集中同时存在的时间戳不可用、不完整属性值、不一致属性值这三种数据质量问题进行有效地识别和修复。
-
公开(公告)号:CN110458452A
公开(公告)日:2019-11-15
申请号:CN201910739011.4
申请日:2019-08-12
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及数据服务技术领域,尤其涉及一种质量驱动的公平数据市场平台、交易系统及方法;其中,该数据市场平台包括:接收模块用于接收买方发送的查询请求,并将查询请求发送至查询模块;查询模块用于根据查询请求执行查询,并将查询数据结果返回至评估模块;评估模块用于根据多项预定的评估指标对查询数据结果进行质量评估,并将质量评估结果发送至定价模块;定价模块用于根据质量评估结果及查询价格计算数据最终价格,并将数据最终价格发送至加密模块;加密模块用于根据数据最终价格生成价格信息,并将价格信息发送至买方;其中价格信息包括价格范围与加密价格。本发明采用了基于质量的定价策略,并采用公平保证机制,避免潜在欺骗行为。
-
-
-
-
-
-
-
-
-