一种基于Spark平台的频繁项集挖掘方法

    公开(公告)号:CN109783464B

    公开(公告)日:2022-11-04

    申请号:CN201811570307.X

    申请日:2018-12-21

    Inventor: 丁家满 李海滨

    Abstract: 本发明涉及一种基于Spark平台的频繁项集挖掘方法,属于数据挖掘技术领域。本发明基于Spark大数据处理框架,提出了一种新颖的BitMapFIM‑Miner算法,并行化处理数据集,且不需要对数据集进行多次扫描,基于分治的思想,对事务长度大于一定阈值的事务进行分割,然后使用位操作的方法分别计算生成频繁项集,最后将各部分得到的频繁项集进行汇总合并。使用位操作的方法加速了频繁项集的挖掘速度,大大提高了算法的执行效率;通过理论分析和实验验证发现对过长的事务进行分割,在保证结果准确的同时可以高效地得到频繁项集,为频繁项集挖掘方法提供了一种新的思路。

    一种针对APP软件缺陷的用户评论挖掘方法

    公开(公告)号:CN109783807B

    公开(公告)日:2022-10-28

    申请号:CN201811572514.9

    申请日:2018-12-21

    Abstract: 本发明公开了一种针对APP软件缺陷的用户评论挖掘方法,本发明方法为:Step1、提取出与APP软件简介相关及不相关的用户评论;Step2、将与APP软件简介相关的含有缺陷的用户评论归类为功能性缺陷用户评论;Step3、将与APP软件简介不相关的含有缺陷的用户评论进行分类:如果与APP软件简介不相关的用户评论含有缺陷特征词集合中元素,则依据该元素对应的缺陷类型对用户评论进行分类;否则标记为其他缺陷类。本发明有助于从大量的APP软件用户评论中挖掘出含有APP软件缺陷的用户评论,有助于分析用户在使用APP软件时发现的软件缺陷及其类别。

    基于深度强化学习的多属性索引选择

    公开(公告)号:CN115017130A

    公开(公告)日:2022-09-06

    申请号:CN202210059183.9

    申请日:2022-01-19

    Abstract: 本发明涉及基于深度强化学习的多属性索引选择,属于数据库与强化学习领域。本发明根据启发式规则从工作负载中提取多属性索引候选项,能够降低训练时的动作空间维度,同时加快模型训练速度和推荐出更优的索引配置。采用基于字段的选择度规则对索引候选项做筛选与提取,例如重复值多的或选择度小于20%的字段,得到用于训练的索引候选项;再将用于训练的索引候选项与工作负载输入到DRLMAIS模型中进行训练;最后将查询语句或一组工作负载放入已经训练好的DRLMAIS模型中,得到对应的索引配置,并进行评估。本发明设计的基于字段的选择性规则能够对多属性索引候选项进行有效筛选减少动作空间,并且减少模型的训练时间同时为工作负载推荐出最优的索引配置。

    一种基于帧时隙的双阅读器快速识别RFID移动标签方法

    公开(公告)号:CN111079459B

    公开(公告)日:2021-10-22

    申请号:CN201911321775.8

    申请日:2019-12-20

    Abstract: 本发明涉及基于帧时隙的双阅读器快速识别RFID移动标签方法,属无线射频识别技术(RFID)领域。首先是阅读器1获取识别范围内标签尾码,判断当前成功识别的标签尾码是否已存在于尾码表,据此确定标签是否之前已被读取;当尾码存在于尾码表,不读取标签信息,这样就能不重复读取已读标签的信息,当尾码不存在于尾码表,读取标签信息,尾码添加入尾码表,反复此工作直到阅读器1工作结束,阅读器1将尾码表传输给阅读器2,阅读器2重复阅读器1的工作方式直到结束。本发明被很好运用到RFID移动标签的仿真环境中,减少了因重复识别标签而导致的资源浪费,提升标签识别的效率,双阅读器又比单阅读器识别范围更广,能识别更多标签。

    一种针对APP软件使用质量的用户评论挖掘方法

    公开(公告)号:CN107885768B

    公开(公告)日:2021-08-20

    申请号:CN201710890944.4

    申请日:2017-09-27

    Abstract: 本发明涉及一种针对APP软件使用质量的用户评论挖掘方法,属于APP软件使用质量分析领域。本发明首先使用初始评论种子挖掘出反映使用质量的APP软件用户评论;然后针对与评论种子匹配失败的用户评论,根据APP软件使用质量特征词表判断该用户评论是否反映使用质量并抽取评论模式;最后基于候选评论模式抽取新的评论种子,进一步挖掘与使用质量相关的用户评论。本发明有助于从大量的APP软件用户评论中挖掘出与使用质量相关的评论;有助于获取APP软件用户评论中与ISO/IEC 25010使用质量属性相关的信息;有助于分析APP软件使用质量。

    一种基于概率盒理论的风电场不确定性潮流建模方法

    公开(公告)号:CN112736927A

    公开(公告)日:2021-04-30

    申请号:CN202011575380.3

    申请日:2020-12-28

    Inventor: 丁家满 陈芷欣

    Abstract: 本发明涉及一种基于概率盒理论的风电场不确定性潮流建模方法,属于电力系统潮流计算技术领域。针对风电场中的风速所存在的随机不确定性,本发明先分析风速的分布情况,获得风速的漂移区间并建立其概率盒模型,接着依据输出功率关系,由风速概率盒得到风电出力概率盒,然后将风电出力概率盒离散化并作为输入代入潮流方程中建立基于概率盒的潮流模型,最后使用牛顿法对该概率盒潮流模型进行求解。该方法引入了概率盒理论,有效地利用了概率盒处理不确定性问题的优势,避免了在风电场运行时由于风速的不确定性所造成的信息丢失问题。该方法不仅提高了系统对不确定因素描述的准确性,而且直接对不确定参数建模的方法体现了方便易操作的优点。

    一种APP软件运行数据异常判断方法

    公开(公告)号:CN108415815B

    公开(公告)日:2021-03-02

    申请号:CN201810077200.5

    申请日:2018-01-26

    Abstract: 本发明涉及一种APP软件运行数据异常判断方法,属于APP软件运行检测领域。本发明方法为:将APP软件运行数据集作为输入,基于系统日志对APP软件运行数据集进行标记,基于SVM的APP软件运行数据集中数据异常判断,输出判断结果。本发明将手机日志信息与SVM算法相结合,有助于更准确的判断APP应用程序数据信息是否存在异常;本发明对SVM的相关参数进行优选,有助于提高判断的准确率;本发明对SVM的训练数据集进行扩充,有助于提高判断的准确率。

    一种结合CNN和LSTM的航班平均票价预测方法

    公开(公告)号:CN112232483A

    公开(公告)日:2021-01-15

    申请号:CN202011102260.1

    申请日:2020-10-15

    Abstract: 本发明涉及一种结合CNN和LSTM的航班平均票价预测方法,属于深度学习领域,首先,对影响航班票价的多种特征进行融合处理形成票价序列数据;然后输入CNN和LSTM相结合的航班平均票价预测模型(AFFF_CNN_LSTM模型)训练,模型会利用长短期记忆网络构建的编码器‑解码器网络来捕获票价序列的时间周期性依赖,同时利用三层卷积神经网络来获取票价序列关键的空间局部特征;最后使用模型对航班平均票价进行预测,在真实的航班票价数据集上实验表明,本发明的AFFF_CNN_LSTM模型方法相比传统的ARIMA模型方法、LSTM模型方法,预测航班平均票价更加准确,模型的泛化能力也更好。

    一种字典序分区双数组的字符串批量查询方法及装置

    公开(公告)号:CN111339381A

    公开(公告)日:2020-06-26

    申请号:CN202010151192.1

    申请日:2020-03-06

    Abstract: 本发明涉及一种字典序分区双数组字符串批量查询方法及装置,属于信息检索领域。包括:字符串数据集预处理步骤,对字符串数据集和查询集按照字典序升序排序并统计数据集中字符串的总长度;索引创建步骤,对字符串按照全部字符串长度划分成K个分区并创建分区映射表,然后为每个分区创建独立的双数组索引结构;检索步骤,对一批待查询的字典序有序的查询集,根据查询集构建分区查询表确定各查询的分区号并在相应分区内进行检索。本发明通过长度分区创建和检索双数组,使分区负载更为均衡,进而提高双数组的创建效率。

    一种基于帧时隙的双阅读器快速识别RFID移动标签方法

    公开(公告)号:CN111079459A

    公开(公告)日:2020-04-28

    申请号:CN201911321775.8

    申请日:2019-12-20

    Abstract: 本发明涉及基于帧时隙的双阅读器快速识别RFID移动标签方法,属无线射频识别技术(RFID)领域。首先是阅读器1获取识别范围内标签尾码,判断当前成功识别的标签尾码是否已存在于尾码表,据此确定标签是否之前已被读取;当尾码存在于尾码表,不读取标签信息,这样就能不重复读取已读标签的信息,当尾码不存在于尾码表,读取标签信息,尾码添加入尾码表,反复此工作直到阅读器1工作结束,阅读器1将尾码表传输给阅读器2,阅读器2重复阅读器1的工作方式直到结束。本发明被很好运用到RFID移动标签的仿真环境中,减少了因重复识别标签而导致的资源浪费,提升标签识别的效率,双阅读器又比单阅读器识别范围更广,能识别更多标签。

Patent Agency Ranking