-
公开(公告)号:CN110969260A
公开(公告)日:2020-04-07
申请号:CN201911007816.6
申请日:2019-10-22
Applicant: 成都信息工程大学 , 泸州市城投智慧科技发展有限责任公司
Inventor: 乔少杰 , 刘定祥 , 孙科 , 韩楠 , 魏军林 , 张永清 , 许源平 , 彭珍妮 , 王伟 , 元昌安 , 冉先进 , 范勇强 , 彭京 , 周凯 , 黄萍 , 郑皎凌 , 何晓曦 , 李斌勇 , 覃晓 , 张吉烈
Abstract: 本发明涉及机器学习技术领域,提供了一种不平衡数据过采样方法,基于三角形重心特点,包括:S1、获取样本集,并对所述样本集进行正负样本划分,得到正样本集和负样本集;S2、获取正样本集坐标点位信息,根据所述正样本集坐标点位信息生成均值中心点;S3、识别所述正样本集中每一正样本到均值中心点的马氏距离,按马氏距离大小对所述正样本进行排序得到正样本序列;S4、根据所述正样本序列对正样本集进行分组生成正样本组,识别所述正样本组的重心,将所述重心位置标记为新正样本;S5、将所述新正样本并入至正样本集得到新正样本集,重复步骤S2-S4,得到与负样本数量相平衡的正样本数量;通过上述方法,本发明解决了机器学习中的过拟合现象。
-
公开(公告)号:CN112905591B
公开(公告)日:2022-08-26
申请号:CN202110152193.2
申请日:2021-02-04
Applicant: 成都信息工程大学 , 成都探码科技有限公司 , 四川省金科成地理信息技术有限公司
Inventor: 乔少杰 , 韩楠 , 宋学江 , 高瑞玮 , 肖月强 , 张小辉 , 赵兰 , 李鑫钰 , 冉先进 , 甘戈 , 孙科 , 范勇强 , 黄萍 , 魏军林 , 温敏 , 程维杰 , 叶青 , 余华 , 向导 , 彭京 , 周凯 , 元昌安 , 黄发良 , 覃晓 , 李斌勇 , 张永清
IPC: G06F16/22 , G06F16/242 , G06N3/08
Abstract: 本发明公开了一种基于机器学习的数据表连接顺序选择方法,包括以下步骤:S1、对SQL语句进行编码,分别生成列、数据表和连接关系的特征向量;S2、根据列和数据表的特征向量,设计向量树AT来生成连接树的特征向量;S3、根据列、数据表、连接关系和连接树的特征向量,设计部分连接计划模型SP来生成部分连接计划的特征向量,进而生成下一时刻连接状态的特征向量;S4、根据下一时刻连接状态的特征向量,构建深度强化学习模型J,并结合部分连接计划模型SP与向量树AT,生成数据表的最优连接顺序。本发明解决了现有查询优化器生成数据表的次优连接顺序导致查询效率较低的问题。
-
公开(公告)号:CN113094368B
公开(公告)日:2022-08-05
申请号:CN202110392024.6
申请日:2021-04-13
Applicant: 成都信息工程大学 , 汉网云联成都科技有限公司
Inventor: 乔少杰 , 杨国平 , 宋海权 , 韩楠 , 李勇 , 闵圣捷 , 王伟业 , 孙科 , 袁犁 , 张浩东 , 范勇强 , 甘戈 , 冉先进 , 魏军林 , 余华 , 元昌安 , 黄发良 , 覃晓 , 郑皎凌 , 张永清
IPC: G06F16/22 , G06F16/2455 , G06F16/2457 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种提升缓存访问命中率的系统及方法,通过设置DDQN模型,提升了缓存区的访问命中率,能够更好地利用缓存区,提高了查询效率。本发明提供的DDQN模型能够学习经验,可以将若干个查询放入查询集合存储表并调度,且从历史执行的查询中获得更多的经验,改进调度策略。本发明能够有效地捕捉缓存区状态以及数据访问模式,更好地利用了缓存区并改进其查询的决策安排;DDQN模型能够适应从未执行过的查询,查询调度策略能够快速适应新的查询模板,从而产生显著的效果以及提升资源共享效率。
-
公开(公告)号:CN112749191A
公开(公告)日:2021-05-04
申请号:CN202110070780.7
申请日:2021-01-19
Applicant: 成都信息工程大学 , 四川省金科成地理信息技术有限公司 , 成都探码科技有限公司
Inventor: 乔少杰 , 温敏 , 宋学江 , 韩楠 , 杨国平 , 肖月强 , 张小辉 , 赵兰 , 甘戈 , 孙科 , 范勇强 , 冉先进 , 魏军林 , 程维杰 , 余华 , 彭京 , 周凯 , 元昌安 , 黄发良 , 覃晓
IPC: G06F16/2453 , G06F16/242 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种应用于数据库的智能代价估计方法、系统及电子设备,估计方法包括:S1、采集查询计划、真实基数和代价,并将其封装为对象;S2、将封装的对象中的信息数据转换为特征向量;S3、通过构建树形结构的深度神经网络对特征向量进行处理,得到基数及代价估计结果。本发明方法将传统数据库查询的代价估计进行了升级,利用深度学习的理论去解决查询代价所遇到的难题,尽量减少人工干预,提升代价评估的速度及准确性。
-
公开(公告)号:CN110120105A
公开(公告)日:2019-08-13
申请号:CN201910250660.8
申请日:2019-03-29
Applicant: 成都信息工程大学
Abstract: 本公开涉及一种载人车辆自动检票的方法、系统、服务器和终端,该方法包括:终端获取所述车辆的车辆信息和所述车辆上乘客的图片信息;终端发送所述车辆信息和所述图片信息至服务器;服务器基于所述图片信息统计所述乘客的实时人数;服务器确认所述实时人数等于所述车辆信息对应的预设人数;服务器发送通行指令至所述终端。用于解决景区车流量较大时,检票速度慢进而造成检票口拥挤的技术问题。
-
公开(公告)号:CN112905591A
公开(公告)日:2021-06-04
申请号:CN202110152193.2
申请日:2021-02-04
Applicant: 成都信息工程大学 , 成都探码科技有限公司 , 四川省金科成地理信息技术有限公司
Inventor: 乔少杰 , 韩楠 , 宋学江 , 高瑞玮 , 肖月强 , 张小辉 , 赵兰 , 李鑫钰 , 冉先进 , 甘戈 , 孙科 , 范勇强 , 黄萍 , 魏军林 , 温敏 , 程维杰 , 叶青 , 余华 , 向导 , 彭京 , 周凯 , 元昌安 , 黄发良 , 覃晓 , 李斌勇 , 张永清
IPC: G06F16/22 , G06F16/242 , G06N3/08
Abstract: 本发明公开了一种基于机器学习的数据表连接顺序选择方法,包括以下步骤:S1、对SQL语句进行编码,分别生成列、数据表和连接关系的特征向量;S2、根据列和数据表的特征向量,设计向量树AT来生成连接树的特征向量;S3、根据列、数据表、连接关系和连接树的特征向量,设计部分连接计划模型SP来生成部分连接计划的特征向量,进而生成下一时刻连接状态的特征向量;S4、根据下一时刻连接状态的特征向量,构建深度强化学习模型J,并结合部分连接计划模型SP与向量树AT,生成数据表的最优连接顺序。本发明解决了现有查询优化器生成数据表的次优连接顺序导致查询效率较低的问题。
-
公开(公告)号:CN111275480B
公开(公告)日:2021-02-09
申请号:CN202010014388.6
申请日:2020-01-07
Applicant: 成都信息工程大学 , 四川省金科成地理信息技术有限公司 , 成都探码科技有限公司
Inventor: 乔少杰 , 郑皎凌 , 程维杰 , 韩楠 , 宋学江 , 张小辉 , 叶青 , 魏军林 , 肖月强 , 陈权亮 , 李斌勇 , 张吉烈 , 张永清 , 何林波 , 温敏 , 元昌安 , 彭京 , 周凯 , 余华 , 范勇强 , 冉先进
IPC: G06Q30/02 , G06F16/2458 , G06F16/28
Abstract: 本发明涉及一种面向多维稀疏销售数据仓库的欺诈行为挖掘方法,属于数据挖掘领域。该方法包括以下步骤:S1:进行参数定义,包括多维数据空间、多维数据空间上的偏序格、销售数据仓库、销售数据仓库在多维数据空间上的数据分块、挂单行为和挂单模式;S2:进行问题定义;S3:进行特定挂单模式下的挂单点挖掘;S4:进行挂单模式挖掘。本发明提出了挂单模式偏序格的概念,通过引入偏序格中各个挂单模式的相对位置偏序结构信息,有效的使用了数据仓库中的维度层次信息来对挂单行为所遵循的挂单模式进行挖掘。
-
公开(公告)号:CN111189459A
公开(公告)日:2020-05-22
申请号:CN202010026328.6
申请日:2020-01-10
Applicant: 成都信息工程大学 , 四川省金科成地理信息技术有限公司 , 成都探码科技有限公司
Inventor: 乔少杰 , 黄振锋 , 甘戈 , 韩楠 , 宋学江 , 魏军林 , 张小辉 , 温敏 , 肖月强 , 程维杰 , 陈权亮 , 李斌勇 , 张永清 , 张吉烈 , 何林波 , 元昌安 , 彭京 , 周凯 , 余华 , 范勇强 , 冉先进
IPC: G01C21/30
Abstract: 本申请实施例提供了一种定位信息与道路匹配的方法和装置,该方法包括:S1.获取待匹配的定位轨迹序列和道路网络数据;步骤S2.获取所述轨迹序列的候选路段;步骤S3.判断所述定位轨迹序列中已匹配点的个数是否大于两个,若是,则用第一匹配算法计算出所述轨迹序列在所述道路网络数据上的匹配轨迹;若否,则用第二匹配算法计算出所述轨迹序列在所述道路网络数据上的匹配轨迹;步骤S4.输出所述匹配轨迹。本申请提供的定位信息与道路匹配的方法和装置,其通过获取浮动车数据和城市道路网络数据,搜索和筛选出合理的候选路段和候选待匹配点,结合所设计两种不同的匹配算法来进行浮动车地图的匹配,实现了大规模浮动车地图匹配的准确性和效率性。
-
公开(公告)号:CN113094368A
公开(公告)日:2021-07-09
申请号:CN202110392024.6
申请日:2021-04-13
Applicant: 成都信息工程大学 , 汉网云联成都科技有限公司
Inventor: 乔少杰 , 杨国平 , 宋海权 , 韩楠 , 李勇 , 闵圣捷 , 王伟业 , 孙科 , 袁犁 , 张浩东 , 范勇强 , 甘戈 , 冉先进 , 魏军林 , 余华 , 元昌安 , 黄发良 , 覃晓 , 郑皎凌 , 张永清
IPC: G06F16/22 , G06F16/2455 , G06F16/2457 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种提升缓存访问命中率的系统及方法,通过设置DDQN模型,提升了缓存区的访问命中率,能够更好地利用缓存区,提高了查询效率。本发明提供的DDQN模型能够学习经验,可以将若干个查询放入查询集合存储表并调度,且从历史执行的查询中获得更多的经验,改进调度策略。本发明能够有效地捕捉缓存区状态以及数据访问模式,更好地利用了缓存区并改进其查询的决策安排;DDQN模型能够适应从未执行过的查询,查询调度策略能够快速适应新的查询模板,从而产生显著的效果以及提升资源共享效率。
-
公开(公告)号:CN108172298A
公开(公告)日:2018-06-15
申请号:CN201810086348.5
申请日:2018-01-30
Applicant: 成都信息工程大学
Abstract: 本发明公开了一种心理量表的数据预处理方法,其包括以下步骤:S1、从至少两个选项中获取待保留的选项和待删除的选项;获取至少两个已知患病信息的心理量表样本;S2、对待删除的选项进行合并约简至待保留的选项中,得到基于保留选项集的数据集合,实现对心理量表选项的预处理;根据已知患病信息的心理量表样本对心理量表题目进行属性约简,删除模糊题目,实现对心理量表题目的预处理。本发明能够降低心理测量数据中选项的模糊度,并解决属性较多而样本较少时无法约简属性的问题,从而有效挖掘心理测量数据,提取有价值信息。
-
-
-
-
-
-
-
-
-