数据对象的分组方法、装置、计算机设备及存储介质

    公开(公告)号:CN116401566A

    公开(公告)日:2023-07-07

    申请号:CN202310403129.6

    申请日:2023-04-14

    Inventor: 林英志 刘娟

    Abstract: 本发明涉及数据处理领域,公开了一种数据对象的分组方法、装置、计算机设备及存储介质,包括:基于地理坐标数据,采用空间聚类法将备选数据对象划分为多个数据对象组;基于组间距离对任意两个数据对象组进行数据对象剔除,得到多组数据对象小组;对多组数据对象小组进行抽样处理,得到对照数据对象组和实验数据对象组;进行对照数据对象组和实验数据对象组实验,在实验后计算对照数据对象组和实验数据对象组的目标变量差异值;当目标变量差异值大于或等于差异值阈值时,将对照数据对象组和实验数据对象组中的部分数据对象互换,本发明可以消除参与实验对象数据和未参与实验对象数据的相互影响,使得个体差异性较大的对照组和实验组之间具有可比性。

    基于最大权重匹配的差分隐私合成数据发布方法

    公开(公告)号:CN116167078A

    公开(公告)日:2023-05-26

    申请号:CN202310060144.5

    申请日:2023-01-15

    Inventor: 张淼 邓海 叶欣欣

    Abstract: 本发明公开了一种基于最大权重匹配的差分隐私合成数据发布方法,所述方法首先是通过可靠的第三方服务器将收集到的用户数据进行预处理;然后将处理后的数据属性使用图模型的方法进行信息表示,得到一个属性关联图;接着根据最大权重匹配算法选出一组合适的低维边际集合;随后分别对这组低维边际添加噪声,该噪声满足差分隐私定义;再对加噪后的低维边际集合进行后处理,得到一组标准化的低维边际集合;根据这组低维边际集合进行数据合成,使得合成数据集与原始数据集在统计信息上尽可能相似,最后,将合成数据集进行数据发布。采用上述技术方法,能够在保证合成数据集效用的同时,降低计算复杂度,对于高维数据有更好的效用。

    一种基于分布式声学传感的城市隧道防侵限智能预警方法

    公开(公告)号:CN119397423A

    公开(公告)日:2025-02-07

    申请号:CN202411961545.9

    申请日:2024-12-30

    Abstract: 本发明公开了一种基于分布式声学传感的城市隧道防侵限智能预警方法,涉及地下监测和轨道安全预警领域,具体包括:输入分布式光纤的数据记录;将记录以标准尺寸截窗、求频谱振幅、截取范围、数据截断和归一化;训练卷积自编码器重构数据,利用编码器部分对数据进行编码降维;利用实时数据预处理并降维后的特征向量训练随机森林分类器;对连续数据做预处理,卷积编码器降维数据后用随机森林进行检测和分类;对检测结果进行基于信号时空连续性筛选的后处理,得到精确检测和分类结果。本发明利用卷积自编码器和随机森林算法实时监测分布式声学传感数据中的施工信号,以高时空分辨率进行检测和准确分类,实现了基于分布式光纤的轨道施工智能预警。

    分类模型的训练方法与相关方法、装置、设备及介质

    公开(公告)号:CN119293593A

    公开(公告)日:2025-01-10

    申请号:CN202411438904.2

    申请日:2024-10-14

    Inventor: 刘浏

    Abstract: 本申请公开一种分类模型的训练方法与相关方法、装置、设备及介质。包括:基于预设增类模型对第一样本对象的样本特征得到未知预测结果、新增预测结果和已知预测结果;根据未知预测结果、新增预测结果和已知预测结果分类得到的目标分类结果和类别标签确定分类损失;通过分类损失训练得到增类分类模型;将第二样本对象输入已知类分类模型和增类分类模型,由增类分类结果和修正参数,对已知类分类结果进行优化;根据已知类优化结果、增类分类结果和类别标签确定微调损失,由微调损失微调修正参数,得到微调后的修正参数,以基于微调后的修正参数、已知类分类模型和增类分类模型得到目标分类模型。该方法能够在新增分类类别的情况下仍提高分类准确性。

    基于Holt指数平滑和PchipInterpolator插值的路面纹理数据集扩充方法

    公开(公告)号:CN119272051A

    公开(公告)日:2025-01-07

    申请号:CN202411363806.7

    申请日:2024-09-28

    Applicant: 同济大学

    Abstract: 本发明提出了基于Holt指数平滑和PchipInterpolator插值的路面纹理数据集扩充方法。该方法匹配十二种输入特征数据和一种输出特征数据形成多路段小样本的原始路面纹理数据集。以路段为分组依据,采用Holt指数平滑模型通过水平更新、趋势更新方法对原始路面纹理数据集进行横向缺失值补充。采用PchipInterpolator插值法对数据集进行纵向插值扩充,为所有特征生成同一时刻下更密集的插值点。与现有技术相比,本发明解决了路面纹理数据缺失、不连续的问题,可以减少多次数据采集的时间和经济成本,形成路面纹理数据集。

    一种基于多源地学信息数据库的智能化岩性填图方法

    公开(公告)号:CN119131272A

    公开(公告)日:2024-12-13

    申请号:CN202411121919.6

    申请日:2024-08-15

    Abstract: 本发明公开了一种基于多源地学信息数据库的智能化岩性填图方法,属于基础地质调查技术领域,包括S1、获取原始岩性不平衡建模数据;S2、通过混合采样算法将步骤S1的原始岩性不平衡建模数据转化为岩性平衡数据集;S3、岩性平衡数据集经过顾及不确定性量化的监督式机器学习算法获得分类类别;S4、在获得分类类别的基础上,通过后正则化算法对分类结果依次进行修正,直至最终结果无孤立岩性网格,输出三维岩性和不确定性建模结果。本发明采用上述一种基于多源地学信息数据库的智能化岩性填图方法,通过电脑软件输入上述一种基于多源地学信息数据库的监督式岩性填图方法,能提高岩性填图的准确性和效率,并量化填图过程的不确定性。

Patent Agency Ranking