一种基于分类一致性的弱监督异常检测方法

    公开(公告)号:CN118152965A

    公开(公告)日:2024-06-07

    申请号:CN202410394022.4

    申请日:2024-04-02

    IPC分类号: G06F18/2433 G06N3/0895

    摘要: 本发明公开了一种基于分类一致性的弱监督异常检测方法,具体包括如下步骤:原始数据输入;对原始数据进行预处理;计算并构造样本属性的模糊信息粒化;样本属性的分类一致性计算;计算所有样本的异常因子,得到异常评分;通过异常阈值比较判断数据中的异常对象。本发明通过模糊相似关系来对混合型数据进行统一表示,无需进行额外的数据格式转换,避免了重要信息的丢失;利用极少量标记数据来构造数据驱动的模糊决策系统,引入分类一致性来计算属性在异常检测中的重要性。通过融合分类一致性和对象异常因子来计算对象的异常评分,并利用标记数据计算异常阈值,有效地提升了混合型数据异常检测的准确率。

    一种基于多粒度模糊相对差的无监督窃电检测方法

    公开(公告)号:CN117591971A

    公开(公告)日:2024-02-23

    申请号:CN202310845240.0

    申请日:2023-07-10

    摘要: 本发明公开了一种基于多粒度模糊相对差的无监督窃电检测方法,其具体检测步骤如下所示:原始数据输入;对原始数据进行预处理;构造并计算每个属性的模糊关系矩阵;构造多粒度模糊信息粒序列;计算样本的模糊相对差;计算样本的离群度;通过阈值比较判定用电数据中的异常用户。本发明提供的基于模糊粗糙集理论的异常检测方法通过构造模糊关系矩阵提取混合型数据的结构信息,从而对数值型和标称型相混合的数据进行统一表示,无需进行额外的数据格式转换,避免了重要信息的丢失;同时利用模糊相对差从多种粒度视角下刻画样本的异常程度,有效提升了混合型电力数据异常检测的准确率。

    一种面向不完备混合窃电数据的异常检测方法

    公开(公告)号:CN117633575A

    公开(公告)日:2024-03-01

    申请号:CN202311668949.4

    申请日:2023-12-07

    申请人: 四川大学

    摘要: 一种面向不完备混合窃电数据的异常检测方法,包括以下步骤:获取用电数据,并对用电数据进行规范化处理;根据处理后的数据计算模糊相似矩阵;根据模糊相似矩阵计算模糊熵;根据模糊熵将属性排序;根据所得属性序列构建多粒度序列;根据多粒度序列构建多模糊粒族;根据多模糊粒族计算异常分数;逐一判断规范化处理后的数据中样本的异常分数是否大于阈值,若是则输出异常点,直至完成对所有样本的判断;若否则视为正常数据,进行下一样本的判断直至完成所有样本的判断。本发明将模糊粗糙集及多粒度的思想引入了窃电检测中,将多个属性序列进行加权计算样本离群度,解决多尺度数据特征的融合问题;有效实现不完备混合窃电数据的无监督异常检测。

    元学习视觉语言理解与定位方法

    公开(公告)号:CN117095187A

    公开(公告)日:2023-11-21

    申请号:CN202311330418.4

    申请日:2023-10-16

    申请人: 四川大学

    摘要: 本发明提供了一种元学习视觉语言理解与定位方法,包括:构建训练集;构建元学习视觉语言理解与定位训练模型;构建基于随机不相关训练机制的元学习内层循环训练,并利用支持集对基础学习器的参数进行更新;利用更新后的基础学习器参数对训练集中的查询集计算损失,并反向优化元学习视觉语言理解与定位训练模型;利用优化后的元学习视觉语言理解与定位训练模型编码测试图片‑文本描述样本对,输出被描述物体在图片中的定位框。本发明解决了现有的视觉语言理解与定位方法在面临视觉语言理解与定位数据集中训练集和测试集分布差异过大的场景时过度关注训练集,导致模型的泛化能力差,进而降低视觉语言理解与定位精度的问题。

    一种基于对比学习的敏感文本表征方法

    公开(公告)号:CN116611414A

    公开(公告)日:2023-08-18

    申请号:CN202310517482.7

    申请日:2023-05-09

    申请人: 四川大学

    摘要: 本发明提供了一种基于对比学习的敏感文本表征方法,属于文本表征技术领域,该方法包括构建正样本和硬负样本对;建立多任务对比学习模型;进行多任务对比学习模型训练;得到敏感文本的表征结果。本发明解决了现有的基于对比学习模型,利用离散的数据增强获取被歪曲语义样本及直接使用视觉对比框架在自然语言领域进行对比学习,造成对比训练低效的问题。

    一种基于序列和模糊补熵的异常检测方法

    公开(公告)号:CN117591789A

    公开(公告)日:2024-02-23

    申请号:CN202311692716.8

    申请日:2023-12-11

    申请人: 四川大学

    IPC分类号: G06F17/16 G06F18/22 G06N7/02

    摘要: 本发明公开了一种基于序列和模糊补熵的异常检测方法,具体的步骤如下:对数据集进行规范化处理,根据规范化后的数据集,计算各属性上的模糊关系矩阵及的模糊补熵,根据补熵大小得到各属性的权重值;计算各样本在被从数据集中移除后,在各属性上模糊关系矩阵的熵变化量;计算属性集序列上属性集的模糊关系矩阵及属性集的模糊补熵,根据补熵大小得到各属性集序列中属性集的权重值;计算各样本在被从数据集中移除后,在属性集序列上属性集模糊关系矩阵的熵变化量;计算规范化后数据中样本的异常分数;逐一判断规范化处理后的数据中样本的异常分数是否大于阈值,若是则输出数据的异常点,若否则视为正常数据,直至完成所有样本的判断。

    一种基于邻域序列加权求和的用电数据异常检测方法

    公开(公告)号:CN117540341A

    公开(公告)日:2024-02-09

    申请号:CN202311692714.9

    申请日:2023-12-11

    申请人: 四川大学

    IPC分类号: G06F18/25 G06F17/16

    摘要: 本发明公开了一种基于邻域序列加权求和的用电数据异常检测方法,包括以下步骤:获取混合属性用电数据并进行归一化处理;计算单属性曼哈顿重叠度量与单属性邻域半径,构建单属性邻域关系矩阵;计算单属性邻域密度与单属性邻域熵,计算各属性权重;根据各属性权重与单属性邻域密度,计算单属性离群因子;根据单属性邻域熵获得属性序列,并构建属性集序列;计算多属性加权混合曼哈顿重叠度量与多属性邻域半径,构建多属性邻域关系矩阵;计算多属性邻域密度与多属性邻域熵,计算多属性权重;根据多属性权重与多属性邻域密度,计算多属性离群因子;计算总离群因子,并逐一判断论域中各对象总离群因子是否大于等于设定的阈值,若是则输出异常点。

    元学习视觉语言理解与定位方法

    公开(公告)号:CN117095187B

    公开(公告)日:2023-12-19

    申请号:CN202311330418.4

    申请日:2023-10-16

    申请人: 四川大学

    摘要: 本发明提供了一种元学习视觉语言理解与定位方法,包括:构建训练集;构建元学习视觉语言理解与定位训练模型;构建基于随机不相关训练机制的元学习内层循环训练,并利用支持集对基础学习器的参数进行更新;利用更新后的基础学习器参数对训练集中的查询集计算损失,并反向优化元学习视觉语言理解与定位训练模型;利用优化后的元学习视觉语言理解与定位训练模型编码测试图片‑文本描述样本对,输出被描述物体在图片中的定位框。本发明解决了现有的视觉语言理解与定位方法在面临视觉语言理解与定位数据集中训练集和测试集分布差异过大的(56)对比文件曹思雨.细粒度图像分类场景下的小样本学习方法研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2022,(第2期),第I138-432页.牛凯等.视觉-语言导航的研究进展与发展趋势《.计算机辅助设计与图形学学报》.2022,第34卷(第12期),第1815-1827页.Guangxing Han等.Multi-Modal Few-ShotObject Detection with Meta-Learning-BasedCross-Modal Prompting《.arXiv:2204.07841v3》.2023,第1-17页.

    一种基于模糊邻域粗糙集的医保欺诈检测方法

    公开(公告)号:CN116797378A

    公开(公告)日:2023-09-22

    申请号:CN202310368124.4

    申请日:2023-04-08

    申请人: 四川大学

    发明人: 袁源 袁钟 刘昶

    摘要: 本发明公开了一种基于模糊邻域粗糙集的医保欺诈检测方法,涉及医疗健康技术领域,针对现有的欺诈检测方法存在的不适用于处理具有模糊性、异构、非平衡性等特点的不确定性数据的问题,现提出如下方案,包括S1:获取医保数据,对数据进行规范化预处理,导入模糊邻域信息系统;S2:基于信息系统计算模糊相似关系;S3:根据模糊相似关系,构造不同属性子集的模糊邻域信息粒及信息粒结构;S4:计算模糊邻域下近似比率。S5:根据模糊邻域下近似比率,计算模糊邻域信息粒的异常程度;S6:根据信息粒的异常程度,计算所有参保人的异常分数;S7:通过阈值判定异常值,输出存在欺诈行为的参保人。本发明解决了现有的欺诈检测方法存在难以处理具有模糊性、异构、非平衡性等特点的不确定性数据的问题,并能够避免离散化数值数据导致的重要信息的丢失和数据处理时间延长问题,且无需人工标记数据,大大降低医保数据处理成本,提高医保欺诈检测效率和精度。

    一种基于模糊粗糙熵的用电异常检测方法

    公开(公告)号:CN116433049A

    公开(公告)日:2023-07-14

    申请号:CN202310414937.2

    申请日:2023-04-18

    申请人: 四川大学

    IPC分类号: G06Q10/0637 G06Q50/06

    摘要: 本发明公开了一种基于模糊粗糙熵的用电异常检测方法,涉及用电异常检测技术领域,该方案具体包括:对数值数据进行标准化处理;计算各属性的距离矩阵;计算模糊相似度矩阵;计算基于距离的模糊粗糙熵;根据模糊粗糙熵大小对属性排序,得到属性序列和属性集序列;计算属性集序列的距离矩阵以及模糊相似度矩阵;分别计算两种序列的模糊粗糙相对熵矩阵;计算两种序列的权值矩阵;计算每个用户的异常分数;逐一判断用户的分数是否大于阈值,若是,则输出异常用户,直至完成对所有用户的判断。本发明利用模糊粗糙熵能有效提取用电异常数据的模糊和不确定信息,从而提高模型的检测性能,能有效处理混合异构的数据集。