一种基于改进Stacking框架的乳腺癌诊断方法

    公开(公告)号:CN118072939A

    公开(公告)日:2024-05-24

    申请号:CN202410193555.6

    申请日:2024-02-21

    摘要: 本发明涉及机器学习的技术领域,公开了一种基于改进Stacking框架的乳腺癌诊断方法,构建改进Stacking集成分类器,采用K折交叉验证对改进Stacking集成分类器中初级学习器的各个基学习器进行训练,计算各个基学习器的输出值和总体AUC值,再基于各个基学习器的总体AUC值计算对应基学习器的权重,以此对对应基学习器的输出值进行加权处理,最后以各个基学习器加权处理后的输出值作为训练集对改进Stacking集成分类器中次级学习器的元学习器进行训练,以完成整个Stacking集成分类器的训练;利用训练好的改进Stacking集成分类器对乳腺细胞数据进行分类识别,输出识别结果。

    一种基于复合相似度的金融关联账户识别方法和设备

    公开(公告)号:CN115345741A

    公开(公告)日:2022-11-15

    申请号:CN202210968574.2

    申请日:2022-08-12

    摘要: 本发明涉及一种基于复合相似度的金融关联账户识别方法和设备,识别方法包括如下步骤:(1)典型案例爬取与特征提取;(2)指标体系设计;(3)账户基本信息指标和交易信息指标筛选;(4)市场复合信息指标构建;(5)基于模糊层次综合评价的疑似异常账户识别;(6)基于复合相似度的疑似异常账户聚类分析;(7)基于知识图谱的疑似关联账户可视化;设备包括一个或多个处理器、一个或多个存储器、一个或多个程序及多个数据收集装置。本发明对金融关联账户的识别准确度高且提供较完善的可视化功能,既能揭示金融市场中关联账户组的动态发展规律,又可为金融监管机构精准地识别出金融市场中的关联账户组,挖掘账户深层关联关系提供科学决策。

    一种基于SVM-RFE的客户风险特征筛选方法及其应用

    公开(公告)号:CN112182331A

    公开(公告)日:2021-01-05

    申请号:CN202011015886.9

    申请日:2020-09-24

    摘要: 本发明公开了一种基于SVM‑RFE的客户风险特征筛选方法及其应用,方法包括:获取包括多个客户特征的客户风险特征数据;针对客户风险特征Xj,基于基尼系数、信息增益、信息增益比、互信息及SVM分类器最优分类结果的特征权重计算客户风险特征Xj的重要度综合度量指数;依次计算所有的客户风险特征的重要度综合度量指数后,按照以上指数从大到小依次排序,选取前k个特征构成客户风险特征集。本发明的方法不仅考虑了所选特征子集与目标变量的相关性及特征子集自身的冗余性,克服利用单一指标筛选客户风险特征的弊端,而且在特征筛选过程中引入了SVM分类器的训练结果,使得所筛选客户风险特征更加适合SVM分类器的特性,应用前景好。

    一种基于SVM-RFE的客户风险特征筛选方法及其应用

    公开(公告)号:CN112182331B

    公开(公告)日:2022-08-02

    申请号:CN202011015886.9

    申请日:2020-09-24

    摘要: 本发明公开了一种基于SVM‑RFE的客户风险特征筛选方法及其应用,方法包括:获取包括多个客户特征的客户风险特征数据;针对客户风险特征Xj,基于基尼系数、信息增益、信息增益比、互信息及SVM分类器最优分类结果的特征权重计算客户风险特征Xj的重要度综合度量指数;依次计算所有的客户风险特征的重要度综合度量指数后,按照以上指数从大到小依次排序,选取前k个特征构成客户风险特征集。本发明的方法不仅考虑了所选特征子集与目标变量的相关性及特征子集自身的冗余性,克服利用单一指标筛选客户风险特征的弊端,而且在特征筛选过程中引入了SVM分类器的训练结果,使得所筛选客户风险特征更加适合SVM分类器的特性,应用前景好。

    一种基于自然语言处理的金融风险预警方法

    公开(公告)号:CN115391498A

    公开(公告)日:2022-11-25

    申请号:CN202210833092.6

    申请日:2022-07-14

    发明人: 江开忠 王国强

    摘要: 本发明属于金融信用服务的技术高领域,公开了一种基于自然语言处理的金融风险预警方法,包括步骤一、搜集金融语料集,建立正、负面词典和金融主题词典;步骤二、搜集客户所关注的金融数据,以句子为单位,提取包含金融主题词典中词的句子,组成集合S(Concern);步骤三、对于集合S(Concern)中的每一个句子,利用相似性替换法,将当中的词对应替换为正、负面词典中的正面词、负面词,计算替换后的各个句子的情感极性,然后将情感极性为负面的句子筛选出来,组成集合S(neg);步骤四、利用情感波谷搜索法遍历集合S(neg)中的每个句子,找出处于最深情感波谷处的句子集并展示给客户,以帮助客户快速找到潜在风险,有效实施风险管控。

    基于特征筛选和自适应参数聚类的工业设备故障预测方法

    公开(公告)号:CN117932378A

    公开(公告)日:2024-04-26

    申请号:CN202311752024.8

    申请日:2023-12-19

    摘要: 本发明公开了一种基于特征筛选和自适应参数聚类的工业设备故障预测方法,以运行状态变量表征设备运行的正常状态或者故障状态,采集运行状态变量和影响运行状态变量的多个特征变量的历史数据,利用距离相关系数和主成分分析方法对所有的特征变量进行筛选,获取对运行状态变量影响度高的特征变量;利用自适应参数聚类模型对筛选出特征变量对应的历史数据分别进行分类,并结合专家系统,划分异常簇和正常簇,再以此分类结果,更新运行状态变量对应的历史数据;以运行状态变量更新后的历史数据、筛选出特征变量对应异常簇和正常簇的历史数据对随机森林模型进行训练,并利用训练好的随机森林模型对新的设备运行数据进行故障预测。

    一种基于韵律特征的并行语音合成方法及装置、介质、设备

    公开(公告)号:CN114724538A

    公开(公告)日:2022-07-08

    申请号:CN202210327585.2

    申请日:2022-03-30

    发明人: 王国强

    摘要: 本发明提出了一种基于韵律特征的并行语音合成方法及装置、设备、介质,属于语音合成技术领域。该方法包括:首先将待合成语音文本正则化;将所述正则化语音文本并行转换为音素序列和音素级别韵律序列;将所述音素序列和所述音素级别韵律序列利用声学模型预测其梅尔频谱图;将所述梅尔频谱图利用声码器转换为所述待合成语音文本的语音信号。本专利融合自回归合成和非自回归合成的优势,不仅能有效提升语音合成的音质、流畅度、速度和鲁棒性,而且能实现实时的高效语音合成。基于本专利开发的系统可广泛应用于人工智能领域的智能化语音合成,如智能客服、智能音响、语音播报、地图导航和有声读物等人机交互场景。