基于迁移学习分布式期望最大化金融数据聚类方法及系统

    公开(公告)号:CN113688934B

    公开(公告)日:2024-06-07

    申请号:CN202111026341.2

    申请日:2021-09-02

    申请人: 济南大学

    摘要: 本发明公开了一种基于迁移学习分布式期望最大化金融数据聚类方法,用于细分金融领域分布式P2P网络环境下的客户数据。包括:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移;对于各个节点上的每个数据点进行类别划分。本发明通过在分布式期望最大化算法中引入迁移学习项,能够显示揭示节点间的协作机制,加速算法收敛,同时,提高聚类精度,精准细分金融客户。

    基于层次特征图网络的文本宣传意图识别方法及系统

    公开(公告)号:CN116795988A

    公开(公告)日:2023-09-22

    申请号:CN202310763638.X

    申请日:2023-06-26

    申请人: 济南大学

    摘要: 本发明公开了一种基于层次特征图网络的文本宣传意图识别方法及系统,该方法包括:基于预处理后的待识别文本,提取文本的序列、句法和语义特征,并根据提取的特征分别构建对应的文本特征图,获取特征图向量;基于每一文本特征的特征图向量,采用残差连接的双层粗细化操作传播图内同构节点信息,更新节点的上下文特征表示,得到节点向量;基于节点向量,采用基于注意力的三通道集成操作聚合多图最相关的序列、句法和语义信息,增强图间异构节点信息,得到节点增强向量;对三张文本特征图的节点增强向量进行池化融合,得到文本向量,通过分类器进行最终的分类判定,得到待识别文本鼓动宣传意图识别精度更高的识别结果。

    Android应用程序加密网络流量的提取系统及方法

    公开(公告)号:CN112784289B

    公开(公告)日:2022-10-18

    申请号:CN202110103856.1

    申请日:2021-01-26

    申请人: 济南大学

    摘要: 本发明公开了Android应用程序加密网络流量的提取系统及方法,包括:部署在服务器上的Android模拟器;所述Android模拟器上部署有Android应用程序、Android系统级TLS类库和Java虚拟机,所述Android应用程序内设有业务逻辑代码和应用内置的TLS类库,所述Java虚拟机内部署钩子框架,所述钩子框架内设有系统调用代理模块;所述系统调用代理模块分别与业务逻辑代码、应用内置的TLS类库、Android系统级TLS类库和流量收集模块连接;应用内置的TLS类库和Android系统级TLS类库均与Internet网络连接;流量收集模块与测试结果数据库连接。

    一种在线课程学习监督方法及系统

    公开(公告)号:CN114863341A

    公开(公告)日:2022-08-05

    申请号:CN202210535724.0

    申请日:2022-05-17

    申请人: 济南大学

    摘要: 本发明涉及人工智能技术领域,提供了一种在线课程学习监督方法及系统,包括:采集待监督用户的退课预测数据;对所述退课预测数据进行预处理和特征提取后,得到退课特征,输入加权软投票集成分类模型,得到待监督用户对所选课程的退课概率;若退课概率超出设定值,则向待监督用户发送提醒信息;其中,加权软投票集成分类模型集成若干个基分类器,并由遗传算法确定每个基分类器的权重,各基分类器的结果经过加权求和得到模型输出的退课概率。提高了模型对不同数据的泛化能力,提高线课程学习监督的精度。

    一种营销文本识别方法及系统
    6.
    发明公开

    公开(公告)号:CN114724167A

    公开(公告)日:2022-07-08

    申请号:CN202210498687.0

    申请日:2022-05-09

    申请人: 济南大学

    摘要: 本发明提供了一种营销文本识别方法及系统,包括:获取待识别文本,并进行预处理;基于预处理后的待识别文本,构建待识别文本的文本图;基于待识别文本的文本图,生成文本级单词表示,并结合所有标签的嵌入表示,生成文本表示;基于文本表示,采用分类器得到待识别文本是否属于营销文本的结果;其中,标签的嵌入表示的获取方法为:基于训练集的文本图及其标签,生成主题单词概率分布,将主题单词概率分布映射到标签向量空间,并在标签图的指导下学习标签间的相关性关系和语义信息,得到标签的嵌入表示。达到了生成完整标签嵌入的目的,联合学习单词与标签捕获更多与分类相关的信息,提高了营销文本识别的精度。

    一种网站行为分类方法、系统、存储介质及设备

    公开(公告)号:CN113688926A

    公开(公告)日:2021-11-23

    申请号:CN202111014054.X

    申请日:2021-08-31

    申请人: 济南大学

    IPC分类号: G06K9/62 G06F16/958

    摘要: 本发明属于网站行为分类领域,提供了一种网站行为分类方法、系统、存储介质及设备。其中,该方法包括获取网站行为数据集合;其中,集合中每个数据的一个属性为一个维度;对每个数据的邻居进行筛选来确定相应数据的滤波窗口;从网站行为数据集合中随机选出预设数量条数据分别作为类中心数据,计算网站行为数据集合中各个数据属于各个类中心数据的隶属度;基于每个数据的滤波窗口,再利用每个数据的每一维分别作为引导对隶属度滤波,将多维滤波后的隶属度加权求和作为最终滤波后的隶属度;利用最终滤波后的隶属度更新各个的类中心数据,进而更新各类各个维度的属性权重;迭代计算判断更新各个的类中心数据的步骤的终止情况,最后输出网站行为分类结果。

    基于PCA降维的堆积两层框架的异常电话识别方法及系统

    公开(公告)号:CN109359193A

    公开(公告)日:2019-02-19

    申请号:CN201811119184.8

    申请日:2018-09-25

    申请人: 济南大学

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本发明公开了一种基于PCA降维的堆积两层框架的异常电话识别方法及系统,包括:采集电话样本,基于PCA对电话样本的特征进行降维;将采集到的样本分为选择训练集样本和测试集样本;对于训练集样本,采用5折交叉验证方法分别训练第一层的五个基学习器;根据第一层的训练结果得到第二层学习器的训练集样本和测试集样本,对第二层学习器进行训练,输出最后的测试结果。本发明有益效果:使用两层的Stacking框架预测异常电话准确率高于单层集成算法,采用五折交叉验证可以增加训练数据的个数,解决样本少的问题。

    基于算法胶囊的算法模型部署实施方法及系统

    公开(公告)号:CN117785218A

    公开(公告)日:2024-03-29

    申请号:CN202311815990.X

    申请日:2023-12-26

    申请人: 济南大学

    IPC分类号: G06F8/60 G06F9/455

    摘要: 本发明提供了一种基于算法胶囊的算法模型部署实施方法及系统,包括:获取待部署的算法模型,并根据预设任务对所述算法模型进行预先训练;将训练好的算法模型作为算法胶囊的外部属性,并对算法胶囊进行配置;其中,所述算法胶囊包括外部属性和内部结构,所述外部属性包括训练好的算法模型源码以及算法胶囊的外部依赖;所述内部结构包括基于外部属性构建的输入输出接口层、核心层以及环境依赖层;所述核心层用于对当前算法模型对应任务的输入数据按照其对应应用领域进行预处理;基于预处理的输入数据,请求算法模型的数据处理服务,获得处理结果;将配置后的算法胶囊转化为容器镜像,进而实现算法模型的部署实施。