基于主题记忆网络的仇恨和攻击性言论识别方法及系统

    公开(公告)号:CN113704472B

    公开(公告)日:2024-04-09

    申请号:CN202111005000.7

    申请日:2021-08-30

    申请人: 济南大学

    摘要: 本发明属于自然语言处理领域,提供了基于主题记忆网络的仇恨和攻击性言论识别方法及系统,首先将文本转换为词袋向量和词索引序列向量,并进行特征提取得到特征向量;然后基于词袋向量,主题提取模型提取主题混合分布;基于主题混合分布,主题记忆机制获得主题词权重矩阵,并通过两次级联运算与词索引序列向量和特征向量进行联合学习,得到分类特征;最后基于分类特征,分类器得到文本是否属于仇恨和攻击性言论的结果;达到了丰富短文本特征的目的,解决了短文本存在的特征稀疏问题,提高了仇恨和攻击性言论识别的精度。

    基于双解码器融合的数学应用题自动解答方法及系统

    公开(公告)号:CN117217316A

    公开(公告)日:2023-12-12

    申请号:CN202311283635.2

    申请日:2023-09-28

    申请人: 济南大学

    摘要: 本发明提供了基于双解码器融合的数学应用题自动解答方法及系统,基于Seq2Seq与树解码器融合,首先根据语法依存关系,在问题文本中提取与数字关联的属性词;然后引入数字实体嵌入重构预训练语言模型PLM编码器,提取数字实体间关系;基于数字特性增强的PLM编码器初始化构建解码器,解决Seq2Seq解码器数学知识缺失的问题;进一步共享编码器‑解码器对应参数的权重,使编码器参数同时作用于问题解析和表达式生成两任务;最终融合Seq2Seq和树解码器结构学习生成多形式表达式,增强了编码器对数字多样性结构信息的提取和数字特征的表示,提高了数学应用题解答的准确度。

    一种模型增量更新的方法及系统

    公开(公告)号:CN112860303B

    公开(公告)日:2023-07-04

    申请号:CN202110175581.2

    申请日:2021-02-07

    申请人: 济南大学

    摘要: 本公开提出了一种模型增量更新的方法及系统,包括:使用归纳保形的思想筛选出测试数据集中携带新知识或复杂知识的数据,用于训练数据集和模型的迭代更新;使用时间窗口限制训练数据集的规模;使用数据循环选择的方法来抑制老旧冲突数据对训练模型的负面影响和训练数据集的无限增长。当携带复杂知识的数据占据新增数据一定比例或模型精确度降低到设定阈值,重新进行特征选择,数据集构建和模型训练。本公开实施例子提出了一种带有新知识和复杂知识的数据筛选方式,大幅度减少人工标记样本数量,减少训练数据规模,一定程度可以减少非平衡对模型性能的影响。

    一种基于学习成效预测的学习方案推荐方法及系统

    公开(公告)号:CN114912027A

    公开(公告)日:2022-08-16

    申请号:CN202210608349.8

    申请日:2022-05-31

    申请人: 济南大学

    摘要: 本发明涉及学习方案推荐技术领域,提供了一种基于学习成效预测的学习方案推荐方法及系统,包括:获取待预测用户的基本数据以及对某个课程的学习行为数据,并进行预处理后,构建并筛选出分类特征,得到待预测用户的特征向量,输入训练好的在线课程学生学习成效预测模型,预测得到待预测用户对该课程的学习成效,当学习成效为未通过考核时,发送预警信息给待预测用户,并获取参考用户的学习效率和学习方案,将学习效率最高的参考用户的学习方案发送给待预测用户;并通过集成多个机器学习模型提高了模型对不同样本的泛化能力,实现了对有失败风险的学生做到准确预警和对预警学生进行最优、最适合的学习方案推荐。

    基于迁移学习分布式期望最大化金融数据聚类方法及系统

    公开(公告)号:CN113688934A

    公开(公告)日:2021-11-23

    申请号:CN202111026341.2

    申请日:2021-09-02

    申请人: 济南大学

    摘要: 本发明公开了一种基于迁移学习分布式期望最大化金融数据聚类方法,用于细分金融领域分布式P2P网络环境下的客户数据。包括:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移;对于各个节点上的每个数据点进行类别划分。本发明通过在分布式期望最大化算法中引入迁移学习项,能够显示揭示节点间的协作机制,加速算法收敛,同时,提高聚类精度,精准细分金融客户。

    Android应用程序加密网络流量的提取系统及方法

    公开(公告)号:CN112784289A

    公开(公告)日:2021-05-11

    申请号:CN202110103856.1

    申请日:2021-01-26

    申请人: 济南大学

    摘要: 本发明公开了Android应用程序加密网络流量的提取系统及方法,包括:部署在服务器上的Android模拟器;所述Android模拟器上部署有Android应用程序、Android系统级TLS类库和Java虚拟机,所述Android应用程序内设有业务逻辑代码和应用内置的TLS类库,所述Java虚拟机内部署钩子框架,所述钩子框架内设有系统调用代理模块;所述系统调用代理模块分别与业务逻辑代码、应用内置的TLS类库、Android系统级TLS类库和流量收集模块连接;应用内置的TLS类库和Android系统级TLS类库均与Internet网络连接;流量收集模块与测试结果数据库连接。

    智慧社区的业主身份验证方法及社区服务器

    公开(公告)号:CN109190342B

    公开(公告)日:2020-10-23

    申请号:CN201810947822.9

    申请日:2018-08-20

    摘要: 本发明公开了智慧社区的业主身份验证方法及社区服务器,社区服务器向移动终端发送基本资讯和用户可信度;社区服务器根据用户浏览记录,提取用户的多维度交互特征;挖掘用户行为习惯特征;建立随机森林模型,利用已知社区业主和已知非社区业主的用户行为习惯特征,对随机森林模型进行训练,得到训练好的随机森林模型;按照设定周期挖掘待预测用户的用户行为习惯特征,将待预测用户的用户行为习惯特征输入到训练好的随机森林模型中,预测是社区业主或非社区业主的分类结果;将分类的结果作为调整用户可信度的依据,更改用户的当前可信度;社区服务器接收用户的新访问请求,社区服务器根据用户当前可信度,向用户推送对应的用户可享受的服务内容。

    一种概率主题计算与匹配的舆情监测方法及系统

    公开(公告)号:CN107066585B

    公开(公告)日:2019-10-01

    申请号:CN201710248537.3

    申请日:2017-04-17

    申请人: 济南大学

    IPC分类号: G06F16/906

    摘要: 本发明公开了一种概率主题计算与匹配的舆情监测方法及系统;包括:数据采集解析:利用爬虫集群从数据源中采集页面HTML,然后爬虫集群依据规则库对采集到的页面HTML进行解析得到若干条媒体数据;爬虫集群采用异步方式将解析得到的文档存储在全文检索系统,采用同步方法将解析得到的文档进行主题匹配;中文分词:从全文检索系统中读取文档,将每个文档的标题与内容合并,对合并后的内容进行分词,分词后去掉停用词;主题估计:对分词后的内容估计出主题库与历史文档主题集;主题匹配:将数据采集实时推送的文档推断出实际文档主题集,并将实际文档主题集与用户输入的舆情监测关键词进行匹配,得到有序文档集,从而实现舆情监测。

    基于排序学习和集成学习的异常电话主动预测方法及系统

    公开(公告)号:CN109474755A

    公开(公告)日:2019-03-15

    申请号:CN201811279810.X

    申请日:2018-10-30

    申请人: 济南大学

    IPC分类号: H04M3/22 G06K9/62

    摘要: 本公开公开了基基于排序学习和集成学习的异常电话主动预测方法及系统,包括:采集电话样本,基于分析和组合对电话样本的特征进行选择;将采集到的样本分为训练集和测试集;对于训练集样本,采用排序学习处理数据,得出的结果作为新的测试集,然后组建n组新的训练集继续通过学习模型,得出n组结果,再将这n组结果通过集成学习,输出最后的测试结果。本公开有益效果:使用排序学习和集成学习预测异常电话准确率高于单一使用排序学习,和常规方法比我们的方法更能主动预测异常电话,可以进行解决大规模数据问题。