-
公开(公告)号:CN113704472B
公开(公告)日:2024-04-09
申请号:CN202111005000.7
申请日:2021-08-30
申请人: 济南大学
IPC分类号: G06F16/35 , G06F16/31 , G06F40/205 , G06F40/279 , G06Q50/00
摘要: 本发明属于自然语言处理领域,提供了基于主题记忆网络的仇恨和攻击性言论识别方法及系统,首先将文本转换为词袋向量和词索引序列向量,并进行特征提取得到特征向量;然后基于词袋向量,主题提取模型提取主题混合分布;基于主题混合分布,主题记忆机制获得主题词权重矩阵,并通过两次级联运算与词索引序列向量和特征向量进行联合学习,得到分类特征;最后基于分类特征,分类器得到文本是否属于仇恨和攻击性言论的结果;达到了丰富短文本特征的目的,解决了短文本存在的特征稀疏问题,提高了仇恨和攻击性言论识别的精度。
-
公开(公告)号:CN117634608A
公开(公告)日:2024-03-01
申请号:CN202311283185.7
申请日:2023-09-28
申请人: 济南大学
IPC分类号: G06N5/025 , G06N3/045 , G06N3/0464 , G06N3/09 , G06F18/2415 , G06F18/25
摘要: 本发明属于人工智能技术领域,提供了一种基于双向集成匹配网络的阅读理解方法及系统。首先,融合段落上下文和问答序列对以增强词向量表示;其次,线性集成协同注意力模块和卷积模块以匹配全局交互关系,进而提高机器阅读理解模型的性能。
-
公开(公告)号:CN117217316A
公开(公告)日:2023-12-12
申请号:CN202311283635.2
申请日:2023-09-28
申请人: 济南大学
IPC分类号: G06N5/04 , G06N5/025 , G06N3/0455 , G06F40/253 , G06F40/30
摘要: 本发明提供了基于双解码器融合的数学应用题自动解答方法及系统,基于Seq2Seq与树解码器融合,首先根据语法依存关系,在问题文本中提取与数字关联的属性词;然后引入数字实体嵌入重构预训练语言模型PLM编码器,提取数字实体间关系;基于数字特性增强的PLM编码器初始化构建解码器,解决Seq2Seq解码器数学知识缺失的问题;进一步共享编码器‑解码器对应参数的权重,使编码器参数同时作用于问题解析和表达式生成两任务;最终融合Seq2Seq和树解码器结构学习生成多形式表达式,增强了编码器对数字多样性结构信息的提取和数字特征的表示,提高了数学应用题解答的准确度。
-
公开(公告)号:CN114912027A
公开(公告)日:2022-08-16
申请号:CN202210608349.8
申请日:2022-05-31
申请人: 济南大学
IPC分类号: G06F16/9535 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/20
摘要: 本发明涉及学习方案推荐技术领域,提供了一种基于学习成效预测的学习方案推荐方法及系统,包括:获取待预测用户的基本数据以及对某个课程的学习行为数据,并进行预处理后,构建并筛选出分类特征,得到待预测用户的特征向量,输入训练好的在线课程学生学习成效预测模型,预测得到待预测用户对该课程的学习成效,当学习成效为未通过考核时,发送预警信息给待预测用户,并获取参考用户的学习效率和学习方案,将学习效率最高的参考用户的学习方案发送给待预测用户;并通过集成多个机器学习模型提高了模型对不同样本的泛化能力,实现了对有失败风险的学生做到准确预警和对预警学生进行最优、最适合的学习方案推荐。
-
公开(公告)号:CN107066585B
公开(公告)日:2019-10-01
申请号:CN201710248537.3
申请日:2017-04-17
申请人: 济南大学
IPC分类号: G06F16/906
摘要: 本发明公开了一种概率主题计算与匹配的舆情监测方法及系统;包括:数据采集解析:利用爬虫集群从数据源中采集页面HTML,然后爬虫集群依据规则库对采集到的页面HTML进行解析得到若干条媒体数据;爬虫集群采用异步方式将解析得到的文档存储在全文检索系统,采用同步方法将解析得到的文档进行主题匹配;中文分词:从全文检索系统中读取文档,将每个文档的标题与内容合并,对合并后的内容进行分词,分词后去掉停用词;主题估计:对分词后的内容估计出主题库与历史文档主题集;主题匹配:将数据采集实时推送的文档推断出实际文档主题集,并将实际文档主题集与用户输入的舆情监测关键词进行匹配,得到有序文档集,从而实现舆情监测。
-
公开(公告)号:CN106845230B
公开(公告)日:2019-05-14
申请号:CN201611243535.7
申请日:2016-12-29
申请人: 济南大学
IPC分类号: G06F21/56
摘要: 本发明公开了基于恶意网络流量词库的恶意软件检测可视化方法及系统;包括如下步骤:对HTTP网络流的内容进行单词分割,并建立恶意网络流量词库;训练恶意软件检测模型;对待检测的HTTP网络流的流内容进行单词分割,分割成单词集合;利用得到的词库将单词集合进行向量化处理;将词向量输入到训练得到的恶意软件检测模型中,恶意软件检测模型通过计算给出检测结果;如果待检测HTTP网络流被预测为恶意流量,找到所述恶意流量的HTTP网络流的源头app,将源头app标记为恶意app;计算恶意网络流中单词的权重;恶意网络流的流内容可视化。本发明的有益效果:充分解决了恶意流量检测过程对用户的透明性问题。
-
公开(公告)号:CN109474755A
公开(公告)日:2019-03-15
申请号:CN201811279810.X
申请日:2018-10-30
申请人: 济南大学
CPC分类号: H04M3/2272 , G06K9/6256 , G06K9/6267 , H04M3/2281
摘要: 本公开公开了基基于排序学习和集成学习的异常电话主动预测方法及系统,包括:采集电话样本,基于分析和组合对电话样本的特征进行选择;将采集到的样本分为训练集和测试集;对于训练集样本,采用排序学习处理数据,得出的结果作为新的测试集,然后组建n组新的训练集继续通过学习模型,得出n组结果,再将这n组结果通过集成学习,输出最后的测试结果。本公开有益效果:使用排序学习和集成学习预测异常电话准确率高于单一使用排序学习,和常规方法比我们的方法更能主动预测异常电话,可以进行解决大规模数据问题。
-
公开(公告)号:CN104572505B
公开(公告)日:2017-05-17
申请号:CN201510056231.9
申请日:2015-02-03
申请人: 济南大学
发明人: 马坤
IPC分类号: G06F12/0842 , G06F17/30
摘要: 本发明公开了一种保证海量数据缓存最终一致性的系统及方法,包括:日志监听模块:监听实际数据存储模块的二进制数据操作日志,从中提取出变化数据记录,所述变化数据记录包括变化前后的数据记录,每个数据记录由多个数据列组成;数据缓存最终一致批处理任务模块:接收变化数据记录,将变化数据记录按列拆分为多个变化数据列,将未发生变化的数据列删除,仅仅保留变化数据列,然后利用化简器将变化数据列合并,最后对变化数据列进行修正,实现实际数据存储模块的变化数据记录到目标数据缓存模块的复制,达到海量数据缓存一致。本系统具有高并发、批处理、高可用等特性,通过映射、化简、修正批处理任务实现数据缓存一致的优点。
-
公开(公告)号:CN114863341B
公开(公告)日:2024-05-31
申请号:CN202210535724.0
申请日:2022-05-17
申请人: 济南大学
IPC分类号: G06V20/40 , G06V10/764 , G06V10/80 , G06N3/126 , G06Q50/20
摘要: 本发明涉及人工智能技术领域,提供了一种在线课程学习监督方法及系统,包括:采集待监督用户的退课预测数据;对所述退课预测数据进行预处理和特征提取后,得到退课特征,输入加权软投票集成分类模型,得到待监督用户对所选课程的退课概率;若退课概率超出设定值,则向待监督用户发送提醒信息;其中,加权软投票集成分类模型集成若干个基分类器,并由遗传算法确定每个基分类器的权重,各基分类器的结果经过加权求和得到模型输出的退课概率。提高了模型对不同数据的泛化能力,提高线课程学习监督的精度。
-
公开(公告)号:CN115100664B
公开(公告)日:2024-04-09
申请号:CN202210699828.5
申请日:2022-06-20
申请人: 济南大学
IPC分类号: G06V30/19 , G06V30/18 , G06V30/262 , G06V10/82 , G06F16/35
摘要: 本发明提供了一种基于相关性信息扩展的多模态虚假新闻识别方法及系统,所述方案包括:获取目标新闻的新闻文本及图像;提取所述目标新闻图像的语义表示以及颜色直方图向量,并进行融合,获得视觉融合特征;基于所述目标新闻的新闻文本进行特征提取,获得新闻文本特征;提取目标新闻图像的OCR文本,并基于OCR文本提取OCR文本特征;计算所述新闻文本特征和OCR文本特征的文本相关性特征;并计算所述新闻文本特征及视觉融合特征的相似度特征;将所述新闻文本特征、OCR文本特征、图像的语义表示、文本相关性特征和相似度特征进行拼接,输入预先训练的分类器,获得目标新闻是否为假新闻的判别结果。
-
-
-
-
-
-
-
-
-