一种基于多信息过滤编码的多标签文本分类方法及系统

    公开(公告)号:CN115168566A

    公开(公告)日:2022-10-11

    申请号:CN202210914791.3

    申请日:2022-08-01

    Applicant: 济南大学

    Abstract: 本发明公开了一种基于多信息过滤编码的多标签文本分类方法及系统,该方法包括:获取包含标签的文本训练集;基于文本训练集,得到文本和标签的单词向量;通过多信息过滤编码进行文本信息和标签信息的过滤和特征提取,得到过滤的文本特征和标签特征;通过过滤的文本特征和过滤的标签特征交互,结合过滤的文本特征,得到最终文本向量表示,以此训练多标签文本分类模型;利用训练好的多标签文本分类模型对待分类文本数据集进行多标签文本分类。本发明通过过滤文本信息和标签信息的噪音及冗余信息,分别在文本空间和标签空间提取过滤信息中的语义特征,通过过滤的语义特征的交互,捕获更多与分类相关的信息,提高多标签文本分类的精度。

    从N到N+1的多类转换恶意软件检测方法

    公开(公告)号:CN112861130B

    公开(公告)日:2022-09-06

    申请号:CN202110118437.5

    申请日:2021-01-28

    Applicant: 济南大学

    Abstract: 本公开提供了一种从N到N+1的多类转换恶意软件检测方法,包括获取待测软件的网络流量,输入到预训练的检测模型中,输出待测软件的检测结果;其中,所述检测模型的训练及更新过程包括:通过聚类算法对初始训练集进行分类处理,将所述初始训练集构建成树形结构,树的节点为训练样本中不同类别的质心;随着训练样本的更新,将增量数据样本输入预训练的检测模型,对所述检测模型进行更新,生成最新的检测模型;所述方案通过对动态增长的数据集进行有效处理,解决了训练数据的数量和类的数量随着时间的推移而增加场景下的恶意软件检测问题。

    基于图内图间联合信息传播的假新闻检测方法及系统

    公开(公告)号:CN114911933A

    公开(公告)日:2022-08-16

    申请号:CN202210446994.4

    申请日:2022-04-26

    Applicant: 济南大学

    Abstract: 本发明属于自然语言处理技术领域,提供了基于图内图间联合信息传播的假新闻检测方法及系统,包括:获取待检测文本,并进行预处理后,分别构建文本顺序图、文本语法图和文本语义图;基于文本顺序图、文本语法图和文本语义图,先进行图内信息交互,再进行图间信息交互后,得到联合信息文本顺序图、联合信息文本语法图和联合信息文本语义图,通过图注意力机制和节点注意力机制,得到待检测文本的向量表示,输入到分类器,得到待检测文本是否属于假新闻的结果。解决了短文本向量化时存在的特征稀疏问题,丰富了文本向量表示,解决了长距离和非连续文本信息交互缺失问题,提高文本表示的精确度。

    支持双向隐私保护的机器学习安全聚合预测方法及系统

    公开(公告)号:CN112347473B

    公开(公告)日:2022-07-26

    申请号:CN202011230255.9

    申请日:2020-11-06

    Applicant: 济南大学

    Abstract: 本申请公开了支持双向隐私保护的机器学习安全聚合预测方法及系统,包括:客户端、计算服务器和聚合服务器;计算服务器接收客户端发送的待预测数据的数据份额;所述计算服务器对数据份额进行处理,得到预测结果份额;所述计算服务器对预测结果份额进行盲化处理,得到盲化预测结果份额;所述计算服务器将盲化预测结果份额发送给聚合服务器;所述聚合服务器对盲化预测结果份额进行移除盲化处理和加噪声处理,将结果反馈给客户端。

    一种基于ALBERT与多重词信息嵌入的命名实体识别方法

    公开(公告)号:CN113128232B

    公开(公告)日:2022-06-21

    申请号:CN202110512639.8

    申请日:2021-05-11

    Abstract: 本发明提供了一种基于ALBERT与多重词信息嵌入的命名实体识别方法,利用训练后的深度学习模型对预处理后的待识别语句进行处理,得到识别结果;深度学习模型的训练过程包括根据已标注语料主题,进行未标注语料爬取;获取预训练好的ALBERT语言模型,对全部语料进行预训练微调,得到字向量;构建命名实体识别数据集,并对数据集做预处理,依据数据集构建多重词信息特征;将字向量序列与多重词信息特征序列进行融合,得到加强的字向量序列;构建深度学习模型,利用加强的字向量序列进行模型训练。本发明可以有效的表征字的多义性,提升实体识别的效率。

    基于多模态特征的测谎数据处理方法及系统

    公开(公告)号:CN113080969B

    公开(公告)日:2022-06-21

    申请号:CN202110333041.2

    申请日:2021-03-29

    Abstract: 本发明公开了基于多模态特征的测谎数据处理方法及系统,包括:获取被审讯人员的审讯视频,获取被审讯人员的审讯过程中实时心率;对审讯视频中的音频进行端点检测,得到若干个音频端点;提取音频端点对应视频中被审讯人员的面部图像,识别面部图像中的微表情特征;对微表情特征进行测谎结果识别,得到微表情测谎结果;基于所有的音频端点,对整个音频进行划分,得到若干个音频段,对每个音频段进行测谎结果识别,得到音频测谎结果;对音频端点对应的心率进行测谎结果识别,得到心率测谎结果;综合微表情测谎结果、音频测谎结果和心率测谎结果,得到最终的测谎结果。

    蜜罐和沙箱相互增强的恶意程序行为处理方法及系统

    公开(公告)号:CN114629714A

    公开(公告)日:2022-06-14

    申请号:CN202210319190.8

    申请日:2022-03-29

    Abstract: 本发明公开了蜜罐和沙箱相互增强的恶意程序行为处理方法及系统,蜜罐对恶意代码进行诱导捕获;将捕获的恶意代码及产生的信息发送给沙箱;沙箱生成代码运行环境配置文件;沙箱根据恶意代码运行环境配置文件,生成恶意代码运行环境;在恶意代码运行环境中,沙箱触发恶意代码的运行分析恶意代码的运行过程;沙箱对运行过程中的网络通信行为进行分析,并将网络通信行为发送给蜜罐和虚拟网络;蜜罐接收网络通信行为后,对已知网络通信行为进行交互,对未知网络通信行为通过记录沙箱与虚拟网络的交互过程进行学习提升捕获能力;学习过后的蜜罐,重新对恶意代码进行诱导捕获。使蜜罐更高效的捕获恶意样本以及使沙箱更高效安全的分析恶意样本。

    带噪语音情感识别方法、系统、设备及存储介质

    公开(公告)号:CN113053417B

    公开(公告)日:2022-04-19

    申请号:CN202110332451.5

    申请日:2021-03-29

    Abstract: 本发明公开了带噪语音情感识别方法、系统、设备及存储介质,获取待识别的带噪语音信号;对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;对有声音的语音片段进行特征提取,得到语音特征;将语音特征输入到训练后的语音情感识别模型中,输出情感类别。端点检测方法可以在样本重建过程中,计算正交匹配追踪算法算法迭代过程中预测残差与上一次迭代的信号估计值之间的条件熵,根据迭代前后的残差条件熵差值,在样本重建完成的同时直接给出重建样本的端点检测结果,充分利用样本重建过程中产生的数据,节省系统后续的分析与处理时间,且由于该端点检测方法是建立在压缩感知重建算法之上的,具有抗噪性能。

Patent Agency Ranking