-
公开(公告)号:CN118250089B
公开(公告)日:2024-08-02
申请号:CN202410650796.9
申请日:2024-05-24
Applicant: 南京理工大学
IPC: H04L9/40 , H04L43/04 , H04L41/142 , G06F18/243 , H04L67/02
Abstract: 本发明公开了一种基于流量多尺度特征的加密代理大语言模型会话属性推断方法及系统,方法包括:将待测五元组会话流进行包分簇,将加密代理的大语言模型连续会话流按照会话进行切分;提取包簇内所有数据包的多维属性,形成表征单个包簇的多维属性特征,根据包簇传输次序形成包簇特征时序矩阵;针对各维属性列向量在不同时刻构成的时间序列,进行时序相关性分析,将得到的融合特征与包簇特征行向量的相似性度量结果组合成向量,输入随机森林算法模型中进行有监督学习。本发明通过构建流量多尺度特征来实现加密代理大语言模型会话属性的推断,有助于对加密代理流量中文本大模型属性进行更加准确的理解。
-
公开(公告)号:CN118250089A
公开(公告)日:2024-06-25
申请号:CN202410650796.9
申请日:2024-05-24
Applicant: 南京理工大学
IPC: H04L9/40 , H04L43/04 , H04L41/142 , G06F18/243 , H04L67/02
Abstract: 本发明公开了一种基于流量多尺度特征的加密代理大语言模型会话属性推断方法及系统,方法包括:将待测五元组会话流进行包分簇,将加密代理的大语言模型连续会话流按照会话进行切分;提取包簇内所有数据包的多维属性,形成表征单个包簇的多维属性特征,根据包簇传输次序形成包簇特征时序矩阵;针对各维属性列向量在不同时刻构成的时间序列,进行时序相关性分析,将得到的融合特征与包簇特征行向量的相似性度量结果组合成向量,输入随机森林算法模型中进行有监督学习。本发明通过构建流量多尺度特征来实现加密代理大语言模型会话属性的推断,有助于对加密代理流量中文本大模型属性进行更加准确的理解。
-