-
公开(公告)号:CN111221964A
公开(公告)日:2020-06-02
申请号:CN201911360607.X
申请日:2019-12-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种不同分面观点演化趋势引导的文本生成方法,(1)构造分面分类器和观点分类器:收集社交网络中特定热点事件的全部博文作为源语料集,根据专家知识或舆情事件管理需要,确定舆情事件的重要分面并给出分面描述;根据语料子句与分面描述的语义距离实现源语料集中不同分面的子句提取,以此训练分面分类器;利用基于观点的文本聚类方法将每个分面中不同观点语料聚类,利用聚类后的语料训练观点分类器。(2)生成对抗观点文本:文本生成模型包括一个生成器和三个对抗训练的判别器,生成器生成和语料句子分面相同、观点对抗的文本,三个判别器区分生成器生成的句子和源语料句子,如此反复对抗训练,直到三个判别器均无法区分生成器生成的句子和源语料句子。
-
公开(公告)号:CN111192154A
公开(公告)日:2020-05-22
申请号:CN201911358527.0
申请日:2019-12-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于风格迁移的跨平台用户节点匹配方法,(1)通过auto-encoder学习目标网络节点低维表征的训练以及从GCN中提取目标网络的风格信息;(2)通过将(1)中得到的风格信息与源网络内容信息融合得到符合目标网络风格的源网络节点表征向量;(3)计算(1)与(2)中分别得到的节点表征之间的相似度从而得到相似度矩阵,并利用拓扑一致性优化相似度矩阵,以提高匹配准确率。
-
公开(公告)号:CN111541621B
公开(公告)日:2021-09-07
申请号:CN201911358529.X
申请日:2019-12-25
Applicant: 西安交通大学
IPC: H04L12/851
Abstract: 本发明公开了一种基于转向包间隔概率分布的VPN流量分类方法,其特征在于:1)从网络采集较为广泛的加密流量数据;2)对流量数据进行数据包标识并组流,流以会话的形式表示隐含了更多有助于分类的统计信息3)针对VPN流量和非VPN流量分类,充分考虑到了这两种流量在传输过程中的差异,提取了一种新的高效的特征,称为转向包时间间隔,并且在此基础上通过对转向包时间间隔的概率分布统计更细粒度的对该特征进行了优化拓展,得到了基于转向包时间间隔的概率分布的统计特征;4)因为采用集成学习,拥有较传统流量分类模型更高的准确率和更广泛的应用范围,具有实际应用的优势。
-
公开(公告)号:CN111541621A
公开(公告)日:2020-08-14
申请号:CN201911358529.X
申请日:2019-12-25
Applicant: 西安交通大学
IPC: H04L12/851
Abstract: 本发明公开了一种基于转向包间隔概率分布的VPN流量分类方法,其特征在于:1)从网络采集较为广泛的加密流量数据;2)对流量数据进行数据包标识并组流,流以会话的形式表示隐含了更多有助于分类的统计信息3)针对VPN流量和非VPN流量分类,充分考虑到了这两种流量在传输过程中的差异,提取了一种新的高效的特征,称为转向包时间间隔,并且在此基础上通过对转向包时间间隔的概率分布统计更细粒度的对该特征进行了优化拓展,得到了基于转向包时间间隔的概率分布的统计特征;4)因为采用集成学习,拥有较传统流量分类模型更高的准确率和更广泛的应用范围,具有实际应用的优势。
-
公开(公告)号:CN111192154B
公开(公告)日:2023-05-02
申请号:CN201911358527.0
申请日:2019-12-25
Applicant: 西安交通大学
IPC: G06Q50/00 , G06N3/0455 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于风格迁移的跨平台用户节点匹配方法,(1)通过auto‑encoder学习目标网络节点低维表征的训练以及从GCN中提取目标网络的风格信息;(2)通过将(1)中得到的风格信息与源网络内容信息融合得到符合目标网络风格的源网络节点表征向量;(3)计算(1)与(2)中分别得到的节点表征之间的相似度从而得到相似度矩阵,并利用拓扑一致性优化相似度矩阵,以提高匹配准确率。
-
公开(公告)号:CN111221964B
公开(公告)日:2023-04-14
申请号:CN201911360607.X
申请日:2019-12-25
Applicant: 西安交通大学
IPC: G06F16/35 , G06N3/0442 , G06N3/0464 , G06N3/045 , G06N3/094
Abstract: 本发明公开了一种不同分面观点演化趋势引导的文本生成方法,(1)构造分面分类器和观点分类器:收集社交网络中特定热点事件的全部博文作为源语料集,根据专家知识或舆情事件管理需要,确定舆情事件的重要分面并给出分面描述;根据语料子句与分面描述的语义距离实现源语料集中不同分面的子句提取,以此训练分面分类器;利用基于观点的文本聚类方法将每个分面中不同观点语料聚类,利用聚类后的语料训练观点分类器。(2)生成对抗观点文本:文本生成模型包括一个生成器和三个对抗训练的判别器,生成器生成和语料句子分面相同、观点对抗的文本,三个判别器区分生成器生成的句子和源语料句子,如此反复对抗训练,直到三个判别器均无法区分生成器生成的句子和源语料句子。
-
-
-
-
-