一种基于网络社交平台的用户行为相似性计算方法

    公开(公告)号:CN116415074A

    公开(公告)日:2023-07-11

    申请号:CN202310036751.8

    申请日:2023-01-10

    Abstract: 本发明提供一种基于网络社交平台的用户行为相似性计算方法,包括以下步骤:步骤1,基于网络社交平台用户数据集成为包括发文内容、发文时间、用户信息的数据源文件;步骤2,对数据源文件进行数据处理;步骤3,将处理后的数据源文件的数据存储在数据库当中;步骤4,采用seq2seq算法建立机器学习模型,并基于已建立的机器学习模型识别数据源文件为发文内容的特征向量;步骤5,通过计算Jaccard相似度,得出用户间的行为相似值。本发明通过利用大数据技术,在网络社交平台发文数据的基础上,对数据进行处理计算,并且通过建立算法模型来达到计算用户行为相似度的目的。

    一种基于时空矢量场的城市人群活动聚集度计算方法

    公开(公告)号:CN115757670A

    公开(公告)日:2023-03-07

    申请号:CN202211430463.2

    申请日:2022-11-15

    Abstract: 本发明提供一种基于时空矢量场的城市人群活动聚集度计算方法,包括以下步骤:步骤1,获取人群活动数据,并对人群活动数据进行预处理;步骤2,划分城市时空单元;步骤3,计算每个时空单元间的人群活动主体方向;步骤4,计算每个时空单元间的人群活动主体流量;步骤5,计算人群活动时空矢量场中每个时空单元的散度算子,并将其转化为人群活动聚集度。本发明提出的方法通过建模人群活动的趋向性构造人群活动的时空矢量场,并通过矢量场理论中的散度算子来定量计算人群活动聚散强度。本发明还在模拟数据集上进行了实验,说明了方法的有效性。

    一种基于深度学习的图像电子证据筛选方法

    公开(公告)号:CN112464015A

    公开(公告)日:2021-03-09

    申请号:CN202011494349.7

    申请日:2020-12-17

    Abstract: 本发明提供一种基于深度学习的图像电子证据筛选方法,包括从电子设备中获取数据为证据源,复制证据源进行图像预处理得到图像证据数据集;将图像证据数据集输送到深度学习分类网络中进行分类,保存分类结果和分类特征;同时将图像证据数据集输送到深度学习检测网络中进行检测,保存检测结果和检测特征;将分类结果和检测结果进行阈值判别,筛选出相同目标类别;将分类特征和检测特征进行特征比对,筛选出相同目标类别;经过阈值筛选和特征比对的同目标类别图像即为电子证据。为了提高图像电子证据的精度,采用两种深度学习方法进行图像电子证据筛选;为了提高图像电子证据的有效性,运用阈值筛选和特征比对的方法进行图像电子证据筛选。

    基于正则极限学习机的安卓恶意apk检测方法

    公开(公告)号:CN115310089A

    公开(公告)日:2022-11-08

    申请号:CN202211047790.X

    申请日:2022-08-30

    Abstract: 本发明提供了一种基于正则极限学习机的安卓恶意apk检测方法,所述方法包括以下步骤:步骤1,按照功能类别对样本应用程序集apk进行分类,得到M个不同功能类别的样本子集;步骤2,从样本子集的应用清单AndroidManifest.xml文件中提取出第一类特征属性,根据样本子集的.smali文件提取出第二类特征属性,构造出基础特征矩阵R;步骤3,筛选出共有特征集合,作为特征子集X;步骤4,基于极限学习机算法进行模型训练得到初始分类检测模型等;步骤5,提取待检测应用程序apk,利用分类检测模型检测待检测应用程序是否为恶意应用程序。本发明能够快速高效地检测出威胁Android系统信息安全的恶意应用程序。

    一种案件大数据网络身份关联与人物画像方法

    公开(公告)号:CN115374371A

    公开(公告)日:2022-11-22

    申请号:CN202210951172.1

    申请日:2022-08-09

    Abstract: 本发明提供一种案件大数据网络身份关联与人物画像方法,所述方法包括:步骤1,获取案件数据;步骤2,对获取的数据进行清洗;步骤3,采用重叠社团发现技术识别重要目标;步骤4,用户博文向量化;步骤5,用户个人信息向量化;步骤6,源用户和候选用户的博文相似度计算。本发明能够对涉案数据进行很好的处理;本发明中采用基于重叠社团发现的重要目标识别技术,利用局部聚类结构的引导来检测重叠社团,将复杂的重叠聚类问题降低为一个更简单、更易于处理的非重叠分区问题;本发明利用向量表示、行为关联等方法,构建基于多维特征的网络用户身份关联模型,挖掘跨社交平台用户关联关系和还原用户社交关系网络。

    一种基于模型融合的海量旅游网络文本语义分析方法

    公开(公告)号:CN115099241A

    公开(公告)日:2022-09-23

    申请号:CN202210772206.0

    申请日:2022-06-30

    Abstract: 本发明公开了一种基于模型融合的海量旅游网络文本语义分析方法,获取评论数据集,并对数据集中的数据进行预处理;对数据集中的数据进行可视化分析;对评论数据集采用DBSCAN密度聚类,获得数据集D1;利用Word2Vec模型,得到数据集D2;利用Simhash算法,得到数据集D3;利用N‑Gram语言模型得到数据集D4;将数据集D1‑D4中的数据结果综合得到数据集D5;将预处理之后的数据集D5导入TF‑IDF模型和LDA模型,提取得到关键词和主题词;词向量化计算每条评论的关键词向量与主题词向量之间的距离,并根据距离输出结果高的词;根据特色词、酒店名称、酒店类型相互组合构建三元组,得到知识图谱。

    一种基于模型融合的海量旅游网络文本语义分析方法

    公开(公告)号:CN115099241B

    公开(公告)日:2024-04-12

    申请号:CN202210772206.0

    申请日:2022-06-30

    Abstract: 本发明公开了一种基于模型融合的海量旅游网络文本语义分析方法,获取评论数据集,并对数据集中的数据进行预处理;对数据集中的数据进行可视化分析;对评论数据集采用DBSCAN密度聚类,获得数据集D1;利用Word2Vec模型,得到数据集D2;利用Simhash算法,得到数据集D3;利用N‑Gram语言模型得到数据集D4;将数据集D1‑D4中的数据结果综合得到数据集D5;将预处理之后的数据集D5导入TF‑IDF模型和LDA模型,提取得到关键词和主题词;词向量化计算每条评论的关键词向量与主题词向量之间的距离,并根据距离输出结果高的词;根据特色词、酒店名称、酒店类型相互组合构建三元组,得到知识图谱。

Patent Agency Ranking