-
公开(公告)号:CN119025934A
公开(公告)日:2024-11-26
申请号:CN202411170592.1
申请日:2024-08-26
Applicant: 东南大学
IPC: G06F18/22 , G06F18/10 , G06F18/25 , G06F40/289 , G06F18/24 , G06N3/042 , G06N3/084 , G06N5/01 , G06N20/00 , G06N3/045 , G06Q50/00
Abstract: 本发明属于社交媒体数据分析领域,涉及用户数据的预处理、特征提取、分类和相似性计算技术,尤其涉及基于嵌入修正的无监督用户身份关联技术。包括S1、采用排序、清洗、转换、归一化等方式进行数据预处理;S2、基于预训练语言模型以及图神经网络技术,获取用户多元单属性嵌入;S3、利用注意力机制对不同的单属性嵌入进行特征融合;S4、在单平台和跨平台两个方面同时整合多种类型的信息形成多维用户判别性特征;S5、利用用户判别性特征构造相似用户对,训练生成修正过程中所需的相关性信息,并获得最终用户嵌入;S6、计算每一对跨平台用户间的嵌入向量余弦相似度以作为用户匹配得分,根据得分确定跨网络社交网络用户。