-
公开(公告)号:CN119578496A
公开(公告)日:2025-03-07
申请号:CN202510131006.0
申请日:2025-02-06
Applicant: 北京邮电大学 , 微梦创科网络科技(中国)有限公司
IPC: G06N3/0895 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06F18/25 , G06F18/27 , G06Q50/00 , G06Q30/018 , G06Q30/0201
Abstract: 本发明提供一种基于测试时训练的信息传播预测模型训练方法、预测方法及系统,根据用户集和级联集构建有向社交图和序列扩散超图,构建训练集和测试集;信息传播预测模型包括宏观预测分支、微观预测分支和引入MAE的辅助自监督学习分支,三条分支共享特征提取器;训练时基于训练集对模型进行联合训练,引入一致性损失确保辅助任务与主任务对特征提取器参数的优化方向一致;测试时针对特定测试样本以最小化辅助自监督学习任务损失为目标进行测试时训练,调整特征提取器以适应样本分布,结合任务特定的预测头获取信息传播预测模型。本发明能够实现多尺度信息传播预测,解决信息传播预测任务中的分布偏移问题,提高模型在不同测试环境下的泛化性能。
-
公开(公告)号:CN116738962B
公开(公告)日:2024-04-26
申请号:CN202310157754.7
申请日:2023-02-13
Applicant: 北京邮电大学
IPC: G06F40/194 , G06F40/166 , G06F40/226 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种面向社交媒体的事实核查方法及系统,接收网页语句和比对文章,将所述网页语句和比对文章输入到推文核查模型中,在推文核查模型中将所述比对文章拆分为多个比对语句,将网页语句和每个比对语句组合拼接为句子对,将所述句子对输入到预设的第一BERT模型中,输出对应所述句子对的第一向量;将所述第一向量分别输入到预设的第一分类器中,得到证据筛选结果;将所述第一向量经过全连接层进行处理得到第二向量,基于所述证据筛选结果对第二向量进行加权处理,将加权处理后的多个第二向量输入到预设的验证模型中,所述验证模型通过第二分类器输出验证结果。本方案不需要人为进行处理,在节约大量人力资源的前提下提高了验证精确度。
-
公开(公告)号:CN116260668A
公开(公告)日:2023-06-13
申请号:CN202310070374.X
申请日:2023-01-12
Applicant: 北京邮电大学
IPC: H04L12/18 , H04L51/216 , G06N3/08 , G06N3/0464 , H04L51/04 , H04L51/21
Abstract: 本发明提供一种面向聊天群组的关键人物提取方法及装置,包括:获取聊天群组中的消息信息,采用滑动时间窗口算法为消息构建全连接消息图,采用结构感知图神经网络计算消息边的向量值,并通过多层感知器层计算第一权值,构建消息关系图;基于消息关系图确定发送消息的用户,并计算用户边第二权值,构建用户关系图;基于各用户的发言数和各用户边的第二权值设置预设PageRank算法的分数分配权重,对用户关系图采用预设PageRank算法进行迭代,直至收敛,得到各用户的影响力分数;按照影响力分数对各用户进行排序,以提取该聊天群组中的关键人物。本发明构建了有向的用户关系图,并对PageRank算法进行改进,实现了针对聊天群组的关键人物提取。
-
公开(公告)号:CN116738962A
公开(公告)日:2023-09-12
申请号:CN202310157754.7
申请日:2023-02-13
Applicant: 北京邮电大学
IPC: G06F40/194 , G06F40/166 , G06F40/226 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种面向社交媒体的事实核查方法及系统,接收网页语句和比对文章,将所述网页语句和比对文章输入到推文核查模型中,在推文核查模型中将所述比对文章拆分为多个比对语句,将网页语句和每个比对语句组合拼接为句子对,将所述句子对输入到预设的第一BERT模型中,输出对应所述句子对的第一向量;将所述第一向量分别输入到预设的第一分类器中,得到证据筛选结果;将所述第一向量经过全连接层进行处理得到第二向量,基于所述证据筛选结果对第二向量进行加权处理,将加权处理后的多个第二向量输入到预设的验证模型中,所述验证模型通过第二分类器输出验证结果。本方案不需要人为进行处理,在节约大量人力资源的前提下提高了验证精确度。
-
公开(公告)号:CN118709739A
公开(公告)日:2024-09-27
申请号:CN202410839791.0
申请日:2024-06-26
Applicant: 北京邮电大学
Abstract: 本发明涉及一种用于提升模型训练效率的动态数据选择方法。方法包括:利用预设的样本集对模型进行预设轮次的预训练,并构建大小为w的滑动窗口;滑动窗口用于保存样本集中的每个样本在过去最近的w个训练轮次中的损失值;针对预设轮次之后的每一个训练轮次,均执行:S1,确定当前训练轮次的重要子集,过程为:基于上一个滑动窗口内的损失值,更新样本集中每个样本的当前综合得分;基于该当前综合得分和预设的选择率,确定当前训练轮次的重要子集;S2,利用该重要子集进行当前训练轮次的模型训练,并根据训练结果确定当前滑动窗口内的损失值;循环执行S1和S2,直至模型收敛。本申请,可以在尽量不损失训练精度的同时,提高模型的训练效率。
-
公开(公告)号:CN116260668B
公开(公告)日:2024-06-28
申请号:CN202310070374.X
申请日:2023-01-12
Applicant: 北京邮电大学
IPC: H04L12/18 , H04L51/216 , G06N3/08 , G06N3/0464 , H04L51/04 , H04L51/21
Abstract: 本发明提供一种面向聊天群组的关键人物提取方法及装置,包括:获取聊天群组中的消息信息,采用滑动时间窗口算法为消息构建全连接消息图,采用结构感知图神经网络计算消息边的向量值,并通过多层感知器层计算第一权值,构建消息关系图;基于消息关系图确定发送消息的用户,并计算用户边第二权值,构建用户关系图;基于各用户的发言数和各用户边的第二权值设置预设PageRank算法的分数分配权重,对用户关系图采用预设PageRank算法进行迭代,直至收敛,得到各用户的影响力分数;按照影响力分数对各用户进行排序,以提取该聊天群组中的关键人物。本发明构建了有向的用户关系图,并对PageRank算法进行改进,实现了针对聊天群组的关键人物提取。
-
-
-
-
-