-
公开(公告)号:CN106202530A
公开(公告)日:2016-12-07
申请号:CN201610586683.2
申请日:2016-07-22
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种数据处理方法及装置,所述方法包括:获取资讯,将资讯加入资讯集合中;将资讯集合中的一篇资讯作为待处理文档;若均为未处理文档,根据预设规则将待处理文档映射成对应的特征向量;否则,根据预设规则将待处理文档映射成对应的特征向量,根据获取待处理文档的第一时间以及待处理文档中事件发生的第二时间,分别计算待处理文档对应的特征向量与话题模型集合中的各个已检测话题对应的向量的相似度,选取最大相似度值进行判断;将待处理文档的下一篇文档作为待处理文档,直到资讯集合中的全部资讯全部处理完毕。所述方法考虑了获取待处理文档的第一时间以及待处理文档中事件发生的第二时间,提高了话题模型的精确度。
-
公开(公告)号:CN116431847B
公开(公告)日:2023-11-14
申请号:CN202310700719.5
申请日:2023-06-14
Applicant: 北京邮电大学
IPC: G06F16/51 , G06F16/583 , G06F16/31 , G06F16/383 , G06F18/25 , G06N3/045 , G06N3/047 , G06N3/048 , G06N3/0464 , G06N3/094 , G06N3/084 , G06N5/04
Abstract: 本申请提供一种基于多重对比和双路对抗的跨模态哈希检索方法及设备,能够对图像模态的图像信息和文本模态的文本信息进行跨模态语义融合,得到图像推理特征和文本推理特征;对图像推理特征和文本推理特征进行模态间、模态内和全局局部的多重对比哈希学习和双路对抗学习,得到二进制哈希码,通过多重对比学习进行全局局部、模态内和模态间的语义匹配和融合,并通过双路对抗学习机制更好地对齐不同模态哈希码的语义分布,产生更高质量和更具判别性的二进制哈希码作为跨模态检索的统一哈希表示。使用二进制哈希码,可以快速实现跨模态检索;此外,哈希码占用的内存空间也显著减少,且哈希码具有唯一性,以此确保跨模态检索的高效性和准确性。
-
公开(公告)号:CN116614484A
公开(公告)日:2023-08-18
申请号:CN202310884262.8
申请日:2023-07-19
Applicant: 北京邮电大学
Abstract: 本申请提供一种基于结构增强的异质数据联邦学习方法及相关设备包括接收服务器端的全局模型根据全局模型对本地网络模型进行初始化;响应于确定完成所述初始化,获取本地数据根据本地数据对所述本地网络模型进行正则化训练确定第一损失函数;响应于确定完成训练获取预设采样系数和预设采样宽度对本地网络模型进行结构增强训练,根据预设采样系数和所述预设采样宽度对所述本地网络模型进行采样确定若干子网络模型;对所述本地数据进行数据增强处理确定训练用数据,根据所述训练用数据对若干所述子网络模型进行更新训练确定全局损失函数;根据全局损失函数对本地网络模型的权重进行更新将所述全局损失函数将更新的所述本地网络模型上传所述服务器端。
-
公开(公告)号:CN116578674A
公开(公告)日:2023-08-11
申请号:CN202310826329.2
申请日:2023-07-07
Applicant: 北京邮电大学
IPC: G06F16/33 , G06N3/0455 , G06N3/08 , G06F16/35 , G06F18/23
Abstract: 本申请提供联邦变分自编码主题模型训练方法、主题预测方法及装置,方法包括:在当前的剪枝训练轮次中,接收联邦学习系统中的各个节点各自采用本地的文本训练数据训练得到的局部变分自编码主题模型的模型参数和神经元累计梯度,并对各个局部变分自编码主题模型的模型参数进行聚类以生成目标变分自编码主题模型;基于各个局部变分自编码主题模型的神经元累计梯度对目标变分自编码主题模型进行神经元剪枝处理,得到当前的全局变分自编码主题模型。本申请能够在有效保护本地数据隐私的基础上,能够有效降低模型训练过程的通信和计算开销,能够有效提高采用训练得到的主题模型预测文本数据所属主题类型的预测精度及可靠性。
-
公开(公告)号:CN115457619A
公开(公告)日:2022-12-09
申请号:CN202210895264.2
申请日:2022-07-26
Applicant: 北京邮电大学
IPC: G06V40/16 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/764
Abstract: 本申请提供一种学生表情识别方法及教学状态评估方法及相关设备。通过预先训练的学生表情识别模型提取课堂教学视频中人脸图像上多个视角的表情特征;然后计算提取的多个视角的表情特征对应的权重,再融合计算得到的权重和对应的表情特征,得到全局表情特征;最后,根据全局表情特征得到学生表情分类结果。此外,在学生表情识别方法的基础上,通过融合课堂性质、学生表情识别结果和学生行为识别结果综合进行课堂教学状态评估值的计算。最后根据综合评估值判定学生课堂听课状态。本申请能够充分提取学生表情特征,提高姿势偏移场景下学生表情识别能力,还能够客观准确地对课堂教学视频中的教学状态进行评估。
-
公开(公告)号:CN114818737B
公开(公告)日:2022-11-18
申请号:CN202210745539.4
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文数据文本语义特征提取方法、系统及存储介质,所述方法包括:获取科技论文的文本信息,并基于获取到的科技论文的文本信息构建实体关系图,所述文本信息包括论文标题以及关键词,实体关系图中的节点为论文标题或关键词,实体关系图中的边为节点之间的关联关系;基于获取到的科技论文的文本信息提取语义特征,得到语义特征矩阵;基于实体关系图确定原始邻接矩阵,将语义特征矩阵及所述原始邻接矩阵输入至图网络模型,得到空间特征矩阵;将语义特征矩阵与空间特征矩阵进行特征融合,得到科技论文的最终语义特征。该特征提取方法在提取科技论文语料的语义特征的基础上,利用知识图谱的空间关联,可较好的提取到科技论文的语义特征。
-
公开(公告)号:CN114817578B
公开(公告)日:2022-09-09
申请号:CN202210745739.X
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。
-
公开(公告)号:CN114817578A
公开(公告)日:2022-07-29
申请号:CN202210745739.X
申请日:2022-06-29
Applicant: 北京邮电大学
Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。
-
公开(公告)号:CN113535912A
公开(公告)日:2021-10-22
申请号:CN202110540413.9
申请日:2021-05-18
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33 , G06F40/194 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本公开提供一种基于图卷积网络和注意力机制的文本关联方法及相关设备,该方法包括:获取用户问题和文档;通过分词算法分别提取所述用户问题和所述文档的关键词及权重;利用词向量模型得到所述用户问题的词向量序列和所述文档的词向量序列;基于文档的词向量序列构建交互图;将用户问题的词向量和文档的词向量进行交互后构建视图;将所有所述视图输入预先构建的图卷积神经网络模型中,输出所述用户问题和所述文档的关联标签,其中,所述图卷积神经网络模型是经过预训练的。本公开采用图结构来表示文档,图结构可以在一定程度上保持文档中关键词之间的交互关系,既解决了词向量模型文本长度表征有限的问题,同时提高了科研论文检索的准确性。
-
公开(公告)号:CN113312480A
公开(公告)日:2021-08-27
申请号:CN202110548961.6
申请日:2021-05-19
Applicant: 北京邮电大学
Abstract: 本公开提供一种基于图卷积网络的科技论文层级多标签分类方法及设备,其中方法包括:利用注意力机制在论文与关键词的无向图上进行图形节点嵌入,输出更新后的论文节点特征;将更新后的论文节点特征输入预先训练好的多输出深度神经网络模型中,输出整体的全局标签和局部标签;通过注意力机制组合局部标签和全局标签,组合后的标签经计算处理后得到最终的论文标签分类结果。本公开提供的方法及设备丰富了论文的语义表示,在论文分类中考虑了具有相同关键词的论文之间的关联,使得论文分类更加准确;并且分类过程中每一层仅关注相应层级的标签,减少了每个层需要区分的类别数量,充分获取到不同层级标签的特征,提高了论文分类的准确性。
-
-
-
-
-
-
-
-
-