数据处理方法及装置
    11.
    发明公开

    公开(公告)号:CN106202530A

    公开(公告)日:2016-12-07

    申请号:CN201610586683.2

    申请日:2016-07-22

    Abstract: 本发明实施例提供一种数据处理方法及装置,所述方法包括:获取资讯,将资讯加入资讯集合中;将资讯集合中的一篇资讯作为待处理文档;若均为未处理文档,根据预设规则将待处理文档映射成对应的特征向量;否则,根据预设规则将待处理文档映射成对应的特征向量,根据获取待处理文档的第一时间以及待处理文档中事件发生的第二时间,分别计算待处理文档对应的特征向量与话题模型集合中的各个已检测话题对应的向量的相似度,选取最大相似度值进行判断;将待处理文档的下一篇文档作为待处理文档,直到资讯集合中的全部资讯全部处理完毕。所述方法考虑了获取待处理文档的第一时间以及待处理文档中事件发生的第二时间,提高了话题模型的精确度。

    基于结构增强的异质数据联邦学习方法及相关设备

    公开(公告)号:CN116614484A

    公开(公告)日:2023-08-18

    申请号:CN202310884262.8

    申请日:2023-07-19

    Abstract: 本申请提供一种基于结构增强的异质数据联邦学习方法及相关设备包括接收服务器端的全局模型根据全局模型对本地网络模型进行初始化;响应于确定完成所述初始化,获取本地数据根据本地数据对所述本地网络模型进行正则化训练确定第一损失函数;响应于确定完成训练获取预设采样系数和预设采样宽度对本地网络模型进行结构增强训练,根据预设采样系数和所述预设采样宽度对所述本地网络模型进行采样确定若干子网络模型;对所述本地数据进行数据增强处理确定训练用数据,根据所述训练用数据对若干所述子网络模型进行更新训练确定全局损失函数;根据全局损失函数对本地网络模型的权重进行更新将所述全局损失函数将更新的所述本地网络模型上传所述服务器端。

    联邦变分自编码主题模型训练方法、主题预测方法及装置

    公开(公告)号:CN116578674A

    公开(公告)日:2023-08-11

    申请号:CN202310826329.2

    申请日:2023-07-07

    Abstract: 本申请提供联邦变分自编码主题模型训练方法、主题预测方法及装置,方法包括:在当前的剪枝训练轮次中,接收联邦学习系统中的各个节点各自采用本地的文本训练数据训练得到的局部变分自编码主题模型的模型参数和神经元累计梯度,并对各个局部变分自编码主题模型的模型参数进行聚类以生成目标变分自编码主题模型;基于各个局部变分自编码主题模型的神经元累计梯度对目标变分自编码主题模型进行神经元剪枝处理,得到当前的全局变分自编码主题模型。本申请能够在有效保护本地数据隐私的基础上,能够有效降低模型训练过程的通信和计算开销,能够有效提高采用训练得到的主题模型预测文本数据所属主题类型的预测精度及可靠性。

    学生表情识别方法及教学状态评估方法及相关设备

    公开(公告)号:CN115457619A

    公开(公告)日:2022-12-09

    申请号:CN202210895264.2

    申请日:2022-07-26

    Abstract: 本申请提供一种学生表情识别方法及教学状态评估方法及相关设备。通过预先训练的学生表情识别模型提取课堂教学视频中人脸图像上多个视角的表情特征;然后计算提取的多个视角的表情特征对应的权重,再融合计算得到的权重和对应的表情特征,得到全局表情特征;最后,根据全局表情特征得到学生表情分类结果。此外,在学生表情识别方法的基础上,通过融合课堂性质、学生表情识别结果和学生行为识别结果综合进行课堂教学状态评估值的计算。最后根据综合评估值判定学生课堂听课状态。本申请能够充分提取学生表情特征,提高姿势偏移场景下学生表情识别能力,还能够客观准确地对课堂教学视频中的教学状态进行评估。

    科技论文数据文本语义特征提取方法、系统及存储介质

    公开(公告)号:CN114818737B

    公开(公告)日:2022-11-18

    申请号:CN202210745539.4

    申请日:2022-06-29

    Abstract: 本发明提供一种科技论文数据文本语义特征提取方法、系统及存储介质,所述方法包括:获取科技论文的文本信息,并基于获取到的科技论文的文本信息构建实体关系图,所述文本信息包括论文标题以及关键词,实体关系图中的节点为论文标题或关键词,实体关系图中的边为节点之间的关联关系;基于获取到的科技论文的文本信息提取语义特征,得到语义特征矩阵;基于实体关系图确定原始邻接矩阵,将语义特征矩阵及所述原始邻接矩阵输入至图网络模型,得到空间特征矩阵;将语义特征矩阵与空间特征矩阵进行特征融合,得到科技论文的最终语义特征。该特征提取方法在提取科技论文语料的语义特征的基础上,利用知识图谱的空间关联,可较好的提取到科技论文的语义特征。

    科技论文引用关系表示学习方法、系统及存储介质

    公开(公告)号:CN114817578B

    公开(公告)日:2022-09-09

    申请号:CN202210745739.X

    申请日:2022-06-29

    Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。

    科技论文引用关系表示学习方法、系统及存储介质

    公开(公告)号:CN114817578A

    公开(公告)日:2022-07-29

    申请号:CN202210745739.X

    申请日:2022-06-29

    Abstract: 本发明提供一种科技论文引用关系表示学习方法、系统及存储介质,所述方法包括:获取科技论文的关系图,所述关系图中的各节点表示各科技论文,所述关系图中的各边表示科技论文之间的引用关系;基于所述关系图确定第一科技论文特征矩阵及科技论文邻接矩阵;构建图自动编码器;将所述第一科技论文特征矩阵及科技论文邻接矩阵输入至图自动编码器,得到各科技论文的第一嵌入表示。该方法可使科技论文引用关系得到更准确的表示。

    基于图卷积网络和注意力机制的文本关联方法及相关设备

    公开(公告)号:CN113535912A

    公开(公告)日:2021-10-22

    申请号:CN202110540413.9

    申请日:2021-05-18

    Abstract: 本公开提供一种基于图卷积网络和注意力机制的文本关联方法及相关设备,该方法包括:获取用户问题和文档;通过分词算法分别提取所述用户问题和所述文档的关键词及权重;利用词向量模型得到所述用户问题的词向量序列和所述文档的词向量序列;基于文档的词向量序列构建交互图;将用户问题的词向量和文档的词向量进行交互后构建视图;将所有所述视图输入预先构建的图卷积神经网络模型中,输出所述用户问题和所述文档的关联标签,其中,所述图卷积神经网络模型是经过预训练的。本公开采用图结构来表示文档,图结构可以在一定程度上保持文档中关键词之间的交互关系,既解决了词向量模型文本长度表征有限的问题,同时提高了科研论文检索的准确性。

    基于图卷积网络的科技论文层级多标签分类方法及设备

    公开(公告)号:CN113312480A

    公开(公告)日:2021-08-27

    申请号:CN202110548961.6

    申请日:2021-05-19

    Abstract: 本公开提供一种基于图卷积网络的科技论文层级多标签分类方法及设备,其中方法包括:利用注意力机制在论文与关键词的无向图上进行图形节点嵌入,输出更新后的论文节点特征;将更新后的论文节点特征输入预先训练好的多输出深度神经网络模型中,输出整体的全局标签和局部标签;通过注意力机制组合局部标签和全局标签,组合后的标签经计算处理后得到最终的论文标签分类结果。本公开提供的方法及设备丰富了论文的语义表示,在论文分类中考虑了具有相同关键词的论文之间的关联,使得论文分类更加准确;并且分类过程中每一层仅关注相应层级的标签,减少了每个层需要区分的类别数量,充分获取到不同层级标签的特征,提高了论文分类的准确性。

Patent Agency Ranking