-
公开(公告)号:CN113963748A
公开(公告)日:2022-01-21
申请号:CN202111140313.3
申请日:2021-09-28
Applicant: 华东师范大学
Abstract: 本发明公开了一种蛋白质知识图谱向量化方法,该方法中,首先采集大量蛋白质知识库文本信息,通过实体检测、关系提取建立初步的三元组集合,再进行标准知识图谱建立,然后将三元组集合作为训练集进行向量化进而得到蛋白质向量。本发明的创新点在于创建并使用了一种能够将蛋白质文本知识转变为知识图谱并将蛋白质实体向量化的方法。本发明构建了向量化蛋白质知识图谱,同时展示出了建模过程和学习更新过程并给出了应用方法。
-
公开(公告)号:CN113947135A
公开(公告)日:2022-01-18
申请号:CN202111136027.X
申请日:2021-09-27
Applicant: 华东师范大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于缺失图重构和自适应近邻的不完整多视图聚类方法,该方法通过学习一致性非负特征实现不完整多视图数据的聚类。本发明考虑到不同视图上的不完整图结构将其分解成一个视图一致性特征和多个视图特定特征,其中视图一致性特征用来保留多视图数据的近邻图结构信息。本发明的创新点在于从不完整视图的图结构分解角度重新思考不完整多视图聚类问题,同时学习缺失多视图数据的一致性非负特征与公共图结构,其中一致性非负特征满足公共图结构约束。本发明的不完整多视图聚类框架由矩阵分解模型和自适应近邻模型组成,同时推导了训练目标和推导过程;本发明方法能够在不填充缺失视图的情况下处理各种不完整多视图场景。
-
公开(公告)号:CN112766393A
公开(公告)日:2021-05-07
申请号:CN202110103982.7
申请日:2021-01-26
Applicant: 华东师范大学
Abstract: 本发明公开了一种基于主动学习多视图多标签分类器的构建方法,在基于多视图工作基础上,首先采用条件伯努利混合模型构建了一种多视图的分类器和一个综合分类器。并构建了一种选择样本的查询函数,用于在未标注样本集上挑选信息最为丰富的样本标注,添加到标注样本集上能够以标注最少的样本,最大化地提升分类器的效果,并减少标注的成本。本发明的创新点是将多视图的方法引入到多标签分类中构建分类器,并考虑标签之间的依赖关系、视图的一致性来制定样本的查询函数。最后在场景数据集上进行了实验,验证了本发明的有效性。
-
公开(公告)号:CN112016332B
公开(公告)日:2021-05-07
申请号:CN202010867461.4
申请日:2020-08-26
Applicant: 华东师范大学
Abstract: 本发明公开了一种基于变分推理和多任务学习的多模态机器翻译方法,该方法具备翻译能力前,首先得用变分推理理论对图像、文本等多模态信息进行多任务建模,然后在给定足量训练集的情况下,训练得到变分多模态机器翻译模型,由此获得机器翻译能力。最后本方法通过束搜索和最大似然来预测出多个翻译文本。本发明的创新点在于创建并使用了一种能够将图像等多模态信息融入机器翻译的模型:变分多模态机器翻译。本发明的变分模型构建了一套混淆图像和文本语义的特征提取神经网络框架,同时推导出了建模过程和自我学习更新过程,给出了详细的推导算法,并指导性的给出了应用方法。
-
-
-