-
公开(公告)号:CN119577433A
公开(公告)日:2025-03-07
申请号:CN202311150248.1
申请日:2023-09-06
Applicant: 腾讯科技(深圳)有限公司 , 复旦大学
IPC: G06F18/214 , G06F18/241 , G06F18/27 , G06N20/00 , G06F17/18
Abstract: 本申请公开了一种数据处理方法和相关装置,针对获取的待处理样本和样本标签特征,生成特征节点和账号节点。根据各个特征分别与账号信息间的因果关系,将特征节点划分为账号独立节点和账号依赖节点这两种类型。由于账号独立节点对应的因果关系不随账号信息的改变而改变,账号依赖节点对应的因果关系随账号信息的改变而改变,针对不同类型的特征节点采用不同的因果发现机制进行针对性的因果关系发现,由此确定出高精度的因果关系,由于目标节点的因果关系能够直观的体现出数据特征和样本标签特征间影响机制的重要因素,故可以基于该因果关系优化待处理样本,提升训练样本的质量,由其训练得到的分类模型能够更好的为分类任务提供服务。
-
公开(公告)号:CN118607689A
公开(公告)日:2024-09-06
申请号:CN202410559788.3
申请日:2024-05-08
Applicant: 复旦大学
IPC: G06Q10/04 , G06N3/0442 , G06N5/04 , G06F18/214 , G06F18/24 , G06F17/16 , G06N3/08
Abstract: 本发明属于深度学习中的数据挖掘技术领域,具体为一种基于因果关系与注意力机制的多变量时间序列预测系统。本发明系统包括:适用于时间序列的因果推断模块;基于神经网络的因果‑时序注意力机制模块;基于多层感知机的解码器模块;因果推断模块从采样数据中推断出各个变量的因果图,包括用于评估所因果图质量的交叉验证对数似然得分函数以及用于搜索因果图的贪婪等价搜索算法;因果‑时序注意力机制模块提取时间序列历史数据的因果‑时序特征,并将该特征编码为一组特征向量;解码器解码因果‑时序注意力机制输出的因果‑时序特征,以得到最终的预测结果。本发明弥补现有多变量时间序列预测在因果推断方面的空缺,有效地提高时间序列预测准确性。
-
公开(公告)号:CN114741528B
公开(公告)日:2024-08-02
申请号:CN202210330089.2
申请日:2022-03-31
IPC: G06F16/36 , G06F18/2431 , G16B40/00 , G16B5/00
Abstract: 本发明提供了一种高效构建人类蛋白质复合物图谱的方法与系统,包括:对初始人类蛋白质相互作用网络进行加边,得到重构后人类蛋白质相互作用网络:计算重构后人类蛋白质相互作用网络中各个边的特征属性;根据边的特征属性以及重构后人类蛋白质相互作用网络,通过预先训练好的边分类模型预测得到边类别;基于边类别以及重构后人类蛋白质相互作用网络,利用预设的图分割算法识别得到人类蛋白质复合物;对人类蛋白质复合物进行滤除,从而得到过滤后人类蛋白质复合物作为最终人类蛋白质复合物,并基于最终人类蛋白质复合物构建人类蛋白质复合物图谱。本发明能够提升复合物识别的精度,以及人类蛋白质复合物图谱的构建效率。
-
公开(公告)号:CN116756318A
公开(公告)日:2023-09-15
申请号:CN202310743895.7
申请日:2023-06-24
Applicant: 复旦大学
IPC: G06F16/35 , G06F40/30 , G06F40/268 , G06F40/247 , G06F40/151
Abstract: 本发明属于自然语言处理技术领域,具体为基于数据增强和自训练的属性级情感四元组预测系统和方法。本发明系统包括:增强样本生成器模块,为编码器‑解码器结构;增强样本判别器模块,为一个多标签分类器;属性级情感四元组预测模块,包括编码器和解码器;基于多任务学习的四元组校验模块,通过单独的属性词和观点词的预测结果校验四元组任务的结果。本发明将生成式数据增强和自训练算法引入属性级情感四元组预测框架;框架简单、使用方便、可扩展性强;在两个主流属性级情感数据集的四元组预测结果优于现有方法。本发明能够为属性级情感分析技术在舆情分析和电商评论等应用领域,提供基础框架和算法的支持,提高属性级情感四元组预测性能。
-
公开(公告)号:CN109558424B
公开(公告)日:2023-04-18
申请号:CN201811304324.9
申请日:2018-11-03
Applicant: 复旦大学
IPC: G06F16/2455 , G06F18/241 , G06F18/23
Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。
-
公开(公告)号:CN115082417A
公开(公告)日:2022-09-20
申请号:CN202210814039.1
申请日:2022-07-11
Applicant: 北京字跳网络技术有限公司 , 复旦大学
Abstract: 本公开提供了一种图像质量的处理方法、装置、电子设备及存储介质。方法包括:获取待处理的原始文本图像;利用预先训练好的文本处理模型,提取原始文本图像的第一图像特征,并基于第一图像特征检测原始文本图像的目标质量缺陷类型;确定目标质量缺陷类型对应的目标增强处理策略,利用目标增强处理策略对第二图像特征进行质量增强处理,得到目标文本图像,其中,第二图像特征为原始文本图像中待进行质量增强的图像特征。本公开的方法相比现有的图像修复方法更精准的定位了图像质量增强的方式。且利用图像增强处理策略对原始文本图像进行增强,以此实现了在没有高质量文本的情况下,满足文本图像多样化的修复需求,也提高了文本图像的修复精度。
-
公开(公告)号:CN113191359B
公开(公告)日:2021-11-16
申请号:CN202110734232.X
申请日:2021-06-30
Abstract: 本发明公开了基于支持与查询样本的小样本目标检测方法与系统,包括,支持样本和查询样本特征提取、基于查询样本引导的支持样本加权、支持样本引导的查询特征增强、候选框的打分和筛选、混合损失函数计算,将小样本学习机制引入到深度目标检测框架,建立了一套准确率高的小样本目标检测系统。本发明的方法框架简单、使用方便、可扩展性强、可解释性强,并在两个主流视觉属性数据集的小样本目标检测的结果上,都超过了现有方法。本发明能够为目标检测技术在军事和工业应用领域,提供基础框架和算法的支持,也能很容易地扩展到其他小样本学习任务上。
-
公开(公告)号:CN113256629A
公开(公告)日:2021-08-13
申请号:CN202110759301.2
申请日:2021-07-05
Abstract: 本发明公开了一种图像标定错误检测方法及装置,方法包括:建立图像数据集,利用所述图像数据集对无监督异常检测神经网络进行训练,将训练过程中将产生的隐层特征进行重构,得到隐层特征重构层;将所述隐层特征重构层嵌入所述无监督异常检测神经网络,然后对待检测图像数据进行异常检测,根据异常得分函数,判别待检测图像数据是否标定错误;装置包括:依次连接的基干网络模块、隐层特征重构模块和异常得分模块;本发明能够扩大正常样本与异常样本之间的异常得分差距,提高异常检测性能。
-
公开(公告)号:CN109558898A
公开(公告)日:2019-04-02
申请号:CN201811333067.1
申请日:2018-11-09
Applicant: 复旦大学
CPC classification number: G06K9/6256 , G06N3/0454 , G06N3/08
Abstract: 本发明属于机器学习技术领域,具体为一种基于深度神经网络的高置信度多选择学习方法。本发明方法中,提出了一个置信合页损失来解决专家网络过度自信的问题,防止非专家模型以高可信度进行不准确的预测;采用选择网络来学习每个专家网络的可信度,使得最终可以从多样性的预测结果这聚合一个更可靠的决策预测。本发明方法框架简单、使用方便、可扩展性强;在图像分类和图像语义分割的任务上进行实验,达到或超过现有最好方法的水平。本发明能够为计算机视觉、数据挖掘等领域,提供基础框架和算法的支持。
-
公开(公告)号:CN1237736A
公开(公告)日:1999-12-08
申请号:CN99109122.1
申请日:1999-06-16
Applicant: 复旦大学
IPC: G06F17/00
Abstract: 本发明属信息技术领域,是一种基于∑2邻接矩阵的全文数据库模型,包括表达方式和操作方法。它用∑2邻接矩阵A和约减的扩展∑2邻接矩阵B表示全文数据库,并提出了对∑2邻接矩阵A的简单操作和布尔操作方法,以及基于约减的扩展∑2邻接矩阵B的各种查询方法。本发明与现有全文数据库模型相比,具有很强的领域独立性、时间无关性、查询完备性、较低的空间复杂性、较快的查询响应能力和良好的可操作性,因而具有广泛的应用前景。
-
-
-
-
-
-
-
-
-