-
公开(公告)号:CN115713665A
公开(公告)日:2023-02-24
申请号:CN202211237958.3
申请日:2022-10-10
Applicant: 中国科学院信息工程研究所
IPC: G06V10/774 , G06V20/40 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/0895
Abstract: 本发明公开了一种基于宏观到微观语义关联对比的视频自监督表征学习方法。本发明首先创建一视频自监督时空表示模型,其包括时域模块MaMiCo与空域模块MaMiCo;所述时域模块MaMiCo包括第一编码器、平均全局映射头,所述空域模块MaMiCo包括第二编码器、密集映射头,所述第一编码器与第二编码器共享参数;然后在视频数据中以金字塔的形式采样全局片段、局部片段以及静止片段用于训练视频自监督时空表示模型,其中时域MaMiCo关注在学习全局片段与局部片段的时域语义关联,空域MaMiCo旨在学习局部片段与静止片段的空域语义关联;然后将待处理视频输入训练后的第一编码器或第二编码器,得到该待处理视频的特征图。
-
公开(公告)号:CN112199532B
公开(公告)日:2022-10-14
申请号:CN202010906456.X
申请日:2020-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/532 , G06F16/55 , G06F16/583 , G06V10/74 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于哈希编码和图注意力机制的零样本图像检索方法及装置。该方法包括:构建哈希网络和关系网络;基于软边距的分类损失对哈希网络和关系网络进行训练;将数据库中的每一张图像输入到训练完成的哈希网络中,得到对应的图像哈希码;将待查询图像输入到训练完成的哈希网络中生成哈希码,计算其与数据库中每一张图像的哈希码之间的距离,并根据距离返回满足要求的查询结果。本发明能够同时考虑语义和视觉信息,充分挖掘类别之间的相似关系,从而更好地实现知识迁移,同时基于软边距的分类损失进行哈希学习能够在一定程度上避免对可见类别过拟合学习,提升模型对未见类别的泛化能力,进而提高零样本图像检索的效果。
-
公开(公告)号:CN112380326B
公开(公告)日:2022-07-08
申请号:CN202011079727.5
申请日:2020-10-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/36 , G06N3/04
Abstract: 本发明提供一种基于多层感知的问题答案抽取方法,其步骤包括:将一问题与若干目标文档拼接,输入到预训练语言模型中,得到问题的表示Q与目标文档的上下文表示P,将表示Q与上下文表示P交互,得到文档相关的问题表示u与融合问题信息的文档表示h;对问题表示u进行多层感知分类,获取问题的推理类型,并根据推理类型、问题表示u、文档表示h及通过表示Q生成的子问题ct,得到所述问题在目标文档中的答案注意力分布,其中t为生成子问题的次数;依据答案注意力分布,获取该问题的答案预测结果。本发明以子问题拆分的形式递进回答问题,引入推理类别分类器控制拆分,对问题的回答进行共享,提升推理阅读理解效果。
-
公开(公告)号:CN114219017A
公开(公告)日:2022-03-22
申请号:CN202111459333.7
申请日:2021-12-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。
-
公开(公告)号:CN114155524A
公开(公告)日:2022-03-08
申请号:CN202111271651.0
申请日:2021-10-29
Applicant: 中国科学院信息工程研究所
IPC: G06V20/64 , G06V20/58 , G06V10/762 , G06V10/766 , G06V10/80 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种单阶段3D点云目标检测方法及装置、计算机设备、介质。本方法为:根据3D点云中目标与获取3D点云的采样传感器距离不同,设置不同的聚类半径参数对3D点云进行聚类操作,用立体包围框将同类的点云包含起来得到最小立体包围框,并对每一所述最小立体包围框内的点集合进行下采样,得到数据增广后的点云数据;对数据增广后的点云数据进行基于球内最远距离采样,并对采样得到的点进行特征提取,得到语义特征和空间特征;根据空间特征和语义特征预测每个点的预测分数,然后按照预测分数从高到低完成点采样;对采样点的特征进行融合得到融合特征图;回归预测网络根据该融合特征图进行预测,得到点云当中目标的位置和类别。
-
公开(公告)号:CN113887282A
公开(公告)日:2022-01-04
申请号:CN202111004566.8
申请日:2021-08-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开一种面向场景图像中任意形状邻近文本的检测系统及方法,属于图像文本检测领域,通过生成区域建议使得网络更加关注文本特征,同时提出一种一对多的训练策略,为每一个候选框匹配多个目标文本,用以缓解邻近文本时在选取回归目标混淆的问题,最终提升基于回归的两阶段模型检测场景图像中任意形状邻近文本的能力。
-
公开(公告)号:CN113626723A
公开(公告)日:2021-11-09
申请号:CN202110777236.6
申请日:2021-07-09
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明涉及一种基于表示学习的属性图社区搜索方法和系统。该方法以查询节点为随机游走的起点,使用节点的属性信息和结构信息引导随机游走的跳转,获取节点序列和属性关键词序列;分别对节点序列和属性关键词序列进行节点的表示学习,获得节点的拓扑表示和属性表示,将其结合作为节点表示信息;根据节点之间的相似度对原始图数据进行重构,得到重构图;基于重构图和节点表示信息建立社区模型;以建立的社区模型为指导寻找满足要求的目标社区。本发明降低了计算的规模,表示学习过程更加契合社区搜索关注局部特性的特点,并融入了节点在社区层面的信息,提高了节点特征挖掘的准确度,建立的社区模型兼顾了发现社区的可解释性、质量和效率。
-
公开(公告)号:CN112883216A
公开(公告)日:2021-06-01
申请号:CN202110226266.8
申请日:2021-03-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/55 , G06F16/583 , G06K9/62 , G06N3/08
Abstract: 本发明公开了一种基于扰动一致性自集成的半监督图像检索方法及装置,包括将图像输入训练后的半监督图像特征提取模型,得到该图像的特征,其中所述半监督图像特征提取模型包括:一卷积神经网络、一哈希层和一扰动一致性自集成模块;将图像的特征转换为图像离散的二值哈希码;依据二值哈希码进行检索,得到图像检索结果。本发明通过集成同一个样本在不同数据增强条件下的特征,能够发现每个类别的判别特征;通过设计的扰动一致性损失函数最大化无标记数据的哈希层输出与对应的集成特征的相似性,充分的利用了无标记数据提升网络的泛化能力;能够取得更好的检索效果。
-
公开(公告)号:CN112256434A
公开(公告)日:2021-01-22
申请号:CN202011194618.8
申请日:2020-10-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种加密数据破解场景中的资源匹配方法,其步骤包括:1)分布式集群资源管理系统对任务调度发出的资源匹配请求进行检查,如果正确则进行步骤2),否则将错误信息返回至任务调度;2)分布式集群资源管理系统根据资源匹配请求中的条件信息,对分布式集群资源管理系统中的资源节点进行过滤筛选,得到可用的资源节点集合;3)从时间成本、能源成本、故障成本、已运行任务数量四个维度,对该资源节点集合中的资源节点属性信息进行量化,分别计算出相应的时间成本值、能源成本值、故障成本值和任务负载值;4)根据上述所得结果计算得到对应资源节点的rank值,对资源节点进行优先级排序,选取优先级最高的资源节点返回至任务调度。
-
公开(公告)号:CN112199717A
公开(公告)日:2021-01-08
申请号:CN202011065611.6
申请日:2020-09-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于少量公共数据的隐私模型训练方法及电子装置,包括:使用若干训练得到N个神经网络教师模型;将少量的公共数据xi分别输入N个神经网络教师模型,得到各公共数据xi对各标签k的统计投票结果;对各统计投票结果添加噪声,获取满足差分隐私原理的公共数据xi及相应标签;通过大量的随机噪声向量与一预训练判别神经网络,优化对抗生成网络,并生成大量无标注数据;通过满足差分隐私原理的公共数据xi及相应标签、大量无标注数据对预训练的自编码器联合训练学生模型,得到隐私学生模型。本发明只需少量公共数据即可训练一个隐私学生模型,实现对敏感数据的物理隔离和网络隔离,解决了隐私学生模型的精确度不高这一问题。
-
-
-
-
-
-
-
-
-