-
公开(公告)号:CN113936173A
公开(公告)日:2022-01-14
申请号:CN202111170350.9
申请日:2021-10-08
Applicant: 上海交通大学
IPC: G06V10/764 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种最大化互信息的图像分类方法、设备、介质及系统,包括:采集训练图像;最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。本发明基于给定图像数据,通过最大化互信息方式,自动设计确定神经网络的网络结构和参数,用于图像分类,无需繁杂的人工设计,节省人力资源和计算资源消耗。本发明能在极短的时间内,自动设计得到基于神经网络的图像分类方法,同时能实现较高的图像分类准确率。
-
公开(公告)号:CN113673591A
公开(公告)日:2021-11-19
申请号:CN202110931387.2
申请日:2021-08-13
Applicant: 上海交通大学
Abstract: 本发明提供一种自调整采样优化的图像分类方法、设备及介质,包括:获取训练图像;最小化训练图像分类的交叉熵,自动确定深度神经网络的网络结构和参数;采用得到的所述深度神经网络对待分类图像进行处理,得到图像分类结果。本发明能基于给定的图像数据,自动调整设计基于深度神经网络的图像分类方法,减少人为设计的繁杂性和人力资源消耗,同时在计算资源限定的情况下,能实现较高的分类准确率,保证了图像分类方法的稳定性和实用性。
-
公开(公告)号:CN112184840A
公开(公告)日:2021-01-05
申请号:CN202011002405.0
申请日:2020-09-22
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于多尺度结构化字典学习的3D点云压缩系统,其中:点云数据划分模块输出点云划分后的体素集合、不同尺度的体素块集合;几何信息编码模块输出编码的几何信息比特流;几何信息解码模块输出解码的几何信息;属性信号编码模块输出稀疏编码的系数矩阵与学习的多尺度结构化字典;属性信号编码模块输出学习到的多尺度结构化字典,属性信号压缩模块输出压缩后的属性信号比特流,属性信号解码模块输出解码的属性信号,3D点云重建模块完成重建。本发明适用于点云信号无损几何与有损属性压缩,利用点云信号天然的层次划分结构,沿着信号尺度由粗到精的方向,渐层地提升高频细节信息的重建质量,能够获得显著的性能增益。
-
公开(公告)号:CN109582960B
公开(公告)日:2020-11-24
申请号:CN201811423691.0
申请日:2018-11-27
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于结构化关联语义嵌入的零示例学习方法,所述方法通过提取输入图像的属性特征构建语义嵌入空间,在语义嵌入空间挖掘语义嵌入关联关系并构建局部线性相关的图结构,再利用语义嵌入空间的结构化限制约束已知类别的分类模型,最终合成未见类别的模型并实现未训练样本类别的有效预测。本发明在挖掘类别相近的语义嵌入信息的同时保留语义空间的全局结构,可以获取有效的语义表示并有效提高未见类别图像样本的类别预测准确率。
-
公开(公告)号:CN106227836B
公开(公告)日:2020-07-14
申请号:CN201610595620.3
申请日:2016-07-26
Applicant: 上海交通大学
Abstract: 本发明公开一种基于图像与文字的无监督联合视觉概念学习系统及方法,包括:文字解析模块,基数示例学习模块和多任务聚类模块,其中:所述文字解析模块利用社交媒体对图像的附加句子描述提取相应的名词作为视觉概念及其基数词作为下一模块的附加约束信息;所述基数示例学习模块利用基数引导的多示例学习方法来训练每个视觉概念的分类器;所述多任务聚类模块处理概念间的多样性,即将指代相似物体的名词聚集为一个大类作为视觉概念。本发明利用无监督的自动学习可以有效解决大规模数据下人工标定的实现繁复问题。
-
公开(公告)号:CN111008293A
公开(公告)日:2020-04-14
申请号:CN201811164612.9
申请日:2018-10-06
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于结构化语义表示的视觉问答方法,通过卷积神经网络提取出输入图像的图像特征;通过预先训练的字嵌入模型从所述输入图像相关的输入问题中,提取出每个词的词向量;对所述图像特征和所述词向量进行加权处理,得到加权后的图像特征向量和文本特征向量;通过Tree-LSTM网络将所述词向量转换为结构化语义表示向量;将所述图像特征向量、文本特征向量、结构化语义表示向量进行融合处理,得到对应的融合特征向量;将所述融合特征向量作为预测模型的输入,由所述预测模型输出所述输入问题对应的答案。本发明从问题中提取了更加丰富的语义信息,通过多层训练优化提高了预测模型的性能,从而提高了答案的准确性。
-
公开(公告)号:CN110248212A
公开(公告)日:2019-09-17
申请号:CN201910445463.1
申请日:2019-05-27
Applicant: 上海交通大学
IPC: H04N21/238 , H04N21/258 , H04N21/262 , H04N21/442 , H04N21/81 , H04N21/845
Abstract: 本发明提供了一种多用户360度视频流服务器端码率自适应传输方法,在用户端处,将各用户端的网络条件和用户观看信息实时反馈给服务器,并从服务器上下载分配给当前用户的视频流版本;在服务器端处,根据用户端上传的用户观看信息实时预测用户的观看视点变化,同时进行视频帧空间切片可视概率计算,通过用户的实时观看视点计算出每一个空间切片被该用户观看的概率;随后,结合用户的网络条件和空间切片被用户观看的概率,为每一个用户分配合适的视频流码率版本。同时提供了一种多用户360度视频流服务器端码率自适应传输系统。本发明提高了360度视频流传输的带宽利用率,为用户提供更好的视频服务质量。
-
公开(公告)号:CN105069286B
公开(公告)日:2019-02-22
申请号:CN201510443551.X
申请日:2015-07-24
Applicant: 上海交通大学
IPC: G06F16/2458 , G06F21/62
Abstract: 本发明提供一种基于垂直分布隐私数据保护的logistic回归分析系统,包括:隐私数据处理模块、数据挖掘学习模块和分析应用模块,其中:隐私数据处理模块利用线性核函数得到各个垂直分布机构的隐私数据的核训练集,数据挖掘学习模块首先对各个局部核训练集累加得到总体核训练集,然后对总体核训练集进行logistic回归学习,所得的全局模型向量最后在分析应用模块中被用于判断分析。本发明提供数据共享挖掘的同时还保证了垂直分布式的原始隐私数据的安全性,求解全局模型向量的特殊方法也提升了学习求解的效率,本发明采用服务器‑客户的辐射分布式结构具备良好的实用性和扩展性。
-
公开(公告)号:CN104243986B
公开(公告)日:2018-07-20
申请号:CN201410468199.0
申请日:2014-09-15
Applicant: 上海交通大学
IPC: H04N19/132 , H04N19/119 , H04N19/176 , H04N19/192
Abstract: 本发明提供了一种基于数据驱动张量子空间的压缩视频采集与重构系统,包括:张量稀疏基构造模块、视频信号传感模块和重构处理模块,其中:张量稀疏基构造模块利用张量子空间学习方法生成张量子空间对应的稀疏基矩阵;视频信号传感模块对视频信号以张量块的形式进行投影,得到观测值;重构处理模块接收对稀疏基矩阵和观测值,对张量信号的各个维度分别解码重构。本发明提供压缩采样的同时还契合了视频采样过程的分布式渐进式的结构,对张量稀疏基矩阵的特殊构造也提升了重构的精确度和效率。本发明大大提高了视频信号的采样效率,在不同的采样压缩率下相比其他方法取得了重构增益,同时也具备良好的可扩展性。
-
公开(公告)号:CN108268950A
公开(公告)日:2018-07-10
申请号:CN201810042040.0
申请日:2018-01-16
Applicant: 上海交通大学
CPC classification number: G06N3/08 , G06K9/6223
Abstract: 本发明提供了一种基于矢量量化的迭代式神经网络量化系统,包括:聚类模块、基于误差的划分模块、参数共享模块和重训练模块,其中:聚类模块充分利用参数本身的分布来控制量化误差;基于误差的划分模块将网络参数划分为量化和重训练两部分;参数共享模块将划分的量化部分进行量化;重训练模块固定量化后的参数,更新重训练部分的参数来弥补量化误差,恢复量化后网络的精度。四部分迭代式进行,直到网络所有参数都被量化为止。同时提供了一种基于矢量量化的迭代式神经网络量化方法。本发明在不损失网络精度的情况下,能够将神经网络的32位浮点数量化为4bit,具有很高的实用价值。
-
-
-
-
-
-
-
-
-