-
公开(公告)号:CN118154090A
公开(公告)日:2024-06-07
申请号:CN202410301933.8
申请日:2024-03-17
申请人: 同济大学
IPC分类号: G06Q10/087 , G06N3/0455 , G06N3/092
摘要: 本发明公开了一种基于Transformer的供应链库存管理方法。本发明针对飞机制造供应链库存管理模型规模增速较快、决策复杂度较高的问题,基于多智能体强化学习序列决策的本质,将多智能体强化学习问题转化为编码器‑解码器架构的序列建模问题,从逻辑上降低算法的复杂度。本发明设计了轻量化编码器模块以及自回归解码器模块:轻量化编码器模块通过利用傅里叶变换的对偶性,对复杂度较高的自注意力机制进行替换,从实现上降低算法复杂度;自回归解码器模块基于信息传递机制的思想,通过自回归顺序决策的方式保证供应链整体的联合策略单调改善。本方法能够在保持性能的基础上,在训练时间、模型参数量等方面相对于现有其他方法实现有效简化。
-
公开(公告)号:CN117152784A
公开(公告)日:2023-12-01
申请号:CN202311000952.9
申请日:2023-08-09
申请人: 同济大学
IPC分类号: G06V30/422 , G06V30/148 , G06V30/19 , G06V30/146 , G06V30/18 , G06V10/82 , G06V30/26
摘要: 本发明公开了一种基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。本发明针对现有基于深度学习的电网图纸文本检测识别方法在处理多尺度、多方向、形状不规则的紧凑文本方面的局限性问题,提出了基于改进PP‑OCRv3的厂站接线图文本自动检测和识别方法。利用基于像素行聚类的区域重分割模块,纠正了包含垂直和水平字符的不规则形状文本的检测错误。通过BiFPN模块中引入通道注意力机制和深度可分卷积,提高了识别模型对不同尺度输入图像的鲁棒性。利用基于区域扩展和切割的字符重识别模块,减少了简单字符和密集文本对模型的不利影响。实验结果表明,本发明通过对PP‑OCRv3的一系列改进,可以显著提高厂站接线图中文本的检测和识别精度。
-
公开(公告)号:CN115905188A
公开(公告)日:2023-04-04
申请号:CN202211160479.6
申请日:2022-09-22
申请人: 同济大学
IPC分类号: G06F16/215 , G06F16/22 , G06F16/242 , G06F16/25 , G06F16/36
摘要: 本发明公开了一种基于知识图谱的数据质量提升方法,包括,对数据库中的建表语句进行预处理,再进行实体抽取和关系抽取;提取数据库中的数据仓库加工流程之间的关系自动化建立知识图谱;基于知识图谱的关系检索,对数据处理和加工过程进行关联关系映射;在运用异常检测算法的过程中,利用知识图谱中的关联关系,为相近数据特征的异常检测提供数据补充,提升大数据的异常值检测效果。本发明简单利用了两种不同的异常检测算法模型对样板用电量数据进行检测,算法本身具有一定的局限性,在利用知识图谱进行群体划分对算法进行优化后,一定程度上提升了算法的精准度,通过知识图谱很好的反映出数据加工结构,有效地提高异常检测的精确度。
-
公开(公告)号:CN114170066A
公开(公告)日:2022-03-11
申请号:CN202111326217.8
申请日:2021-11-10
申请人: 同济大学
摘要: 本发明公开了一种基于多注意力网络的任意风格迁移方法。本发明针对现有风格迁移方法在保留显著的内容结构和细节的风格模式方面存在局限性的问题,提出了用于任意风格迁移的多注意网络,利用多注意力机制提取内容图像的显著结构和风格图像的细节纹理,将艺术作品中丰富的风格模式迁移到内容图像中;并设计了一种新颖的注意力损失来保留内容的重要信息。实验结果表明,本发明通过多注意力网络可以保留内容显著结构和风格细节纹理,可以有效生成更高质量的风格化图像。
-
公开(公告)号:CN109688414A
公开(公告)日:2019-04-26
申请号:CN201811556797.8
申请日:2018-12-19
申请人: 同济大学
IPC分类号: H04N19/593 , H04N19/147 , H04N19/186 , H04N19/11 , H04N19/625 , H04N19/119 , H04N19/176
CPC分类号: H04N19/593 , H04N19/11 , H04N19/119 , H04N19/147 , H04N19/176 , H04N19/186 , H04N19/625
摘要: 本发明“一种VVC帧内编码单元候选预测模式缩减及块划分提前终止方法”利用了图像纹理复杂度的特性,通过分析图像的纹理复杂度和图像像素值经DCT变换后的非0系数个数之间的关系,提前对该图像块的帧内编码单元候选模式进行缩减,降低模式选择的计算复杂度。还通过分析图像像素值经DCT变换后的非0系数个数以及图像的四个子块之间纹理复杂度的差异和帧内编码单元块的最优划分尺寸之间的关系,提前终止帧内编码单元块的向下递归划分。该方法可以有效的缩减VVC帧内编码单元候选模式的数量以及避免为了寻找最优编码块划分尺寸而进行的额外计算,从而降低VVC编码器的复杂度,在几乎不影响视频编码质量的前提下,有效的降低了VVC编码器的时间复杂度,提高了编码速度。
-
公开(公告)号:CN105430407B
公开(公告)日:2018-06-05
申请号:CN201510881394.0
申请日:2015-12-03
申请人: 同济大学
IPC分类号: H04N19/40 , H04N19/109
摘要: 应用于H.264到HEVC转码的快速帧间模式决策方法。根据H.264码流信息以及HEVC帧间编码单元(Coding Unit,CU)不同深度的预测模式信息,对于HEVC不同深度层次的CU采取不同的快速帧间模式决策方法。对于深度为0、1层的CU,使用分类器处理H.264码流解码得到的信息,并计算分别用于Skip模式判定和CU划分的决策阈值。首先根据Skip模式判定阈值对CU进行提前Skip模式判决,然后预测CU是否要向下一层子CU划分。该方法结合了CU划分分布的统计特征以及H.264的码流信息,可以提前地判定Skip模式,有效地预测CU的划分是否应当终止或者继续划分,从而对四叉树进行有效的剪枝和跳过不必要的编码分支。该方法可显著减少H.264到HEVC转码过程中帧间编码的计算复杂度。
-
公开(公告)号:CN108111255A
公开(公告)日:2018-06-01
申请号:CN201711190617.4
申请日:2017-11-24
申请人: 同济大学
IPC分类号: H04L1/00 , H04N19/177 , H04N19/625 , H04N19/176 , H04N19/89
摘要: 本发明涉及一种模拟编码中基于最大后验概率的译码方法,包括:S1、发送端将经过模拟编码后的信号和块方差通过引入设定混沌函数伪模拟传输SoftCast发送到接收端;S2、对接收到的模拟信号的噪声建模为高斯噪声,得到等效建模的待解码信号;S3、计算编码增益;S4、利用设定的混沌函数和MAP译码器高斯分布函数的闭合表达式,得到1/2模拟编码和1/3模拟编码的MAP解码闭合表达式;S5、DCT系数矩阵经过IDCT重建得到带噪编码符号的解码输出。与现有技术相比,本发明充分利用信源的先验概率分布信息和已知的接收数据,同时平衡性能和计算复杂度,在实际系统中具有易于使用的优点。
-
公开(公告)号:CN107454425A
公开(公告)日:2017-12-08
申请号:CN201710746027.9
申请日:2017-08-26
申请人: 同济大学
IPC分类号: H04N19/593 , H04N19/182 , H04N19/103
摘要: 一种SCC帧内CU候选预测模式缩减范围的方法。本发明利用了屏幕内容视频的特征和编码单元的空间一致性,通过计算深度为0和1的编码单元的灰度共生矩阵的特征,利用相邻编码单元相关性特点,对深度为0的编码单元,预测是否提前跳过Intra模式,对深度为1的编码单元,预测是否提前跳过Intra和Palette模式。该方法可以有效地对SCC帧内编码单元候选预测模式进行缩减,从而降低SCC编码器的复杂度,在几乎不影响屏幕内容视频编码质量的前提下,提高SCC编码器编码速度。
-
公开(公告)号:CN107239730A
公开(公告)日:2017-10-10
申请号:CN201710249003.2
申请日:2017-04-17
申请人: 同济大学
摘要: 智能汽车能利用传感器收集道路信息,通过计算分析进行驾驶辅助,有利于保障交通安全。对交通标志进行自动识别是智能汽车的关键技术之一,然而,现有方法仍未在一个统一框架中有效对交通标志重要的颜色,轮廓及时间域信息进行联合挖掘学习。针对以上问题,本发明基于四元数的数学表示框架,提出了一种四元数深度神经网络模型方法以提高交通标志识别的鲁棒性,从而为智能汽车的辅助驾驶研究提供了更准确的模型保障。
-
公开(公告)号:CN106125928A
公开(公告)日:2016-11-16
申请号:CN201610472100.3
申请日:2016-06-24
申请人: 同济大学
IPC分类号: G06F3/01
CPC分类号: G06F3/017
摘要: 为了克服现有的PPT演示辅助工具的不足,本发明提供一种基于Kinect的PPT演示辅助系统及方法。用户无需使用传统的鼠标、光笔即可进行演讲,扩大了使用者的活动范围,同时提供了一种更好的人机交互方式。一种基于Kinect的PPT演示辅助系统,系统主要模块分为数据采集模块、手势识别模块、位置计算模块和PPT功能控制模块。数据采集模块,包括Kinect,安放于云台上并通过电机控制云台旋转角度,利用Kinect采集深度信息和骨骼信息,深度信息用于计算用户(演讲者)的位置,骨骼信息用于手势识别。手势识别模块根据采集数据识别出用户(演讲者)手势,进而能够执行用户所需要的操作。位置计算模块,根据采集数据识别出用户(演讲者)手势头部位置操控云台转动,实现实时跟踪。
-
-
-
-
-
-
-
-
-