-
公开(公告)号:CN118428318A
公开(公告)日:2024-08-02
申请号:CN202410540125.7
申请日:2024-04-30
Applicant: 上海鼎天时尚科技股份有限公司 , 东华大学
IPC: G06F40/126 , G06F40/30 , G06N3/0475 , G06N3/084 , G06N3/09 , G06N3/094
Abstract: 本发明涉及一种纺织品提花纹样创意生成方法,通过文本编码器将输入的提示词映射至文本‑图像联合特征空间,得到提示词的特征表达;将提示词特征表达输入扩散对抗模型的生成器,生成器以扩散模型为核心基于噪声估计器生成结果图像;扩散对抗模型的鉴别器判别生成器输出是否符合边界处四象连续要求,并生成对抗训练监督信号;生成器加载低秩轻量模块以吸收对抗训练监督信号的反向传播梯度;将微调过程与已完成训练的生成器相剥离;由完成微调的生成器输出符合图案循环要求的创意纹样图像。本发明以提示词为引导生成符合提示词语义的创意纹样,通过加载经对抗训练的低秩轻量模块生成在边界处四象连续的创意纹样,为创意纹样的横纵平接提供必要条件。
-
公开(公告)号:CN116433804A
公开(公告)日:2023-07-14
申请号:CN202310376564.4
申请日:2023-04-10
Applicant: 东华大学
Abstract: 本发明涉及一种美学性引导的个性化图像增强交互系统,图像编辑器根据输入的图像编辑参数将输入待增强图像映射为增强后的输出图像;将图像编辑器输出图像送入审美偏好特征提取器中,提取审美偏好特征,获得的审美偏好特征与用户的审美偏好特征进行比较,得到审美偏好损失;同时,将图像编辑器输出图像送入图像美学性评分器,输出该图像的美学性得分分布,并与最优美学性得分分布进行比较,得到美学性损失;将上述审美偏好损失和美学性损失相加,得到总损失函数,以减小总损失函数的数值为目标,通过梯度反向传播循环迭代式地更新图像编辑参数。根据大众审美的标准自动地对图像进行美化,同时允许用户按照个人审美偏好进行手动干预,完成个性化图像增强。
-
公开(公告)号:CN116340556A
公开(公告)日:2023-06-27
申请号:CN202310287058.8
申请日:2023-03-22
Applicant: 东华大学
Abstract: 本发明涉及一种分治整合架构的丝绸文物图像检索系统,设计循环优化的主题类别划分方案,按照预检索效果将丝绸文物图像数据集划分为若干组。以组为单位,分别构建基于视觉Transformer的丝绸文物图像检索模型,减轻单个模型的检索压力,实现分而治之。分析主题类别的语义,归并语义相似的主题类别,得到若干超类别。构建基于ResNet50的图像超类别识别模型。将识别模型输出的置信度转换为指导因子,进而统一调整所有检索模型输出结果的汉明距离,为多检索模型输出结果的联合排序提供依据,实现调整整合。通过检索任务分解和多路检索结果的协同整合,实现丝绸文物图像的检索,有利于缓解数据量少、类别多、分布不均衡、呈现长尾分布等不利于网络训练的负面因素。
-
公开(公告)号:CN109934882B
公开(公告)日:2023-04-25
申请号:CN201910092190.7
申请日:2019-01-30
Applicant: 东华大学
IPC: G06T9/00 , H04N19/176 , H04N19/85
Abstract: 本发明涉及一种基于动态挑选多假设匹配块的视频压缩感知重构方法,包括以下步骤:独立地重构序列中的每一帧图像;对于上述非关键帧重构得到的图像,采用K种根据距离动态挑选匹配块的模式从前后两个关键帧中依次进行匹配块的挑选,再利用多假设匹配块形成残差稀疏模型,进行K种模式下的重构该非关键帧图像;基于阈值与整体结构相似性确定非关键帧的最终重构结果。本发明能够提高重构质量。
-
公开(公告)号:CN111292265A
公开(公告)日:2020-06-16
申请号:CN202010073860.3
申请日:2020-01-22
Applicant: 东华大学
Abstract: 本发明公开了一种基于生成式对抗神经网络的图像修复方法,该方法使用了四个部分,分别是生成网络、全局判别网络、局部判别网络和LSTM神经网络。两个判别器主要用于保证缺失区域修复后能够和周围保持一致性。LSTM神经网络主要用于分阶段修复破损图像。算法包括数据预处理模块、模型训练模块和图像修复模块,主要用于对大面积缺失的图像进行语义修复任务,以重建出符合人眼感官的完整逼真图像。
-
公开(公告)号:CN110414557A
公开(公告)日:2019-11-05
申请号:CN201910540222.5
申请日:2019-06-21
Applicant: 东华大学
IPC: G06K9/62
Abstract: 本发明公开了一种面向归类模型训练的迭代自适应终止方法,其特征在于,通过拟合归类精度与迭代次数的关系函数,自适应地控制归类模型训练的迭代次数。本发明针对图像归类模型的训练,设计了一种迭代次数自适应的终止方法。所提方法适合于目前通用的归类模型,通过在迭代训练中拟合迭代次数与归类精度之间的关系函数,实现了归类精度约束下的迭代次数控制。基于样本点的函数拟合有助于消除在迭代训练中归类精度的大幅波动问题,所提迭代终止方法成功地引入了模式识别应用所需要的归类精度条件。本发明能够自适应地确定归类模型训练的迭代次数,减少迭代训练所需的时间,在确保归类精度合乎预期的前提下降低了迭代训练的复杂度。
-
公开(公告)号:CN110290389A
公开(公告)日:2019-09-27
申请号:CN201910623614.8
申请日:2019-07-11
Applicant: 东华大学
IPC: H04N19/177 , H04N19/58 , H04N19/132 , H04N19/593 , H04N19/105
Abstract: 本发明涉及一种基于长短期参考帧挑选假设匹配块视频压缩感知重构方法。通过充分挖掘图像帧之间的相似性,本发明提出了一种新的视频压缩感知重构策略:长短期参考帧动态挑选多假设匹配块,所提方法主要包括四个阶段:第一阶段,对压缩视频序列中每帧的测量值进行单独的图像重构;第二阶段,为较低采样率的图像帧指定长短期的多个重构参考帧;第三阶段,从多个参考帧中挑选多个假设匹配块;第四阶段,利用多假设匹配块形成残差稀疏模型,进而完成各个图像帧的重构。所提方法在增加一定复杂度的情况下能够获得较好的视频重构质量。
-
公开(公告)号:CN109859180A
公开(公告)日:2019-06-07
申请号:CN201910072215.7
申请日:2019-01-25
Applicant: 东华大学
Abstract: 本发明提出了一种融合多种度量准则的图像集质量增强评价方法,首先使用现有的多种图像质量度量准则对原始图像集的每一张图像分别进行打分,然后计算质量分数平均值和标准差,其次计算相对质量分数,再考虑多个图像质量度量准则下的相对质量分数,最终得到原始图像集的融合质量分数。本发明通过比较增强图像集的融合质量分数和原始图像集的融合质量分数的大小,即可判断该图像增强算法对原始图像集的增强效果。当有多种图像增强算法作用于原始图像集时,则通过比较不同图像增强算法下增强图像集的融合质量分数大小,即可为原始图像集挑选出最佳的图像增强算法。相比于现有的平均方法,融合多种度量准则的图像集质量增强评价方法具有更高的可靠性。
-
公开(公告)号:CN109785847A
公开(公告)日:2019-05-21
申请号:CN201910072231.6
申请日:2019-01-25
Applicant: 东华大学
Abstract: 本发明属于音频信号压缩处理领域,具体涉及一种基于残差网络的动态编码算法。该算法基于深度学习中的残差网络方法进行设计,主要包括自编码器预处理模块、多段残差网络的动态编码、动态残差网络的模型压缩三大部分。该算法首先对音频进行分割,并依据心理声学对音频信号进行特征剔除,之后使用自编码器进行预训练。利用双向循环神经网络优化在多段残差中动态编码的注意力行为,实现动态比特率分配,从而使动态残差网络的压缩效果更好。最后利用蒸馏学习的方式对网络进行模型压缩训练,降低训练难度,最终获得压缩性能良好的编码方式。
-
公开(公告)号:CN108877832A
公开(公告)日:2018-11-23
申请号:CN201810532016.5
申请日:2018-05-29
Applicant: 东华大学
Abstract: 本发明涉及一种基于GAN的音频音质还原系统,包括模型共享区块模块、生成网络模型模块、判别网络模型模块和序列重组模块;所述模型共享区块模块主要用于对于因防止损失信息没有进行频域处理的时域信号进行特征提取,将特征抽象为高层单元;所述生成网络模型模块利用高层抽象单元进行分析和重构;所述判别网络模型模块不断与所述生成网络模型进行对抗训练,不断改进生成效果;所述序列重组模块分析网络对最终生成输出进行序列加权重组。本发明能够生成更加逼真的音频信号。
-
-
-
-
-
-
-
-
-