基于可变形卷积的图像分割方法

    公开(公告)号:CN118397274B

    公开(公告)日:2024-12-13

    申请号:CN202410512249.4

    申请日:2024-04-26

    Abstract: 本发明公开了一种基于可变形卷积的图像分割方法,方法步骤包括:对原始图像进行预处理获得输入图像、由特征提取网络对输入图像进行逐层特征提取、由上采样网络通过结合各层的图像特征和语义信息来逐层恢复图像尺寸得到网络预测分割结果、根据网络预测分割结果与对应的真实分割结果的对比结果来对图像分割网络进行训练、对图像分割网络的分割效果进行评估和可视化展示。该图像分割方法设置有可变形的卷积核结构,可避免固定尺寸卷积核的感受野太小无法捕获大尺寸对象特征或感受野太大引入过多噪声和无效信息的问题,提高网络对于有效信息的提取能力,解决不同类型的图像对于网络分割效果产生影响的问题,从而提高分割性能。

    基于傅里叶变换的拉曼光谱曲线数据增强方法

    公开(公告)号:CN115508335A

    公开(公告)日:2022-12-23

    申请号:CN202211290178.5

    申请日:2022-10-21

    Abstract: 本方案涉及一种基于傅里叶变换的拉曼光谱曲线数据增强方法。所述方法包括:获取待处理拉曼光谱曲线进行快速傅里叶变换得到拉曼光谱曲线频域图;将拉曼光谱曲线频域图中的两端极端频率曲线峰屏蔽,得到目标拉曼光谱曲线频域图;确定频域掩模起始位置与宽度并执行频域屏蔽操作,判断对目标拉曼光谱曲线频域图的频域屏蔽操作是否合法;若合法,则对目标拉曼光谱曲线频域图进行逆傅里叶变换,得到数据增强的拉曼光谱曲线。通过利用快速傅里叶变换获得的拉曼光谱曲线对应的频域图进行屏蔽操作,可以保留原有拉曼光谱曲线数据的基本框架,在部分频率点进行轻微扰动,以达到合理数据扩充的目的,可以提升机器学习模型分类效果。

    一种基于一致性模型的文生图方法

    公开(公告)号:CN118887308A

    公开(公告)日:2024-11-01

    申请号:CN202410923814.6

    申请日:2024-07-11

    Abstract: 本发明公开了一种基于一致性模型的文生图方法,步骤包括:使用原始数据集来训练Tokenizer和变分自编码器;将Tokenizer和变分自编码器用于处理原始的图像和文本对,将图像和文本对转化为图像特征向量和文本特征向量对;构建文本条件生成的一致性模型并进行训练;由Tokenizer、随机采样高斯噪声、一致性模型以及变分自编码器的解码器构建推理模型,将待生成文本输入至Tokenizer,从变分自编码器的解码器处获得生成的图像。该文生图方法利用Tokenizer嵌入文本信息,利用变分自编码器压缩数据集,实现一步采样,且在训练过程中,只需训练单个条件采样器,节省了训练的时间。

    一种基于潜在扩散模型和多级上下文交叉一致性的半监督分割方法

    公开(公告)号:CN116958554A

    公开(公告)日:2023-10-27

    申请号:CN202310959223.X

    申请日:2023-08-01

    Abstract: 本发明公开一种基于潜在扩散模型和多级上下文交叉一致性的半监督分割方法,该方法包括两个阶段,图像生成阶段和半监督学习阶段。在图像生成阶段包括如下步骤:首先将图像输入到变分自动编码器的编码器中生成潜在空间编码,将对应图像的潜在空间编码输入到潜在扩散模型中,其次利用去噪自动编码器对加噪后的潜在空间编码计算去噪拟合损失以学习去噪分布,最后利用潜在扩散模型随机生成高斯噪声并进行去噪估计以生成潜在空间编码,将潜在空间编码通过变分自动解码器生成像素级图像。为了利用图像生成阶段生成的大量有价值合成无标记样本,半监督学习阶段包括如下步骤:首先将有标记图像和无标记合成图像样本输入到编码器以提取高级语义特征,其次引入多个辅助解码器,对辅助解码器和主解码器的输入特征提取不同等级的全局上下文信息,并对辅助解码器的输入特征额外施加噪声扰动,最后通过保持主解码器和辅助解码器之间输出结果的一致性来学习生成的未标记样本。发明可以用于任何利用合成图像进行半监督学习的任务。

    图像分割方法、装置、存储介质及电子装置

    公开(公告)号:CN116402996A

    公开(公告)日:2023-07-07

    申请号:CN202310289173.9

    申请日:2023-03-20

    Abstract: 本申请公开了一种图像分割方法、装置、存储介质及电子装置。该方法包括接收待分割图像;采用第一编码器对所述待分割图像进行多级编码,得到多级语义特征;采用第二编码器对高级语义特征图进行混合编码,得到全局上下文特征;采用解码器基于多尺度注意力门,构建全局上下文特征和多级语义特征的跳跃连接;对跳跃连接后的特征进行重建以细粒度地实现图像分割。在使用较少数据集和算力的情况下获取全局上下文,且抑制输入图像中于分割目标无关的区域,同时突出对分割目标有用的显著特征,能够有效提升分割性能。本申请解决了由于需要大量数据集和算力以获取全局上下文,且跳跃连接时无法传递有价值的显著特征造成的分割性能差的技术问题。

    基于傅里叶变换的拉曼光谱曲线数据增强方法

    公开(公告)号:CN115508335B

    公开(公告)日:2024-08-13

    申请号:CN202211290178.5

    申请日:2022-10-21

    Abstract: 本方案涉及一种基于傅里叶变换的拉曼光谱曲线数据增强方法。所述方法包括:获取待处理拉曼光谱曲线进行快速傅里叶变换得到拉曼光谱曲线频域图;将拉曼光谱曲线频域图中的两端极端频率曲线峰屏蔽,得到目标拉曼光谱曲线频域图;确定频域掩模起始位置与宽度并执行频域屏蔽操作,判断对目标拉曼光谱曲线频域图的频域屏蔽操作是否合法;若合法,则对目标拉曼光谱曲线频域图进行逆傅里叶变换,得到数据增强的拉曼光谱曲线。通过利用快速傅里叶变换获得的拉曼光谱曲线对应的频域图进行屏蔽操作,可以保留原有拉曼光谱曲线数据的基本框架,在部分频率点进行轻微扰动,以达到合理数据扩充的目的,可以提升机器学习模型分类效果。

    基于多层次级联结构的图像风格迁移方法

    公开(公告)号:CN118350984A

    公开(公告)日:2024-07-16

    申请号:CN202410608320.9

    申请日:2024-05-16

    Inventor: 丁建睿 张听 丁卓

    Abstract: 本发明公开了一种基于多层次级联结构的图像风格迁移方法,步骤包括:将风格图和内容图输入到级联编码器中得到不同尺度的风格语义特征以及内容语义特征;对风格语义特征以及内容语义特征的每一尺度使用协方差变换网络进行特征融合,生成融合特征图;对融合特征图计算多级风格损失;对多级风格损失计算后的融合特征图计算多级内容损失;对计算损失后的融合特征图进行解码操作并作为下一级特征融合的内容图,经过级联的编解码器结构最终生成多层次风格迁移后的风格化图像。该图像风格迁移方法能够有效提升模型在不同风格特征迁移情况下对风格图的特征捕捉和迁移能力。

    一种基于多模态图卷积的影像推荐系统及方法

    公开(公告)号:CN116932887B

    公开(公告)日:2024-06-18

    申请号:CN202310669701.3

    申请日:2023-06-07

    Abstract: 本发明所述一种基于多模态图卷积的影像推荐系统及方法,属于计算机技术领域。本发明综合利用图卷积对多模态特征聚合的方法,基于图卷积架构针对用户偏好实现影视作品的推荐。本方法首先通过爬虫算法,获取同一个用户对影视作品的评价记录、影视作品相关海报等信息;对数据集进行预处理,使用MixGen方法对数据进行增强,对数据集进行扩充;使用线性变换等方法将图像数据模态和文本数据模态表示为向量形式;对不同模态的信息进行提取,分别获取多模态中文本模态和图像数据模态的向量表示;利用图卷积对同一个模态进行层内和层间节点聚合,提取用户对电影的细粒度意图;利用层间聚合建立细粒度和粗粒度用户意图之间的关系,对不同模态的处理都建立超级节点结合;将聚合得到各模态的特征通过一个注意力机制层,增强不同模态之间的交互,最终获取影视作品推荐列表。本发明解决了现有的多模态推荐系统难以很好的在特定模式下对用户偏好建模以及不同模态数据难以进行交互的问题。

    基于可变形卷积的图像分割方法

    公开(公告)号:CN118397274A

    公开(公告)日:2024-07-26

    申请号:CN202410512249.4

    申请日:2024-04-26

    Abstract: 本发明公开了一种基于可变形卷积的图像分割方法,方法步骤包括:对原始图像进行预处理获得输入图像、由特征提取网络对输入图像进行逐层特征提取、由上采样网络通过结合各层的图像特征和语义信息来逐层恢复图像尺寸得到网络预测分割结果、根据网络预测分割结果与对应的真实分割结果的对比结果来对图像分割网络进行训练、对图像分割网络的分割效果进行评估和可视化展示。该图像分割方法设置有可变形的卷积核结构,可避免固定尺寸卷积核的感受野太小无法捕获大尺寸对象特征或感受野太大引入过多噪声和无效信息的问题,提高网络对于有效信息的提取能力,解决不同类型的图像对于网络分割效果产生影响的问题,从而提高分割性能。

Patent Agency Ranking