-
公开(公告)号:CN108010514B
公开(公告)日:2021-09-10
申请号:CN201711155884.8
申请日:2017-11-20
申请人: 四川大学
摘要: 本发明公开了一种基于深度神经网络的语音分类方法,旨在通过一个统一的算法模型,解决不同的语音分类问题。本发明包括如下步骤:S1:将语音转换为相应的语谱图;在完整的语谱图上沿着频域进行分块,获得一组局部的频域信息集合。S2:分别将完整和局部的频域信息作为模型的输入,基于不同的输入,卷积神经网络能够提取到局部和全局特征。S3:运用注意力机制,融合全局和局部的特征表达,形成最终的特征表达。S4:采用已标记的数据,通过梯度下降以及反向传播算法训练网络。S5:对未标记的语音,采用训练好的参数,模型输出最高概率的分类作为预测结果。本发明实现了对不同语音分类问题的统一算法模型,在多个语音分类问题上提高了准确度。
-
公开(公告)号:CN107945870A
公开(公告)日:2018-04-20
申请号:CN201711335488.3
申请日:2017-12-13
申请人: 四川大学 , 四川省人民医院 , 成都市妇女儿童中心医院
摘要: 本发明实施例提供的基于深度神经网络的早产儿视网膜病变检测方法及装置,属于图像处理领域。该方法通过先采集多张眼底图像数据,再基于预设规则对所述多张眼底图像数据进行标注,生成待处理图像数据;接着再将所述待处理图像数据按照预设比例划分为训练集和测试集;再建立深度神经网络模型;再基于所述训练集训练所述深度神经网络模型;再将所述测试集中的数据通过已经训练好的所述深度神经网络模型处理,以获取处理后的输出数据;最后基于所述输出数据获取ROP病变诊断结果。从而可以减少人力资源,提高检测效率,省去了眼科医生的一部分工作,为临床检测早产儿视网膜病变有重要的指导意义。
-
公开(公告)号:CN113113155A
公开(公告)日:2021-07-13
申请号:CN202110658591.1
申请日:2021-06-15
申请人: 四川大学
摘要: 本发明涉及人工智能预测领域,具体是一种基于神经网络与SEIR模型的传染病趋势预测方法,包括如下步骤:步骤1、获取数据集;步骤2、数据预处理;步骤3、构建由病毒传染率预测模块和疫情趋势预测模块构成的疫情趋势预测模型;步骤4、使用步骤2预处理的数据对疫情趋势预测模型进行训练,同时设置疫情趋势预测模型的损失函数和模型参数更新方式;步骤5、利用步骤1~步骤4训练好的疫情趋势预测模型对疫情趋势进行预测;该方法可使用较少的训练数据,对传染病疫情趋势进行有效的自动动态实时预测,且预测过程无需人为干预。
-
公开(公告)号:CN112597981B
公开(公告)日:2021-06-01
申请号:CN202110237564.7
申请日:2021-03-04
申请人: 四川大学
摘要: 本发明涉及结肠镜检查过程质量评价领域,提出一种基于深度神经网络的肠镜退镜质量智能监控系统及方法,系统包括:质量监控模型端、后台视频处理和调用端和视频流展示端;方法包括:获取结肠镜检查时生成的视频流并拆分成图像帧;检测出每一帧图像中的目标区域并分割出来;对分割后的目标区域进行视野的有效性判定,并将有效视野的图像的数量和总图像数量的比值作为退镜过程中的视野有效率返回至视频流展示端;将判定为有效视野的图像按照四个象限等分为四份,分别进行管腔、局部和模糊的三分类判定,并将局部分类的图像数量和有效视野的图像数量的比值,以及管腔分类的图像数量和有效视野的图像数量的比值返回至视频流展示端。
-
公开(公告)号:CN112598086A
公开(公告)日:2021-04-02
申请号:CN202110237440.9
申请日:2021-03-04
申请人: 四川大学
摘要: 本发明涉及计算机视觉的图像识别领域以及人工智能领域,提出一种基于深度神经网络的常见结肠部疾病分类方法及辅助系统,辅助系统包括模型训练模块和辅助诊断模块;方法包括:获得多分类数据集及二分类数据集;基于二分类数据集训练得到正常‑异常深度神经网络分类模型;基于多分类数据集训练得到病变类型深度神经网络分类模型;将两个模型进行融合,得到结肠镜图像的深度神经网络疾病分类模型,在该模型中,测试集中的图像将首先被输入正常‑异常深度神经网络分类模型中,若被判定为正常的图像则直接输出判定结果,若被判定为异常的图像,则被输入到病变类型深度神经网络分类模型中,进一步确定病变类型后将判定结果输出。
-
公开(公告)号:CN109523994A
公开(公告)日:2019-03-26
申请号:CN201811346110.8
申请日:2018-11-13
申请人: 四川大学
摘要: 本发明公开了一种基于胶囊神经网络的多任务语音分类方法,涉及语音信号分析,人工智能等技术领域,解决在语音识别中的多任务分类问题。本发明主要有提取语音的特征表达,包括从频域,时域等多个角度去提取语音的初级特征;运用卷积神经网络和胶囊神经网络,在预处理后的语音初级特征基础上,再进行深层次的语音特征的抽象与学习;在高级特征之后根据多任务需求设计多个分类器,将多个分类器的损失函数融合,统一训练多任务语音分类模型,最终达到在多个任务上同时提高分类准确率。
-
公开(公告)号:CN109460737A
公开(公告)日:2019-03-12
申请号:CN201811346114.6
申请日:2018-11-13
申请人: 四川大学
摘要: 本发明公开了一种基于增强式深度残差神经网络的多模态语音情感识别方法,涉及视频流图像处理和语音信号分析等技术领域,解决人机交互的情感识别问题。本发明主要有提取视频(序列数据)与语音的特征表达,包括将语音数据转换为相应的语谱图表达,以及对时序数据进行编码;使用卷积神经网络提取原始数据的情感特征表达用于分类,模型接受多输入并且输入维度不等,提出交叉卷积层对不同模态的数据特征进行融合,模型使用的整体网络结构是增强式深度残差神经网络;模型初始化后,使用语音语谱图、序列视频信息及相应的情感标签训练多分类模型,训练完毕后对未标记的语音和视频进行预测,得到情感预测的概率值,选择概率最大值作为该多模态数据的情感类别。本发明在多模态情感识别问题上提高了识别准确率。
-
公开(公告)号:CN108010514A
公开(公告)日:2018-05-08
申请号:CN201711155884.8
申请日:2017-11-20
申请人: 四川大学
摘要: 本发明公开了一种基于深度神经网络的语音分类方法,旨在通过一个统一的算法模型,解决不同的语音分类问题。本发明包括如下步骤:S1:将语音转换为相应的语谱图;在完整的语谱图上沿着频域进行分块,获得一组局部的频域信息集合。S2:分别将完整和局部的频域信息作为模型的输入,基于不同的输入,卷积神经网络能够提取到局部和全局特征。S3:运用注意力机制,融合全局和局部的特征表达,形成最终的特征表达。S4:采用已标记的数据,通过梯度下降以及反向传播算法训练网络。S5:对未标记的语音,采用训练好的参数,模型输出最高概率的分类作为预测结果。本发明实现了对不同语音分类问题的统一算法模型,在多个语音分类问题上提高了准确度。
-
公开(公告)号:CN112580639B
公开(公告)日:2021-08-13
申请号:CN202110223672.9
申请日:2021-03-01
申请人: 四川大学
摘要: 本发明公开一种基于进化神经网络模型压缩的早期胃癌图像识别方法,涉及计算机应用技术领域,解决现有卷积神经网络模型中的参数冗余、早期胃癌识别过程中神经网络模型计算量消耗大而导致的实时性差的问题;包括以下步骤:采集早期胃癌图像数据集;训练神经网络模型;构建二值编码方式来对神经网络模型中的参数进行编码;使用进化算法对训练后的神经网络模型进行压缩;微调压缩后的神经网络模型,并识别新输入的胃镜检查图像上的早期胃癌病变区域;本发明能够根据收集的胃镜检查图像数据压缩用于检测的神经网络模型,从而提高早期胃癌检测任务中神经网络模型的效率,使得深度神经网络方法在早期胃癌检测方面具有好的实时性能。
-
公开(公告)号:CN112464579B
公开(公告)日:2021-06-01
申请号:CN202110141443.2
申请日:2021-02-02
申请人: 四川大学
IPC分类号: G06F30/27 , G06T7/00 , G06T3/40 , G06N3/04 , G06N3/08 , G06F111/04 , G06F111/06 , G06F111/08
摘要: 本发明公开了一种基于进化神经网络结构搜索的食管癌病变区域识别建模方法,涉及图像模式识别及医学图像的技术领域,包括如下步骤:S1:采集并标注用于训练神经网络模型的食管图像数据集;S2:构建用于食管癌病变区域识别的神经网络结构搜索空间;S3:训练面向食管癌病变区域识别的超网络模型;S4:使用进化算法在构建的超网络模型上搜索最优神经网络结构;S5:微调搜索到的神经网络结构,并预测新输入的食管图像上的病变区域。本发明消除食管癌智能识别任务中神经网络结构设计对于专家经验的依赖,使得深度神经网络方法在食管癌病变区域识别方面更加容易使用。
-
-
-
-
-
-
-
-
-