基于非局部注意力机制的多期相融合器官分割方法及装置

    公开(公告)号:CN112862784A

    公开(公告)日:2021-05-28

    申请号:CN202110180370.8

    申请日:2021-02-08

    IPC分类号: G06T7/00 G06T7/11 G06T7/66

    摘要: 本申请公开了一种基于非局部注意力机制的多期相融合器官分割方法及装置,该方法通过预设多期相融合器官分割网络模型分别对全局尺度多期相数据对和局部尺度多期相数据对进行图片分割得到全局尺度分割结果和局部尺度分割结果,对全局尺度分割结果和局部尺度分割结果进行融合得到待分割器官的分割结果。本申请中通过预设多期相融合器官分割网络模型中的跨期相非局部注意力融合机制模块根据两个期相的特征之间的位置关系和深度关系对两个期相的特征进行互补,充分利用双期相的互补使得两个期相的特征之间可以有效融合,采用了多尺度分割框架对全局尺度分割结果和局部尺度分割结果进行融合,有效的利用全局上下文信息,提高器官分割的准确性。

    一种基于短语关系传播的语义视觉定位方法及装置

    公开(公告)号:CN111783475B

    公开(公告)日:2021-05-11

    申请号:CN202010736120.3

    申请日:2020-07-28

    摘要: 本发明提供了一种基于短语关系传播的语义视觉定位方法及装置,其中方法包括:提取图像信息的多尺度特征,将多尺度特征与每个特征的位置信息进行融合,得到图像空间特征;获取文字描述信息,利用句法解析工具,生成语法图,学习短语特征,将短语特征与图像空间特征进行融合,得到多模态特征,并学习短语增强的特征图,得到语义特征,将主语节点的语义特征和主语节点的多模态特征,以及物体节点的语义特征和物体节点的多模态特征,输入到关系传播模块,得到关系增强的特征图;对每个节点进行节点合并,得到最终的关系增强特征图;对于最终的关系增强的特征图的每个空间位置,选择具有最高置信度的检测框作为输出,输出预测结果。

    辅助盲人进行视觉重构的方法、系统、设备和存储介质

    公开(公告)号:CN112634303A

    公开(公告)日:2021-04-09

    申请号:CN202011599079.6

    申请日:2020-12-29

    IPC分类号: G06T7/13 A61F9/08 A61N1/36

    摘要: 本发明提供了一种辅助盲人进行视觉重构的方法、系统、设备和存储介质,属于计算机视觉技术领域,解决现有导盲方法响应速度慢、不实用的技术问题。该方法包括:实时获取视觉视据;根据视觉视据确定目标物体的边缘并形成关键点云;根据关键点云形成目标物体轮廓的辅助数据;将辅助数据以接触或非接触方式传输至脑内电极,使得与视网膜形成耦合的脑内电极获得信号输入。本发明可以在满足盲人视觉重构所需数据的条件下,将视据数据简化为低码率的数据实现对数据的精简,有利于降低计算量,提高响应速度,降低延时,提升用户使用体验。

    一种基于可变形卷积网络的图像立体匹配方法以及系统

    公开(公告)号:CN112598722A

    公开(公告)日:2021-04-02

    申请号:CN202110023089.3

    申请日:2021-01-08

    摘要: 本发明提供了基于可变形卷积网络的图像立体匹配方法以及系统,解决现有技术中立体匹配模型训练成本高企、识别鲁棒性不足的技术问题。方法包括:形成两侧视图的视图特征;根据视图特征的差异形成特征差值;利用特征差值通过特征推断网络确定一侧视图特征与另一侧视图特征的初始采样偏移数据;利用一侧视图特征和初始采样偏移数据通过可变形卷积网络形成另一侧的视图预测特征;根据视图预测特征与另一侧视图特征的差异调整特征推断网络的损失函数,训练特征推断网络优化输出的采样偏移数据;根据优化阈值将采样偏移数据形成两侧视图像素间的视差值。可以有效应对常见的单向遮挡、光线变化等问题,增强算法鲁棒性。减少数据成本,有效利用计算资源。

    一种曼哈顿场景消失点、消失线检测方法及装置

    公开(公告)号:CN112598665A

    公开(公告)日:2021-04-02

    申请号:CN202011632601.6

    申请日:2020-12-31

    摘要: 本申请公开了一种曼哈顿场景消失点、消失线检测方法及装置,该方法中针对每条直线,计算与该直线同方向同长度的相邻两条直线的线积分的差值,根据差值计算得到该直线的边缘响应,根据各直线的边缘响应以及非极大值抑制方法得到消失线,建立待检测图像的曼哈顿场景参数的贝叶斯概率模型,在待检测图像中搜索竖直方向消失点的位置,通过霍夫变换的方式确定水平方向消失点的位置,根据水平方向消失点的位置对曼哈顿场景参数进行初始化,基于贝叶斯概率模型和模拟退火算法对初始化后的曼哈顿场景参数进行优化得到消失点的位置。在本申请的技术方案中,能够鲁棒的检测出待检测图像中反映结构信息的直线,可以检测到全局最优的消失点避免陷入局部最优。

    一种基于深度回归网络的骨龄预测方法及装置

    公开(公告)号:CN109741309B

    公开(公告)日:2021-04-02

    申请号:CN201811616211.2

    申请日:2018-12-27

    IPC分类号: G06T7/00 G06N3/04

    摘要: 本申请公开了一种基于深度回归网络的骨龄预测方法及装置。该方法包括输入待处理骨龄片图像;根据多级关键点检测深度卷积网络,获取骨骺区域图像;以及将所述骨骺区域图像输入预设深度学习回归网络,得到骨骺等级预测结果,计算出对应的骨龄。本申请解决了骨龄预测方法效果较差的技术问题。通过本申请不需要链接骨骺等级标注数据库而直接输出骨骺等级预测结果,并且可准确预测出骨龄。本申请于基于多级关键点检测得到的骨骺区域作为输入,经过卷积网络后通过多分支深度回归网络输出骨骺等级预测结果,获得的预测效果较佳。

    基于差分神经网络和图像序列数据的车速识别方法及装置

    公开(公告)号:CN112418157A

    公开(公告)日:2021-02-26

    申请号:CN202011422623.X

    申请日:2020-12-08

    摘要: 本申请公开了一种基于差分神经网络和图像序列数据的车速识别方法及装置,在本方法中,通过预设卷积神经网络对导盲设备采集的图像序列进行特征提取以及特征跨帧匹配得到图像序列中包含的各目标车辆的特征向量时序序列,然后通过预设LSTM速度预测神经网络和预设LSTM加速度预测神经网络基于各目标车辆的特征向量时序序列得到各目标车辆的上一时刻车速、当前时刻速度以及当前时刻加速度,最后根据上一时刻车速、当前时刻速度和当前时刻加速度预测得到各目标车辆的下一时刻车速,由于本申请中是基于导盲设备采集的图像序列进行的车速分析,因此,是从盲人的角度来识别得到车辆的当前速度以及预测车辆未来速度,提高了引导盲人避障的准确度。