文本图像识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN113313127A

    公开(公告)日:2021-08-27

    申请号:CN202110537652.9

    申请日:2021-05-18

    Abstract: 本发明公开了一种文本图像识别方法、装置、计算机设备和存储介质,所述方法包括:获取原始文本图像并进行预处理,得到处理后图像;利用特征编码网络中的残差卷积模块对所述处理后图像进行特征提取,得到图像特征;利用所述特征编码网络中上下文感知模块的类递归扩张卷积部分和通道级尺度注意力部分,对图像特征进行处理,得到上下文调制特征序列;对上下文调制序列进行解码,预测得到对应的符号序列。本发明利用上下文感知模块对不同尺度的文本进行上下文调制,同时利用残差模块和上下文感知模块交错连接,实现不同语义层次的上下文信息融合,为后续解码提供更多有效信息,提高了文本识别的准确率。

    文本图像标注系统、方法、计算机设备和存储介质

    公开(公告)号:CN111898411A

    公开(公告)日:2020-11-06

    申请号:CN202010548848.3

    申请日:2020-06-16

    Abstract: 本申请涉及一种文本图像标注系统、方法、计算机设备和存储介质,通过接收前端网页上发的预标注请求;根据预标注请求携带的待标注文本图像的标识查找得到待标注文本图像;对待标注文本图像进行实例分割得到候选文本框集合;基于最小函数和交集运算,对候选文本框集合中的各个候选文本框进行计算,得到各个候选文本框之间的重叠度;根据重叠度在候选文本框集合中选取得到至少一个目标文本框,生成目标文本框集合;对待标注文本图像进行特征提取,根据提取得到的特征与目标文本框集合,对待标注文本图像进行预标注;将预标注结果发送至前端网页,以使前端网页显示预标注结果,根据修正指令对预标注结果进行修正,得到标注结果;能够提高标注效率。

    基于深度强化学习的场景文本检测方法及系统

    公开(公告)号:CN108090443B

    公开(公告)日:2020-09-22

    申请号:CN201711352220.0

    申请日:2017-12-15

    Abstract: 本发明公开了基于深度强化学习的场景文本检测方法及系统,所述方法包括:训练一个特征提取网络;训练一个决策网络;通过特征提取网络和决策网络定位待检测图像上场景文本的位置;其中,所述特征提取网络为场景文本图像特征提取的深度卷积神经网络;所述决策网络为拟合强化学习Q值函数的神经网络。本发明将场景文本检测解析为基于视觉的连续性决策问题,结合强化学习与深度神经网络,模拟日常生活中人眼从整图开始逐渐聚焦到目标物体的过程;在训练过程中,利用深度神经网络,很好地提取出当前定位框图像信息,以强化学习方法训练出能进行目标文本定位的模型。

    基于三维卷积神经网络的边界框回归方法、系统、设备及介质

    公开(公告)号:CN109255351A

    公开(公告)日:2019-01-22

    申请号:CN201811031633.3

    申请日:2018-09-05

    Abstract: 本发明公开了一种基于三维卷积神经网络的边界框回归方法、系统、设备及介质,所述方法包括:构建回归器,对跟踪算法预测出的目标边界框进行回归;根据给定跟踪序列的第一帧信息,生成样本对并训练回归器;在后续每一帧的目标跟踪过程中,使用回归器对跟踪算法预测的目标边界框进行回归;在设定三维卷积神经网络的时序维度输入量为N的情况下,当跟踪到第N帧时,将前N帧的跟踪目标图像作为三维卷积神经网络的输入,再根据第一帧的信息,生成样本对,对回归器进行适应性调优重训练。本发明首次将边界框回归应用在基于三维卷积神经网络的目标跟踪算法领域,使预测的边界框经过回归后更接近真实值,提高了跟踪效果的精确性。

    基于深度学习与深度信息检测定位的云台结构及方法

    公开(公告)号:CN117991825B

    公开(公告)日:2024-10-15

    申请号:CN202410149341.9

    申请日:2024-02-02

    Abstract: 本发明公开了一种基于深度学习与深度信息检测定位的云台结构及方法,包括:图像采集装置,用于采集目标物体的图像信息和深度信息;计算处理模块,将所述图像信息和深度信息转化为位置信息、姿态信息并生成控制指令发送至云台舵机控制模块中;云台舵机控制模块,根据所述计算处理模块发送的控制指令驱动云台舵机机构;云台舵机机构,通过所述云台舵机控制模块的驱动控制对所述图像采集装置进行方位角度调整;本发明结构简单,安装方便快捷,易于推广应用;在结构上配备有可转动的图像采集装置,可实现对云台舵机机构、运动机构和执行机构的精确控制。

    基于扩散驱动数据回放的联邦类持续学习图像分类方法

    公开(公告)号:CN118710996A

    公开(公告)日:2024-09-27

    申请号:CN202411191850.4

    申请日:2024-08-28

    Abstract: 本发明公开了一种基于扩散驱动数据回放的联邦类持续学习图像分类方法,所述方法包括:初始化阶段,服务器初始化预训练扩散模型和图像分类模型并发送给客户端;类别逆向编码阶段,客户端对新任务类别进行逆向编码,得到类别嵌入向量;图像生成阶段,利用类别嵌入向量生成图像;图像分类模型训练阶段,各个客户端用生成数据和合成数据训练图像分类模型。对于联邦类持续学习图像分类,其关键难点在于灾难性遗忘,即模型在学习新任务时遗忘旧任务的知识,为解决这一难点,通过预训练扩散模型对各个类别数据进行逆向工程,得到类别嵌入向量,在学习新任务时利用类别嵌入向量对历史任务数据进行生成回放,有效缓解灾难性遗忘。

    基于深度学习与深度信息检测定位的云台结构及方法

    公开(公告)号:CN117991825A

    公开(公告)日:2024-05-07

    申请号:CN202410149341.9

    申请日:2024-02-02

    Abstract: 本发明公开了一种基于深度学习与深度信息检测定位的云台结构及方法,包括:图像采集装置,用于采集目标物体的图像信息和深度信息;计算处理模块,将所述图像信息和深度信息转化为位置信息、姿态信息并生成控制指令发送至云台舵机控制模块中;云台舵机控制模块,根据所述计算处理模块发送的控制指令驱动云台舵机机构;云台舵机机构,通过所述云台舵机控制模块的驱动控制对所述图像采集装置进行方位角度调整;本发明结构简单,安装方便快捷,易于推广应用;在结构上配备有可转动的图像采集装置,可实现对云台舵机机构、运动机构和执行机构的精确控制。

    基于关系先验偏置的文档关系抽取方法

    公开(公告)号:CN117874174A

    公开(公告)日:2024-04-12

    申请号:CN202410273703.5

    申请日:2024-03-11

    Inventor: 黄森 黄双萍

    Abstract: 本发明公开了基于关系先验偏置的文档关系抽取方法,所述方法包括:构建关系抽取模型,包括预训练语言模型和关系预测层;使用预训练语言模型编码文档,获得文档特征以及实体特征;对每个实体对计算关系先验偏置;把每个实体对的实体特征和关系先验偏置输入关系预测层,获得实体对的关系概率分布;计算关系分类损失函数,优化关系分类损失函数,训练关系抽取模型;使用关系抽取模型进行关系抽取。本发明发现对于文档关系抽取,其天然存在着很强的统计先验知识,本发明创新性地根据头尾实体的类型计算出实体对的关系先验偏置,并将关系先验偏置作为先验知识引入深度学习模型中,实现了高精度的文档关系抽取。

    一种基于视频动作的多模型集成多相位MRI肿瘤分类方法

    公开(公告)号:CN117351003B

    公开(公告)日:2024-02-23

    申请号:CN202311579723.7

    申请日:2023-11-24

    Abstract: 本发明公开了一种基于视频动作的多模型集成多相位MRI肿瘤分类方法,包括以下步骤:步骤1,对MRI肿瘤病例数进行划分处理与对MRI三维图像进行预处理;步骤2,通过分类模型获取MRI三维图像的特征图;步骤3,对特征图进行融合并映射到输出类别中得到预测结果;步骤4,重复步骤2和步骤3,获取多个独立且对不同类别具有不同分类能力的模型的预测结果;步骤5,集成多个模型的预测结果从而得到最终的多相位MRI肿瘤分类结果;得到更具鲁棒性和更精准的预测结果,使自动诊断多相位MRI肿瘤分类结果的精准度进一步提高,有效的缓解了医疗数据集中、数据量少、数据集不平衡的问题。

Patent Agency Ranking