语义增强型场景文本识别方法及装置

    公开(公告)号:CN113591546A

    公开(公告)日:2021-11-02

    申请号:CN202110653956.1

    申请日:2021-06-11

    Inventor: 崔萌萌 王威 王亮

    Abstract: 本发明提供一种语义增强型场景文本识别方法及装置,通过场景文本识别模型的编码器提取场景文本图像的视觉特征图以及上下文特征序列,并基于视觉特征图、上下文特征序列以及特征图的位置编码确定增强型特征表达,获取场景文本图像全局的视觉信息和语义信息,解码器采用特殊设计的循环神经网络单元进行解码,该单元能够均衡上下文信息的独立性和相关性。将隐含状态向量和展开后的增强型特征表达进行多头注意力运算,得到局部表观特征向量。局部表观特征向量与循环神经网络单元的隐层输出共同参与当前时刻的字符预测,增强了语义信息和视觉信息的相关性。多头注意力机制设计能够捕捉特征的显著性信息和辅助信息,使得场景文本识别结果准确率较高。

    语义增强型场景文本识别方法及装置

    公开(公告)号:CN113591546B

    公开(公告)日:2023-11-03

    申请号:CN202110653956.1

    申请日:2021-06-11

    Inventor: 崔萌萌 王威 王亮

    Abstract: 本发明提供一种语义增强型场景文本识别方法及装置,通过场景文本识别模型的编码器提取场景文本图像的视觉特征图以及上下文特征序列,并基于视觉特征图、上下文特征序列以及特征图的位置编码确定增强型特征表达,获取场景文本图像全局的视觉信息和语义信息,解码器采用特殊设计的循环神经网络单元进行解码,该单元能够均衡上下文信息的独立性和相关性。将隐含状态向量和展开后的增强型特征表达进行多头注意力运算,得到局部表观特征向量。局部表观特征向量与循环神经网络单元的隐层输出共同参与当前时刻的字符预测,增强了语义信息和视觉信息的相关性。多头注意力机制设计能够捕捉特征的显著性信息和辅助信息,使得场景文本识别结果准确率较高。

    基于信息导向注意力网络的图像识别方法、系统及装置

    公开(公告)号:CN111881957B

    公开(公告)日:2022-09-23

    申请号:CN202010683490.5

    申请日:2020-07-15

    Abstract: 本发明属于领域,具体涉及了一种基于信息导向注意力网络的图像识别方法,旨在解决的问题。本发明包括:获取输入图像,通过信息导向的注意力网络计算输入图像的特征向量,计算特征向量和信息导向的注意力网络中的原型表征之间的距离,选取特征向量距离最近的类别得到图像的分类结果。本发明解决了现有的图像识别技术中训练神经网络严重依赖数据规模的缺陷,通过将标注数据和未标注数据组织在一起并对他们之间的关系进行建模,可以抽取更具代表性的特征,解决了现有图像识别技术所用人工神经网络需要大量有标注的训练数据才能满足使用性能需求的缺陷。

    基于信息导向注意力网络的图像识别方法、系统及装置

    公开(公告)号:CN111881957A

    公开(公告)日:2020-11-03

    申请号:CN202010683490.5

    申请日:2020-07-15

    Abstract: 本发明属于领域,具体涉及了一种基于信息导向注意力网络的图像识别方法,旨在解决的问题。本发明包括:获取输入图像,通过信息导向的注意力网络计算输入图像的特征向量,计算特征向量和信息导向的注意力网络中的原型表征之间的距离,选取特征向量距离最近的类别得到图像的分类结果。本发明解决了现有的图像识别技术中训练神经网络严重依赖数据规模的缺陷,通过将标注数据和未标注数据组织在一起并对他们之间的关系进行建模,可以抽取更具代表性的特征,解决了现有图像识别技术所用人工神经网络需要大量有标注的训练数据才能满足使用性能需求的缺陷。

    基于渐进式簇净化网络的转导推理小样本分类方法

    公开(公告)号:CN111881954A

    公开(公告)日:2020-11-03

    申请号:CN202010679785.5

    申请日:2020-07-15

    Abstract: 本发明属于计算机视觉、模式识别和神经网络技术领域,具体涉及一种基于渐进式簇净化网络的转导推理小样本分类方法、系统、装置,旨在解决现有基于小样本学习的分类方法忽略了测试样本的作用,导致分类精度、鲁棒性较差的问题。本系统方法包括:获取第一数据集、第二数据集;提取第一数据集、第二数据集中图像的特征,对第二数据集不同类别的图像特征求均值,作为各类别的特征初始值;通过分类模型对第一数据集中的图像分类;第一数据集中重分类的各图像的正得分;第一数据集中重分类的各图像的负得分;通过预设的第一方法对特征初始值进行更新;循环判断。本发明提高了分类的精度、鲁棒性。

Patent Agency Ranking