一种基于拉普拉斯嵌入的图像分类词典学习方法和装置

    公开(公告)号:CN107169531A

    公开(公告)日:2017-09-15

    申请号:CN201710447133.7

    申请日:2017-06-14

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于拉普拉斯嵌入的图像分类词典学习方法和装置,属于图像处理技术领域,通过在传统的拉普拉斯约束条件中引入了词典权重矩阵,给图像分类词典中的每一个原子赋予不同的权重,实现了可以给图像分类词典中有利于图像分类准确性的原子赋予较大的权重,提高了本发明实施例的图像分类词典用于图像分类时的分类效果;同时,本发明实施例在传统的拉普拉斯约束条件中引入了词典权重矩阵,对图像分类词典矩阵进行升维,可以进一步提高本发明实施例的图像分类词典用于图像分类时的分类效果;而且,本发明实施例采用多距离加权的图结构模型计算两个样本之间的近邻程度,提高了衡量两个样本之间的近邻程度的准确性。

    弹性网络约束自解释稀疏表示分类器的设计方法

    公开(公告)号:CN106250929A

    公开(公告)日:2016-12-21

    申请号:CN201610620582.2

    申请日:2016-07-29

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6267 G06K9/6256

    摘要: 本发明涉及一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法,含有以下步骤:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典;通过训练得到的稀疏表达词典获取测试样本在核空间的弹性网络系数编码,最后用每一类的词典及词典所对应的弹性网络稀疏编码拟合测试样本,并计算该拟合误差,拟合误差最小类为测试样本的类别。本发明综合了岭回归和lasso回归的优点,使样本的稀疏编码特征既具有稀疏性,又具有较小的拟合误差,有效降低了分类误差,提升分类器的识别性能。

    基于OCR技术的票据识别及结构恢复方法

    公开(公告)号:CN117727062A

    公开(公告)日:2024-03-19

    申请号:CN202311738558.5

    申请日:2023-12-18

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种基于OCR技术的票据识别及结构恢复方法,所述方法包括:s1、通过OCR技术对图片内容进行范围检测并识别文字内容;s2、对表格图片进行灰度化及二值化处理;s3、利用OpenCV中的形态学函数对二值化后的图片进行膨胀和腐蚀操作,初步得到表格的行线和列线;s4、利用霍夫变换分别检测图像中的行线和列线,同时过滤掉噪声线条;s5、计算行线和列线的交点坐标,并根据交点坐标对表格区域进行提取;s6、与s1中OCR检测与识别结果进行合并;s7、根据合并后的内容生成excel表格或其它常用存储形式。本发明利用OpenCV库中的图像处理函数,结合深度学习OCR识别技术,对表单表格进行识别和处理,进一步提高了表格OCR识别的准确率及效率。

    一种基于表单分割的实时文本检测方法

    公开(公告)号:CN117727058A

    公开(公告)日:2024-03-19

    申请号:CN202311738652.0

    申请日:2023-12-18

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种基于表单分割的实时文本检测方法,该方法包括如下步骤:s1、通过相机扫描获取目标表单的图像信息;s2、将通过扫描获得的表单图像上传到服务器;s3、对上传的表单图像进行预处理,并将完整表单图像进行分割;s4、使用深度学习模型,分别检测分割后表单的文本信息,完成对各个分割表单的文本信息提取;s5、使用合并算法,将各个分割表单的文本检测结果进行合并,形成完整的表单检测结果;s6、将结果实时反馈。本发明方法通过使用深度学习模型对于表单的文本信息进行提取,使用切割合并算法,充分对分割后局部表单的文本信息进行整合,实现对表单数据实时检测。

    基于核空间自解释稀疏表示的分类器设计方法

    公开(公告)号:CN105740908B

    公开(公告)日:2017-05-24

    申请号:CN201610070445.6

    申请日:2016-01-31

    IPC分类号: G06K9/62

    摘要: 本发明涉及一种基于核空间自解释稀疏表示的分类器设计方法,含有以下步骤:读取训练样本,将训练样本映射到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;对测试样本通过词典矩阵获得该测试样本在核空间的稀疏编码,用每一类的词典及词典所对应的稀疏编码拟合测试样本,并计算该拟合误差;拟合误差最小的类即为测试样本的类别。与现有技术相比,本发明结合核技巧和词典学习方法,一方面,考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。

    基于核空间的线性鉴别稀疏表示分类器的设计方法

    公开(公告)号:CN105868796A

    公开(公告)日:2016-08-17

    申请号:CN201610264895.9

    申请日:2016-04-26

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6267 G06K9/6256

    摘要: 本发明涉及一种基于核空间的线性鉴别稀疏表示分类器的设计方法,步骤为:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;通过词典矩阵获得该测试样本在核空间的线性鉴别稀疏编码,用每一类的词典及词典所对应的线性鉴别稀疏编码拟合测试样本,计算该拟合误差;拟合误差最小的类为测试样本的类别。本发明能够保证同一类样本的稀疏编码是集中的,不同类样本稀疏编码是分散的,有效地增加了样本鉴别性,提升了分类器性能。

    基于核空间自解释稀疏表示的分类器设计方法

    公开(公告)号:CN105740908A

    公开(公告)日:2016-07-06

    申请号:CN201610070445.6

    申请日:2016-01-31

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6267 G06K9/6256

    摘要: 本发明涉及一种基于核空间自解释稀疏表示的分类器设计方法,含有以下步骤:读取训练样本,将训练样本映射到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;对测试样本通过词典矩阵获得该测试样本在核空间的稀疏编码,用每一类的词典及词典所对应的稀疏编码拟合测试样本,并计算该拟合误差;拟合误差最小的类即为测试样本的类别。与现有技术相比,本发明结合核技巧和词典学习方法,一方面,考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。

    一种复杂场景下的多目标跟踪方法

    公开(公告)号:CN118261945A

    公开(公告)日:2024-06-28

    申请号:CN202311730265.2

    申请日:2023-12-15

    IPC分类号: G06T7/277 G06T7/70

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种适用于复杂场景下的多目标跟踪方法。算法包含以下三个创新:引入轨迹置信度对传统卡尔曼滤波进行改进,可以在存在遮挡的场景下得到正确的匹配结果;引入了除外观与运动外的弱线索,如目标的深度信息及运动方向信息,可以有效针对遮挡及外观相似场景下不同目标间区分度较低的问题,减少误匹配率;同时还设计了一种轨迹恢复策略,可以找回因短时间内严重遮挡而丢失的目标以获得完整的轨迹。本发明实现了拥挤、遮挡或目标外观相似等复杂场景下较为鲁棒的多目标跟踪。

    一种基于深度学习的票据、表格文本实时识别方法

    公开(公告)号:CN117710998A

    公开(公告)日:2024-03-15

    申请号:CN202311739683.8

    申请日:2023-12-15

    摘要: 本发明结合深度学习与自然语言处理算法,具体公开了一种基于深度学习的票据、表格文本实时识别方法,该方法包括如下步骤:s1、对待识别的票据表格图片进行去噪等预处理;s2、对票据、表格数据进行自动标注和人工修正,得到准确的文本标签和目标文本区域;s3、对文本标签进行数据分布分析,根据分布情况进行针对性的样本扩充和数据增广;s4、以目标文本区域为输入,分解字符,采用局部和全局模块感知字符间与字符内的关系,充分挖掘特征;s5、进行测试,选择适合的规则后处理策略优化识别结果;s6、将结果实时反馈。本发明方法通过使用深度学习算法来分析票据表格文本,采用局部与全局模块充分挖掘文本细粒度特征,快速获得准确、鲁棒的识别结果。

    基于核空间的线性鉴别稀疏表示分类器的设计方法

    公开(公告)号:CN105868796B

    公开(公告)日:2019-03-01

    申请号:CN201610264895.9

    申请日:2016-04-26

    IPC分类号: G06K9/62

    摘要: 本发明涉及一种基于核空间的线性鉴别稀疏表示分类器的设计方法,步骤为:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;通过词典矩阵获得该测试样本在核空间的线性鉴别稀疏编码,用每一类的词典及词典所对应的线性鉴别稀疏编码拟合测试样本,计算该拟合误差;拟合误差最小的类为测试样本的类别。本发明能够保证同一类样本的稀疏编码是集中的,不同类样本稀疏编码是分散的,有效地增加了样本鉴别性,提升了分类器性能。