基于级联卷积神经网络的自然场景图像文本检测方法

    公开(公告)号:CN107766860A

    公开(公告)日:2018-03-06

    申请号:CN201711053435.2

    申请日:2017-10-31

    发明人: 刘菊华 吴伟 顾龙

    IPC分类号: G06K9/32 G06K9/34 G06K9/62

    摘要: 本发明公开了一种基于级联卷积神经网络的自然场景图像文本检测方法,首先利用最大稳定极值区域方法对输入图像进行候选字符提取;其次,将预训练好的16-net卷积神经网络与32-net卷积神经网络进行串联,组成一个级联卷积神经网络,并利用该级联卷积神经网络对候选字符进行分类,剔除候选字符中的非真实字符,得到最终的真实字符检测结果;然后,将字符检测结果中的相邻字符进行两两组对,并将存在共有字符的字符进行合并,直到所有字符对均被合并为止,得到文本行;最后根据字符间距将文本行分割为多个单词或词组,得到最终的文本检测结果。本发明有效解决了训练样本类别不平衡的问题,有效地提升了文本检测效率和性能。

    基于SAM的文本分割方法、装置、设备及存储介质

    公开(公告)号:CN118262360A

    公开(公告)日:2024-06-28

    申请号:CN202410321703.8

    申请日:2024-03-20

    申请人: 武汉大学

    摘要: 一种基于SAM的文本分割方法、装置、设备及存储介质。该方法包括:输入图像至图像编码器后,得到图像特征;自提示模块利用图像特征自动生成提示令牌,输入到掩膜解码器中用于分割全图中的文本前景;掩膜解码器以图像特征、提示令牌以及自身带有的输出令牌为输入,提供掩膜特征,基于掩膜特征与多层感知机处理后的输出令牌得到高分辨率文本分割掩膜。通过本申请,利用SAM中强大的预训练分割知识来赋能数据受限的文本分割任务,并针对分割精细文本的任务要求设计了简单有效的新方法提供高分辨率的分割掩膜,实现了对精细文本的高质量分割。

    一种基于知识引导的方面级情感分析模型训练方法

    公开(公告)号:CN113204645B

    公开(公告)日:2023-05-16

    申请号:CN202110353985.6

    申请日:2021-04-01

    申请人: 武汉大学

    发明人: 刘菊华 钟起煌

    摘要: 本发明公开了一种基于知识引导的方面级情感分析模型训练方法,首先在句子级情感分析数据集上对方面级情感分析模型进行预训练,得到学习了丰富语义知识的预训练模型M1;然后,使用基于知识引导的训练策略,在方面级情感分析数据集上对预训练模型M1再次进行训练,通过学习速度快的导航者模型引导学习速度慢的学习者模型,使学习者模型(即模型M2)能够学习到预训练数据集和目标任务数据集之间领域不变的语义知识;最后,构造最终的方面级情感分析模型,并使用模型M2对其进行初始化,在方面级情感分析数据集上该情感分析模型进行微调,从而得到最终的高性能的方面级情感分析模型Mfinal。本发明在多个方面级情感分析公开数据集上实现了最优的效果。

    一种基于光谱的专色叠印颜色预测方法

    公开(公告)号:CN105681624A

    公开(公告)日:2016-06-15

    申请号:CN201610095210.2

    申请日:2016-02-22

    申请人: 武汉大学

    IPC分类号: H04N1/58 H04N1/60

    摘要: 本发明公开了一种基于光谱的专色叠印颜色预测方法。本发明通过分析大量专色叠印组合的光谱反射率曲线,得到单个专色与叠印色光谱值之间的关系,建立一种简单的专色叠印颜色预测模型,首先设计单个专色的颜色特性化色靶,通过该色靶求解专色叠印预测模型的系数,即可求该专色与其他颜色叠印得到的叠印色的色度值。本发明操作方法简单,可方便的应用于印前数字流程中,且预测精度符合工业生产的需求;通过本发明所得的专色叠印预测值与专色叠印测量值的色差小于3(即ΔE

    彩色喷墨打印机单通道墨量限制方法

    公开(公告)号:CN104354475B

    公开(公告)日:2016-03-16

    申请号:CN201410669425.1

    申请日:2014-11-20

    申请人: 武汉大学

    IPC分类号: B41J2/21 B41J29/393

    摘要: 本发明公开了一种彩色喷墨打印机单通道墨量限制方法,包括步骤:步骤1,设计青、品红、黄、黑四色通道的输出色靶;步骤2,关闭彩色喷墨打印机色彩控制及墨量限制功能,打印输出色靶;步骤3,测量输出色靶各色块的色度和亮度,根据色度获得各色块的饱和度;步骤4,根据各色通道的网点百分比与亮度、饱和度间的变化规律,获得各色通道的最大墨量阈值;步骤5,根据输入的网点百分比及各色通道的最大墨量阈值控制各色通道对应的输出墨量。本发明在实现输出墨量精准控制的同时,也能实现打印机输出色域的最大化,避免了墨量超限引起的起皱、堆墨、溢出等问题,从而提高打印机的色彩输出能力。

    打印机图像半色调输出算法质量评价方法

    公开(公告)号:CN103595894A

    公开(公告)日:2014-02-19

    申请号:CN201310626343.4

    申请日:2013-11-28

    申请人: 武汉大学

    IPC分类号: H04N1/405

    摘要: 本发明公开了打印机图像半色调输出算法质量评价方法,通过将输出的半色调图像测量值转换为孟塞尔明度值,再对孟塞尔明度值与其对应的灰度值进行线性拟合,并使用误差项平方和、均方根误差、回归系数和调整后的回归系数四个指标进行一元线性回归分析,从而评价半色调算法对激光打印机非线性特性的鲁棒性。本发明达到了评价该半色调算法对激光打印机非线性特性的鲁棒性的目的,为进一步修改半色调算法及建立打印机模型提供基础。

    一种扫描图像色偏自动检测方法

    公开(公告)号:CN103200349A

    公开(公告)日:2013-07-10

    申请号:CN201310118929.X

    申请日:2013-04-08

    申请人: 武汉大学

    IPC分类号: H04N1/60

    摘要: 本发明提出了一种扫描图像色偏自动检测方法。扫描仪在扫描图像时,容易受到环境光源、物体本身的反射特性及采集设备的感光系数等的影响,使扫描得到的图像存在色偏。本发明所述的方法选择与设备无关的CIEL*a*b*均匀颜色空间,然后统计扫描图像的色度信息、色度平均值、平均色度中心距和偏色因子,最后通过与典型标准无色偏图像得到的标准色度平均值的分析比较,判断扫描图像是否存在色偏以及色偏的具体情况。采用本发明所述技术方案,可以准确地自动检测扫描图像的色偏,具有较高的准确率和可靠性,同时对扫描图像的色偏程度能做出一定的预估。

    一种印前数据自动检查方法及系统

    公开(公告)号:CN107203356A

    公开(公告)日:2017-09-26

    申请号:CN201710322932.1

    申请日:2017-05-09

    申请人: 武汉大学

    IPC分类号: G06F3/12

    摘要: 本发明公开了一种印前数据自动检查方法及系统,属于印前数据处理技术领域。本发明公开的方法首先在拼版文件中查找与单页原稿相对应的拼版对象,其次,根据拼版对象在拼版文件中的相对位置,获取1‑bit tiff文件中单页原稿对应的半色调数据,并对其进行逆半色调处理得到单页原稿对应的制版图像;然后将单页原稿与拼版对象以相同分辨率进行栅格化处理并比较两者的数据差异;再将单页原稿以制版图像的分辨率进行栅格化处理,比较栅格化处理后的数据与制版图像数据的差异;最后将数据差异区域显示在用户界面上。本发明所述的方法及系统实现了对印前数据的自动检查,并将数据差异区域准确直观地显示给数据检查人员,提高了检查效率。