一种自然场景图片中的文本字体的识别方法

    公开(公告)号:CN108376244B

    公开(公告)日:2022-03-25

    申请号:CN201810104830.7

    申请日:2018-02-02

    申请人: 北京大学

    摘要: 本发明公布了一种自然场景图片中的文本字体的识别方法,通过图片合成方法获得大量融合不同字体文本的具体类似真实效果的自然场景图片,利用图片训练得到字体识别器和文本定位器,通过文本定位器从互联网图片中定位出更多文本图片,再利用迁移学习方法,通过字体识别器从图片中进一步学习,进一步提高识别的准确度。本发明采用自动合成高质量训练图片的方案,避免了耗时耗力的人工标注,大幅度降低成本,使得字体分类器具有更好的识别精度。此外,本发明引入迁移学习方法,充分利用大量无字体标签的图片,进一步增强字体分类器的准确度。

    一种基于样例的动态文本特效的自动迁移方法

    公开(公告)号:CN110738715B

    公开(公告)日:2021-07-09

    申请号:CN201810796815.3

    申请日:2018-07-19

    申请人: 北京大学

    IPC分类号: G06T13/20 G06T3/00

    摘要: 本发明公布了一种基于样例的动态文本特效的自动迁移方法,输入包含素材文本图、素材动态特效字或素材风格动画和目标文本图的一组样例;依据素材风格动画中的动态风格及目标文本图中的文本内容,通过关键帧提取、时空相干性构建、基于改进PatchMatch的纹理合成的方法,使得素材风格动画中的文本特效充分迁移到目标文本中,保持整体及细节的纹理风格,自动生成动态效果生动逼真、自然流畅的目标动态特效字/目标风格动画;目标风格动画由多帧目标风格图构成。本发明能够解决目标风格动画中纹理闪烁、抖动的时序问题,解决复杂流体特效效果丢失、迁移不完整的外观问题,保证各帧的纹理连续性。

    一种基于单阶段少量样本学习的艺术字体自动生成方法

    公开(公告)号:CN110443864B

    公开(公告)日:2021-03-02

    申请号:CN201910670478.8

    申请日:2019-07-24

    申请人: 北京大学

    摘要: 本发明公布了一种基于单阶段少量样本建模学习的艺术字体自动生成方法,建立网络模型(AGS‑Net),针对已有的完整的合成艺术字体字库,预训练网络模型(AGS‑Net),使模型能够从风格参考集输入中提取风格特征、从内容参考集输入中提取内容特征以及合成指定风格和内容的风格化字符;利用只有少量样本的设计师设计的艺术字体字库对网络模型AGS‑Net进行微调;通过训练完成的网络模型AGS‑Net生成完整的艺术特效字体字库。本发明的网络模型规模、参数量较小。采用本发明技术方案,能够在任何的语言系统上扩展,不局限于特定的语言,能够达到最佳的艺术字体自动合成效果。

    一种基于深度神经网络的手写体中文字库自动生成方法

    公开(公告)号:CN107644006B

    公开(公告)日:2020-04-03

    申请号:CN201710908121.X

    申请日:2017-09-29

    申请人: 北京大学

    IPC分类号: G06F40/109 G06K9/68 G06N3/04

    摘要: 本发明公布了一种基于深度神经网络的手写体中文字库自动生成方法,通过少量手写体汉字进行字体特征重建,建立字体风格迁移网络,通过字体风格迁移网络估计用户未书写字形的字体风格特征,将参考字体的字形内容与用户书写风格结合,迁移到目标手写体风格,生成目标字形图片,从而得到完整的字库中文手写体字库。本发明方法是一种端到端的生成方法,不需要对汉字进行笔画或部件提取,也不需要人工干预,生成高质量的汉字字形,极大地提高了手写体字库制作的效率,使得个性化字库的生成变得简单方便,能够满足普通人对于个性化手写体字库的需求,加快个性化字库的发展进程。

    一种基于单张图像的三维网格模型生成方法及装置

    公开(公告)号:CN110443892A

    公开(公告)日:2019-11-12

    申请号:CN201910675788.9

    申请日:2019-07-25

    申请人: 北京大学

    IPC分类号: G06T17/20 G06T19/20 G06T7/13

    摘要: 本发明公布了一种基于单张图像的三维网格模型重建方法及装置,单张图像可为自然图像或物体的轮廓图,根据用户提供的单张图像,完全自动化地生成与之形状匹配一致的三维模型。包括:语义分割、前景提取、形状特征提取、视角预测、三维模型训练、点云封装表面网格,从而重建生成三维网格模型。本发明能够极大地加快三维模型设计的时间,使得设计三维模型时只需在生成的三维模型的基础上精修即可得到目标模型。

    一种基于结构引导的图像纹理迁移方法

    公开(公告)号:CN110288667A

    公开(公告)日:2019-09-27

    申请号:CN201810224267.7

    申请日:2018-03-19

    申请人: 北京大学

    摘要: 本发明公布了一种基于结构引导的图像纹理迁移方法,输入包含素材语义图、素材风格图和目标语义图的一组样图,通过显著结构信息提取、结构信息传播、引导性的纹理合成等步骤,使得纹理迁移后仍能保持内部结构信息、底层细节信息,由此自动生成与目标语义图内容一致且具备素材风格图的纹理风格的目标风格图。本发明方法通过显著性结构纹理引导的方式解决了目标风格图中结构信息丢失的问题,通过语义引导项为用户提供了控制纹理形态、位置的接口,解决了用户交互性的问题,通过改进的最近邻搜索匹配方法提高了生成图片质量。

    一种基于风格学习的汉字合成方法

    公开(公告)号:CN106611172A

    公开(公告)日:2017-05-03

    申请号:CN201510696769.6

    申请日:2015-10-23

    申请人: 北京大学

    IPC分类号: G06K9/22 G06N3/08

    摘要: 本发明公开了一种基于风格学习的汉字合成方法。本发明为:1)提取用户输入的每一手写字及对应参考字的骨架点坐标;2)根据骨架点分别计算对应手写字和参考字的笔画布局和每个笔画的笔画形状;3)对于每一手写字,计算该手写字与其对应参考字之间的笔画形状差值以及笔画布局差值;4)使用神经网络分别对笔画形状差值、笔画布局差值进行训练,得到笔画形状风格的神经网络权值、笔画布局风格的神经网络权值;5)将新的参考字的笔画惯性、笔画重心位置输入到已训练的神经网络中,分别得到该用户风格的笔画形状和笔画布局;6)组合步骤5)得到的笔画形状和笔画布局得到合成汉字的骨架,然后对该骨架进行平滑、渲染得到该用户风格的手写体汉字。

    一种个性化汉字数字墨水的生成方法

    公开(公告)号:CN103488339B

    公开(公告)日:2016-09-07

    申请号:CN201310407336.5

    申请日:2013-09-09

    申请人: 北京大学

    IPC分类号: G06F3/041 G06T11/00

    摘要: 本发明涉及一种个性化汉字数字墨水的生成方法,步骤为:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整的笔画训练字并提取得到训练字图像;2)拆分已标定出训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。本发明提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。

    一种面向矢量字形的汉字笔画自动提取方法

    公开(公告)号:CN104992143A

    公开(公告)日:2015-10-21

    申请号:CN201510303067.7

    申请日:2015-06-04

    申请人: 北京大学

    IPC分类号: G06K9/00

    CPC分类号: G06K9/00865

    摘要: 本发明涉及一种面向矢量字形的汉字笔画自动提取方法,其步骤包括:1)对待提取的目标字形以及模板数据库中与其相对应的带有笔画归类信息的模板字形进行骨架提取,得到数据点集和模板点集;2)将数据点集、模板点集以及模板点集的笔画归属关系作为输入,进行基于结构信息的非刚性点集注册,得到数据点集的笔画归属关系;3)将数据点集的笔画归属关系转换成数据轮廓段的归属关系,使构成字形轮廓的每一个轮廓段具有相应的归属笔画;4)连接生成的轮廓段,得到最终的矢量笔画提取结果。本发明的矢量化方法能够精确地实现字形的笔画提取,且完全不需要人工的干预,算法可以自动运行,有利于矢量化笔画提取的批量运行。