一种自然场景图片中的文本字体的识别方法

    公开(公告)号:CN108376244A

    公开(公告)日:2018-08-07

    申请号:CN201810104830.7

    申请日:2018-02-02

    申请人: 北京大学

    摘要: 本发明公布了一种自然场景图片中的文本字体的识别方法,通过图片合成方法获得大量融合不同字体文本的具体类似真实效果的自然场景图片,利用图片训练得到字体识别器和文本定位器,通过文本定位器从互联网图片中定位出更多文本图片,再利用迁移学习方法,通过字体识别器从图片中进一步学习,进一步提高识别的准确度。本发明采用自动合成高质量训练图片的方案,避免了耗时耗力的人工标注,大幅度降低成本,使得字体分类器具有更好的识别精度。此外,本发明引入迁移学习方法,充分利用大量无字体标签的图片,进一步增强字体分类器的准确度。

    一种基于字体流形的中文字库自动生成方法

    公开(公告)号:CN108304357A

    公开(公告)日:2018-07-20

    申请号:CN201810093715.4

    申请日:2018-01-31

    申请人: 北京大学

    摘要: 本发明公布了一种中文字库自动生成方法,基于流形学习和深度神经网络,针对已有的汉字字库,提取字库的风格特征向量和字形特征向量,建立每个字的风格流形;再训练字体渲染网络,实现从特征向量到汉字图像的映射;在流形空间中获得新的特征向量,放入训练好的字体渲染网络,得到新风格的汉字字库。本发明不需人工书写汉字,无需人工干预;同时,流形空间的创建基于已有字体的特征向量,所以保证了新的特征向量不会出现巨大的偏差,保证了汉字原有的字形,风格特征的可解释性也较高。

    一种快速制作矢量字库的方法及系统

    公开(公告)号:CN103488711A

    公开(公告)日:2014-01-01

    申请号:CN201310407337.X

    申请日:2013-09-09

    申请人: 北京大学

    IPC分类号: G06F17/30 G06T11/80

    CPC分类号: G06T11/80 G06F17/30271

    摘要: 本发明涉及一种快速制作矢量字库的方法及系统,由计算机、打印机以及扫描仪组成的系统中,其步骤包括:1)指定待建立字库中的文字内容并机器写入一标准表格中;2)在打印出的标准表格上按照书写规范手写入文字,同时以标准表格为单位采集手写入文字得到若干表格图像;3)切分表格图得到文字闭合轮廓,根据文字闭合轮廓选出其中部分点作为关键点,对关键点筛选后得到最优关键点;4)根据最优关键点得到文字的矢量化轮廓,根据矢量化轮廓生成标准TrueType字库。本发明得到的矢量字库质量较高,可以完整的保持原作者的书写风格。在生成字库的过程中完全不需人工干预,扫描得到的图像一步生成高质量的标准字库,利于个性化字库批量生产。

    一种从网页中抽取信息的方法及装置

    公开(公告)号:CN101996190B

    公开(公告)日:2012-08-08

    申请号:CN200910090455.6

    申请日:2009-08-12

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种从网页中抽取信息的方法及装置,用以解决现有技术中不能从非结构化格式的网页中获取准确的信息问题。该方法包括:查找网页中的每种信息属性,获取每种信息属性对应的信息属性候选集,根据保存的信息属性间的位置关系与布局关系概率的对应关系,查找至少两种信息属性间的至少一个最大布局关系概率,并确定查找到的最大布局关系概率对应的位置关系,从所述至少两种信息属性对应的信息属性候选集中,抽取满足所述位置关系的信息属性组合。

    一种视频文字多帧融合的方法

    公开(公告)号:CN101615255B

    公开(公告)日:2012-03-21

    申请号:CN200910088875.0

    申请日:2009-07-21

    申请人: 北京大学

    IPC分类号: G06K9/62 G06F17/30

    摘要: 本发明公开了一种视频文字多帧融合的方法,用于对出现在多个连续视频帧的相同文字区域进行融合,包括如下步骤:1)在连续视频帧的文字区域检测结果中识别文字区域组,所述文字区域组指包含相同内容的多个文字区域;2)对步骤1)中得到的文字区域组进行过滤,去除会对融合结果造成负面影响的模糊的文字区域;3)对步骤2)中过滤后的文字区域组进行融合,得到融合结果。使用本发明的方法避免了模糊文字区域对于融合结果的影响;能够高效准确地检测连续视频帧中包含相同内容的多个文字区域;能够在简化背景的同时,得到较高的对比度和清晰的文字融合结果。

    一种双线性两倍上采样方法及系统

    公开(公告)号:CN102333212A

    公开(公告)日:2012-01-25

    申请号:CN201010226016.6

    申请日:2010-07-14

    IPC分类号: H04N7/26 H04N7/46

    摘要: 本发明公开了一种双线性两倍上采样方法及系统,属于图像处理、视频编解码等技术领域。现有的双线性上采样方式的效率较低。本发明首先申请四个缓冲区,分别为第一缓冲区、第二缓冲区、第三缓冲区和第四缓冲区;然后将待采样图像输入到第一缓冲区;再遍历待采样图像,分别对待采样图像进行横向像素采样、纵向像素采样和相邻四像素采样;将横向像素采样结果存入第二缓冲区,将纵向像素采样结果存入第三缓冲区,将相邻四像素采样结果存入第四缓冲区;最后将四个缓冲区中的像素进行交错排布,输出采样后图像。本发明主要应用于对图像进行双线性两倍上采样处理中。

    一种从网页中抽取评论内容的方法和装置

    公开(公告)号:CN102117289A

    公开(公告)日:2011-07-06

    申请号:CN200910244539.0

    申请日:2009-12-30

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种从网页中抽取评论内容的方法和装置,涉及信息处理技术,通过建立评论页面的DOM树,并选择符合评论区抽取规则的子树抽取出评论区,再利用评论记录间的结构相似性,抽取出评论区中的评论记录,利用包含评论内容的子树的差异性,选择标准差最大的子树作为包含评论内容的子树,最后选取稳定性最小的一条路径中,稳定性差绝对值最大的相邻节点中的孩子节点作为根节点,这个子树就是要抽取的评论内容。由于利用了评论内容的无结构特性来进行抽取,而不是根据网页的模板进行抽取,所以网页的不同不影响抽取的准确性,并且不需要根据网页的模板进行复杂的配置,并通过计算去除了噪声信息,提高了从网页中抽取评论内容的效率和准确性。

    一种基于簇排列的面向主题或查询的多文档摘要方法

    公开(公告)号:CN1828609A

    公开(公告)日:2006-09-06

    申请号:CN200610072587.2

    申请日:2006-04-13

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明涉及一种基于簇排列的面向主题或查询的多文档摘要方法,属于语言文字处理技术领域。现有的多文档摘要方法,在用户搜索感兴趣的主题时,不能准确地根据用户定义的兴趣爱好等属性返回相关的新闻信息和面向用户属性的摘要。本发明所述的方法提供了一种新的半监督学习算法即基于簇排列的算法,该方法全面考虑了句子之间的相互关系以及句子和用户主题或查询之间的关系,从而使得生成的摘要既能包含文档集的主要信息,又能诠释主题或回答查询,同时利用差异性惩罚算法来保证摘要的新颖性。采用本发明所述的方法能够根据用户的兴趣爱好等需求,返回相关的新闻信息,从而得到更好的面向主题或查询的多文档摘要,可以满足不同用户的个性化需求。