一种证件识别方法及装置
    32.
    发明申请

    公开(公告)号:WO2021057138A1

    公开(公告)日:2021-04-01

    申请号:PCT/CN2020/098482

    申请日:2020-06-28

    发明人: 徐崴 陈继东

    IPC分类号: G06K9/32 G06K9/72

    摘要: 一种证件识别方法及装置,其中,该方法包括:首先,获取待识别的目标证件对应的证件版面模版,基于该证件版面模版确定目标证件的证件版面信息,来实现目标证件中文字区域的初步圈定,然后,再利用预设文字行检测方法并结合初步圈定出的文字区域,确定目标证件中各证件字段的实际位置信息,来实现目标证件中文字区域的精准定位。

    REPRESENTATIVE DOCUMENT HIERARCHY GENERATION
    33.
    发明申请

    公开(公告)号:WO2020234749A1

    公开(公告)日:2020-11-26

    申请号:PCT/IB2020/054695

    申请日:2020-05-18

    摘要: In some aspects, a method includes performing optical character recognition (OCR) based on data corresponding to a document to generate text data, detecting one or more bounded regions from the data based on a predetermined boundary rule set, and matching one or more portions of the text data to the one or more bounded regions to generate matched text data. Each bounded region of the one or more bounded regions encloses a corresponding block of text. The method also includes extracting features from the matched text data to generate a plurality of feature vectors and providing the plurality of feature vectors to a trained machine-learning classifier to generate one or more labels associated with the one or more bounded regions. The method further includes outputting metadata indicating a hierarchical layout associated with the document based on the one or more labels and the matched text data.

    DISPLAYING DATA RELATED TO OBJECTS IN IMAGES
    34.
    发明申请

    公开(公告)号:WO2020086055A1

    公开(公告)日:2020-04-30

    申请号:PCT/US2018/056920

    申请日:2018-10-22

    发明人: GUPTA, Mohit

    IPC分类号: G06T19/20 G06K9/72

    摘要: An example of a non-transitory computer-readable medium storing machine-readable instructions. The instructions may cause a controller to receive an image and detect an object in the image. Based on a contextual setting of the electronic device, overlay data may be retrieved from a database or a remote electronic device to be visually associated with the object on a display.

    VIDEO FINGERPRINTING BASED ON FOURIER TRANSFORM OF HISTOGRAM
    35.
    发明申请
    VIDEO FINGERPRINTING BASED ON FOURIER TRANSFORM OF HISTOGRAM 审中-公开
    基于傅里叶变换的视频指纹识别

    公开(公告)号:WO2017146937A1

    公开(公告)日:2017-08-31

    申请号:PCT/US2017/017797

    申请日:2017-02-14

    发明人: CHEN, Juikun

    摘要: A content device and method is disclosed to include a processing device to process streaming video content. A fingerprinter receives captured frames of the streaming video content and, for each frame of a plurality of the captured frames, generates a one-dimensional histogram function of pixel values and transforms the histogram function with a Fast Fourier Transform (FFT), to generate a plurality of complex values for the frame. The fingerprinter further, for each of the plurality of complex values, assigns a binary one ("1") when a real part of the complex value is greater than zero ("0") and assigns a binary zero ("0") when the real part is less than or equal to zero, to generate a plurality of bits. The fingerprinter further concatenates a specific number of the bits to generate a fingerprint for the frame.

    摘要翻译: 公开了一种内容装置和方法,其包括处理流式视频内容的处理装置。 指纹识别器接收流式视频内容的捕获帧,并且对于多个捕获帧中的每个帧,生成像素值的一维直方图函数,并且利用快速傅立叶变换(FFT)来变换直方图函数,以生成 该帧的多个复数值。 当复合值的实部大于零(“0”)并且分配二进制零(“0”)时,对于多个复值中的每一个复合值,指纹器还分配二进制(“1” ;)当实部小于或等于零时,生成多个比特。 指纹仪进一步连接特定数量的比特以产生帧的指纹。

    認識装置、認識方法およびプログラム
    36.
    发明申请
    認識装置、認識方法およびプログラム 审中-公开
    识别装置,识别方法和程序

    公开(公告)号:WO2016181470A1

    公开(公告)日:2016-11-17

    申请号:PCT/JP2015/063526

    申请日:2015-05-11

    发明人: 鈴木 智久

    IPC分类号: G06K9/72

    摘要: 禁止される文字列等を効率良く排除して、文字列を精度良く認識する。認識装置は、入力画像から、文字を含むと推測される画素の集合である文字候補を検出する候補検出部と、前記文字候補のそれぞれを認識して、認識結果の候補の文字である少なくとも1つの認識候補を生成する認識部と、前記少なくとも1つの認識候補のそれぞれを、認識対象の文字列をモデル化した知識辞書と照合して、前記入力画像に含まれると推測される文字列と知識辞書を照合して得られる少なくとも1つの照合結果を生成する照合部と、前記少なくとも1つの照合結果のうち、禁止対象の文字列を含む文字列と知識辞書を照合して得られた照合結果を削除する禁則処理部を備える。

    摘要翻译: 为了准确地识别字符串,同时有效地排除禁止的字符串等,该识别装置具有:候选检测单元,其从输入图像检测字符候选,其为估计为包含字符的像素集合; 识别单元,其对每个所述字符候选进行识别,并且生成作为由所述识别产生的候选字符的至少一个识别候选; 匹配单元,其将所述至少一个识别候选中的每一个与知识词典相匹配,该知识词典包括用于识别的字符串的模型,并且通过将所估计的包含在输入图像中的字符串与知识相匹配来生成至少一个匹配结果 字典; 以及东亚语言连字处理单元,其从所述至少一个匹配结果中删除通过将包含禁止字符串的字符串与所述知识词典相匹配而获得的匹配结果。

    VISUAL STORYTELLING AUTHENTICATION
    37.
    发明申请
    VISUAL STORYTELLING AUTHENTICATION 审中-公开
    视觉认证

    公开(公告)号:WO2016061505A1

    公开(公告)日:2016-04-21

    申请号:PCT/US2015/056018

    申请日:2015-10-16

    IPC分类号: G06K9/72 G06F21/31

    摘要: Method, system and media for authenticating a subject as a user. Embodiments generate visual stories specific to the user and for which the subject must select the corresponding images from among a plurality of decoy images. Gaze tracking can be used to determine which images the user has selected without allowing an observer to learn which images have been selected. Images for the visual story can be retrieved from the user's social networking profile, and corresponding text storied generated to indicate which images should be selected. Multiple security levels are possible by varying the number of story images and decoy images.

    摘要翻译: 用户认证主题的方法,系统和媒体。 实施例产生特定于用户的视觉故事,并且对象必须从多个诱饵图像中选择相应的图像。 凝视跟踪可用于确定用户选择的图像,而不允许观察者了解哪些图像已被选择。 可以从用户的社交网络配置文件中检索视觉故事的图像,并生成相应的文本,以指示应选择哪些图像。 通过改变故事图像和诱饵图像的数量,可以实现多种安全级别。

    文書処理装置および項目抽出方法
    38.
    发明申请
    文書処理装置および項目抽出方法 审中-公开
    文件处理装置和项目提取方法

    公开(公告)号:WO2016046988A1

    公开(公告)日:2016-03-31

    申请号:PCT/JP2014/075744

    申请日:2014-09-26

    发明人: 藤尾 正和

    IPC分类号: G06K9/72

    CPC分类号: G06K9/72

    摘要:  本発明の文書解析装置は、英文帳票のように、枠構造が非明示な帳票や、文字間隔が離れており、従来手法では項目文字行の抽出に失敗する場合や、文字行が途中で改行して離れた位置に存在するため、項目文字行抽出に失敗し、ひいては項目文字行と値文字行の抽出に影響を及ぼす帳票においても、正しく項目文字行を抽出することを課題とする。 入力装置と、入力装置に接続されたプロセッサと、プロセッサに接続された記憶装置と、前記プロセッサに接続された出力装置と、を備える文書処理装置であって、プロセッサは、入力装置を介して入力された、帳票文書各々について、文字の配置に基づき文字間の連接候補関係を抽出し、抽出した文字間連接関係に基づき項目名である可能性が高い連接関係を抽出し、抽出した連接関係に基づき、項目名文字列領域候補を抽出する手段と、項目名文字列領域候補が、項目名文字列であるか否かを判定する手段を持つことを特徴とする。

    摘要翻译: 根据本发明的文档分析装置解决了从不清楚显示帧结构的形式(例如英文形式)或字符间隔如此大的形式来正确地提取项目字符行的问题 通过常规技术提取项目字符行失败,或者由于字符行具有中断线并且被移动到分离位置,因此提取项目字符行失败,并且另外 ,项目字符行和值字符行的提取将受到影响。 具有输入装置的文件处理装置,连接到输入装置的处理器,连接到处理器的存储装置以及连接到处理器的输出装置的特征在于,处理器包括:一个装置,用于相对于 通过输入装置输入的每个表单文档,基于字符的位置的字符之间的结合候选关系,基于提取的字符到字符结合关系具有作为项目名称的高可能性的连接关系 ,以及基于所提取的结合关系的项目名称字符串区域候选; 以及用于确定项目名称字符串区域候选项是否是项目名称字符串的装置。

    APPARATUS AND METHOD FOR DISPLAYING IMAGE-BASED REPRESENTATIONS OF GEOGRAPHICAL LOCATIONS IN AN ELECTRONIC TEXT
    39.
    发明申请
    APPARATUS AND METHOD FOR DISPLAYING IMAGE-BASED REPRESENTATIONS OF GEOGRAPHICAL LOCATIONS IN AN ELECTRONIC TEXT 审中-公开
    用于在电子文本中显示地理位置的基于图像的表示的装置和方法

    公开(公告)号:WO2014072767A1

    公开(公告)日:2014-05-15

    申请号:PCT/IB2012/056189

    申请日:2012-11-06

    申请人: NOKIA CORPORATION

    发明人: BOLDYREV, Sergey

    摘要: An apparatus comprising at least one processor; and at least one memory, the memory comprising computer program code stored thereon, the at least one memory and computer program code being configured to, when run on the at least one processor, cause the apparatus to: process a passage of electronic text to identify at least one word associated with a geographical location in the passage of electronic text; search for an image-based representation of the geographical location associated with the at least one identified word; and output the image-based representation of the geographical location to a display.

    摘要翻译: 一种装置,包括至少一个处理器; 以及至少一个存储器,所述存储器包括存储在其上的计算机程序代码,所述至少一个存储器和计算机程序代码被配置为当在所述至少一个处理器上运行时使得所述设备:处理电子文本的通过以识别 与电子文本通过中的地理位置相关联的至少一个词; 搜索与所述至少一个识别的词相关联的地理位置的基于图像的表示; 并将地理位置的基于图像的表示输出到显示器。

    VISUAL OCR FOR POSITIONING
    40.
    发明申请
    VISUAL OCR FOR POSITIONING 审中-公开
    视觉OCR定位

    公开(公告)号:WO2013130216A1

    公开(公告)日:2013-09-06

    申请号:PCT/US2013/024248

    申请日:2013-02-01

    摘要: A mobile device can receive OCR library information associated with a coarse position. The coarse position can be determined by the mobile device, or by a network server configured to communicate with the mobile device. A camera on the mobile device can obtain images of human-readable information in an area near the coarse position. The view finder image can be processed with an OCR engine that is utilizing the OCR library information to determine one or more location string values. A location database can be searched based on the location string values. The position of the mobile device can be estimated and displayed. The position estimated can be adjusted based on the proximity of the mobile device to other features in the image.

    摘要翻译: 移动设备可以接收与粗略位置相关联的OCR库信息。 粗略位置可以由移动设备或被配置为与移动设备通信的网络服务器确定。 移动设备上的相机可以在粗略位置附近的区域中获得人类可读信息的图像。 可以利用利用OCR库信息来确定一个或多个位置字符串值的OCR引擎来处理取景器图像。 可以根据位置字符串值搜索位置数据库。 可以估计和显示移动设备的位置。 可以基于移动设备与图像中的其他特征的接近度来调整所估计的位置。