专利检索 ipc:"G06K9/72" 第 4 页

31.

发明申请
STRUCTURED ADVERSARIAL TRAINING FOR NATURAL LANGUAGE MACHINE LEARNING TASKS 审中-公开

公开(公告)号：WO2021145514A1

公开(公告)日：2021-07-22

申请号：PCT/KR2020/007078

申请日：2020-06-01

申请人： SAMSUNG ELECTRONICS CO., LTD.

发明人： STABLER, Edward Palmer , GOLDSMITH, Benjamin , HARKEMA, Hendrik

IPC分类号： G06N20/00 , G06F40/40 , G06F40/166 , G06F40/35 , G06K9/6257 , G06K9/72

摘要： A method includes obtaining first training data having multiple first linguistic samples. The method also includes generating second training data using the first training data and multiple symmetries. The symmetries identify how to modify the first linguistic samples while maintaining structural invariants within the first linguistic samples, and the second training data has multiple second linguistic samples. The method further includes training a machine learning model using at least the second training data. At least some of the second linguistic samples in the second training data are selected during the training based on a likelihood of being misclassified by the machine learning model.

32.

发明申请
一种证件识别方法及装置审中-公开

公开(公告)号：WO2021057138A1

公开(公告)日：2021-04-01

申请号：PCT/CN2020/098482

申请日：2020-06-28

申请人： 支付宝（杭州）信息技术有限公司

发明人： 徐崴 , 陈继东

IPC分类号： G06K9/32 , G06K9/72

摘要： 一种证件识别方法及装置，其中，该方法包括：首先，获取待识别的目标证件对应的证件版面模版，基于该证件版面模版确定目标证件的证件版面信息，来实现目标证件中文字区域的初步圈定，然后，再利用预设文字行检测方法并结合初步圈定出的文字区域，确定目标证件中各证件字段的实际位置信息，来实现目标证件中文字区域的精准定位。

33.

发明申请
REPRESENTATIVE DOCUMENT HIERARCHY GENERATION 审中-公开

公开(公告)号：WO2020234749A1

公开(公告)日：2020-11-26

申请号：PCT/IB2020/054695

申请日：2020-05-18

申请人： THOMSON REUTERS ENTERPRISE CENTRE GMBH

发明人： AMMAR, Khaled , ZUBERT, Brian , KHAN, Sakif Hossain

IPC分类号： G06K9/00 , G06K9/34 , G06K9/72 , G06K9/62

摘要： In some aspects, a method includes performing optical character recognition (OCR) based on data corresponding to a document to generate text data, detecting one or more bounded regions from the data based on a predetermined boundary rule set, and matching one or more portions of the text data to the one or more bounded regions to generate matched text data. Each bounded region of the one or more bounded regions encloses a corresponding block of text. The method also includes extracting features from the matched text data to generate a plurality of feature vectors and providing the plurality of feature vectors to a trained machine-learning classifier to generate one or more labels associated with the one or more bounded regions. The method further includes outputting metadata indicating a hierarchical layout associated with the document based on the one or more labels and the matched text data.

34.

发明申请
DISPLAYING DATA RELATED TO OBJECTS IN IMAGES 审中-公开

公开(公告)号：WO2020086055A1

公开(公告)日：2020-04-30

申请号：PCT/US2018/056920

申请日：2018-10-22

申请人： HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P.

发明人： GUPTA, Mohit

IPC分类号： G06T19/20 , G06K9/72

摘要： An example of a non-transitory computer-readable medium storing machine-readable instructions. The instructions may cause a controller to receive an image and detect an object in the image. Based on a contextual setting of the electronic device, overlay data may be retrieved from a database or a remote electronic device to be visually associated with the object on a display.

35.

发明申请
VIDEO FINGERPRINTING BASED ON FOURIER TRANSFORM OF HISTOGRAM 审中-公开
标题翻译：基于傅里叶变换的视频指纹识别

公开(公告)号：WO2017146937A1

公开(公告)日：2017-08-31

申请号：PCT/US2017/017797

申请日：2017-02-14

申请人： SORENSON MEDIA, INC.

发明人： CHEN, Juikun

IPC分类号： G06F17/30 , G06K9/00 , G06F15/16 , G06F17/00 , G06F17/22 , G06K9/62 , G06K9/72

CPC分类号： H04N21/440245 , G06F17/30 , G06K9/00744 , G06K9/00758 , G06K9/4642 , G06K9/522 , H04N21/222 , H04N21/23424 , H04N21/2407 , H04N21/26258 , H04N21/435 , H04N21/437 , H04N21/44008 , H04N21/812 , H04N21/84

摘要： A content device and method is disclosed to include a processing device to process streaming video content. A fingerprinter receives captured frames of the streaming video content and, for each frame of a plurality of the captured frames, generates a one-dimensional histogram function of pixel values and transforms the histogram function with a Fast Fourier Transform (FFT), to generate a plurality of complex values for the frame. The fingerprinter further, for each of the plurality of complex values, assigns a binary one ("1") when a real part of the complex value is greater than zero ("0") and assigns a binary zero ("0") when the real part is less than or equal to zero, to generate a plurality of bits. The fingerprinter further concatenates a specific number of the bits to generate a fingerprint for the frame.

摘要翻译： 公开了一种内容装置和方法，其包括处理流式视频内容的处理装置。指纹识别器接收流式视频内容的捕获帧，并且对于多个捕获帧中的每个帧，生成像素值的一维直方图函数，并且利用快速傅立叶变换（FFT）来变换直方图函数，以生成该帧的多个复数值。当复合值的实部大于零（“0”）并且分配二进制零（“0”）时，对于多个复值中的每一个复合值，指纹器还分配二进制（“1” ;）当实部小于或等于零时，生成多个比特。指纹仪进一步连接特定数量的比特以产生帧的指纹。

36.

发明申请
認識装置、認識方法およびプログラム审中-公开
标题翻译：识别装置，识别方法和程序

公开(公告)号：WO2016181470A1

公开(公告)日：2016-11-17

申请号：PCT/JP2015/063526

申请日：2015-05-11

申请人： 株式会社東芝 , 東芝ソリューション株式会社

发明人： 鈴木　智久

IPC分类号： G06K9/72

CPC分类号： G06K9/723 , G06K9/6204 , G06K9/6277 , G06K9/72 , G06K2209/01

摘要： 禁止される文字列等を効率良く排除して、文字列を精度良く認識する。認識装置は、入力画像から、文字を含むと推測される画素の集合である文字候補を検出する候補検出部と、前記文字候補のそれぞれを認識して、認識結果の候補の文字である少なくとも１つの認識候補を生成する認識部と、前記少なくとも１つの認識候補のそれぞれを、認識対象の文字列をモデル化した知識辞書と照合して、前記入力画像に含まれると推測される文字列と知識辞書を照合して得られる少なくとも１つの照合結果を生成する照合部と、前記少なくとも１つの照合結果のうち、禁止対象の文字列を含む文字列と知識辞書を照合して得られた照合結果を削除する禁則処理部を備える。

摘要翻译： 为了准确地识别字符串，同时有效地排除禁止的字符串等，该识别装置具有：候选检测单元，其从输入图像检测字符候选，其为估计为包含字符的像素集合; 识别单元，其对每个所述字符候选进行识别，并且生成作为由所述识别产生的候选字符的至少一个识别候选; 匹配单元，其将所述至少一个识别候选中的每一个与知识词典相匹配，该知识词典包括用于识别的字符串的模型，并且通过将所估计的包含在输入图像中的字符串与知识相匹配来生成至少一个匹配结果字典; 以及东亚语言连字处理单元，其从所述至少一个匹配结果中删除通过将包含禁止字符串的字符串与所述知识词典相匹配而获得的匹配结果。

37.

发明申请
VISUAL STORYTELLING AUTHENTICATION 审中-公开
标题翻译：视觉认证

公开(公告)号：WO2016061505A1

公开(公告)日：2016-04-21

申请号：PCT/US2015/056018

申请日：2015-10-16

申请人： THE CURATORS OF THE UNIVERSITY OF MISSOURI

发明人： SHYU, Chi-Ren , CAO, Hongfei , KLARIC, Matthew , UHLMANN, Jeffrey

IPC分类号： G06K9/72 , G06F21/31

CPC分类号： G06F21/36 , G06K9/00604 , G06K9/72 , H04L63/06

摘要： Method, system and media for authenticating a subject as a user. Embodiments generate visual stories specific to the user and for which the subject must select the corresponding images from among a plurality of decoy images. Gaze tracking can be used to determine which images the user has selected without allowing an observer to learn which images have been selected. Images for the visual story can be retrieved from the user's social networking profile, and corresponding text storied generated to indicate which images should be selected. Multiple security levels are possible by varying the number of story images and decoy images.

摘要翻译： 用户认证主题的方法，系统和媒体。实施例产生特定于用户的视觉故事，并且对象必须从多个诱饵图像中选择相应的图像。凝视跟踪可用于确定用户选择的图像，而不允许观察者了解哪些图像已被选择。可以从用户的社交网络配置文件中检索视觉故事的图像，并生成相应的文本，以指示应选择哪些图像。通过改变故事图像和诱饵图像的数量，可以实现多种安全级别。

38.

发明申请
文書処理装置および項目抽出方法审中-公开
标题翻译：文件处理装置和项目提取方法

公开(公告)号：WO2016046988A1

公开(公告)日：2016-03-31

申请号：PCT/JP2014/075744

申请日：2014-09-26

申请人： 株式会社日立製作所

发明人： 藤尾　正和

IPC分类号： G06K9/72

CPC分类号： G06K9/72

摘要： 　本発明の文書解析装置は、英文帳票のように、枠構造が非明示な帳票や、文字間隔が離れており、従来手法では項目文字行の抽出に失敗する場合や、文字行が途中で改行して離れた位置に存在するため、項目文字行抽出に失敗し、ひいては項目文字行と値文字行の抽出に影響を及ぼす帳票においても、正しく項目文字行を抽出することを課題とする。　入力装置と、入力装置に接続されたプロセッサと、プロセッサに接続された記憶装置と、前記プロセッサに接続された出力装置と、を備える文書処理装置であって、プロセッサは、入力装置を介して入力された、帳票文書各々について、文字の配置に基づき文字間の連接候補関係を抽出し、抽出した文字間連接関係に基づき項目名である可能性が高い連接関係を抽出し、抽出した連接関係に基づき、項目名文字列領域候補を抽出する手段と、項目名文字列領域候補が、項目名文字列であるか否かを判定する手段を持つことを特徴とする。

摘要翻译： 根据本发明的文档分析装置解决了从不清楚显示帧结构的形式（例如英文形式）或字符间隔如此大的形式来正确地提取项目字符行的问题通过常规技术提取项目字符行失败，或者由于字符行具有中断线并且被移动到分离位置，因此提取项目字符行失败，并且另外，项目字符行和值字符行的提取将受到影响。具有输入装置的文件处理装置，连接到输入装置的处理器，连接到处理器的存储装置以及连接到处理器的输出装置的特征在于，处理器包括：一个装置，用于相对于通过输入装置输入的每个表单文档，基于字符的位置的字符之间的结合候选关系，基于提取的字符到字符结合关系具有作为项目名称的高可能性的连接关系，以及基于所提取的结合关系的项目名称字符串区域候选; 以及用于确定项目名称字符串区域候选项是否是项目名称字符串的装置。

39.

发明申请
APPARATUS AND METHOD FOR DISPLAYING IMAGE-BASED REPRESENTATIONS OF GEOGRAPHICAL LOCATIONS IN AN ELECTRONIC TEXT 审中-公开
标题翻译：用于在电子文本中显示地理位置的基于图像的表示的装置和方法

公开(公告)号：WO2014072767A1

公开(公告)日：2014-05-15

申请号：PCT/IB2012/056189

申请日：2012-11-06

申请人： NOKIA CORPORATION

发明人： BOLDYREV, Sergey

IPC分类号： G06F17/21 , G06F17/27 , G06F17/28 , G06F17/30 , G06K9/72

CPC分类号： G06F17/30424 , G01C21/362 , G01C21/3647 , G06F17/278 , G06F17/30265 , G06F17/30477 , H04L51/04 , H04L61/609

摘要： An apparatus comprising at least one processor; and at least one memory, the memory comprising computer program code stored thereon, the at least one memory and computer program code being configured to, when run on the at least one processor, cause the apparatus to: process a passage of electronic text to identify at least one word associated with a geographical location in the passage of electronic text; search for an image-based representation of the geographical location associated with the at least one identified word; and output the image-based representation of the geographical location to a display.

摘要翻译： 一种装置，包括至少一个处理器; 以及至少一个存储器，所述存储器包括存储在其上的计算机程序代码，所述至少一个存储器和计算机程序代码被配置为当在所述至少一个处理器上运行时使得所述设备：处理电子文本的通过以识别与电子文本通过中的地理位置相关联的至少一个词; 搜索与所述至少一个识别的词相关联的地理位置的基于图像的表示; 并将地理位置的基于图像的表示输出到显示器。

40.

发明申请
VISUAL OCR FOR POSITIONING 审中-公开
标题翻译：视觉OCR定位

公开(公告)号：WO2013130216A1

公开(公告)日：2013-09-06

申请号：PCT/US2013/024248

申请日：2013-02-01

申请人： QUALCOMM INCORPORATED

发明人： GUPTA, Rajarshi , DAS, Saumitra Mohan , CHAO, Hui

IPC分类号： G01C21/20 , G01C21/36 , G01S5/16 , G06K9/00 , G06K9/32 , G06K9/72

CPC分类号： G01C21/206 , G01C21/3602 , G01S5/16 , G06K9/3258 , G06K2209/01

摘要： A mobile device can receive OCR library information associated with a coarse position. The coarse position can be determined by the mobile device, or by a network server configured to communicate with the mobile device. A camera on the mobile device can obtain images of human-readable information in an area near the coarse position. The view finder image can be processed with an OCR engine that is utilizing the OCR library information to determine one or more location string values. A location database can be searched based on the location string values. The position of the mobile device can be estimated and displayed. The position estimated can be adjusted based on the proximity of the mobile device to other features in the image.

摘要翻译： 移动设备可以接收与粗略位置相关联的OCR库信息。粗略位置可以由移动设备或被配置为与移动设备通信的网络服务器确定。移动设备上的相机可以在粗略位置附近的区域中获得人类可读信息的图像。可以利用利用OCR库信息来确定一个或多个位置字符串值的OCR引擎来处理取景器图像。可以根据位置字符串值搜索位置数据库。可以估计和显示移动设备的位置。可以基于移动设备与图像中的其他特征的接近度来调整所估计的位置。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类