-
公开(公告)号:CN105900141A
公开(公告)日:2016-08-24
申请号:CN201480072590.7
申请日:2014-12-24
Applicant: 微软技术许可有限责任公司
CPC classification number: G06K9/6215 , A61B3/113 , G06F3/013 , G06K9/00604 , G06K9/2027 , G06T7/73 , G06T2207/10016 , G06T2207/10152 , G06T2207/20224 , H04N5/23229 , H04N5/2354 , H04N5/243
Abstract: 本文公开的技术提供了用于将反射离开对象的闪光映射到负责该闪光的光源的各实施例。本文公开的各实施例能够通过用相机捕捉仅仅若干图像来正确地将闪光映射到光源。在用光源的不同图案照明对象的同时,捕捉每一图像。还可确定无闪光图像。无闪光图像是其中闪光已经通过图像处理技术被移除的图像。
-
公开(公告)号:CN102279926B
公开(公告)日:2016-05-18
申请号:CN201110165719.7
申请日:2011-06-09
Applicant: 微软技术许可有限责任公司
CPC classification number: G06K9/3283 , G06K2209/01
Abstract: 将图像纠偏系统和技术用于光学字符识别的上下文中。获取以原始线性(水平)定向的原始字符集的图像。相对于该原始线性定向偏斜一旋转角的所获取的字符集由该图像的像素表示。估计该旋转角,且可以将置信度值与该估计关联起来,以便判断是否纠偏该图像。结合旋转角估计,将边缘检测滤波器应用于所获取的字符集以便产生边缘图,将该边缘图输入到线性霍夫变换滤波器以便以参数形式产生一组输出线。给各输出线分配分数,且基于各分数将具有接近旋转角的斜率的至少一个输出线判断为主导线。
-
公开(公告)号:CN102714692B
公开(公告)日:2015-12-16
申请号:CN201080042348.7
申请日:2010-08-28
Applicant: 微软技术许可有限责任公司
CPC classification number: H04N5/23293 , G06K9/3216 , H04N1/00251 , H04N1/00307
Abstract: 描述了基于照相机的扫描的各实施例。在各实施例中,可使用由与设备相关联的照相机拍摄的图像来创建扫描的文档。处理由照相机拍摄的图像以标识图像内与诸如纸、名片、白板、屏幕等矩形对象相对应的部分。可选择这些部分中的一个或多个以用来基于评分方案自动地扫描和/或在来自用户的输入的帮助下半自动地扫描。通过展开所选部分以消除透视效应(例如,将该部分调整为矩形)以及应用各种图像增强以改进外观来从所选的部分中创建一个或多个扫描的文档。
-
公开(公告)号:CN102236800B
公开(公告)日:2015-12-02
申请号:CN201110117322.0
申请日:2011-04-29
Applicant: 微软技术许可有限责任公司
IPC: G06K9/72
CPC classification number: G06K9/344 , G06K2209/01
Abstract: 本发明公开了经历OCR过程的文本的单词识别。一种用于在经历光学字符识别的文本图像中标识单词的方法包括,接收(410)包括已由多个切分线分割的文本行的图像(15)的位图(多个切分线各自与反映相应的切分线正确地将文本行分割成个体字符的程度的置信水平相关联)。至少部分基于文本行以及具有大于第一阈值的切分线置信水平的第一子集的切分线,来在文本行的一个中标识(420)一个或多个单词。如果(430)第一单词不与足够高的单词置信水平相关联,则至少部分基于具有大于小于第一阈值的第二阈值的置信水平的第二子集的切分线,来标识(440)至少一第二单词。
-
公开(公告)号:CN106575357B
公开(公告)日:2020-04-17
申请号:CN201580041095.4
申请日:2015-07-22
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及确定眼睛的估计的瞳孔区域的实施例。在一个实施例中,一种方法包括接收眼睛的图像,该图像包括多个像素。粗略的瞳孔区域可使用多个像素的至少一个子集来生成。多个瞳孔边界点候选被提取自粗略的瞳孔区域,其中候选中的每一个基于至少两个相邻像素的颜色值被加权。参数曲线可被拟合到经加权的瞳孔边界点候选,以确定用户眼睛的估计的瞳孔区域。
-
公开(公告)号:CN106575357A
公开(公告)日:2017-04-19
申请号:CN201580041095.4
申请日:2015-07-22
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及确定眼睛的估计的瞳孔区域的实施例。在一个实施例中,一种方法包括接收眼睛的图像,该图像包括多个像素。粗略的瞳孔区域可使用多个像素的至少一个子集来生成。多个瞳孔边界点候选被提取自粗略的瞳孔区域,其中候选中的每一个基于至少两个相邻像素的颜色值被加权。参数曲线可被拟合到经加权的瞳孔边界点候选,以确定用户眼睛的估计的瞳孔区域。
-
公开(公告)号:CN105900141B
公开(公告)日:2019-04-30
申请号:CN201480072590.7
申请日:2014-12-24
Applicant: 微软技术许可有限责任公司
Abstract: 本文公开的技术提供了用于将反射离开对象的闪光映射到负责该闪光的光源的各实施例。本文公开的各实施例能够通过用相机捕捉仅仅若干图像来正确地将闪光映射到光源。在用光源的不同图案照明对象的同时,捕捉每一图像。还可确定无闪光图像。无闪光图像是其中闪光已经通过图像处理技术被移除的图像。
-
公开(公告)号:CN102870399B
公开(公告)日:2015-09-02
申请号:CN201180023323.7
申请日:2011-04-28
Applicant: 微软技术许可有限责任公司
Inventor: D·尼耶姆切维奇
CPC classification number: G06K9/342 , G06K2209/01
Abstract: 提供一种图像处理装置,包括在进行OCR处理的文本图像的位图中将词语分割为单个字符的字符截断器组件。字符截断器组件被配置为产生(可能是弯曲的)截断线的集合,所述截断线将任何给定的词语的位图分为其单个字符或字形候选。当输入的位图包含两个独立的词语,这种情况可以通过标记这些词语应当被拆分的位置来处理。通过考虑在给定的词语位图中的字形和背景颜色,字符分割算法计算垂直方向的、弯曲的截断线的集合。随后为了保存那些确实分隔了词语的字形的线以及将那些没有分隔词语的字形的线的数目减到最少,使用各种试探法过滤所述集合。
-
-
-
-
-
-
-