-
公开(公告)号:CN101957919B
公开(公告)日:2012-10-10
申请号:CN201010289545.0
申请日:2010-09-22
Applicant: 上海交通大学
Abstract: 一种图像处理技术领域的基于图像局部特征检索的文字识别方法,首先建立汉字模板图库并提取其中每个汉字所对应图片的特征值作为特征匹配库;然后计算待识别汉字所对应图片的特征值,与特征匹配库进行特征点匹配,得到局部特征点坐标;再对待识别汉字所对应图片进行单字子窗口提取;最后构建识别最大堆并进行单字子窗口识别和合并处理,实现文字识别。本发明利用文字关键区域的局部特征来描述文字,并利用检索技术来实现复杂背景和自然拍摄的图片文字的识别。
-
公开(公告)号:CN101957919A
公开(公告)日:2011-01-26
申请号:CN201010289545.0
申请日:2010-09-22
Applicant: 上海交通大学
Abstract: 一种图像处理技术领域的基于图像局部特征检索的文字识别方法,首先建立汉字模板图库并提取其中每个汉字所对应图片的特征值作为特征匹配库;然后计算待识别汉字所对应图片的特征值,与特征匹配库进行特征点匹配,得到局部特征点坐标;再对待识别汉字所对应图片进行单字子窗口提取;最后构建识别最大堆并进行单字子窗口识别和合并处理,实现文字识别。本发明利用文字关键区域的局部特征来描述文字,并利用检索技术来实现复杂背景和自然拍摄的图片文字的识别。
-
公开(公告)号:CN101877133A
公开(公告)日:2010-11-03
申请号:CN200910311674.2
申请日:2009-12-17
Applicant: 上海交通大学
IPC: G06T7/20
Abstract: 一种图像处理技术领域的二视图像场景的运动分割方法,包括步骤为:进行局部特征提取和特征抽象描述;对提取的局部特征进行初步匹配,形成特征点对匹配集合;为每一特征点对生成一个初始运动模型,得到初始运动模型集合;将每一个初始运动模型映射成一个高维概率向量;为每个高维概率向量指定权重;通过指导抽样和分治处理,得到若干主要运动,使概率向量集合中剩余的概率向量都小于概率阈值;进行特征点对匹配附属指派,并剔除异常。本发明不需要任何关于运动模型数量的先验知识;可以在无需大量特征点的情况下,处理大数量的运动模型;能够较好地处理噪声数据;解决了均值平移的局限性,扩大了应用面;在时间消耗方面取得了一定的改善。
-
公开(公告)号:CN113312498B
公开(公告)日:2022-06-17
申请号:CN202110642699.1
申请日:2021-06-09
Applicant: 上海交通大学
IPC: G06F16/36 , G06F16/35 , G06F16/335
Abstract: 一种用无向图嵌入知识图谱的文本信息抽取方法,基于待抽取字符串构建包含关联句子信息节点和知识信息节点的无向图,分别根据无向图及其节点编号生成位置编码、根据无向图及其邻接矩阵生成关联控制矩阵,将关联控制矩阵引入注意力机制中,即关联控制矩阵中显示关联的节点能够正常计算注意力、显示无关联的节点对当前节点的注意力值无限趋近于0,即表示二者不相关,将节点序列中各个节点的词嵌入向量和根据位置编码和图中关联关系得到的相对位置编码输入基于注意力机制的信息抽取模型,将模型输出接入CRF层进行分类输出,得到信息抽取结果。
-
公开(公告)号:CN103095499B
公开(公告)日:2016-05-04
申请号:CN201310017802.9
申请日:2013-01-17
Applicant: 上海交通大学
Abstract: 本发明提供了一种在微博平台中捕获水军的方法,包括如下步骤:第一步,通过新微博热门话题或者名人微博的转发列表,辅以人工判断,获得初始水军样本S;第二步,获取所有样本水军的粉丝列表L,按照预先设定的阈值,过滤得到和样本中多个水军关系密切的用户列表L’;第三步,获取这些用户的微博发布特征信息;第四步,利用第三步获得的信息,逐个判断用户是否具有水军的特点;第五步,将新得到的水军加入到样本中,之后选择重复步骤二到步骤四的迭代过程。
-
公开(公告)号:CN105469047A
公开(公告)日:2016-04-06
申请号:CN201510819927.2
申请日:2015-11-23
Applicant: 上海交通大学
CPC classification number: G06K9/00456 , G06K9/344 , G06K9/6267
Abstract: 本发明公开一种基于无监督学习深度学习网络的中文检测方法及系统。本发明使用无监督学习法训练一个深度卷积神经网络,而后使用该网络对自然图像中的各个候选文字区域进行分类,最后对分类为文字的区域进行文本行聚合,检测得到图像中的文字区域。本发明抓住深度学习网络对图像特征超强的提取能力,利用无监督学习强大的训练能力,针对中文字特征训练深度卷积神经网络,实现文字区域定位和分割,方法简单有效;针对文字特征构建了深度卷积神经网络无监督学习方法,在文字检测方面具有更好的针对性,因此具有更高的主动性和精确性。
-
公开(公告)号:CN103093228B
公开(公告)日:2015-12-09
申请号:CN201310017804.8
申请日:2013-01-17
Applicant: 上海交通大学
IPC: G06K9/46
Abstract: 本发明公开一种在自然场景图像中基于连通域的中文检测方法,该方法首先获取自然场景图像,将自然场景图像进行笔划宽度变换预处理;笔划宽度变换的输出是一个图像,该图像的每一个像素值代表原始图像相应位置的像素的最大可能笔划宽度,在这一步中进行图像像素的连通域标定;在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;从中文结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的汉字,字间合并方法检测文本行,并用矩形框对文本区域加以标定。本发明方法以中文的复杂结构为出发点,在中文检测方面具有更好的针对性,因此具有更高的主动性和精确性。
-
公开(公告)号:CN102571485A
公开(公告)日:2012-07-11
申请号:CN201110419266.6
申请日:2011-12-14
Applicant: 上海交通大学
Abstract: 本发明公开一种在微博平台上识别机器人用户的方法,通过分析用户好友的社会关系来区分正常用户和机器人用户。该方法获取用户的好友之间的关系信息和交互程度信息,利用Fruchterman-Reingold算法得到用户的好友关系网络图,通过分析关系网络图来鉴别机器人用户。本发明区别于传统的用户举报等检测机制,这种方法是建立在分析用户的社会特点上,具有更高的主动性和精确性。
-
公开(公告)号:CN101901344B
公开(公告)日:2012-04-25
申请号:CN201010252373.X
申请日:2010-08-13
Applicant: 上海交通大学
Abstract: 一种图像处理技术领域的基于腐蚀方法和DoG算子检测文字图像局部特征的方法。包括以下步骤:对于给定的文字图像,用MSER方法得到文字的连通区域;对得到的每一个文字连通区域,用改进的迭代腐蚀方法检测文字的端点和角点,然后合并相似的点,得到腐蚀方法后的特征点;对于步骤一中的文字图像,用DoG算子检测文字图像中尺度空间中稳定的特征点;合并步骤二和步骤三中相似的特征点,合并后的特征点为丰富的文字局部特征信息,即得到最终文字图像总的特征点。本发明腐蚀方法能够精确的定位文字的端点和角点,DoG算子对尺度、仿射变化、旋转、噪声等因素有很好的鲁棒性,能够提供更丰富的文字局部特征信息。
-
公开(公告)号:CN101819680B
公开(公告)日:2011-08-31
申请号:CN201010170965.7
申请日:2010-05-12
Applicant: 上海交通大学
IPC: G06T7/00
Abstract: 一种图像处理技术领域的图像匹配点对的检测方法,包括以下步骤:建立直角坐标系,得到图像中每个像素点的位置信息;对要匹配的查询图像和目标图像进行局部特征检测,分别得到查询图像和目标图像的特征点;对特征点进行初步匹配,得到查询图像和目标图像的匹配特征点对;得到满足弱几何约束关系的匹配特征点对;对满足弱几何约束关系的匹配特征点对进行强几何约束处理;得到每个目标图像与查询图像正确的匹配特征点对的数目,其中与查询图像正确的匹配特征点对的数目最多的目标图像就是查询图像的匹配图像。本发明对异常值的鲁棒性更好;能够为全局几何约束找到更适合的区域,运算简单,空间和时间复杂度低,且准确率高,时间成本低。
-
-
-
-
-
-
-
-
-