-
公开(公告)号:CN111860257B
公开(公告)日:2022-11-11
申请号:CN202010663170.3
申请日:2020-07-10
Applicant: 上海交通大学
IPC: G06V30/412 , G06V30/413 , G06V20/62 , G06V10/82 , G06V30/10
Abstract: 本发明提供了一种融合多种文本特征及几何信息的表格识别方法,包括:数据处理步骤:获取表格区域的图片,分别对获取的图片进行OCR识别与直线识别,获得关键特征信息;图卷积神经网络训练步骤:根据获得的关键特征信息,进行图卷积神经网络训练,构建表格结构识别模型;表格识别步骤:根据构建的表格结构识别模型,对图片格式的表格进行结构识别。本发明提出了一种融合多种文本特征及几何信息的表格识别方法,从采用数据的多样性方面和对数据进行特征提取的方法等方面进行改进,有效提升了表格识别的准确率,获得了更加准确的表格结构重建结果,相对现有基于传统规则的表格识别机制及基于图片的传统深度学习方法有了很大的提升效果。
-
公开(公告)号:CN113221874A
公开(公告)日:2021-08-06
申请号:CN202110642032.1
申请日:2021-06-09
Applicant: 上海交通大学
Abstract: 一种基于Gabor卷积和线性稀疏注意力的场景文字识别系统,包括:空间矫正模块、Gabor特征提取模块和线性稀疏注意力模块,空间矫正模块对输入的场景文字图像进行矫正,Gabor特征提取模块从矫正图像中提取出Gabor特征和卷积特征,经融合后输出至线性稀疏注意力模块进行编解码从而实现文字识别。本发明能够有效捕获场景文字图像各字符对象的方向和纹理变化特征,在提取目标的局部空间和频率域信息方面具有良好的特性。采用自注意力机制替代循环神经网络结构,由此具备了良好的并行计算的能力,加快了训练和推理速度。同时在自注意力机制中引入稀疏注意力的思想,解决了模型随着长度的增加,注意力部分所占用的内存和计算呈平方比增加的问题,同时有助于将引起注意的部分被保留下来,而忽视其他无关的信息。并且在稀疏注意力中加入线性关系约束,一定程度上可以缓解注意力偏移的问题,使得文字识别更加精准。
-
公开(公告)号:CN112380857A
公开(公告)日:2021-02-19
申请号:CN202011206972.8
申请日:2020-11-03
Applicant: 上海交通大学
IPC: G06F40/289 , G06F40/247 , G06F16/332 , G06Q40/00
Abstract: 本发明公开了一种金融领域近义词的扩展方法、装置及存储介质,该方法包括:从多个金融门户和/或网站获取金融语料;对获取的金融语料进行分词处理;分别计算每个单词最相近的单词;构建单词网络结构;利用可重叠社区发现算法建立具有社区结构的语料库;将每个社区归类出的单词存储至存储单元,当接收到检索词时,将检索词所在的社区输出。该装置包括:金融语料单元、分词处理单元、最相近的单词计算单元、单词网络结构构建单元、语料库建立单元以及社区输出单元。通过本发明,可以识别语义相似关系,当输入一个或多个金融词语时,可以输出意思相近的若干词语,无需用户具备专业领域的知识,可以大大降低用户的检索难度和时间,提高检索准确度。
-
公开(公告)号:CN105608454B
公开(公告)日:2019-08-09
申请号:CN201510968301.8
申请日:2015-12-21
Applicant: 上海交通大学 , 中国太平洋保险(集团)股份有限公司
Abstract: 本发明公开一种基于文字结构部件检测神经网络的文字检测方法及系统,所述方法在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。在文字结构部件检测层中,构建是多个文字结构检测器,对某一类文字结构使用单独的文字结构检测器进行检测,提高了文字结构检测的准确性和独特性。本发明以文字结构部件检测的深度学习网络对文字结构特征的强提取能力为出发点,针对中文字结构特征做了专项检测,因此具有更高的主动性和精确性。
-
公开(公告)号:CN104182750B
公开(公告)日:2017-08-01
申请号:CN201410334436.4
申请日:2014-07-14
Applicant: 上海交通大学
IPC: G06K9/46
Abstract: 本发明公开一种在自然场景图像中基于极值连通域的文字检测方法,该方法首先获取自然场景图像,将自然场景图像进行分离的最大稳定极值区域提取;分离的最大稳定极值区域输出是一系列互不交叠的区域,每一个区域都是一个连通分量;在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;从文字结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的文字,字间合并方法检测文本行;最后分析文本行的角点分布,筛选得到文字区域,并用矩形框对文本区域加以标定。本发明方法以文字的边缘特征为出发点,在文字检测方面具有更好的针对性,因此具有更高的主动性和精确性。
-
公开(公告)号:CN104182750A
公开(公告)日:2014-12-03
申请号:CN201410334436.4
申请日:2014-07-14
Applicant: 上海交通大学
IPC: G06K9/46
Abstract: 本发明公开一种在自然场景图像中基于极值连通域的文字检测方法,该方法首先获取自然场景图像,将自然场景图像进行分离的最大稳定极值区域提取;分离的最大稳定极值区域输出是一系列互不交叠的区域,每一个区域都是一个连通分量;在获得连通分量之后,提取连通分量的各种特征,这些特征组合能很好的表达连通分量;从文字结构出发,首先执行字内合并,接着执行字间合并,字内合并方法检测单个的文字,字间合并方法检测文本行;最后分析文本行的角点分布,筛选得到文字区域,并用矩形框对文本区域加以标定。本发明方法以文字的边缘特征为出发点,在文字检测方面具有更好的针对性,因此具有更高的主动性和精确性。
-
公开(公告)号:CN103095499A
公开(公告)日:2013-05-08
申请号:CN201310017802.9
申请日:2013-01-17
Applicant: 上海交通大学
Abstract: 本发明提供了一种在微博平台中捕获水军的方法,包括如下步骤:第一步,通过新微博热门话题或者名人微博的转发列表,辅以人工判断,获得初始水军样本S;第二步,获取所有样本水军的粉丝列表L,按照预先设定的阈值,过滤得到和样本中多个水军关系密切的用户列表L’;第三步,获取这些用户的微博发布特征信息;第四步,利用第三步获得的信息,逐个判断用户是否具有水军的特点;第五步,将新得到的水军加入到样本中,之后选择重复步骤二到步骤四的迭代过程。
-
公开(公告)号:CN113312498A
公开(公告)日:2021-08-27
申请号:CN202110642699.1
申请日:2021-06-09
Applicant: 上海交通大学
IPC: G06F16/36 , G06F16/35 , G06F16/335
Abstract: 一种用无向图嵌入知识图谱的文本信息抽取方法,基于待抽取字符串构建包含关联句子信息节点和知识信息节点的无向图,分别根据无向图及其节点编号生成位置编码、根据无向图及其邻接矩阵生成关联控制矩阵,将关联控制矩阵引入注意力机制中,即关联控制矩阵中显示关联的节点能够正常计算注意力、显示无关联的节点对当前节点的注意力值无限趋近于0,即表示二者不相关,将节点序列中各个节点的词嵌入向量和根据位置编码和图中关联关系得到的相对位置编码输入基于注意力机制的信息抽取模型,将模型输出接入CRF层进行分类输出,得到信息抽取结果。
-
公开(公告)号:CN105469047B
公开(公告)日:2019-02-22
申请号:CN201510819927.2
申请日:2015-11-23
Applicant: 上海交通大学
Abstract: 本发明公开一种基于无监督学习深度学习网络的中文检测方法及系统。本发明使用无监督学习法训练一个深度卷积神经网络,而后使用该网络对自然图像中的各个候选文字区域进行分类,最后对分类为文字的区域进行文本行聚合,检测得到图像中的文字区域。本发明抓住深度学习网络对图像特征超强的提取能力,利用无监督学习强大的训练能力,针对中文字特征训练深度卷积神经网络,实现文字区域定位和分割,方法简单有效;针对文字特征构建了深度卷积神经网络无监督学习方法,在文字检测方面具有更好的针对性,因此具有更高的主动性和精确性。
-
公开(公告)号:CN102571485B
公开(公告)日:2014-08-27
申请号:CN201110419266.6
申请日:2011-12-14
Applicant: 上海交通大学
Abstract: 本发明公开一种在微博平台上识别机器人用户的方法,通过分析用户好友的社会关系来区分正常用户和机器人用户。该方法获取用户的好友之间的关系信息和交互程度信息,利用Fruchterman-Reingold算法得到用户的好友关系网络图,通过分析关系网络图来鉴别机器人用户。本发明区别于传统的用户举报等检测机制,这种方法是建立在分析用户的社会特点上,具有更高的主动性和精确性。
-
-
-
-
-
-
-
-
-