-
公开(公告)号:CN118918600A
公开(公告)日:2024-11-08
申请号:CN202410931844.1
申请日:2024-07-12
申请人: 欢六科技(广州)有限公司
IPC分类号: G06V30/41 , G06V30/148 , G06V30/162 , G06V30/164 , G06V30/18 , G06V10/82 , G06N3/0464
摘要: 本发明涉及基于大语言模型的简历识别方法,包括以下:获取简历相关数据;判断简历相关数据的格式类型,若为文本格式则无需处理,若为图片格式则进行图像识别转换为文本格式;对文本格式的简历相关数据进行文本预处理得到简历文本数据;通过大语言模型对所述简历文本数据进行简历识别得到识别结果。本发明不仅能够对文本格式的简历进行识别处理,还能够对图片格式的简历进行准确的识别转换形成文本格式的简历,进而进行识别;其次通过大语言模型对文本格式的简历文件进行关键信息提取,能够准确提取其中的关键信息,进而在保证简历关键信息提取准确的基础上大幅减轻简历筛选者的工作量。
-
公开(公告)号:CN118898852A
公开(公告)日:2024-11-05
申请号:CN202310493421.1
申请日:2023-05-04
申请人: 华为技术有限公司
发明人: 余亚奇
IPC分类号: G06V30/412 , G06V30/414 , G06V30/162 , G06V20/70 , G06V10/82
摘要: 本申请提供一种表格识别方法及设备,涉及图像识别技术领域。本申请能够通过文本投影和状态机,自动识别表格行列起始位置和终止位置,提高表格识别的准确性。该方法包括:第一设备获取图像中表格区域对应的文本行区域后,基于该文本行区域,生成二值化图像。之后将二值化图像的单行的像素点的像素值累加,获取二值化图像对应的行投影;以及将述二值化图像的单列的像素点的像素值累加,获取二值化图像对应的列投影。之后通过状态机扫描行投影和列投影,确定行的起始位置和终止位置以及列的起始位置和终止位置,以根据行的起始位置和终止位置以及列的起始位置和终止位置,确定表格位置。
-
公开(公告)号:CN118865426A
公开(公告)日:2024-10-29
申请号:CN202410906373.9
申请日:2024-07-08
申请人: 昆明理工大学
IPC分类号: G06V30/414 , G06V30/416 , G06V30/42 , G06V30/146 , G06V30/16 , G06V30/162 , G06V30/164 , G06V30/166 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/044 , G06N3/045 , G06N3/0464
摘要: 本发明公开一种机场行李标签的关键信息提取方法,属于图像处理及航空行李管理系统技术领域。本发明首先对采集到的机场行李标签的原始图像进行预处理,然后采用卷积神经网络模型初次识别行李标签边缘,确定目标目标标签文本区域图像,然后通过自动透视校正算法,计算图像中的倾斜和扭曲,并应用透视矩阵进行几何校正,最后再通过卷积循环神经网络进行二次识别,然后提取关键信息,如乘客姓名、航班号及行李序号等。本发明为机场行李处理系统提供了一种高效且准确的行李标签图像识别和关键信息提取方法,彻底改变了传统的行李处理流程,大幅提高了处理速度和准确性。
-
公开(公告)号:CN118823789A
公开(公告)日:2024-10-22
申请号:CN202410990738.0
申请日:2024-07-22
申请人: 北京世纪影源科技有限公司
IPC分类号: G06V30/146 , G06V30/162 , G06T3/60
摘要: 本申请提供了一种扫描设备文档图像自动倾斜校正的方法及装置,该方法包括:利用扫描设备获取文档图像;对文档图像进行预处理操作,得到二值图像,预处理操作至少包括灰度化处理和二值化处理;对二值图像进行形态学膨胀处理,得到膨胀图像,并提取膨胀图像中所有文本行对应的中心点骨架线,得到中心骨架图,中心点骨架线为文本行对应的中心点的连续线条;对中心骨架图进行直线拟合检测,得到直线组,直线组为多个文本行形成的直线集合;根据直线组计算目标倾斜角度,并根据目标倾斜角度对文档图像进行倾斜校正。本申请解决了现有技术中扫描出的文档图像倾斜校正不准确的问题。
-
公开(公告)号:CN118823788A
公开(公告)日:2024-10-22
申请号:CN202410971835.5
申请日:2024-07-19
申请人: 中国移动通信集团广东有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V30/146 , G06V30/19 , G06V30/162 , G06F40/186 , G06N3/0464 , G06V10/82 , G06N3/084 , G06N3/0985 , G06N3/0455
摘要: 本公开提供一种文本处理方法、装置、设备及存储介质,涉及人工智能技术领域。在本公开的一些实施例中,对信令流程图进行目标检测,得到信令流程图中的关键元素的位置坐标和类别;根据关键元素的位置坐标和类别,构建关键元素关系图;根据关键元素和关键元素关系图,生成自然语言文本,自动对信令流程图进行处理,自动获取信令流程图中的关键元素,提高信令流程图中的关键元素的获取效率;对自然语言文本进行标注,得到标注后的自然语言文本;对标注后的自然语言文本进行向量化处理,得到专用文本语料库;自动获取专用文本语料库,降低人工成本。
-
公开(公告)号:CN109522898B
公开(公告)日:2024-10-15
申请号:CN201811084479.6
申请日:2018-09-18
申请人: 平安科技(深圳)有限公司
IPC分类号: G06V30/244 , G06V30/148 , G06V30/162 , G06V20/70
摘要: 本发明公开了一种手写样本图片标注方法、装置、计算机设备及存储介质。所述方法包括:获取待标注的手写样本图片和该手写样本图片中包含的手写文本的文本内容;对手写样本图片进行图像预处理,得到手写样本图片对应的二值化图像,并获取该二值化图像的图片尺寸;根据二值化图像中每个像素点的像素值,确定手写文本在二值化图像中对应的目标像素点,并根据目标像素点得到手写文本在手写样本图片中的相对位置信息;设置手写样本图片的图片名称;对图片名称、文本内容、相对位置信息,以及图片尺寸进行组合,得到待标注的手写样本图片的标注信息。本发明的技术方案提高了样本标注效率,以及标注内容的完整性和准确性。
-
公开(公告)号:CN115147852B
公开(公告)日:2024-10-11
申请号:CN202210258636.0
申请日:2022-03-16
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06V30/40 , G06V30/148 , G06V30/162 , G06V30/19
摘要: 本申请公开了一种古籍识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标古籍图像;并利用骨干网络对其进行分类特征提取,得到骨干分类特征,然后对骨干分类特征进行检测,确定目标古籍图像包含的单字位置和文本行位置;接着,对单字位置进行识别,得到单字的内容信息;以及对文本行位置进行预测,得到文本行位置中的文字的阅读顺序,进而可以根据单字位置与文本行位置的比例关系,将单字的内容信息按照文本行位置中的文字的阅读顺序进行排列,得到目标古籍图像中文字的识别结果。可见,由于本申请是通过将古籍图像中单字的位置和内容,与文本行的位置和文字阅读方向进行聚合,从而提高了识别准确率和识别效率。
-
公开(公告)号:CN118711200A
公开(公告)日:2024-09-27
申请号:CN202411196255.X
申请日:2024-08-29
申请人: 广东光大信息科技股份有限公司
IPC分类号: G06V30/30 , G06V30/162 , G06V30/168 , G06V30/18 , G06V30/186
摘要: 本发明涉及图像处理技术领域,尤其涉及一种移动辅助阅卷方法及系统。方法包括:获取试卷图像及试卷图像中各连通区的像素点数量和外接矩形面积;确定各连通区的可疑度;响应于连通区的可疑度大于预设的杂质阈值,该连通区为杂质区;构建各像素点探索窗口;确定试卷图像和各像素点探索窗口的杂质密集度;优化像素点的初始的滤波器;根据各像素点的初始或优化后的滤波器,对试卷图像进行滤波除杂。本发明通过连通区可疑度以及确定杂质区,能够准确地识别试卷图像中的杂质,从而提高杂质识别的精度;通过构建探索窗口并根据杂质密集度调整滤波器的边长,能够有效地去除杂质同时保留字符细节,提高了滤波器处理的灵活性和针对性。
-
公开(公告)号:CN118711192A
公开(公告)日:2024-09-27
申请号:CN202411195956.1
申请日:2024-08-29
申请人: 陕西风华时代环境工程有限公司
IPC分类号: G06V30/162 , G06V30/146 , G06V30/18 , G06V30/186 , G06V20/62
摘要: 本发明涉及图像处理技术领域,具体涉及一种车牌图像处理方法,包括:提取车牌区域的灰度图像,对每个像素点进行扩展,得到像素点的扩展区域,根据扩展区域的外接矩形的面积和像素点的灰度值确定像素点的阴影区域可能性,对每一列像素点的灰度值进行累加,得到灰度累加值序列,根据每个极大值点的突出程度和所有极大值点的突出程度累加值的比值,以及极大值点左右两侧最近的极小值点之间的横向跨度,计算初始窗口尺寸,利用所述阴影区域可能性调整所述初始窗口尺寸得到像素点的自适应窗口尺寸,基于自适应窗口尺寸进行局部二值化完成车牌号识别,减弱了噪声和阴影对字符细节的干扰,提高了车牌识别的准确性,进而方便有效管理车辆。
-
公开(公告)号:CN118587719A
公开(公告)日:2024-09-03
申请号:CN202410712820.7
申请日:2024-06-04
申请人: 东北石油大学
IPC分类号: G06V30/16 , G06V30/162 , G06V30/19 , G06V30/41 , G06V10/82
摘要: 本发明涉及测井档案资料处理技术领域,公开了一种面向生产测井的档案资料的OCR识别方法,本发明解决了现有生产测井档案资料依赖人工处理效率低和纸质档案资料腐损的问题。本发明结合了DBNet的文本检测技术和CRNN的文本识别技术,用于高效准确地识别生产测井档案资料,DBNet通过ResNet18和FPN结构解决了梯度问题,提高了检测准确性,而CRNN中的Bi LSTM增强了序列上下文建模能力,CTC损失函数则优化了识别效果,实验证明该方法在提取图像特征、识别档案资料方面表现卓越,有效增强了模型能力,为生产测井档案资料的数字化转化提供了新思路,显著提高了处理效率和准确性。
-
-
-
-
-
-
-
-
-