基于大语言模型的简历识别方法及装置

    公开(公告)号:CN118918600A

    公开(公告)日:2024-11-08

    申请号:CN202410931844.1

    申请日:2024-07-12

    摘要: 本发明涉及基于大语言模型的简历识别方法,包括以下:获取简历相关数据;判断简历相关数据的格式类型,若为文本格式则无需处理,若为图片格式则进行图像识别转换为文本格式;对文本格式的简历相关数据进行文本预处理得到简历文本数据;通过大语言模型对所述简历文本数据进行简历识别得到识别结果。本发明不仅能够对文本格式的简历进行识别处理,还能够对图片格式的简历进行准确的识别转换形成文本格式的简历,进而进行识别;其次通过大语言模型对文本格式的简历文件进行关键信息提取,能够准确提取其中的关键信息,进而在保证简历关键信息提取准确的基础上大幅减轻简历筛选者的工作量。

    一种表格识别方法及设备
    2.
    发明公开

    公开(公告)号:CN118898852A

    公开(公告)日:2024-11-05

    申请号:CN202310493421.1

    申请日:2023-05-04

    发明人: 余亚奇

    摘要: 本申请提供一种表格识别方法及设备,涉及图像识别技术领域。本申请能够通过文本投影和状态机,自动识别表格行列起始位置和终止位置,提高表格识别的准确性。该方法包括:第一设备获取图像中表格区域对应的文本行区域后,基于该文本行区域,生成二值化图像。之后将二值化图像的单行的像素点的像素值累加,获取二值化图像对应的行投影;以及将述二值化图像的单列的像素点的像素值累加,获取二值化图像对应的列投影。之后通过状态机扫描行投影和列投影,确定行的起始位置和终止位置以及列的起始位置和终止位置,以根据行的起始位置和终止位置以及列的起始位置和终止位置,确定表格位置。

    扫描设备文档图像自动倾斜校正的方法及装置

    公开(公告)号:CN118823789A

    公开(公告)日:2024-10-22

    申请号:CN202410990738.0

    申请日:2024-07-22

    发明人: 马兴杰 王泽武

    摘要: 本申请提供了一种扫描设备文档图像自动倾斜校正的方法及装置,该方法包括:利用扫描设备获取文档图像;对文档图像进行预处理操作,得到二值图像,预处理操作至少包括灰度化处理和二值化处理;对二值图像进行形态学膨胀处理,得到膨胀图像,并提取膨胀图像中所有文本行对应的中心点骨架线,得到中心骨架图,中心点骨架线为文本行对应的中心点的连续线条;对中心骨架图进行直线拟合检测,得到直线组,直线组为多个文本行形成的直线集合;根据直线组计算目标倾斜角度,并根据目标倾斜角度对文档图像进行倾斜校正。本申请解决了现有技术中扫描出的文档图像倾斜校正不准确的问题。

    手写样本图片标注方法、装置、计算机设备及存储介质

    公开(公告)号:CN109522898B

    公开(公告)日:2024-10-15

    申请号:CN201811084479.6

    申请日:2018-09-18

    发明人: 金晨 刘克亮

    摘要: 本发明公开了一种手写样本图片标注方法、装置、计算机设备及存储介质。所述方法包括:获取待标注的手写样本图片和该手写样本图片中包含的手写文本的文本内容;对手写样本图片进行图像预处理,得到手写样本图片对应的二值化图像,并获取该二值化图像的图片尺寸;根据二值化图像中每个像素点的像素值,确定手写文本在二值化图像中对应的目标像素点,并根据目标像素点得到手写文本在手写样本图片中的相对位置信息;设置手写样本图片的图片名称;对图片名称、文本内容、相对位置信息,以及图片尺寸进行组合,得到待标注的手写样本图片的标注信息。本发明的技术方案提高了样本标注效率,以及标注内容的完整性和准确性。

    一种古籍识别方法、装置、存储介质及设备

    公开(公告)号:CN115147852B

    公开(公告)日:2024-10-11

    申请号:CN202210258636.0

    申请日:2022-03-16

    摘要: 本申请公开了一种古籍识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标古籍图像;并利用骨干网络对其进行分类特征提取,得到骨干分类特征,然后对骨干分类特征进行检测,确定目标古籍图像包含的单字位置和文本行位置;接着,对单字位置进行识别,得到单字的内容信息;以及对文本行位置进行预测,得到文本行位置中的文字的阅读顺序,进而可以根据单字位置与文本行位置的比例关系,将单字的内容信息按照文本行位置中的文字的阅读顺序进行排列,得到目标古籍图像中文字的识别结果。可见,由于本申请是通过将古籍图像中单字的位置和内容,与文本行的位置和文字阅读方向进行聚合,从而提高了识别准确率和识别效率。

    一种移动辅助阅卷方法及系统
    8.
    发明公开

    公开(公告)号:CN118711200A

    公开(公告)日:2024-09-27

    申请号:CN202411196255.X

    申请日:2024-08-29

    摘要: 本发明涉及图像处理技术领域,尤其涉及一种移动辅助阅卷方法及系统。方法包括:获取试卷图像及试卷图像中各连通区的像素点数量和外接矩形面积;确定各连通区的可疑度;响应于连通区的可疑度大于预设的杂质阈值,该连通区为杂质区;构建各像素点探索窗口;确定试卷图像和各像素点探索窗口的杂质密集度;优化像素点的初始的滤波器;根据各像素点的初始或优化后的滤波器,对试卷图像进行滤波除杂。本发明通过连通区可疑度以及确定杂质区,能够准确地识别试卷图像中的杂质,从而提高杂质识别的精度;通过构建探索窗口并根据杂质密集度调整滤波器的边长,能够有效地去除杂质同时保留字符细节,提高了滤波器处理的灵活性和针对性。

    一种车牌图像处理方法
    9.
    发明公开

    公开(公告)号:CN118711192A

    公开(公告)日:2024-09-27

    申请号:CN202411195956.1

    申请日:2024-08-29

    摘要: 本发明涉及图像处理技术领域,具体涉及一种车牌图像处理方法,包括:提取车牌区域的灰度图像,对每个像素点进行扩展,得到像素点的扩展区域,根据扩展区域的外接矩形的面积和像素点的灰度值确定像素点的阴影区域可能性,对每一列像素点的灰度值进行累加,得到灰度累加值序列,根据每个极大值点的突出程度和所有极大值点的突出程度累加值的比值,以及极大值点左右两侧最近的极小值点之间的横向跨度,计算初始窗口尺寸,利用所述阴影区域可能性调整所述初始窗口尺寸得到像素点的自适应窗口尺寸,基于自适应窗口尺寸进行局部二值化完成车牌号识别,减弱了噪声和阴影对字符细节的干扰,提高了车牌识别的准确性,进而方便有效管理车辆。

    一种面向生产测井的档案资料的OCR识别方法

    公开(公告)号:CN118587719A

    公开(公告)日:2024-09-03

    申请号:CN202410712820.7

    申请日:2024-06-04

    摘要: 本发明涉及测井档案资料处理技术领域,公开了一种面向生产测井的档案资料的OCR识别方法,本发明解决了现有生产测井档案资料依赖人工处理效率低和纸质档案资料腐损的问题。本发明结合了DBNet的文本检测技术和CRNN的文本识别技术,用于高效准确地识别生产测井档案资料,DBNet通过ResNet18和FPN结构解决了梯度问题,提高了检测准确性,而CRNN中的Bi LSTM增强了序列上下文建模能力,CTC损失函数则优化了识别效果,实验证明该方法在提取图像特征、识别档案资料方面表现卓越,有效增强了模型能力,为生产测井档案资料的数字化转化提供了新思路,显著提高了处理效率和准确性。