基于多模态图像识别的木板等级分类及切割方法与系统

    公开(公告)号:CN116486141A

    公开(公告)日:2023-07-25

    申请号:CN202310287761.9

    申请日:2023-03-20

    摘要: 本公开提供了基于多模态图像识别的木板等级分类及切割方法与系统,涉及机器学习技术领域,方法包括对木板图像并进行预处理;检测木板切割的圆形定位点,获取切割的木板的粗定位图像;根据粗定位图像进行垂直方向投影,获取投影遮挡区域的掩膜图像;对掩膜图像进行木板特征提取,将提取的特征向量输入支持向量机进行分类,获取分级类型;对分级之后的非缺陷木板进行最大内接矩形算法计算,得到木板区域内的最大切割面积,进而得到切割位置,再使用改进的Mask R‑CNN算法,对木板进行像素级的定位,接着进行最大内接矩形算法,得到木板区域内的最大切割面积,利用两者的面积差值与一定的阈值大小关系,确定切割方法进行木板的分割。本公开提高了木板的出材率。

    一种基于规则和语义的多标签文本分类方法和系统

    公开(公告)号:CN116483997A

    公开(公告)日:2023-07-25

    申请号:CN202310272292.3

    申请日:2023-03-16

    摘要: 本发明公开了一种基于规则和语义的多标签文本分类方法和系统,涉及自然语言处理技术领域。该方法步骤包括:获取文本数据,对文本数据进行标签标注,根据标签语义构建分类规则;根据标签语义寻找相同的词、短语或词语组合构建分类规则;根据标点符号位置将文本数据进行拆分;通过词性分析去除拆分后文本中的干扰信息,对去除干扰信息后的文本进行分词;根据分类规则对分词后的文本进行词语匹配,得到匹配到的带有分类标签的词语记录;对词语记录中的标签进行评分,根据分数阈值得到文本分类结果。本发明利用语句中词语的词性,分析句子结构,综合词性和句子成分制定规则,使规则清晰、简洁、覆盖面广,提高了文本分类的速度和精度。

    一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统

    公开(公告)号:CN116597466A

    公开(公告)日:2023-08-15

    申请号:CN202310685498.9

    申请日:2023-06-08

    摘要: 本发明提出了一种基于改进YOLOv5s的工程图纸文字检测识别方法及系统,包括:利用预先训练好的改进的YOLOv5s检测模型对待检测的工程图纸图像进行文字检测,得到文字坐标信息;其中,所述改进的YOLOv5s检测模型为将主干网络采用多个并行不同大小的卷积核来提取不同尺度的特征;将所得到的文字坐标信息将待检测的工程图纸裁剪对应的文字图像,将所述文字图像输入至训练好的PaddleOCR识别模型,得到文字识别结果。基于工程图纸中文字框的宽高比的特性,对YOLOv5s网络进行改进,在不增加计算复杂度的情况下,增加模型的非线性表达能力,提高模型对工程图纸的检测精度。

    一种PDF边线缺失表格内容识别方法及系统

    公开(公告)号:CN116246289A

    公开(公告)日:2023-06-09

    申请号:CN202211685908.1

    申请日:2022-12-27

    摘要: 本发明提供了一种PDF边线缺失表格内容识别方法及系统,所述方案包括:读取待表格内容识别的PDF文档,并进行解析;对于解析得到的线段对象中满足预设要求的水平线段和竖直线段分别进行线段合并;计算所有竖直线段中端点纵坐标的出现频次,若出现频次大于2的纵坐标且不存在使用该纵坐标的水平线段,则认为存在水平边线缺失,并进行水平边线补齐;基于合并及边线补齐后的水平线段和竖直线段的交叉点坐标,实现表格单元格的获取,并基于获得的单元格实现二维表格的提取;基于二维表格中单元格的位置坐标以及解析结果中结构化对象的位置坐标,获得不同单元格中的具体内容,实现表格内容的识别。

    一种基于印章去除的OCR文字识别方法及系统

    公开(公告)号:CN116630984A

    公开(公告)日:2023-08-22

    申请号:CN202310677858.0

    申请日:2023-06-07

    摘要: 本发明涉及光学字符识别技术领域,提供了一种基于印章去除的OCR文字识别方法及系统,包括:基于目标图像,得到第一印章区域和印章是否覆盖文字的第一类别信息;以第一印章区域作为掩膜,使用印章颜色区间,去除掩膜中的印章后,得到第二图像,对第二图像进行印章检测,得到第二印章区域和第二类别信息后,对第二印章区域进行裁剪,获得多个包含印章的子图片,并基于第二类别信息,通过深度学习模型,去除子图片中的印章;对第二图像进行二值化,得到第三图像,并将去除印章后的子图像合并到第三图像上后,检测出文本区域,并进行文字识别;使用语义纠正对文字识别结果进行纠正,得到最终文字识别结果。提高了OCR识别结果的准确性。