-
公开(公告)号:CN119540969A
公开(公告)日:2025-02-28
申请号:CN202411579364.X
申请日:2024-11-07
Applicant: 同方知网数字出版技术股份有限公司
IPC: G06V30/244 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/096
Abstract: 本申请公开了一种化学式结构识别的方法、装置、电子设备及存储介质,该方法将图像输入到化学式结构识别模型,以输出化学式代码,利用化学式结构识别模型提高识别手写和印刷两种化学式结构的准确性。其中,化学式结构模型的确定过程包括:获取训练样本;利用合成训练样本对预设模型预训练,得到基础模型;利用原始训练样本和已增强训练样本中根据原始训练样本处理得到的样本训练基础模型,得到第一模型;利用原始训练样本、已增强训练样本和合成训练样本训练基础模型,得到第二模型;基于预设模型参数,利用原始训练样本对第一模型和第二模型分别多次微调;根据每次微调后的第一模型和第二模型,通过模型集成策略,确定化学式结构识别模型。
-
公开(公告)号:CN118314583B
公开(公告)日:2025-01-21
申请号:CN202410337361.9
申请日:2024-03-23
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/244 , G06V30/18 , G06V10/82
Abstract: 本发明公开了一种语义增强的零样本甲骨文字符识别方法,包括:根据域和字符类别为甲骨文图像构造可学习的提示信息;引入对比式语言‑图像预训练模型,并通过平衡采样策略采样数据,对可学习的提示信息进行优化,以实现从甲骨文拓片和字模图像中挖掘出语义信息;去除域提示信息来得到域无关的提示信息,进而通过语义编码器编码得到域无关的字符语义;通过类内共享特征学习分支和类间差异特征学习分支对视觉编码器进行监督训练;采用训练好的视觉编码器,实现零样本甲骨文字符识别。
-
公开(公告)号:CN119296114A
公开(公告)日:2025-01-10
申请号:CN202411099986.2
申请日:2024-08-12
Applicant: 东方财富信息股份有限公司
Inventor: 冯晨
IPC: G06V30/18 , G06V30/186 , G06V30/19 , G06V30/262 , G06V30/244 , G06V10/82 , G06N3/045 , G06N3/084 , G06N3/092
Abstract: 本发明的技术方案是提供了一种实现高准确率语义匹配的向量化表示模型方法。本发明的另一个技术方案是提供了一种实现高准确率语义匹配的向量化表示模型的实现方法。本发明提供了一种结构和训练方法双重创新的中文向量化模型,本发明所公开的方案能够解决在语义匹配任务中应用通用向量化模型准确率、召回率低的问题,优化向量化模型的表现效果,解决其句子表示坍缩的问题,提高了模型的准确性和适应性。本发明从字形和字义两个层面进行向量化,提升模型在中文语义理解上的性能。本发明提供了一种强化学习的动态训练方法,采用强化学习的训练框架,并且通过奖励机制,模型可以自我优化,增强其在实际应用中的表现力和鲁棒性。
-
公开(公告)号:CN119229424A
公开(公告)日:2024-12-31
申请号:CN202410852092.X
申请日:2024-06-28
Applicant: 星克跃尔株式会社
Abstract: 本公开涉及用于获取标注信息的电子装置、方法及存储介质。电子装置可以包括存储器和处理器。所述处理器,可以利用表示车牌类型的模板,获取包含具有文本对象的虚拟车牌的第一图像;可以在与车辆对应的第二图像中,基于识别附着在车辆上的实际车牌,获取实际车牌的位置信息及实际车牌的至少一部分的颜色信息;可以利用颜色信息,更改第一图像中包含的至少一个像素的颜色;可以基于位置信息,将包含至少一个颜色被更改的至少一个像素的第一图像与第二图像进行结合,从而获取包含虚拟车牌得以合成的车辆的第三图像;可以将第三图像、文本对象及表示第一图像得以结合的第三图像内位置的位置信息对,作为用于训练神经网络的标注信息来进行存储。
-
公开(公告)号:CN119131813A
公开(公告)日:2024-12-13
申请号:CN202310693645.7
申请日:2023-06-12
Applicant: 北京云思智学科技有限公司
IPC: G06V30/244 , G06V10/44 , G06V30/14 , G06V30/19 , G06V30/26 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及一种信息处理方法、装置及电子设备,涉及教育领域,包括获取相机采集的目标用户的手部图像;对手部图像进行图像矫正,并通过对矫正后的手部图像进行特征识别,得到目标用户的手部特征信息;利用卷积神经网络对手部特征信息进行特征处理,确定目标用户的指尖位置;确定指尖位置对应的信息识别区域,并按照对应扫描功能对信息识别区域内的待扫描信息进行处理,扫描功能包括扫词翻译功能和/或扫题答疑功能,采用上述技术方案,通过相机采集手部图像,并利用卷积神经网络实现指尖信息识别,可以提高输入效率,增强用户体验,同时具有较强的实用性和广泛的应用前景。
-
公开(公告)号:CN112464926B
公开(公告)日:2024-11-22
申请号:CN202011259598.8
申请日:2020-11-12
Applicant: 北京工业大学
IPC: G06V30/14 , G06V30/146 , G06V30/19 , G06V30/244 , G06N3/0464 , G06N3/048 , G06N3/09
Abstract: 本发明涉及一种联机中英文混合手写识别方法,用于在线输入法、在线输入系统中英文混合手写输入识别。首先,对联机中英文混合手写文本行进行倾斜矫正处理,并对其进行基于规则的过切分,其次,把过切分完成的字符片段进行中英文二分类,并且把字符片段通过路径评价、搜索算法得到一条字符合并最佳路径;最后,把每类字符送入相应的联机手写字符识别模型进行识别,把识别结果按照原先的顺序进行重组,最终得到联机中英文混合手写文本识别结果,实验证明,联机中英文混合手写识别率可达93.67%。
-
公开(公告)号:CN118865415A
公开(公告)日:2024-10-29
申请号:CN202410860169.8
申请日:2024-06-28
Applicant: 杨宏伟
Inventor: 杨宏伟
IPC: G06V30/244 , G06V30/18
Abstract: 本说明书实施例提供了一种利用视觉特征优化文本识别或处理的方法及系统,其中,方法包括:识别图像中的视觉特征,基于所述视觉特征获取识别结果;基于所述识别结果,确定与之对应的用于文本识别或处理的方法或产品;利用所述用于文本识别或处理的方法或产品,识别图像生成文本,和/或对文本或图像进行处理。
-
公开(公告)号:CN118230348B
公开(公告)日:2024-08-23
申请号:CN202410349731.0
申请日:2024-03-26
Applicant: 北京智谱华章科技有限公司
IPC: G06V30/42 , G06V30/413 , G06V30/19 , G06V30/26 , G06V30/244
Abstract: 本发明属于文本处理技术领域,涉及一种含数学公式的输入文本的智能提取方法及系统,所述方法包括:1)输入文本的格式判定、转换和预处理;2)对预处理后的图片格式的文本进行角度矫正;3)进行公式检测;4)进行版面分析;5)对于嵌入公式,根据公式检测框判断矫正后的OCR检测框是否包含嵌入公式并对包含嵌入公式的OCR检测框进行拆分,以获得纯文本的OCR检测框;6)进行公式识别,以获得公式识别结果;7)进行文本识别,以获得文本识别结果;8)结合版面分析框及其版面类别对公式识别结果与文本识别结果进行同行检测框判定和合并,以获得输入文本的提取结果。其能够有效提高含数学公式的输入文本的提取效率和准确性。
-
公开(公告)号:CN118397640A
公开(公告)日:2024-07-26
申请号:CN202410454108.1
申请日:2024-04-16
Applicant: 南京邮电大学
IPC: G06V30/246 , G06V30/244 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于改进Transformer的手写英文识别方法、系统,该方法包括获取手写英文图像,对该图像进行预处理,得到单词图像和单词图像文本标签;构建预设编码模块、预设解码模块和预设分析模块;利用预设编码模块得到视觉特征矩阵和语义特征矩阵;将视觉特征矩阵和语义特征矩阵对齐,输入预设解码模块,得到联合反向残差特征矩阵;将联合反向残差特征矩阵输入预设分析模块,获得预测概率分布,对预设编码模块、预设解码模块和预设分析模块进行调整;利用调整后的模块,选取每个英文字母类别中概率最高的标记作为手写英文识别的预测结果。本发明对手写英文图像进行双模态处理,完善了手写英文识别任务的处理,有效提高了手写英文识别的准确率。
-
公开(公告)号:CN118298446A
公开(公告)日:2024-07-05
申请号:CN202410573878.8
申请日:2024-05-10
Applicant: 恒音国济(苏州)教育咨询有限公司
Inventor: 姚虎雄
IPC: G06V30/244 , G06V30/12
Abstract: 本申请涉及计算机数据处理技术领域,特别是涉及一种学校用的学生手写字的评价方法、系统、电子设备及存储介质。所述系统包括:测评建立模块,用于建立书写能力测评及对应的测评数据库;上传提取模块,用于提取电子试卷中的待测评手写字和学生信息;评分模块,与上传提取模块连接,用于对提取的每一待测评手写字和测评试卷进行评分;报告生成模块,与所述评分模块连接,用于生成书写能力测评报告并保存至测评数据库;标准手写字库,与所述评分模块连接,配置有中国汉字的标准手写字;统计分析模块,用于统计分析书写能力测评报告。本申请的学校用的学生手写字的评价方法,能够客观评价学生的书写能力,有助于老师和学校掌握学生的书写水平。
-
-
-
-
-
-
-
-
-