化学结构式的识别方法、装置、存储介质及电子设备

    公开(公告)号:CN115908775A

    公开(公告)日:2023-04-04

    申请号:CN202110935708.6

    申请日:2021-08-16

    摘要: 本公开提供了化学结构式的识别方法、装置、存储介质及电子设备,识别方法包括:获取化学结构图像,化学结构图像中包含至少一个完整的化学结构式;利用预先训练好的转换模型将化学结构图像转换为其对应的化学文本,转换模型对化学结构图中完整的化学结构式进行单次转换。相较于将化学结构图像进行图像矢量化之后以对得到的线条和节点分别进行转换,进而组合形成化学文本,本公开通过预先训练好的转换模型将期刊、专利等出版物中的化学结构图像中的每个完整的化学结构式进行单次转换,进而一次性得到完整的化学结构式对应的完整的化学文本,开发周期较短,开发成本较低,易于维护,在处理模糊和噪声较大的图像时,能够确保识别结果准确率较高。