化学结构式的识别方法、装置、存储介质及电子设备

    公开(公告)号:CN115908775A

    公开(公告)日:2023-04-04

    申请号:CN202110935708.6

    申请日:2021-08-16

    摘要: 本公开提供了化学结构式的识别方法、装置、存储介质及电子设备,识别方法包括:获取化学结构图像,化学结构图像中包含至少一个完整的化学结构式;利用预先训练好的转换模型将化学结构图像转换为其对应的化学文本,转换模型对化学结构图中完整的化学结构式进行单次转换。相较于将化学结构图像进行图像矢量化之后以对得到的线条和节点分别进行转换,进而组合形成化学文本,本公开通过预先训练好的转换模型将期刊、专利等出版物中的化学结构图像中的每个完整的化学结构式进行单次转换,进而一次性得到完整的化学结构式对应的完整的化学文本,开发周期较短,开发成本较低,易于维护,在处理模糊和噪声较大的图像时,能够确保识别结果准确率较高。

    一种用于预测药物靶标的信息处理方法及装置

    公开(公告)号:CN113539366A

    公开(公告)日:2021-10-22

    申请号:CN202010309556.4

    申请日:2020-04-17

    摘要: 本申请公开了一种用于预测药物靶标的信息处理方法及装置,用以提升药物靶标预测的准确性。所述方法包括,获取化合物对应的化合物微扰谱;获取所述化合物所作用的目标基因对应的基因微扰谱;确定所述化合物微扰谱和所述基因微扰谱的相关程度;根据所述相关程度和预设的实验条件数据,对所述化合物能够对所述目标基因产生作用的概率进行预测。采用本申请所提供的方案,在确定化合物是否能够对目标基因产生作用的判断过程中,考虑了化合物微扰谱和基因微扰谱之间的相关性,从而提高了药物靶标预测的准确性。

    一种用于有机化合物的化学结构和命名双向自动转化的处理方法及装置

    公开(公告)号:CN113919290A

    公开(公告)日:2022-01-11

    申请号:CN202010657382.0

    申请日:2020-07-09

    IPC分类号: G06F40/126 G06F40/157

    摘要: 本发明公开了一种用于有机化合物的化学结构和命名双向自动转化的处理方法及装置,在有机物化学结构文件存储格式为SMILES格式、MOL2格式、SDF格式或PDB格式的情况下,在有机物命名方式为IUPAC规定的有机物命名法命名的情况下,所述方法包括:获取目标有机化合物待转换的化学结构文件;利用预设的化学结构转化工具将非SMILES格式的化学结构文件转成SMILES格式;对SMILES格式进行处理获得目标第一向量;利用预设的目标转换模型对目标第一向量进行转换,获得若干第二向量;基于各第二向量的概率,确定目标第二向量;基于目标第二向量确定与所述目标有机化合物结构对应的命名。本发明的处理方法和装置能够使得化学结构与命名之间的转换能够更加方便、快捷,提高了转换效率。