基于公开文献中的图像和文本数据构建近药空间数据库的方法及其系统

    公开(公告)号:CN115458077A

    公开(公告)日:2022-12-09

    申请号:CN202211132187.1

    申请日:2022-09-16

    IPC分类号: G16C20/62 G16C20/80 G06F16/28

    摘要: 本发明涉及基于人工智能的药物研发领域,公开了一种基于公开文献中的图像和文本数据构建近药空间数据库的方法及其系统,通过构建结合图像识别神经网络和命名实体识别的神经网络的多模态融合系统,可同时处理公开文献中的图像数据及文本数据,分别提取所述图像数据和文本数据中涵盖的分子结构信息,并基于此进一步构建近药空间数据库,为扩大近药空间带来了新的机遇,获取的具有良好可合成性、成药性及生物活性的分子结构可用于拓展近药空间,在药物研发前期提供大量的近药分子用于先导化合物筛选,从而可大大加速药物研发进程。