一种基于RoBERTa词嵌入技术和图注意力机制组合模型的抗菌肽识别方法

    公开(公告)号:CN117542419A

    公开(公告)日:2024-02-09

    申请号:CN202311305640.9

    申请日:2023-10-10

    摘要: 本发明属于生物医学和药物开发技术领域,具体涉及一种使用RoBERTa词嵌入技术和图注意力机制组合模型来对抗菌肽进行识别的方法。本发明通过从国际上已知的一些抗菌肽数据库中采集正样本和从蛋白质数据库采集残基长度范围在5到255之间的蛋白质序列组合作为负样本,并建立样本集;然后进行数据预处理和构建异构图操作,为组合模型输入做准备;接着利用RoBERTa模型来进行词嵌入,为引入更丰富的语义信息;再建立由RoBERTa模型和图注意力机制组成的组合模型并进行评估、参数调优处理;最后利用调优过的模型对肽序列预测其是抗菌肽还是非抗菌肽。本发明不仅将自然语言处理领域的RoBERTa模型用以对肽序列进行词嵌入操作,还将其与图注意力机制结合构建组合模型用以学习更易辨别的抗菌肽特征,从而达到更准确的抗菌肽性能预测目标,有望帮助生物医学领域的研究人员更快地找到潜在的抗菌肽候选药物,加速新药开发过程和解决抗生素耐药性等问题。

    一种基于可信AI数据预处理技术的无线传感器

    公开(公告)号:CN118647002A

    公开(公告)日:2024-09-13

    申请号:CN202410678121.5

    申请日:2024-05-29

    IPC分类号: H04W4/38 H04Q9/00 H02J7/35

    摘要: 本发明涉及物联网传感器与无线数据采集技术,提供了一种基于可信AI数据预处理的无线传感器系统,适用于环境监测和远程数据收集,特别是无法布线的野外环境。系统包括信号采集与放大处理单元、STM32WLE5JC单片机、数据处理及传输单元、LoRa无线传输模块和太阳能供电系统。信号采集单元将环境信号转换并放大,STM32WLE5JC单片机进行信号数字化及数据清洗,处理单元通过AI算法进行异常检测和噪声过滤,LoRa模块负责无线传输。太阳能供电系统确保长时间独立运行。该系统通过集成数据预处理和无线通信技术,提高了数据准确性和传输效率,降低了部署与维护成本,具备高度灵活性,适应不同环境的监测需求。

    一种野外无线部署的通用485传感器数据采集器

    公开(公告)号:CN118660279A

    公开(公告)日:2024-09-17

    申请号:CN202410952661.8

    申请日:2024-07-16

    IPC分类号: H04W4/38 H04W84/18

    摘要: 本发明属于物联网传感器与无线数据采集的技术领域。具体涉及了一种野外无线部署的通用485传感器数据采集器。本发明提供了一种通用数据采集器,将具备485接口的物联网传感器扩展为可以野外无线部署的系统。系统依赖太阳能供电,无需外部电源,适合长期野外使用。由STM32WL单片机控制,通过间歇性电源控制模块管理传感器电源开关,以减少能耗。主要组件包括300mW太阳能电池板、太阳能充电控制器、1000mAh 12V锂电池、电压转换模块、STM32WL单片机、MAX485芯片和LoRa网关。当系统数据采集和传输时总功耗为5.0972W时,无阳光情况下系统实际应用可达5天以上。该系统高效、低功耗,易部署和维护,适用于远程数据监控和采集。

    一种基于BERT特征编码技术和深度学习组合模型的抗菌肽预测方法

    公开(公告)号:CN117292749A

    公开(公告)日:2023-12-26

    申请号:CN202311276669.9

    申请日:2023-10-05

    摘要: 本发明属于生物技术和药物开发技术领域,具体涉及一种使用BERT特征编码技术和深度学习组合模型来对抗菌肽进行预测的方法。本发明通过从国际上知名的抗菌肽数据库中收集抗菌肽序列作为正样本和从蛋白质数据库收集蛋白质片段残基长度为5至100的序列作为负样本并建立相应的样本集;然后利用BERT预训练模型来对肽序列进行特征编码操作;接着构建由一维卷积神经网络、长短时记忆网络和注意力机制组成的深度学习组合模型和分类模块;再对深度学习组合模型和分类模块构成的整体模型进行训练、评估和利用元学习技术进行参数优化以最大化性能;最后根据优化过的模型对肽序列进行识别其是否具有抗菌活性。本发明将最新的自然语言处理技术(BERT)与深度学习模型结合,用于解决抗菌肽预测的复杂性问题,从而提供更高的准确性、通用性和效率,有望在生物医学研究和药物研发领域产生显著的创新和应用潜力。