一种基于机器学习的公共卫生数据可靠性评估系统

    公开(公告)号:CN115510969A

    公开(公告)日:2022-12-23

    申请号:CN202211165934.1

    申请日:2022-09-23

    IPC分类号: G06K9/62 G06N20/00 G16H50/20

    摘要: 本发明公开了一种基于机器学习的公共卫生数据可靠性评估系统,包括以下阶段:数据准备阶段、特征工程阶段以及模型评估与评价阶段,所述模型评估与评价阶段包括以下步骤:S1,采用半监督学习的方法,探索逻辑回归、支持向量机、神经网络、随机森林与XGBoost模型在公共卫生数据可靠性评估方面的应用;S2,将半监督机器学习分为自主训练与合作训练两种模式,在总体特征可划分为两组子特征,使用合作训练通常会有更好的效果;具有提高半监督机器学习的效率及模型性能的好处,探索并构建多种类模型,并对各模型性能进行量化评估与比较,在此基础上进行模型选择,解决了单一模型无法达到最优效果的问题,进一步提升模型的性能和实用性。

    基于用户个性化需求的一站式搜索推送方法

    公开(公告)号:CN108900574A

    公开(公告)日:2018-11-27

    申请号:CN201810562048.X

    申请日:2018-06-04

    IPC分类号: H04L29/08 G06F17/30

    CPC分类号: H04L67/26

    摘要: 本发明涉及一种基于用户个性化需求的一站式搜索推送方法,包括首先根据一用户搜索请求,创建客户端中的搜索源会话,其次判断所述的服务端是否支持所述的搜索源会话,若支持,则根据用户请求过滤后得到各个文献数据库的搜索表达式,并根据过滤表达式对所述搜索源会话进行过滤后得到搜索表达式,若所述搜索表达式有效,则继续根据所述的搜索表达式,以及在所述服务端中获取的用户兴趣模型,所述的服务端向所述的客户端返回相对应的一站式搜索结果;否则向所述的客户端显示错误信息并结束整个过程。采用了该发明中的基于用户个性化需求的一站式搜索推送方法,不仅方便了用户无需分别进入各数据库,还与用户兴趣模型相结合,实现个性化的搜索推送。

    一种公共卫生数据获取及处理系统

    公开(公告)号:CN115511683A

    公开(公告)日:2022-12-23

    申请号:CN202211165509.2

    申请日:2022-09-23

    IPC分类号: G06Q50/26 G06K9/62 G16H10/00

    摘要: 本发明公开了一种公共卫生数据获取及处理系统,包括1、以下阶段:数据准备阶段、特征工程阶段以及模型评估与评价阶段,所述数据准备阶段包括以下步骤:S1,选择以糖尿病作为项目实例,启动项目;S2,选择业务信息系统及数据资源中心获取糖尿病随访场景的业务数据;S3,对已获得的已明确数据可靠性的数据赋予可靠性标签;S4,收集可靠性标签并归类,将可靠性数据单独归类,与未处理数据分离;S5,筛选后的数据提取部分可靠性标签;S6,提取目标数据中的数据类型、数据结构以及数据形式,并检查数据缺失值、异常值以及重复值;具有可以对数据进行分类描述,减少后续分析时间的好处。