一种基于多视图主题建模技术的异常处方筛选方法

    公开(公告)号:CN109448808B

    公开(公告)日:2022-05-03

    申请号:CN201810992868.2

    申请日:2018-08-29

    Applicant: 北京大学

    Abstract: 本发明公开一种基于多视图主题建模技术的异常处方筛选方法,其步骤为:1)将来自医疗系统的数据整理成处方数据,其中每条处方数据中包含诊断特征和用药特征;2)将处方数据输入MV‑LDA模型进行训练;其中,MV‑LDA模型包括K个主题,每个主题中包含诊断特征视图和用药特征视图;主题k中的诊断特征视图由一个诊断特征集合和在每个诊断特征的所对应的概率值组成,用药特征视图由一个用药特征集合和集合中每个用药特征所对应的概率值组成;3)利用训练好的MV‑LDA模型对待识别处方数据进行推断,得到其基于诊断特征的主题分布和基于用药特征的主题分布;然后计算两主题分布的相似度,判断该待识别处方数据是否为异常处方。

    一种面向知识抽取的智能文本标注方法及系统

    公开(公告)号:CN114091406A

    公开(公告)日:2022-02-25

    申请号:CN202111202937.3

    申请日:2021-10-15

    Applicant: 北京大学

    Abstract: 本发明涉及一种面向知识抽取的智能文本标注方法及系统,针对知识抽取过程存在的深度学习模型缺乏标注数据,且人工数据标注繁琐,需要领域专家大量人工操作,耗时耗力等问题,面向知识抽取的实体识别和关系抽取两个阶段,提出基于主动学习的智能标注方法与系统,本发明的效果在于,当获取完全无标签数据时,领域专家可以自由设定标注模型和标注批次规模等参数,边标注数据,边使实体识别和关系抽取联合模型学习该知识抽取行为,在尽可能少的标注轮次后完成深度学习模型的训练,进而完成整个数据集的知识抽取。

    一种基于本体模型的终端用户数据访问方法及系统

    公开(公告)号:CN108959358B

    公开(公告)日:2019-09-17

    申请号:CN201810457363.6

    申请日:2018-05-14

    Applicant: 北京大学

    Abstract: 本发明涉及一种基于本体模型的终端用户数据访问方法及系统。该方法包括:1)根据查询元模型和基于所述查询元模型的本体推理规则,对用户要查询的本体模型进行预处理,推理出其中的“向内共享”关系和“向外共享”关系;2)将用户输入转换为本体查询SPARQL语句;3)根据所述本体查询SPARQL语句生成SQL语句,通过对所述本体模型进行SQL查询实现数据的访问和查询。本发明充分利用本体模型的语义元素和推理能力来优化终端用户的查询构造流程,帮助用户脱离数据库的实际存储模式细节,同时对终端用户的分组统计需求提供了完整的支持,填补了现有相关工作的不足,具备更强的系统可用性和表达能力。

    一种面向软件项目知识图谱的自然语言查询方法及系统

    公开(公告)号:CN109033135A

    公开(公告)日:2018-12-18

    申请号:CN201810575729.X

    申请日:2018-06-06

    Applicant: 北京大学

    Abstract: 本发明公开了一种面向软件项目知识图谱的自然语言查询方法及系统。本方法为:1)抽取软件项目知识图谱的元模型;2)将自然语言查询语句转换成知识图谱元模型上的一系列子图,称为推理子图,并对推理子图进行了度量;3)基于所述推理子图构造Cypher查询语句,并在软件项目知识图谱上执行,返回查询结果。本发明能够自动提取软件项目知识图谱的元模型,准确理解用户的自然语言问题并构造查询,具有通用性强、扩展性强的特点,提高了软件知识图谱的查询效率。

    一种面向关系数据库的本体模型构造方法及系统

    公开(公告)号:CN108733793A

    公开(公告)日:2018-11-02

    申请号:CN201810456743.8

    申请日:2018-05-14

    Applicant: 北京大学

    Abstract: 本发明涉及一种面向关系数据库的本体模型构造方法及系统。该方法包括以下步骤:1)提取关系数据库的元信息;2)对提取的关系数据库的元信息进行冗余信息检测;3)对提取的关系数据库的元信息进行外键检测;4)通过映射规则,将冗余信息检测、外键检测之后的元信息用本体来表达,得到本体模型。本发明在构造本体模型的过程中加入了“冗余信息检测”和“外键检测”两个步骤,分别用于检测存在的冗余信息以及缺失的外键定义,可以更加高效地通过关系型数据库建立本体模型;建立的本体模型可以为底层的数据库构建统一的视图,为上层应用提供统一的接口,从而方便数据的应用与分析。

    一种面向自然语言的城市领域知识模型查询方法和装置

    公开(公告)号:CN114297350B

    公开(公告)日:2024-08-06

    申请号:CN202110630148.3

    申请日:2021-06-07

    Applicant: 北京大学

    Abstract: 本发明公开了一种面向自然语言的城市领域知识模型查询方法和装置,方法包括:S100、基于城市领域知识模型,对用户输入的自然语言问题进行解析,解析之后,经过与用户迭代式交互,构建自然语言问题的词素集合;S200、基于词素集合和智慧城市领域知识模型,通过隐马模型查询图生成和隐马模型查询图排序,或者通过迭代式查询图生成和迭代式查询图排序,得到最符合自然语言问题的查询子图;S300、将查询子图与预设的模板进行筛选匹配,得到自然语言问题的答案,预设的模板为基于自然语言问题的各类型预设的查询模板。本发明利用隐马模型查询和迭代式查询推测用户问句的领域知识模型查询子图,并查询答案反馈给用户,提高了检索的准确性和检索的效率。

    面向知识抽取模型全生命周期管理方法、装置及相关产品

    公开(公告)号:CN117807063A

    公开(公告)日:2024-04-02

    申请号:CN202311595548.0

    申请日:2023-11-27

    Applicant: 北京大学

    Abstract: 本申请提供一种面向知识抽取模型全生命周期管理方法、装置及相关产品,可用于人工智能技术领域。该方法包括:获取多个预设数据集;将各预设数据集中的数据转换为统一规定格式,并进行数据清洗处理及模型特有的特征抽取处理,以获得各处理后数据集;从Git仓库中获取各预设知识抽取模型;采用各处理后数据集分别对各预设知识抽取模型进行自动训练及评估,以获得各处理后数据集对应的最优预设知识抽取模型;获取待确认的目标数据集,并基于目标数据集与多个候选处理后数据集的相似度确定目标数据集对应的最优目标知识抽取模型;采用最优目标知识抽取模型对目标数据集进行预测。

    一种基于知识图谱的事件发现与展现方法及系统

    公开(公告)号:CN114297516A

    公开(公告)日:2022-04-08

    申请号:CN202110677628.5

    申请日:2021-06-18

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于知识图谱的事件发现与展现方法,包括:S100、对每条政府服务热线数据进行预处理;S200、按照用户指定的时间间隔将用户选择的时间段内的政府服务热线数据划分为数据帧,通过社区发现算法对各帧内的政府服务热线数据进行事件检测,获取各城市事件;S300、基于二部图最大权值匹配算法,对前后两帧的事件进行匹配,建立各城市事件演化的事件链,分析事件链中各城市事件的z‑score值,确定各城市事件的突发和紧急程度,并对其中的城市突发事件进行预警和多维可视化。本发明能够清晰地了解城市发生的各种事件,并能对城市的突发事件做出检测、预警。

Patent Agency Ranking