-
公开(公告)号:CN108712317B
公开(公告)日:2020-12-22
申请号:CN201810264531.X
申请日:2018-03-28
Applicant: 北京大学
Abstract: 本发明涉及一种基于移动社交网络的城市人群时空动态感知方法和系统。该方法的步骤包括:1)将城市区域离散化成边长为一定值的格子,将各格子的中心位置作为候选感知位置集合;2)在候选感知位置集合中,选择当前状态下能够产生最大感知收益的位置作为感知位置,在感知位置进行感知以获取用户的距离信息;3)利用在不同感知位置获得的用户的距离信息,通过三角定位来确定每个用户的具体位置。本发明每次都是选取感知收益最大的探针进行感知,仅需较少的探针数量就能感知到整个城市中用户的具体位置,并且具有良好的扩展性,能够通过大规模地动态地获取社交网络用户的时空特征来表征整个城市人群的时空动态特征。
-
公开(公告)号:CN108710663B
公开(公告)日:2020-05-01
申请号:CN201810455882.9
申请日:2018-05-14
Applicant: 北京大学
IPC: G06F16/903 , G06Q50/16
Abstract: 本发明涉及一种基于本体模型的数据匹配方法及系统。该方法包括:1)对数据库和本体模型中的所有待匹配元素对进行相似度计算,得到其相似度;2)利用步骤1)得到的相似度进行相似度传播,以对相似度进行补全;3)利用步骤2)得到的相似度,对所有待匹配元素对进行匹配仲裁,若待匹配元素对的相似度达到阈值,则认为待匹配元素对相互匹配。所述匹配仲裁是循环迭代的过程,利用匹配仲裁后的所有匹配元素对,通过多轮迭代获取优化的相似度匹配结果。本发明能够将多源异构的数据库和本体模型建立映射,将不同的数据库用相同的本体进行表达,为上层服务提供一个统一的视图,使得上层应用可以更方便地管理和使用数据。
-
公开(公告)号:CN109446231A
公开(公告)日:2019-03-08
申请号:CN201811080977.3
申请日:2018-09-17
Applicant: 北京大学 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司电力科学研究院
IPC: G06F16/2458
Abstract: 本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
-
公开(公告)号:CN108959433A
公开(公告)日:2018-12-07
申请号:CN201810597005.5
申请日:2018-06-11
Applicant: 北京大学
CPC classification number: G06F8/75
Abstract: 本发明公开了一种从软件项目数据中提取知识图谱并问答的方法与系统。本方法为:对于软件项目数据库中每种类型的软件项目数据,从该类型的软件项目数据中提取出实体以及实体之间的关联关系,并存储到一对应的图数据库中;基于软件数据的可追踪性关联技术对各所述图数据库中的数据进行关联处理,得到不同类型软件项目数据的实体之间的关联关系;根据不同类型软件项目数据的实体之间的关联关系,在各图数据库中加入相应的边,对不同来源的实体进行连接,生成软件项目数据的知识图谱;对于输入的自然语言查询语句,从知识图谱中查询得到一匹配的连通子图作为答案。本发明解决了软件项目数据关联缺失、信息隔离现象严重、难以联立查询与分析的问题。
-
公开(公告)号:CN108196880A
公开(公告)日:2018-06-22
申请号:CN201711307630.3
申请日:2017-12-11
Applicant: 北京大学
IPC: G06F8/74
Abstract: 本发明涉及一种软件项目知识图谱自动构造方法与系统。该方法包括:1)对原始软件资源数据进行解析,得到软件项目的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;2)在已有基础知识实体及其关联的基础上,采用知识提炼方法在实体之间建立新的关联,和/或在知识图谱中添加新的基础知识实体及其关联,并以顶点和边的形式存储在图数据库中;3)选择部分或全部基础知识实体及其关联,构成软件项目知识图谱。每种软件资源数据的解析方法以及知识提炼方法以插件形式存在,通过选择并运行需要的插件来生成软件项目知识图谱。本发明解决了从多源异构的软件资源中提取和组织领域特定知识的问题,适用范围广,可扩展性强。
-
公开(公告)号:CN107220297A
公开(公告)日:2017-09-29
申请号:CN201710301051.1
申请日:2017-05-02
Applicant: 北京大学
Abstract: 本发明提供面向软件项目的多源异构数据自动收集方法及系统,该系统包括:多任务多线程爬取模块,用于对多个数据爬取任务进行统一的调度,并对不同类型的数据实现不同的爬取方法,以根据不同数据类型的数据入口地址自动调用不同的爬取方法对不同类型的数据爬取任务进行数据爬取;多源异构软件项目数据自动收集模块,用于根据用户输入的软件项目名称及URL自动化探测该软件项目数据的数据类型及其对应的数据入口地址,并根据已知的不同数据类型的数据入口地址创建其对应的数据爬取任务,在所述多任务多线程爬取模块中调用不同的爬取方法对数据进行收集;数据解析存储模块,用于对上述收集的数据进行解析并存储到数据库中。
-
公开(公告)号:CN106933901A
公开(公告)日:2017-07-07
申请号:CN201511032263.1
申请日:2015-12-31
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供的数据集成方法及系统,通过获取不同输入源中的每个输入源的第一数据;根据语义对所述每个输入源的第一数据进行聚类,得到每个输入源的第二数据,其中,在每个输入源的第一数据中,语义相近的元素将用相同的元素表示并被聚类;将每个输入源的第二数据中任意第一元素与其他输入源的第二数据中的各元素进行并行匹配计算,并获得所述第一元素与各元素的相似度熵;根据所述第一元素与各元素的相似度熵,确定符合预设条件的第二元素,采用目标元素对所述第一元素进行替换。从而使本发明通过聚类使整个集成过程所需的计算量减小,提高集成效率,同时通过匹配算法,使整个数据集成的质量得到保证。
-
公开(公告)号:CN101312463B
公开(公告)日:2011-06-22
申请号:CN200810115314.0
申请日:2008-06-20
Applicant: 北京大学
Abstract: 本发明公开了一种服务冗余方法,该方法包括:选择器生成各个备选WEB服务的可用性信息;根据所述可用性信息和接收到的服务消费请求,选择器选取并提供可用性最高的所述备选WEB服务。所述生成的可用性信息包括状态信息和可用性预测值,所述备选WEB服务的所述可用性预测值按照滑动平均法计算的所述备选WEB服务的可用性生成,所述状态信息按照预定的规则生成。本发明通过包括状态信息和可用性预测值的可用性信息选择WEB服务并将其提供给服务消费者,有效地加快了获得作为判断当前备选WEB服务可用性高低的可用性预测值的收敛速度,同时提高了获得备选WEB服务可用性预测值的准确率,保证了服务消费者调用WEB服务的成功率。
-
公开(公告)号:CN101312463A
公开(公告)日:2008-11-26
申请号:CN200810115314.0
申请日:2008-06-20
Applicant: 北京大学
Abstract: 本发明公开了一种服务冗余方法,该方法包括:选择器生成各个备选WEB服务的可用性信息;根据所述可用性信息和接收到的服务消费请求,选择器选取并提供可用性最高的所述备选WEB服务。所述生成的可用性信息包括状态信息和可用性预测值,所述备选WEB服务的所述可用性预测值按照滑动平均法计算的所述备选WEB服务的可用性生成,所述状态信息按照预定的规则生成。本发明通过包括状态信息和可用性预测值的可用性信息选择WEB服务并将其提供给服务消费者,有效地加快了获得作为判断当前备选WEB服务可用性高低的可用性预测值的收敛速度,同时提高了获得备选WEB服务可用性预测值的准确率,保证了服务消费者调用WEB服务的成功率。
-
公开(公告)号:CN109448808B
公开(公告)日:2022-05-03
申请号:CN201810992868.2
申请日:2018-08-29
Applicant: 北京大学
IPC: G16H20/10 , G16H70/40 , G06F16/335 , G06K9/62
Abstract: 本发明公开一种基于多视图主题建模技术的异常处方筛选方法,其步骤为:1)将来自医疗系统的数据整理成处方数据,其中每条处方数据中包含诊断特征和用药特征;2)将处方数据输入MV‑LDA模型进行训练;其中,MV‑LDA模型包括K个主题,每个主题中包含诊断特征视图和用药特征视图;主题k中的诊断特征视图由一个诊断特征集合和在每个诊断特征的所对应的概率值组成,用药特征视图由一个用药特征集合和集合中每个用药特征所对应的概率值组成;3)利用训练好的MV‑LDA模型对待识别处方数据进行推断,得到其基于诊断特征的主题分布和基于用药特征的主题分布;然后计算两主题分布的相似度,判断该待识别处方数据是否为异常处方。
-
-
-
-
-
-
-
-
-