-
公开(公告)号:CN103745319A
公开(公告)日:2014-04-23
申请号:CN201410010013.7
申请日:2014-01-09
Applicant: 北京大学
Abstract: 一种基于多状态科学工作流的数据世系追溯系统和方法,以基于有向图的科学工作流过程模型为基础,对其进行扩展,得到一个扩展的科学工作流过程模型。再利用数据世系技术丰富其数据模型部分,从过程和数据两个角度全方位地描述科学工作流的执行过程,得到基于多状态的科学工作流过程数据统一管理模型,并以此对数据世系进行描述和追溯。本发明可以更好地描述大规模复杂科学计算和协同研发流程中数据的演化和状态,从而增强对流程过程的监控能力,实现流程全方位的管理策略,提高科研效率,并促进科学发展和技术进步。
-
公开(公告)号:CN114548101B
公开(公告)日:2022-08-02
申请号:CN202210436226.0
申请日:2022-04-25
Applicant: 北京大学
IPC: G06F40/289 , G06F16/35 , G06K9/62 , G06N3/04
Abstract: 本发明涉及软件检测技术领域,提出一种基于可回溯序列生成方法的事件检测方法和系统,其中方法包括:对作为训练文本的输入句子进行编码;对编码后的输入句子计算Luong注意力,并根据计算出的注意力权重定位出输入句子中权重最大的单词;对计算Luong注意力后的输入句子计算其中上下文向量;根据所述上下文向量,对输入句子进行解码,每时刻解码出一个事件类型的名称;根据解码结果、输入句子中包含的事件触发词、触发词触发的事件类型和预先定义的目标函数训练模型,得到事件监测模型;将作为待测文本的输入句子输入所述事件监测模型得到事件检测结果。根据本发明的方案,事件检测效率高,准确度高。
-
公开(公告)号:CN113963357B
公开(公告)日:2022-03-11
申请号:CN202111535596.1
申请日:2021-12-16
Applicant: 北京大学
IPC: G06V30/19 , G06V30/10 , G06V10/774 , G06F16/36 , G06F16/35
Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。
-
公开(公告)号:CN113963357A
公开(公告)日:2022-01-21
申请号:CN202111535596.1
申请日:2021-12-16
Applicant: 北京大学
IPC: G06V30/19 , G06V30/10 , G06V10/774 , G06F16/36 , G06F16/35
Abstract: 本发明公开了一种基于知识图谱的敏感文本检测方法及系统,其中方法包括:爬取网络中现有知识,对所述现有知识进行预处理,得到知识图谱网络;获取网络中的敏感文本,对所述敏感文本进行预处理,得到训练语料;根据所述训练语料和所述知识图谱网络得到文本检测模型的编码信息,将所述编码信息转化为向量表示,得到最终的所述文本检测模型;对待测试文本进行预处理,根据所述文本检测模型得到检测结果。本发明通过知识图谱引入外部知识,建立文本检测模型,并通过多视图推理网络对外部知识进行进一步融合,使得外部知识能够得到充分利用。
-
公开(公告)号:CN111651198B
公开(公告)日:2021-04-13
申请号:CN202010312534.3
申请日:2020-04-20
Applicant: 北京大学
Abstract: 本发明实施例提供一种代码摘要自动化生成方法及装置,方法包括:基于代码摘要生成模型中的编码器分别对输入序列进行编码,获取输入序列的语义向量;基于代码摘要生成模型中的解码器对输入序列的语义向量进行解码,生成代码样本的函数名和代码摘要;根据生成的函数名、生成的代码摘要,以及预先获取的代码样本的目标函数名和目标代码摘要,计算代码摘要生成模型的损失函数的值,根据损失函数的值对代码摘要生成模型进行训练;将目标代码的输入序列输入训练好的代码摘要生成模型中生成目标代码的代码摘要。本发明实施例采用基于函数名预测任务和代码自动摘要生成任务的多任务学习机制对代码摘要生成模型进行训练,提升自动生成的代码摘要的质量。
-
-
公开(公告)号:CN111666761A
公开(公告)日:2020-09-15
申请号:CN202010404188.1
申请日:2020-05-13
Applicant: 北京大学
IPC: G06F40/289 , G06F40/211 , G06N20/00
Abstract: 本发明实施例提供一种细粒度情感分析模型训练方法及装置,所述方法包括:获取带有情感标记以及方面词的文本信息;对文本信息中的每条语句进行分词处理,获取每条语句中每个词的上下文词向量,根据每个词的上下文词向量以及方面词的词向量得到文本信息中每条语句对应的语句向量;根据每条语句对应的语句向量获取每条语句的上下文语句向量,并获取每条语句基于方面词的语句权重,根据上下文语句向量与语句权重得到文本信息的文本向量;将文本向量、情感标记、以及方面词输入到循环神经网络,训练得到神经网络模型。采用本方法能够对文本数据的细粒度的各种方面情感类型进行识别,进而也提高了情感识别的准确率。
-
公开(公告)号:CN111666734A
公开(公告)日:2020-09-15
申请号:CN202010334370.4
申请日:2020-04-24
Applicant: 北京大学
IPC: G06F40/117 , G06F40/289 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种序列标注方法及装置。其中,方法包括:获取待分析的句子;将待分析的句子输入至序列标注模型,输出句子的分词结果及每个词的标注结果;其中,序列标注模型是基于样本句子及样本句子对应的分词和标注数据进行基于强化学习的训练获得的。本发明实施例提供的序列标注方法及装置,通过强化学习技术隐式地学习文本的分词信息,能缓解中文序列标注中分词与目标的不匹配。
-
-
公开(公告)号:CN104199664B
公开(公告)日:2017-06-06
申请号:CN201410445887.5
申请日:2014-09-03
Applicant: 北京大学
Abstract: 一种基于注释的仿真代码同步生成方法,包括:设计一个仿真描述模型;将该仿真描述模型导出为底层仿真代码;将导出的仿真代码放入实际仿真机中进行执行,并根据执行结果对仿真代码进行修改,然后将修改结果同步到仿真描述模型。通过上述方法,就能完成仿真描述模型与仿真代码之间的同步生成。利用本发明,可充分利用软件仿真的优势,将仿真软件应用到实时仿真领域中,能够缩短仿真模型设计周期、减少人为失误、减少重复工作量、降低对仿真人员编程知识的要求。
-
-
-
-
-
-
-
-
-