-
公开(公告)号:CN118779507B
公开(公告)日:2025-02-11
申请号:CN202410916307.X
申请日:2024-07-09
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/9532 , G06F16/958 , G06F40/186 , G06F40/247 , G06F40/30
Abstract: 本申请提供一种面向专家画像的信息追踪方法及装置,方法包括:基于专家信息库中的目标专家的基础专家数据以及该目标专家的简历数据,采用大语言模型获取针对简历数据的缺失信息查询式;应用缺失信息查询式在网络中查找缺失信息关联网页并识别得到目标网页文本数据;对目标网页文本数据和文档数据进行针对用于表示缺失信息的缺失数据的提取、汇总和验证,并验证新增专家属性描述短语及其的语义信息,再基于专家评审规则确定新增专家属性描述短语的标签等级。本申请能够提高面向专家画像的信息追踪的全面性及准确性;并能够提高面向专家画像的信息追踪的效率、准确性以及可靠性,进而能够提高专家画像更新或构建的实时性、准确性及全面性。
-
公开(公告)号:CN119025668A
公开(公告)日:2024-11-26
申请号:CN202411109959.9
申请日:2024-08-13
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/335 , G06F16/31 , G06F16/33 , G06N3/0455
Abstract: 本申请公开了一种基于研究方向的实体匹配方法、装置、设备以及存储介质。该方法包括:获取待匹配研究方向词;采用2GRAM模型分别对待匹配研究方向词和学术主题词库中学术主题词进行切分处理,得到待匹配研究方向词对应的第一双对序列和学术主题词各自对应的第二双字对序列;将每个第二双字对序列分别与第一双对序列进行相似度比对以从学术主题词库中确定多个待匹配学术主题词;采用BERT模型依次对待匹配研究方向词与待匹配学术主题词进行文本向量化处理,并计算得到的待匹配学术主题向量与待匹配研究方向向量的相似度,确定出一个待匹配学术主题词作为目标学术主题词。本申请的方法提高了研究方向实体匹配的效率。
-
公开(公告)号:CN118779507A
公开(公告)日:2024-10-15
申请号:CN202410916307.X
申请日:2024-07-09
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/9532 , G06F16/958 , G06F40/186 , G06F40/247 , G06F40/30
Abstract: 本申请提供一种面向专家画像的信息追踪方法及装置,方法包括:基于专家信息库中的目标专家的基础专家数据以及该目标专家的简历数据,采用大语言模型获取针对简历数据的缺失信息查询式;应用缺失信息查询式在网络中查找缺失信息关联网页并识别得到目标网页文本数据;对目标网页文本数据和文档数据进行针对用于表示缺失信息的缺失数据的提取、汇总和验证,并验证新增专家属性描述短语及其的语义信息,再基于专家评审规则确定新增专家属性描述短语的标签等级。本申请能够提高面向专家画像的信息追踪的全面性及准确性;并能够提高面向专家画像的信息追踪的效率、准确性以及可靠性,进而能够提高专家画像更新或构建的实时性、准确性及全面性。
-
公开(公告)号:CN118467731A
公开(公告)日:2024-08-09
申请号:CN202410537756.3
申请日:2024-04-30
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F16/35 , G06F16/36 , G06F40/284 , G06Q50/18
Abstract: 本申请公开了一种科技发展脉络的提取方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为获取目标技术领域的多个文献数据;对多个文献数据进行数据提取、合并和关系构建处理,得到多类短语和短语之间的短语关系;基于多类短语和短语关系构建知识图谱;对知识图谱进行层次聚类处理,得到目标技术领域的科技发展脉络。本申请的技术方案无需科研人员通过自身的经历和掌握的局部信息对科技演化过程进行描述,即可使其得到客观全面的科技演化路径,从而使其能够了解相应领域内存在的细分领域和先进的研究方法。
-
公开(公告)号:CN118966222A
公开(公告)日:2024-11-15
申请号:CN202411037378.9
申请日:2024-07-30
Applicant: 国家电网有限公司信息通信分公司 , 北京邮电大学
IPC: G06F40/295 , G06F18/214 , G06F18/2411 , G06N3/0442 , G06F18/213
Abstract: 本申请公开了一种基于专家信息的实体抽取方法、装置、设备以及存储介质。该方法包括:从公共资源中获取目标专家信息的文本序列;采用训练好的命名实体识别模型对目标专家信息的文本序列进行标注,确定目标文本序列;目标文本序列为具有实体类型标记的文本序列;其中,训练好的命名实体识别模型中嵌入层采用BERT模型对目标专家信息的文本序列进行文本向量化,编码层采用BiLSTM模型提取语义特征后输出层采用CRF模型确定出目标文本序列;并对目标文本序列进行实体抽取以获取目标专家信息中每个实体类型对应的文本信息,并以结构化数据形式进行存储。本申请的方法能够获取结构化的专家信息,提高了信息获取的效率,避免浪费人力物力。
-
公开(公告)号:CN112328774A
公开(公告)日:2021-02-05
申请号:CN202011355592.0
申请日:2020-11-27
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/35 , G06N3/04
Abstract: 本申请公开了一种基于多文档的任务型人机对话任务的实现方法,包括:每轮对话结束时,利用预设人机对话任务模型对该轮对话的问答文本处理,该处理包括:基于问答文本生成问答向量;计算问答向量与各候选文档的属性相关向量的相似度;基于问答向量和相似度生成该轮对话中各候选文档的概率分布和该轮对话的属性分布;根据所述概率分布更新全局候选文档概率分布向量;根据所述属性分布更新全局属性分布向量;若满足人机对话结束条件,则基于全局候选文档概率分布向量确定任务执行结果并输出;否则,基于全局候选文档概率分布向量和全局属性分布向量,利用自然语言对话模板,确定下一提问信息。采用本发明可以提高任务执行效率和成功率,且易于实现。
-
公开(公告)号:CN104462485B
公开(公告)日:2017-12-05
申请号:CN201410797791.5
申请日:2014-12-18
Applicant: 北京邮电大学
IPC: G06F17/30
Abstract: 本发明提出了一种基于对应的深层信念网络的跨模态检索方法,该方法包括:利用特征提取方法分别获得检索目标与检索库中每一个检索成员的初级向量;检索目标的初级向量分别与检索库中每一个检索成员的初级向量,通过对应的深层信念网络获得检索目标的高级向量和检索库中每一个检索成员的高级向量;利用检索目标的高级向量和检索库中每一个检索成员的高级向量计算检索目标与检索库中每一个检索成员的距离;将检索库中与检索目标距离最近的至少一个检索成员确定为与检索目标匹配的对象。
-
公开(公告)号:CN112328774B
公开(公告)日:2022-10-25
申请号:CN202011355592.0
申请日:2020-11-27
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/35 , G06N3/04
Abstract: 本申请公开了一种基于多文档的任务型人机对话任务的实现方法,包括:每轮对话结束时,利用预设人机对话任务模型对该轮对话的问答文本处理,该处理包括:基于问答文本生成问答向量;计算问答向量与各候选文档的属性相关向量的相似度;基于问答向量和相似度生成该轮对话中各候选文档的概率分布和该轮对话的属性分布;根据所述概率分布更新全局候选文档概率分布向量;根据所述属性分布更新全局属性分布向量;若满足人机对话结束条件,则基于全局候选文档概率分布向量确定任务执行结果并输出;否则,基于全局候选文档概率分布向量和全局属性分布向量,利用自然语言对话模板,确定下一提问信息。采用本发明可以提高任务执行效率和成功率,且易于实现。
-
公开(公告)号:CN109146892B
公开(公告)日:2020-06-19
申请号:CN201810813038.9
申请日:2018-07-23
Applicant: 北京邮电大学
IPC: G06T7/11
Abstract: 本申请实施例提供了一种基于美学的图像裁剪方法及装置,属于计算机技术领域。所述方法包括:获取待裁剪图像;根据显著性检测算法,计算所述待裁剪图像对应的显著图,其中,所述显著图包括所述待裁剪图像对应的显著度图像,所述显著度图像是灰度图像;通过显著区域提取算法,在所述显著图中确定显著边界框;在所述待裁剪图像中,确定所述显著边界框对应的显著区域,其中,所述显著区域为所述待裁剪图像中所述显著边界框包含的图像区域;根据美学区域识别算法和所述显著区域,确定包含所述显著区域的美学区域边界框;基于所述美学区域边界框,对所述待裁剪图像进行裁剪,得到目标图像。采用本发明,可以提高确定裁剪框的效率。
-
公开(公告)号:CN104216983B
公开(公告)日:2019-03-01
申请号:CN201410441434.5
申请日:2014-09-01
Applicant: 北京邮电大学 , 无锡北邮感知技术产业研究院有限公司
Abstract: 本发明公开了一种基于采集搜索引擎数据的隐私信息评级方法,包括以下步骤:第一步从搜索引擎采集数据确定每个隐私信息的普遍性分值U,第二步从搜索引擎采集数据确定每个隐私信息的敏感性分值S,第三步根据U×S计算结果确定隐私信息的安全等级。本发明提供的评级方法使用的数据从搜索引擎采集,数据来源于使用搜索引擎的庞大的用户群,因此评级结果不依赖于个人的经验或意见,评级结果具有公正性;同时本发明提供的隐私信息评级方法不针对特定的隐私内容,既可以评定全体隐私信息,也可用于评定应用系统中有限数量的隐私信息。
-
-
-
-
-
-
-
-
-