-
公开(公告)号:CN110825942B
公开(公告)日:2021-06-29
申请号:CN201911003528.3
申请日:2019-10-22
申请人: 清华大学
IPC分类号: G06F16/951 , G06F17/18
摘要: 本发明提出一种论文质量的计算方法及系统,属于信息技术领域。该系统包括:论文抓取模块、预处理模块和论文质量计算模块。该方法首先建立论文历年被引频次和被引年份的集合;计算论文总被引频次,及论文历年被引频次的增长速率及均值;计算论文历年被引频次的高低变化波动值;分别对论文历年被引频次的增长速率均值和高低变化波动值进行归一化;最后得到论文质量分值。本发明可以客观准确地计算论文的质量分值,消除了人们主观感受、技术研究热度、引用动机复杂等因素对论文质量的影响,保证了结果的准确性和客观性,易于实现。
-
公开(公告)号:CN112989808A
公开(公告)日:2021-06-18
申请号:CN202110326779.6
申请日:2021-03-26
申请人: 清华大学
IPC分类号: G06F40/242 , G06F40/289 , G06F40/295 , G06F40/30 , G06K9/62 , G06F16/36
摘要: 本发明公开了一种实体链接方法及装置,所述实体链接方法包括:基于词典的方式进行实体发现,得到实体提及;基于词和实体的联合表示的方式进行实体链接,得到所述实体提及与知识库中的实体的链接关系;对所述链接关系进行减枝处理。本发明实施例在实体发现中使用基于词典的方式,在增加召回率的同时有效避免了中文分词对实体发现带来的影响,此外,本发明实施例基于词和实体联合表示的方式实现了实体链接,从而使得实体链接更加准确和丰富。通过本发明实施例的实体链接方法,实现辅助阅读,以及可用协助进行文本预处理。
-
公开(公告)号:CN112528033A
公开(公告)日:2021-03-19
申请号:CN202011242473.4
申请日:2020-11-09
申请人: 清华大学
摘要: 本发明提供一种知识图谱多跳推理方法、装置、电子设备及存储介质,其中,该方法包括:若判断获知未达到预设的最大跳数,则根据当前访问实体对应的状态和目标知识图谱中当前访问实体的出边,获取当前访问实体对应的动作列表;根据当前访问实体对应的状态和当前访问实体对应的动作列表,获取当前访问实体对应的动作列表中的一个动作中的实体,作为下一访问实体。本发明提供的知识图谱多跳推理方法、装置、电子设备及存储介质,根据当前访问实体对应的状态和当前访问实体的出边,对当前访问实体对应的状态对应的动作列表进行补充,将未知实体的初步预测结果补充到当前访问实体对应的状态中,能实现对稀疏的连通性较差的知识图谱更高准确性的补全。
-
公开(公告)号:CN109743617B
公开(公告)日:2020-11-24
申请号:CN201811466336.1
申请日:2018-12-03
申请人: 清华大学
IPC分类号: H04N21/435 , H04N21/466 , H04N21/462 , H04N21/845
摘要: 本发明实施例提供一种视频播放的跳转导航方法和设备,包括:根据视频文本将视频划分为多个视频子段;确定当前播放时间点所属的视频子段,提取当前播放时间点所属的视频子段的视频文本特征向量,提取当前播放时间点所属的视频子段的视频图像特征向量;将当前用户信息、当前播放时间点所属的视频子段的视频文本特征向量和视频图像特征向量输入到已训练的神经网络,输出每一视频子段作为跳转目标视频子段的概率值,以供当前用户根据每一概率值选择对应的视频子段进行跳转。本方法和设备能依据用户的不同实现动态跳转导航,并且在视频制作时无需给每个视频插入静态的导航点,减少了视频制作的工作量。
-
公开(公告)号:CN108880846B
公开(公告)日:2020-10-09
申请号:CN201710343881.0
申请日:2017-05-16
申请人: 清华大学 , 腾讯科技(深圳)有限公司
IPC分类号: H04L12/24
摘要: 本发明公开了一种为网络中节点确定向量表示形式的方法及装置,属于网络技术领域。该方法包括:根据网络中的节点和节点信息,生成网络结构;获取每个节点的初始背景向量和初始目标向量;以每个节点为起点进行随机游走,得到节点序列,并确定每个节点的节点频数;对每个节点的背景向量和目标向量进行迭代计算,得到每个节点的向量表示形式。本发明通过生成包括原始节点和群组节点的网络结构,并通过对每个节点的背景向量和目标向量进行迭代计算,得到包括原始节点和群组节点在内的每个节点的向量表示形式。由于基于原始节点和群组节点的向量表示形式,不仅可度量原始节点间的相似度,而且度量原始节点和群组节点的相似度,因而应用范围较广。
-
公开(公告)号:CN107274077B
公开(公告)日:2020-07-31
申请号:CN201710398841.6
申请日:2017-05-31
申请人: 清华大学
摘要: 本发明提供一种课程先后序计算方法和设备,用于解决确定大型网络课程中安排课程的学习顺序问题。其中方法包括:S101、根据辅助语料,获得第一语料中的概念实体的向量表示;S102、计算概念实体对之间的复杂程度距离特征;以及计算以下6种特征中的至少5种:语义关系特征、视频引用距离特征、通用句子引用距离特征、辅助文本引用距离、平均位置距离特征、分布不对称特征;S103、根据获得的概念实体对之间的复杂程度距离特征,以及根据在步骤S102中获得5种特征,采用随机森林方法训练获得概念的先后序关系;S104、通过概念实体的先后顺序,获得课程的先后顺序。本发明对网络上大型开放网络课程提供了一个有效的先后序确认方法。
-
公开(公告)号:CN110909175A
公开(公告)日:2020-03-24
申请号:CN201911140653.9
申请日:2019-11-20
申请人: 清华大学
IPC分类号: G06F16/36 , G06F16/35 , G06F40/284 , G06F40/289 , G06Q50/20
摘要: 本发明提出一种基于搜索引擎的在线课程概念知识图谱构建方法,属于信息技术领域。该方法使用外部数据库和自然语言处理的方法,获取了课程文本中的概念,由此得到课程领域分类的结果,同时利用搜索引擎获取概念的搜索结果,提取其中的课程扩展概念,完成概念知识图谱的构建。本发明无需训练数据,可在课程文本这一特殊场景中获取准确且全面的概念,有效构建在线课程概念知识图谱。
-
公开(公告)号:CN110851669A
公开(公告)日:2020-02-28
申请号:CN201910987453.0
申请日:2019-10-17
申请人: 清华大学
IPC分类号: G06F16/903 , G06F16/29
摘要: 本发明公开了一种基于地理位置信息的机构命名排歧方法及装置,其中,该方法包括:对输入文本信息抽取生成机构信息集合,对输入文本信息挖掘生成具有地理位置指向性的信息,并结构化为地理位置指向性信息集合;根据机构信息集合、地理位置指向性信息集合和多地图API,将机构信息集合中的每个机构映射为不同的地理位置,将映射结果进行结构化生成结构化机构信息集合;根据相似度算法对结构化机构信息集合进行相似度计算,根据计算结果生成机构相似度矩阵;根据机构相似度矩阵判断机构信息集合中的不同机构是否属于同一机构,根据判断结果进行机构命名排歧,输出排歧结果。该方法能够辅助实现快速准确地实现学术成果中不同机构之间的命名排歧。
-
公开(公告)号:CN110851659A
公开(公告)日:2020-02-28
申请号:CN201911009191.7
申请日:2019-10-23
申请人: 清华大学
IPC分类号: G06F16/901 , G06F16/95
摘要: 本发明提出一种基于学者论文关系网络的学者学术影响力计算方法及系统,属于信息技术领域。该系统包括:论文抓取模块、学者论文关系网络构建模块、网络节点权重计算模块和学者学术影响力计算模块。该方法首先确定待评价学者,构造包含学者节点、论文节点以及对应边的学者论文关系网络;计算学者论文关系网络每个节点的权重;根据学者节点的权重以及学者节点之间的引用关系,计算待评价学者的学术影响力分值。本发明同时考虑学者发表的论文数量和质量,以及论文引用者对学者学术影响力的贡献,从而更公平全面地度量学者学术影响力。
-
公开(公告)号:CN110825942A
公开(公告)日:2020-02-21
申请号:CN201911003528.3
申请日:2019-10-22
申请人: 清华大学
IPC分类号: G06F16/951 , G06F17/18
摘要: 本发明提出一种论文质量的计算方法及系统,属于信息技术领域。该系统包括:论文抓取模块、预处理模块和论文质量计算模块。该方法首先建立论文历年被引频次和被引年份的集合;计算论文总被引频次,及论文历年被引频次的增长速率及均值;计算论文历年被引频次的高低变化波动值;分别对论文历年被引频次的增长速率均值和高低变化波动值进行归一化;最后得到论文质量分值。本发明可以客观准确地计算论文的质量分值,消除了人们主观感受、技术研究热度、引用动机复杂等因素对论文质量的影响,保证了结果的准确性和客观性,易于实现。
-
-
-
-
-
-
-
-
-