-
公开(公告)号:CN111489019B
公开(公告)日:2024-05-31
申请号:CN202010242339.8
申请日:2020-03-31
申请人: 清华大学
摘要: 本公开涉及一种睡眠质量预测方法及装置,所述方法包括:获取目标用户在睡眠时刻之前的预设时间段内的用户信息,所述用户信息包括用户生理信息、用户活动信息、用户所在环境信息、用户饮食信息以及用户睡眠信息中的至少一种;根据所述目标用户的用户信息,通过预训练的睡眠质量预测模型对所述目标用户的睡眠质量进行预测,得到所述目标用户的睡眠质量预测结果;在所述睡眠质量预测结果不满足预设条件时,发送提示信息。本公开实施例的睡眠质量预测方法能够在睡前预测目标用户的睡眠质量,并在目标用户的睡眠质量不满足预设条件时发送提示信息。
-
公开(公告)号:CN111414539B
公开(公告)日:2023-09-01
申请号:CN202010197501.9
申请日:2020-03-19
申请人: 清华大学 , 智者四海(北京)技术有限公司
IPC分类号: G06N3/084 , G06F16/9535 , G06F16/435 , G06F16/335 , G06Q30/0601 , G06N3/048
摘要: 本公开涉及一种基于特征增强的推荐系统神经网络训练方法及装置,所述方法包括:将第一训练集中的多个第一样本,输入第t轮待训练的神经网络中进行处理,得到与多个第一样本对应的预测分值;根据多个第一样本的特征信息及与多个第一样本对应的预测分值,分别确定神经网络对各个属性的关注度;根据关注度阈值及神经网络对各个属性的关注度,分别确定各个属性的增强概率;根据第一增强率及增强概率,从多个第一样本的特征信息中,确定出待更新的特征信息;根据待更新的特征信息及噪声特征值,更新第一训练集中的第一样本,得到更新后的第二训练集;根据第二训练集,对神经网络进行第t轮训练。本公开的实施例可提高神经网络的鲁棒性。
-
公开(公告)号:CN111538830A
公开(公告)日:2020-08-14
申请号:CN202010350649.1
申请日:2020-04-28
申请人: 清华大学
IPC分类号: G06F16/34 , G06F16/335 , G06F16/338
摘要: 本公开涉及计算机技术领域,尤其涉及一种法条检索方法、装置、计算机设备及存储介质。所述方法包括:根据待查询案例的案情描述文本,生成待查询的文本摘要;获取候选法条集合;根据待查询的文本摘要和候选法条集合,调用预设检索模型输出得到多个候选法条各自对应的评分;根据多个候选法条各自对应的评分,显示至少两个候选法条。本公开实施例通过基于待查询案例的案情描述文本,计算机设备可以自动生成对应的文本摘要以进行检索,提高了检索的便利性。并且,通过调用预设检索模型得到多个候选法条各自对应的评分,由于评分用于指示候选法条与文本摘要之间的相关性,进而能够快速的确定出与文本摘要相关的法条,提高了检索的准确性。
-
公开(公告)号:CN111538827A
公开(公告)日:2020-08-14
申请号:CN202010350837.4
申请日:2020-04-28
申请人: 清华大学
IPC分类号: G06F16/335 , G06N3/04 , G06N3/08
摘要: 本公开涉及一种基于内容和图神经网络的判例推荐方法、装置及存储介质,所述方法包括:根据目标用户的日志数据,从判例库中确定出多个候选判例;根据所述目标用户的兴趣特征信息及所述多个候选判例的第一特征信息,分别预测所述目标用户对各个候选判例的评分,其中,所述兴趣特征信息包括目标用户的长期兴趣特征和短期兴趣特征,所述长期兴趣特征及所述第一特征信息是通过图神经网络确定的;根据所述评分及预设的推荐数量,确定向所述目标用户推荐的目标判例。根据本公开实施例的判例推荐方法能够有效提高判例推荐的准确性。
-
公开(公告)号:CN103064984B
公开(公告)日:2016-08-10
申请号:CN201310029963.X
申请日:2013-01-25
申请人: 清华大学 , 北京搜狗科技发展有限公司
IPC分类号: G06F17/30
摘要: 本发明提出一种垃圾网页的识别方法及系统。其中,方法包括:获取搜索引擎的查询日志并对查询日志进行预处理获得预处理查询日志;从预处理查询日志的多个查询和结果网页中筛选出查询的用户点击率和结果网页的出现次数大于阈值的查询?结果集合;从查询?结果集合中人工筛选提取出多个垃圾网页生成垃圾网页样例集合;根据查询?结果集合和垃圾网页样例集合计算查询?结果集合中每个结果网页的垃圾得分和每个查询的作弊得分;当结果网页的垃圾得分大于阈值则结果网页为垃圾网页,并将结果网页添加到垃圾网页集合中。根据本发明实施例的方法,通过搜索引擎查询日志发现和识别垃圾网页降低了算法复杂度,具有较好的推广性和适应性。
-
公开(公告)号:CN105630776A
公开(公告)日:2016-06-01
申请号:CN201510998012.2
申请日:2015-12-25
申请人: 清华大学
IPC分类号: G06F17/28
CPC分类号: G06F17/2827 , G06F17/289
摘要: 本发明涉及一种双向词语对齐方法及装置,其中,方法包括构建源语言到目标语言的第一词语对齐模型和目标语言到源语言的第二词语对齐模型;利用一致性评估函数,融合两个方向的词语对齐模型,构建初始目标函数;利用一致性评估函数,对两个方向的词语对齐模型进行联合训练,形成优化目标函数;利用优化目标函数及联合训练得到的模型,对平行双语句对进行词语对齐,得到双向词语对齐结果。系统包括词语对齐模型构建模块、目标函数构建模块、联合训练模块、词语对齐分析模块。通过本发明提供方法及装置,由于引入了一致性评估函数,能对两个方向的词语对齐模型进行联合训练,使两个方向的词语对齐模型相互纠错,极大的降低了词语对齐的错误率。
-
公开(公告)号:CN102156746A
公开(公告)日:2011-08-17
申请号:CN201110098378.6
申请日:2011-04-19
申请人: 清华大学 , 北京搜狗科技发展有限公司
IPC分类号: G06F17/30
摘要: 本发明提出一种搜索引擎的性能评价方法,包括以下步骤:对用户日志进行预处理,并从所述用户日志中获取待评价的查询集合;针对所述查询集合,在所述用户日志中提取相应的查询分类特征;根据所述查询分类特征,将所述查询集合分类成导航类查询集合和信息事务类查询集合;获取所述分类后的查询集合的用户行为特征;以及根据所述用户行为特征,分别对所述导航类查询集合和信息事务类查询集合进行用户满意判定。本发明的搜索引擎的性能评价方法的模型结构和参数简单,算法复杂度低,数据全面客观,评价真实可靠。
-
公开(公告)号:CN101576916B
公开(公告)日:2011-01-05
申请号:CN200910087076.1
申请日:2009-06-18
申请人: 清华大学 , 北京搜狗科技发展有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种获取同义词的方法及装置,属于计算机领域。所述方法包括:创建词与结果地址的匹配对的集合;将所述集合中的每个词作为待查找的词,根据所述待查找的词,从所述集合中查找匹配的结果地址;根据所述结果地址,从所述集合中查找与所述结果地址匹配的词,将所述查找到的词作为同义词。所述装置包括:创建模块、第一查找模块和第二查找模块。本发明能够更容易获取同义词,减少人力、物力资源以及提高算法效率。
-
公开(公告)号:CN116598004B
公开(公告)日:2023-11-28
申请号:CN202310869443.3
申请日:2023-07-17
申请人: 清华大学 , 中国医学科学院北京协和医院
IPC分类号: G16H50/30 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/08
摘要: 本申请涉及一种患病率的预测方法、装置、计算机设备和存储介质。所述方法包括:根据关键词表从搜索引擎的历史数据库中提取会话数据集;将会话数据集输入至会话分类模型中进行会话分类,得到分类结果;根据分类结果对会话数据集进行筛选,得到目标会话数据集;将目标会话数据集输入至预测模型中进行患病率预测,得到预测结果。采用本方法能够提高罕见病患病率的预测准确度。
-
公开(公告)号:CN116916097A
公开(公告)日:2023-10-20
申请号:CN202310799058.6
申请日:2023-06-30
申请人: 清华大学 , 中国移动通信集团有限公司研究院
IPC分类号: H04N21/442 , H04N21/466
摘要: 本发明提供一种推荐处理方法、装置及设备,涉及通信技术领域。该方法包括:获取用户播放历史视频的播放记录和视频信息元数据;对所述视频信息元数据进行分词处理,获得所述视频信息元数据中多个分词的词标识ID;根据所述播放记录和词ID,构建词图;根据所述播放记录、所述视频信息元数据、所述词ID和所述词图,进行语言预训练,获得第一查询信息;其中,所述第一查询信息包括词ID和词ID所对应分词的表征之间的映射关系;根据所述第一查询信息、所述播放记录和所述视频信息元数据,获得第二查询信息;其中,所述第二查询信息包括推荐对象ID和推荐对象ID所对应的表征之间的映射关系。
-
-
-
-
-
-
-
-
-