-
公开(公告)号:CN118760898A
公开(公告)日:2024-10-11
申请号:CN202411245264.3
申请日:2024-09-06
申请人: 清华大学
IPC分类号: G06F18/214 , G06F40/289 , G06F40/35 , G06N5/025
摘要: 本公开涉及人工智能领域,尤其涉及面向城市领域的大语言模型训练方法及城市生成式智能方法、装置,所述训练方法包括:获取通用大语言模型以及初始数据集;通过在虚拟城市场景中设置智能体模拟人类在真实城市场景中的多种行为,得到复合数据集;将复合数据集与初始数据集混合为预训练数据集,并利用预训练数据集对通用大语言模型进行增量预训练,得到第一城市大模型;利用针对城市领域构建的微调数据集对第一城市大模型进行微调训练,得到第二城市大模型;利用人类偏好数据集对第二城市大模型进行偏好对齐训练,得到目标城市大模型。由此,能够得到具有城市领域专业知识、世界通用常识以及认知推理能力的目标城市大模型。
-
公开(公告)号:CN111815396B
公开(公告)日:2024-05-31
申请号:CN202010501385.5
申请日:2020-06-04
申请人: 清华大学
IPC分类号: G06Q30/0601 , G06N3/045 , G06N3/082 , G06N3/086
摘要: 本发明实施例涉及产品智能化推荐技术领域,公开了基于元图的产品筛选方法、系统、设备及存储介质。本发明实施例先获取异构网络信息;将异构网络信息输入至预设产品筛选模型,输出产品分值;基于产品分值确定待推荐产品对应的产品信息;其中,预设产品筛选模型用于通过元图处理异构网络信息。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了推荐准确性较低的技术问题。此外,还可使用遗传算法框架,并同时结合预测操作与测试操作,以自动寻找更有利于产品推荐的元图。
-
公开(公告)号:CN111815396A
公开(公告)日:2020-10-23
申请号:CN202010501385.5
申请日:2020-06-04
申请人: 清华大学
摘要: 本发明实施例涉及产品智能化推荐技术领域,公开了基于元图的产品筛选方法、系统、设备及存储介质。本发明实施例先获取异构网络信息;将异构网络信息输入至预设产品筛选模型,输出产品分值;基于产品分值确定待推荐产品对应的产品信息;其中,预设产品筛选模型用于通过元图处理异构网络信息。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了推荐准确性较低的技术问题。此外,还可使用遗传算法框架,并同时结合预测操作与测试操作,以自动寻找更有利于产品推荐的元图。
-
公开(公告)号:CN110889716A
公开(公告)日:2020-03-17
申请号:CN201910935469.7
申请日:2019-09-29
申请人: 清华大学 , 杭州微拓科技有限公司
摘要: 本实施例提供一种识别潜在注册用户的方法及装置,该方法包括:获取第一预设时间段的用户画像数据及用户行为数据;对获取到的用户画像数据及用户行为数据进行特征提取;将提取的特征数据输入至预设的机器学习分类模型,获得第二预设时间段用户转化为注册用户的概率,并输出结果;其中,分类模型根据已确定注册转化结果的样本数据进行训练后得到。该方法不仅对用户画像此类静态数据进行分析,还对用户行为数据此类动态数据进行分析,能够全面客观的反应用户成为注册用户的潜在可能性。将提取的特征数据输入至机器学习分类模型,获得用户转化为注册用户的概率,能够有效提高预测的时效性,且能够对每个用户进行预测,对用户的定向营销效果较强。
-
公开(公告)号:CN110196891A
公开(公告)日:2019-09-03
申请号:CN201811361868.9
申请日:2018-11-15
申请人: 腾讯大地通途(北京)科技有限公司 , 腾讯科技(深圳)有限公司 , 清华大学
IPC分类号: G06F16/29
摘要: 本发明公开了一种街区类型的确定方法、装置、存储介质及电子装置。其中,该方法包括:在客户端上获取到第一请求,其中,第一请求用于请求获取目标街区的类型;响应第一请求获取目标街区的类型,其中,目标街区的类型根据街区之间已产生的帐号轨迹数据产生,帐号轨迹数据包括:具有关联关系的帐号、帐号产生的运动轨迹、运动轨迹经过的街区和运动轨迹产生的时间,街区包括目标街区;在客户端上显示目标街区的类型。本发明解决了相关技术对街区类型进行识别的准确性较低的技术问题。
-
公开(公告)号:CN118673103B
公开(公告)日:2024-10-29
申请号:CN202411164473.5
申请日:2024-08-23
申请人: 清华大学
IPC分类号: G06F16/33 , G06F16/35 , G06F16/901 , G06F16/906
摘要: 本发明涉及人工智能技术领域,提供一种基于大语言模型的异质图元结构发现方法及系统,该方法包括:确定异质图的候选元结构;将异质图的候选元结构输入元结构选择的大语言模型,得到元结构选择的大语言模型输出的选择的元结构;基于遗传算法对选择的元结构进行优化,重复迭代执行确定异质图的候选元结构的步骤和输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将发现的元结构输入差分解释的大语言模型,得到差分解释的大语言模型输出的语义解释。本发明利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。
-
公开(公告)号:CN118673102A
公开(公告)日:2024-09-20
申请号:CN202411164470.1
申请日:2024-08-23
申请人: 清华大学
IPC分类号: G06F16/33 , G06F16/9537 , G06Q50/50 , G06N5/04
摘要: 本发明涉及人工智能技术领域,提供一种基于大语言模型的人类移动行为生成方法及系统,该方法基于人物画像数据库,确定上下文感知的提示词;基于上下文感知的提示词,使用大语言模型的思维链机制,推理生成完整的移动意图模板;输入完整的移动意图模板至预训练的机制模型,获得机制模型输出的映射到真实地理位置的人类移动行为;机制模型用于基于与完整的移动意图模板对应的移动距离,对完整的移动意图模板进行真实地理位置映射。本发明利用人物画像来指定大语言模型所扮演的角色,再通过大语言模型的逐步推理来生成高层次的移动意图,最后用机制模型将抽象意图模板映射到真实地理位置,能够实现准确、高效、富语义感知的人体移动行为生成。
-
公开(公告)号:CN110196891B
公开(公告)日:2024-03-15
申请号:CN201811361868.9
申请日:2018-11-15
申请人: 腾讯大地通途(北京)科技有限公司 , 腾讯科技(深圳)有限公司 , 清华大学
IPC分类号: G06F16/29
摘要: 本发明公开了一种街区类型的确定方法、装置、存储介质及电子装置。其中,该方法包括:在客户端上获取到第一请求,其中,第一请求用于请求获取目标街区的类型;响应第一请求获取目标街区的类型,其中,目标街区的类型根据街区之间已产生的帐号轨迹数据产生,帐号轨迹数据包括:具有关联关系的帐号、帐号产生的运动轨迹、运动轨迹经过的街区和运动轨迹产生的时间,街区包括目标街区;在客户端上显示目标街区的类型。本发明解决了相关技术对街区类型进行识别的准确性较低的技术问题。
-
-
-
-
-
-
-