面向城市领域的大语言模型训练方法及城市生成式智能方法、装置

    公开(公告)号:CN118760898A

    公开(公告)日:2024-10-11

    申请号:CN202411245264.3

    申请日:2024-09-06

    申请人: 清华大学

    发明人: 徐丰力 李勇 冯杰

    摘要: 本公开涉及人工智能领域,尤其涉及面向城市领域的大语言模型训练方法及城市生成式智能方法、装置,所述训练方法包括:获取通用大语言模型以及初始数据集;通过在虚拟城市场景中设置智能体模拟人类在真实城市场景中的多种行为,得到复合数据集;将复合数据集与初始数据集混合为预训练数据集,并利用预训练数据集对通用大语言模型进行增量预训练,得到第一城市大模型;利用针对城市领域构建的微调数据集对第一城市大模型进行微调训练,得到第二城市大模型;利用人类偏好数据集对第二城市大模型进行偏好对齐训练,得到目标城市大模型。由此,能够得到具有城市领域专业知识、世界通用常识以及认知推理能力的目标城市大模型。

    基于元图的产品筛选方法、系统、设备及存储介质

    公开(公告)号:CN111815396B

    公开(公告)日:2024-05-31

    申请号:CN202010501385.5

    申请日:2020-06-04

    申请人: 清华大学

    摘要: 本发明实施例涉及产品智能化推荐技术领域,公开了基于元图的产品筛选方法、系统、设备及存储介质。本发明实施例先获取异构网络信息;将异构网络信息输入至预设产品筛选模型,输出产品分值;基于产品分值确定待推荐产品对应的产品信息;其中,预设产品筛选模型用于通过元图处理异构网络信息。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了推荐准确性较低的技术问题。此外,还可使用遗传算法框架,并同时结合预测操作与测试操作,以自动寻找更有利于产品推荐的元图。

    基于元图的产品筛选方法、系统、设备及存储介质

    公开(公告)号:CN111815396A

    公开(公告)日:2020-10-23

    申请号:CN202010501385.5

    申请日:2020-06-04

    申请人: 清华大学

    摘要: 本发明实施例涉及产品智能化推荐技术领域,公开了基于元图的产品筛选方法、系统、设备及存储介质。本发明实施例先获取异构网络信息;将异构网络信息输入至预设产品筛选模型,输出产品分值;基于产品分值确定待推荐产品对应的产品信息;其中,预设产品筛选模型用于通过元图处理异构网络信息。明显地,本发明实施例将应用异构网络信息来筛选待推荐产品,而非仅局限于用户与产品二者之间的交互,同时,还使用了元图过滤异构网络信息以辅助推荐行为,从而提升了推荐准确性,解决了推荐准确性较低的技术问题。此外,还可使用遗传算法框架,并同时结合预测操作与测试操作,以自动寻找更有利于产品推荐的元图。

    识别潜在注册用户的方法及装置
    14.
    发明公开

    公开(公告)号:CN110889716A

    公开(公告)日:2020-03-17

    申请号:CN201910935469.7

    申请日:2019-09-29

    IPC分类号: G06Q30/02 G06Q30/06 G06K9/62

    摘要: 本实施例提供一种识别潜在注册用户的方法及装置,该方法包括:获取第一预设时间段的用户画像数据及用户行为数据;对获取到的用户画像数据及用户行为数据进行特征提取;将提取的特征数据输入至预设的机器学习分类模型,获得第二预设时间段用户转化为注册用户的概率,并输出结果;其中,分类模型根据已确定注册转化结果的样本数据进行训练后得到。该方法不仅对用户画像此类静态数据进行分析,还对用户行为数据此类动态数据进行分析,能够全面客观的反应用户成为注册用户的潜在可能性。将提取的特征数据输入至机器学习分类模型,获得用户转化为注册用户的概率,能够有效提高预测的时效性,且能够对每个用户进行预测,对用户的定向营销效果较强。

    基于大语言模型的异质图元结构发现方法及系统

    公开(公告)号:CN118673103B

    公开(公告)日:2024-10-29

    申请号:CN202411164473.5

    申请日:2024-08-23

    申请人: 清华大学

    发明人: 李勇 徐丰力

    摘要: 本发明涉及人工智能技术领域,提供一种基于大语言模型的异质图元结构发现方法及系统,该方法包括:确定异质图的候选元结构;将异质图的候选元结构输入元结构选择的大语言模型,得到元结构选择的大语言模型输出的选择的元结构;基于遗传算法对选择的元结构进行优化,重复迭代执行确定异质图的候选元结构的步骤和输入元结构选择的大语言模型的步骤,直至完成预设迭代次数,得到发现的元结构;将发现的元结构输入差分解释的大语言模型,得到差分解释的大语言模型输出的语义解释。本发明利用大语言模型的推理能力,以下游任务需求为导向,能够实现兼顾预测性能与可解释性的元结构发现,通用性较强。

    基于大语言模型的人类移动行为生成方法及系统

    公开(公告)号:CN118673102A

    公开(公告)日:2024-09-20

    申请号:CN202411164470.1

    申请日:2024-08-23

    申请人: 清华大学

    摘要: 本发明涉及人工智能技术领域,提供一种基于大语言模型的人类移动行为生成方法及系统,该方法基于人物画像数据库,确定上下文感知的提示词;基于上下文感知的提示词,使用大语言模型的思维链机制,推理生成完整的移动意图模板;输入完整的移动意图模板至预训练的机制模型,获得机制模型输出的映射到真实地理位置的人类移动行为;机制模型用于基于与完整的移动意图模板对应的移动距离,对完整的移动意图模板进行真实地理位置映射。本发明利用人物画像来指定大语言模型所扮演的角色,再通过大语言模型的逐步推理来生成高层次的移动意图,最后用机制模型将抽象意图模板映射到真实地理位置,能够实现准确、高效、富语义感知的人体移动行为生成。