-
公开(公告)号:CN117332147A
公开(公告)日:2024-01-02
申请号:CN202311271573.3
申请日:2023-09-28
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/9535 , G06F21/62 , G06F18/214
Abstract: 本发明涉及人工智能技术领域,具体提供了一种用于用户检索的隐私保护方法及装置,包括:获取用户检索特征信息对应的向量信息;将用户检索特征信息对应的向量信息作为多个预先构建的隐私判断模型,得到多个预先构建的隐私判断模型输出的判断结果;采用权重投票的方式在多个预先构建的隐私判断模型输出的判断结果选择最终判断结果。本发明提供的技术方案,采用训练多个模型投票的方式进行训练,通过多个模型提高模型泛化能力,还可以提升预测精度。
-
公开(公告)号:CN117421412A
公开(公告)日:2024-01-19
申请号:CN202311498699.4
申请日:2023-11-10
Applicant: 国家电网有限公司大数据中心
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06F40/289 , G06F18/2433 , G06N3/0455 , G06N3/084
Abstract: 一种搜索场景下用户动态特征捕获与标签生成方法及系统,包括:基于预先设定的标签按照设定比例获取用户的搜索问句构建样本集;基于所述样本集结合预先构建的用户特征相似度判断模型进行计算,得到所述搜索问句的相似度;基于所述搜索问句的相似度结合预先设定的阈值进行判定和流式聚类,得到新的标签;其中,所述用户特征相似度判断模型是以搜索问句的相似度为输出,基于所述样本集结合双塔模式训练得到的;本发明采用用户特征相似度模型可以有效解决搜索场景下用户搜索内容的复杂性、多样性和模糊性的问题,还解决了用户特征难以捕获的问题;本发明挺贵流式聚类提取新的标签,可以让标签更详细,减少计算的复杂度。
-
公开(公告)号:CN115544273A
公开(公告)日:2022-12-30
申请号:CN202211324149.6
申请日:2022-10-27
Applicant: 国家电网有限公司大数据中心
Abstract: 本发明公开了一种实体关系抽取方法、装置、设备及存储介质。通过将句子样本集输入初始实体关系抽取模型得到至少一个第一实体关系集群,以及第一实体关系集群所包含的句子样本的伪标签;根据具有伪标签的句子样本更新句子样本集,将更新后的句子样本集输入初始实体关系抽取模型得到至少一个第二实体关系集群,以及第二实体关系集群所包含的句子样本的预测标签;根据句子样本对应的伪标签和预测标签计算损失函数值,并基于损失函数值对初始实体关系抽取模型中的网络参数进行迭代调整,得到目标实体关系抽取模型,能够实现无需人工标记的实体关系抽取方法。
-
-