词嵌入表示学习方法及装置、文本召回方法及装置

    公开(公告)号:CN112100332A

    公开(公告)日:2020-12-18

    申请号:CN202010961808.1

    申请日:2020-09-14

    IPC分类号: G06F16/33 G06F40/289

    摘要: 本公开提供了一种词嵌入表示学习方法及装置、文本召回方法及装置,涉及人工智能领域。词嵌入表示学习方法包括:获取文本语料,对所述文本语料进行分词处理,并基于得到的分词和所述分词对应的发音信息构建图结构;以所述图结构中的各节点为初始节点,随机游走获取与所述初始节点对应的节点序列;根据所述节点序列对词嵌入表示模型进行训练以获取词嵌入查找表,并基于所述词嵌入查找表确定与所述文本语料对应的词嵌入表示。本公开能够根据分词和发音信息构建图,并基于图结构训练词嵌入,使得词形学接近的词语在词嵌入空间中具有相近的距离,避免了输入错误导致的召回文本错误的问题,提高了召回效率和召回质量,进而提升了用户体验。

    一种位置信息的表示方法、装置、电子设备和存储介质

    公开(公告)号:CN116150289A

    公开(公告)日:2023-05-23

    申请号:CN202111385442.9

    申请日:2021-11-22

    摘要: 本申请涉及计算机技术领域,尤其涉及一种位置信息的表示方法、装置、电子设备和存储介质,可应用于地图领域,用以提高位置信息嵌入表示的准确性。其中,方法包括:获取多个对象上报的位置服务数据,每个位置服务数据至少包括相应的上报时间及上报位置;基于各个上报时间,对各个上报位置进行轨迹聚类,获得至少一条轨迹;基于各个上报位置在地理空间上的区域关系,构建相应的图关系网络;根据图关系网络,以及至少一条轨迹,分别获得各个上报位置各自的目标嵌入表示信息。本申请利用上报位置在地理空间上的区域关系,实现了广泛区域内的位置表示学习,并且能够有效表征相似地理位置之间的关联性,提高了位置信息嵌入表示的准确性。

    模型分析方法、装置、计算机设备、介质及产品

    公开(公告)号:CN115130583A

    公开(公告)日:2022-09-30

    申请号:CN202210755806.6

    申请日:2022-06-29

    发明人: 张雨春

    IPC分类号: G06K9/62 G06N20/20

    摘要: 本申请提出一种模型分析方法、装置、计算机设备、介质及产品。该方法包括:获取目标业务场景中包含目标功能的待分析模型,以及用于对待分析模型的目标功能进行分析处理的样本特征集,样本特征集包含至少一个样本特征,目标功能是基于至少一个判别特征实现的;将任一样本特征与相应的判别特征进行特征比对,并基于特征比对结果确定出待分析模型的分析结果,分析结果用于反映任一判别特征在不同特征取值下影响待分析模型评分的重要程度;根据待分析模型的分析结果,在目标业务场景中对待分析模型采取目标业务操作。本申请可以对模型进行分析解读,并将分析结果与目标业务场景相结合,有助于提高模型的可解释性。

    文本内容的关系提取方法、装置、设备及存储介质

    公开(公告)号:CN112989024B

    公开(公告)日:2023-04-07

    申请号:CN202110334110.1

    申请日:2021-03-29

    摘要: 本申请公开了一种文本内容的关系提取方法、装置、设备及可读存储介质。涉及机器学习领域。该方法包括:获取目标文档和实体参数;以目标实体在目标文档的语句中的分布情况,确定目标实体之间的一跳关联关系;基于目标实体之间的一跳关联关系,确定目标实体之间的多跳关联关系;基于一跳关联关系和多跳关联关系提取目标文档中目标实体之间的实体关系。在一跳关联关系和多跳关联关系的基础上进行实体关系的预测,由于实体特征由一跳和多跳关联关系共同确定,也即通过多跳关联关系整合了多个句子之间的信息,便于模型在实体关系分析时进行跨句推理,避免了一跳关联关系的局限性,提高了实体关系的预测的准确性。

    别名生成方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN111507108A

    公开(公告)日:2020-08-07

    申请号:CN202010303948.X

    申请日:2020-04-17

    摘要: 本发明提供了一种别名生成方法、装置、电子设备及计算机可读存储介质;方法包括:基于名称中每个字的向量表示预测所述每个字所属的字段类型,得到所述名称包括的多个类型的字段;基于所述名称包括的多个类型的字段,生成多个候选别名;将所述名称分别与每个所述候选别名进行语义匹配,得到所述名称与每个所述候选别名之间的匹配结果;将满足匹配条件的匹配结果所对应的候选别名,确定为所述名称的别名。通过本发明,能够针对名称生成数量更多、更为精确的别名。

    规则生成方法、装置、计算机设备及存储介质

    公开(公告)号:CN116976661A

    公开(公告)日:2023-10-31

    申请号:CN202211681274.2

    申请日:2022-12-22

    发明人: 张雨春

    IPC分类号: G06Q10/0635 G06F21/64

    摘要: 本申请公开了一种规则生成方法、装置、计算机设备及存储介质,方法包括:获取至少一个特征集,一个特征集包含不同样本对象在一个特征维度下的特征值;基于特征值筛选规则及任一特征集中特征值的取值范围,在该特征集中进行特征值筛选处理,得到该特征集的筛选特征范围及该筛选特征范围对应筛选效果的指示参数;根据每个特征集对应的指示参数,从指示参数满足参数阈值的特征集中确定目标特征集,当对目标特征集的特征值进行合规性校验后,存在校验结果指示相应目标特征集中特征值满足目标风控场景的需求,基于得到的目标特征集的特征值及相应特征维度,生成目标风控场景的风险控制规则,该方法可以有效地生成目标风控场景下的风险控制规则。

    信息检索方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN111753060B

    公开(公告)日:2023-09-26

    申请号:CN202010741737.4

    申请日:2020-07-29

    摘要: 本申请实施例提供一种信息检索方法、装置、设备及计算机可读存储介质,其中,方法包括:对接收到的信息检索请求中的待检索信息进行文本分割处理,得到至少两个字段;获取所述待检索信息的特征向量和每一字段的子特征向量;在预设的全量文本空间内,根据所述特征向量对预设文本库中的文本进行第一聚类处理,得到第一数量的候选文本;在预设的子文本空间内,根据所述子特征向量对所述第一数量的候选文本进行第二聚类处理,得到第二数量的召回文本;将所述召回文本作为所述信息检索请求的检索结果,输出所述检索结果。通过本申请实施例,能够根据文本的语义相关度,灵活的度量待检索信息与召回文本之间的相似度,提高信息检索系统的检索准确性。

    别名生成方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN111507108B

    公开(公告)日:2021-03-19

    申请号:CN202010303948.X

    申请日:2020-04-17

    摘要: 本发明提供了一种别名生成方法、装置、电子设备及计算机可读存储介质;方法包括:基于名称中每个字的向量表示预测所述每个字所属的字段类型,得到所述名称包括的多个类型的字段;基于所述名称包括的多个类型的字段,生成多个候选别名;将所述名称分别与每个所述候选别名进行语义匹配,得到所述名称与每个所述候选别名之间的匹配结果;将满足匹配条件的匹配结果所对应的候选别名,确定为所述名称的别名。通过本发明,能够针对名称生成数量更多、更为精确的别名。

    信息检索方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN111753060A

    公开(公告)日:2020-10-09

    申请号:CN202010741737.4

    申请日:2020-07-29

    摘要: 本申请实施例提供一种信息检索方法、装置、设备及计算机可读存储介质,其中,方法包括:对接收到的信息检索请求中的待检索信息进行文本分割处理,得到至少两个字段;获取所述待检索信息的特征向量和每一字段的子特征向量;在预设的全量文本空间内,根据所述特征向量对预设文本库中的文本进行第一聚类处理,得到第一数量的候选文本;在预设的子文本空间内,根据所述子特征向量对所述第一数量的候选文本进行第二聚类处理,得到第二数量的召回文本;将所述召回文本作为所述信息检索请求的检索结果,输出所述检索结果。通过本申请实施例,能够根据文本的语义相关度,灵活的度量待检索信息与召回文本之间的相似度,提高信息检索系统的检索准确性。