-
公开(公告)号:CN117786061B
公开(公告)日:2024-06-04
申请号:CN202311675342.9
申请日:2023-12-06
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/08
Abstract: 本说明书公开了一种基于时空注意力机制的大语言模型预测方法及装置,可以用于处理目标实体及部分关联实体的下游预测任务,包括:通过将目标实体及关联实体的初始特征和动态知识图谱输入到空间注意力网络中得到空间拓扑特征;将空间拓扑特征输入到时序注意力网络中得到时空特征;利用目标实体及部分关联实体的时空特征生成隐式提示,并将目标实体的显式的事件文本合并生成提示信息;将提示信息输入给大语言模型,保持大语言模型的参数固定不变,利用下游预测任务的标注信息和损失函数来训练空间注意力网络和时序注意力网络;最后根据训练好的网络来处理目标实体及部分关联实体的下游预测任务。
-
公开(公告)号:CN113837886B
公开(公告)日:2024-05-31
申请号:CN202111085743.X
申请日:2021-09-16
Applicant: 之江实验室
Abstract: 本发明公开了一种基于知识图谱的车险理赔欺诈风险识别方法和系统,该方法通过解析、拆分历史车险案件的结构化数据,根据车险理赔反欺诈业务场景、理赔流程设计的本体,历史案件实例化为案件知识图谱后,使用子图关键节点筛选和图点集向量化,建立多个案件间高欺诈风险筛选模型。该方法将不同时间段的车险理赔案件放于同一知识图谱中,通过分析不同时间、相似节点特征,串联关联案件,从而提示新提交车险案件风险等级。该方法对新提交车险案件进行欺诈风险评估,提供历史关联或相似案件作为风险点参考,提高车险理赔业务欺诈案件治理能力。
-
公开(公告)号:CN117252555B
公开(公告)日:2024-04-09
申请号:CN202311507842.1
申请日:2023-11-14
Applicant: 之江实验室
Abstract: 本申请涉及一种基于车险场景的半自动化特征工程方法、系统和介质,其中,基于车险场景的半自动化特征工程方法包括:对各所述数据表中各字段进行分类,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果,提高了车险事件识别的精确度。
-
公开(公告)号:CN117391081A
公开(公告)日:2024-01-12
申请号:CN202311409794.2
申请日:2023-10-27
Applicant: 之江实验室
IPC: G06F40/289 , G06F40/216 , G06F18/213 , G06F18/24
Abstract: 本申请涉及一种跨系统表单文本处理方法、装置及可读存储介质,所述方法包括:获取历史基准表单,以及所述历史基准表单中的基准字段;获取历史从属表单,以及所述历史从属表单中与所述基准字段对应的从属字段;对所述历史基准表单中所述基准字段对应的文本数据和所述历史从属表单中所述从属字段对应的文本数据进行比较,生成文本映射表,所述文本映射表包括至少一个文本对,所述文本对包括互相映射的标准文本和非标准文本;基于所述文本映射表,将所述历史从属表单和新增从属表单中所述从属字段对应的非标准文本替换为对应的标准文本,解决了跨系统表单的数据一致性较差的问题,提高了表单数据的应用价值。
-
公开(公告)号:CN116578877B
公开(公告)日:2023-12-26
申请号:CN202310867387.X
申请日:2023-07-14
Applicant: 之江实验室
IPC: G06F18/214 , G06Q10/0635
Abstract: 本说明书公开了一种模型训练及二次优化打标的风险识别的方法及装置,通过根据风险识别模型所确定出的低于预设风险阈值的数据,来对辅助模型进行训练。并将风险识别模型与训练所得到的辅助模型相结合,来判断用户所执行的目标业务对应的业务数据是否存在风险。从而保证对于该目标业务是否存在风险的判断的准确性。
-
公开(公告)号:CN117273959A
公开(公告)日:2023-12-22
申请号:CN202311198226.2
申请日:2023-09-15
Applicant: 之江实验室
Abstract: 本申请涉及一种理赔事件检测方法、计算机设备和存储介质,在于当前时间戳的图网络中嵌入新增节点的情况下,从历史节点中筛选目标节点,并根据新增节点和目标节点,生成随机游走路径;其中,图网络基于理赔事件构建得到,目标节点包括与新增节点相关的历史节点和/或节点权重不低于阈值的历史节点,历史节点为于当前时间戳之前在图网络中嵌入的节点;将随机游走路径输入至训练好的词向量模型,输出对应于当前时间戳的节点向量表示;根据节点向量表示,确定对应于当前时间戳的新增理赔事件是否属于欺诈事件。通过本申请,可以降低计算复杂度,提升检测实时性。
-
公开(公告)号:CN117252555A
公开(公告)日:2023-12-19
申请号:CN202311507842.1
申请日:2023-11-14
Applicant: 之江实验室
Abstract: 本申请涉及一种基于车险场景的半自动化特征工程方法、系统和介质,其中,基于车险场景的半自动化特征工程方法包括:对各所述数据表中各字段进行分类,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果,提高了车险事件识别的精确度。
-
公开(公告)号:CN117172720A
公开(公告)日:2023-12-05
申请号:CN202311388196.1
申请日:2023-10-24
Applicant: 之江实验室
Abstract: 本申请涉及一种审计疑点追踪排查方法、系统、计算机设备和存储介质。所述方法包括:获取审计疑点的排查方向并选择排查策略;若选择定制化排查策略,则基于大模型提示词样例,确定审计疑点的排查方向对应的定制化排查步骤,基于审计工具链表依次执行定制化排查步骤直至排查次数达到设定阈值,输出排查结果;若选择自动化排查策略,则利用大模型对审计疑点的排查方向进行拆解得到对应的自动化排查步骤;基于审计工具链表依次执行自动化排查步骤直至依次执行时返回的中间结果与预设结果相匹配或排查次数达到设定阈值,输出排查结果。采用本方法能够实现对用户无感且步骤可控的审计疑点排查,提高审计疑点的排查效率和排查透明性。
-
公开(公告)号:CN117131070A
公开(公告)日:2023-11-28
申请号:CN202311404243.7
申请日:2023-10-27
Applicant: 之江实验室
IPC: G06F16/242 , G06F40/30 , G06F40/242
Abstract: 本发明公开了一种自适应规则引导的大语言模型生成SQL系统,包括:表结构构建模块,用于列名标准化和列名字典构建;参考规则库构建模块用于构建参考规则库,包括表和列名筛选子模块、列条件抽取子模块、合并表嵌套子模块、SQL片段生成子模块、校验子模块;常用规则库中包含实际业务场景中常用的Text到SQL的各个步骤和推理逻辑;自适应规则构建模块用于构建与Text查询语句匹配的自适应规则;规则引导SQL生成模块根据自适应规则,引导大语言模型逐步生成SQL语句。本发明能帮助非数据库技术人员实现自然语言查询转SQL语句,并避免隐含条件和模糊语义引起的列数据筛选条件错误等问题。
-
公开(公告)号:CN117033554A
公开(公告)日:2023-11-10
申请号:CN202311033090.X
申请日:2023-08-16
Applicant: 之江实验室
IPC: G06F16/33 , G06F16/332 , G06F40/30 , G06F40/289 , G06F18/214
Abstract: 本申请涉及一种数据分析方法、装置、计算机设备以及存储介质。所述方法包括:根据公开的语义解析数据集、目标领域的历史数据分析数据集、数据表结构和数据字典对列表自然语言预训练模型进行模型训练,确定数据分析模型;根据标准数据分析要素和历史数据分析数据集,对循环神经网络模型进行训练,确定分析请求解析模型;通过分析请求解析模型,基于数据表结构和数据字典对目标数据分析请求进行解析,确定目标数据分析请求对应的目标数据分析要素;通过数据分析模型,根据目标数据分析要素确定目标数据分析请求对应的目标结构化查询语言,并运行目标结构化查询语言,确定目标数据分析请求所对应的数据分析结果。上述方法可以提高数据分析的准确性。
-
-
-
-
-
-
-
-
-