基于企业征信大数据知识图谱的企业风险检测方法和装置

    公开(公告)号:CN114817557A

    公开(公告)日:2022-07-29

    申请号:CN202210302732.0

    申请日:2022-03-24

    Abstract: 本发明公开了基于企业征信大数据知识图谱的企业风险检测方法和装置,其中,该方法包括:通过分散数据子域数据构建企业征信大数据统一信息模型;基于企业征信大数据统一信息模型,利用自顶向下方式构建第一企业征信大数据领域本体;以及通过自底向上的构建方式对企业征信大数据领域中的数据进行实体抽取和关系抽取,选取优质新词扩充第一企业征信大数据领域本体规模,以构建第二企业征信大数据领域本体;基于构建好的本体,利用企业征信大数据构建企业征信大数据知识图谱,通过知识图谱进行特征获取,将获取的特征数据输入训练好的风控模型输出分类结果,并用于分类企业。本发明提升了企业征信领域知识图谱本体的精确性,提升了风控模型的性能。

    基于Web和Kafka的分布式数据集成系统及方法

    公开(公告)号:CN111061715B

    公开(公告)日:2022-07-01

    申请号:CN201911297173.3

    申请日:2019-12-16

    Abstract: 本发明公开了一种基于Web和Kafka的分布式数据集成系统及方法,其中,系统包括:控制台模块,用于为用户提供控制台,使得用户以Web页面操作的形式进行ETL任务的创建和监控;管理服务模块,用于为控制台模块提供管理服务API;模式管理模块,用于管理数据源端的schema和目的地端的schema及其映射;数据抽取模块,用于将管理数据源端的数据抽取数据到消息队列;数据处理模块,用于对数据进行清洗和转换;数据加载模块,用于将数据从消息队列加载到目的地。该系统使得基于Kafka Connect创建ETL实例的过程操作更简单、管理更规范、配置更灵活,并且使得ETL程序耦合度低、容错性高,易于扩展和集成。

    基于嵌入增强和自适应的小样本图像增量分类方法及装置

    公开(公告)号:CN114549894A

    公开(公告)日:2022-05-27

    申请号:CN202210067078.X

    申请日:2022-01-20

    Abstract: 本发明提出一种基于嵌入增强和自适应的小样本图像增量分类方法,该方法包括:获取图像增量分类系统,该系统用于对待分类图像进行分类任务;获取待分类图像,并上传至系统进行识别,在系统识别失败时,获取该类别少量图像作为训练样本,并将其通过特征预训练模块计算得到目标原型,并通过混合关系映射模块对目标原型和/或原始原型进行自适应调整,以更新系统中所有原型,实现对该类别待分类图像的分类识别;在系统识别成功时,将待分类图像通过特征预训练模块、混合关系映射模块和分类器进行分类识别,并输出分类结果。该方法用于增强分类器的可扩展性,以及引入混合关系映射机制,优化样本的原型表示,使系统逐渐适用于所有可见类图像的识别。

    通用可配置、兼容多模型、领域可迁移的多轮对话系统

    公开(公告)号:CN111414195B

    公开(公告)日:2022-03-25

    申请号:CN201910108762.6

    申请日:2019-02-03

    Abstract: 本发明公开了一种通用可配置、兼容多模型、领域可迁移的多轮对话系统,包括:可配置模块用于根据当前所在领域的专业知识进行自定义的配置;对话理解模块用于通过对话理解对用户语句进行语义编码,并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取;对话状态跟踪模块用于获取当前多轮历史的对话状态信息;策略学习模块,用于通过对话策略模型进行动作决策;对话生成模块用于根据相应的动作进行对话生成;在线训练模块用于作为用户模拟器提供给开发人员,并进行模型的在线迭代更新和生成可用的数据。该系统整体架构模块通用,适应不同应用场景,各字段参数通用可配置,可随意接受语料,对话理解、对话策略模型可灵活扩展更换。

    基于知识图谱的时序可视化开发方法及系统

    公开(公告)号:CN114036311A

    公开(公告)日:2022-02-11

    申请号:CN202111314947.6

    申请日:2021-11-08

    Abstract: 本公开提供的基于知识图谱的时序可视化开发方法、系统及存储介质中,获取数据请求,然后通过查询模板将数据请求生成查询语句,并基于查询语句进行查询,再将查询得到的结果按照时间进行排序,根据时间序列渲染时间轴,获取时间轴上的时间节点的数据请求,并查询符合时间节点的数据,对查询到的时间节点对应的数据进行索引标记,对数据进行可视化渲染,再输出渲染后的数据。由此可知,本公开提出的方法中,实现了基于时间轴的知识图谱动态可视化展示,提升了数据查询效率,减少了查询所花费的时间。同时,可以根据数据的状态仅对发生变化的数据进行重新渲染,无需对全部数据进行重新渲染,从而提升了渲染效率,降低了渲染耗费时长。

    自定义的数据库交互的对话生成方法及系统

    公开(公告)号:CN110096516B

    公开(公告)日:2022-01-28

    申请号:CN201910225496.5

    申请日:2019-03-25

    Abstract: 本发明公开了一种自定义的数据库交互的对话生成方法及系统,方法包括:获取上一对话轮次的动作,若动作为接收操作动作,接收用户输入文本,通过自然语言理解模块提取用户输入文本的意图和实体来更新对话状态生成当前对话信息;将更新的对话状态转换为二进制的向量,并同步更新到历史对话信息中,根据当前对话信息和历史对话信息生成执行动作;若执行动作不为接收操作动作,判断执行动作是否需要对数据库进行检索;如果需要,将用户期望作为检索条件对数据库进行检索,将检索结果融合预设模板生成对用户的回复动作;如果不需要,则直接从预定义的模板中任选一个生成对用户的回复动作。该方法用户对数据库查询结果进行自主选择,提升了用户体验。

    适用于语法分析的置信度评估方法及装置

    公开(公告)号:CN110222148B

    公开(公告)日:2021-05-04

    申请号:CN201910412570.4

    申请日:2019-05-17

    Abstract: 本发明公开了一种适用于语法分析的置信度评估方法及装置,其中,方法包括以下步骤:获取训练数据,并根据训练数据训练从逻辑形式到自然语言的翻译模型;通过翻译模型捕捉逻辑形式与自然语言之间的映射关系,获取输入数据的自然语义和预测的解析结果,预估得到数据不确定性;通过置信度估计算法得到每个输出结果的模型不确定性,其中,对于数据的不确定性,对基础模型的后验概率输出和置信度特征连结,并通过编码器得到其抽象表示,并学习标签的转换概率,得到输入数据的置信度。该方法可以有效的提高模型预测精度,并且在实际场景中能给出预测结果解释性。

    一种融入外部知识的端到端对话方法及系统

    公开(公告)号:CN110188167B

    公开(公告)日:2021-03-30

    申请号:CN201910412757.4

    申请日:2019-05-17

    Abstract: 本发明公开了一种融入外部知识的端到端对话方法及系统,其中,该方法包括:获取输入文本信息;获取与输入文本信息对应的对话历史信息,对对话历史信息进行编码,生成历史信息向量;获取数据库信息,通过外部数据库接入模块的多头键值对记忆网络对数据库信息进行编码,生成数据库向量;对输入文本信息进行编码,并根据历史信息向量和数据库向量生成文本回复。该方法搭建一个完全基于注意力机制的对话系统,降低模型训练时间,从多个维度提取知识库信息,增强知识库检索能力。

    对话管理方案和对话管理语料的构建方法

    公开(公告)号:CN112199477A

    公开(公告)日:2021-01-08

    申请号:CN202010923864.6

    申请日:2020-09-04

    Abstract: 本申请公开了一种对话管理方案和对话管理语料的构建方法,其中,方法包括:根据对话场景、定义意图、词槽和/或动作构建基于规则的对话流树;遍历对话流树,转化成对话管理训练语料的格式,以构建与对话流树能力相适应的对话管理模型;在开发阶段,通过与用户模拟器或人工智能训练师进行交互,并在人机对话体验达到预设效果后,通过上线运行收集用户的真实交互数据,并且引入用户的反馈,持续不断地迭代增强对话管理模型,以实现对话管理。本申请实施例的对话管理方案和对话管理语料的构建方法,采用对话流的开发模式相比于相关技术中的纯技能开发模式具有设计思路更清晰、表达更直观、开发更高效等特点,从而既能作为融入专家知识的规则,又能够解决对话管理语料生成或构造困难的问题。

Patent Agency Ranking