一种基于特征继承的实体关系抽取方法、装置及存储介质

    公开(公告)号:CN115794986A

    公开(公告)日:2023-03-14

    申请号:CN202211615674.3

    申请日:2022-12-15

    摘要: 本申请涉及一种基于特征继承的实体关系抽取方法,其包括:S1:对输入文本进行实体抽取,获得实体的有效特征,所述实体的有效特征包括实体、实体类型以及实体在原文本中的位置;S2:对输入文本进行词性分析,得到句子的词性结果;S3:根据获得的实体的有效特征和词性结果构建三元组特征;S4:将三元组特征输入关系分类网络中,并输出分类结果。本申请提出了一种基于特征继承的实体关系抽取方法,该方法将第一阶段的其他有效特征也传递到第二阶段,因为这些特征都准确率高,所以这样的特征会大大增强了第二阶段关系分类的效果。然后将这些特征通过带有注意力机制的网络层进行各类特征的权重学习,可以有效提升关系抽取效果。

    一种面向多源异构数据源的统一健康检测方法及其系统

    公开(公告)号:CN116860847A

    公开(公告)日:2023-10-10

    申请号:CN202310776959.3

    申请日:2023-06-28

    摘要: 本发明提出了一种面向多源异构数据源的统一健康检测方法及其系统,包括:响应于第三方应用发起的数据源请求,所述请求调用数据源检测控制层接口;所述数据源检测控制层接口接收到该检测信息请求后,调用数据源管理服务类接口;根据预设的校验规则对传参进行校验后,进行核心交互流程;最后将核心交互检测返回的数据源检测结果Map返回给所述数据源管理服务类接口,再返回给所述数据源检测控制层接口,最终返回第三方应用。本方法在近年智慧城市等省级实战建模工作中多次得到验证,在实际建模过程中通过调用面向多源异构数据源的统一健康检测接口能够快速响应多源的连接测试检测任务请求,为解决多源数据库的连接检测问题起到缩时增效的作用。

    一种用于轻客户端的Spark作业提交方法和系统

    公开(公告)号:CN115934286A

    公开(公告)日:2023-04-07

    申请号:CN202211667536.X

    申请日:2022-12-23

    摘要: 公开了用于轻客户端的Spark作业提交方法和系统,包括动态代理接收到前端用户发送的作业处理请求,选择第一后端服务处理请求;第一后端服务将请求写入消息队列,通知前端用户请求提交成功进入调度队列等待处理;集群中空闲的第二后端服务从消息队列中获取请求,第二后端服务利用Spark驱动进程调用集执行器对请求进行调度执行,定时将处理进度、结果和采样数据写入NoSQL数据库;前端用户接收到请求提交成功信息后向动态代理发送获取实时进度和处理结果的请求,动态代理根据请求信息,选择第三后端服务处理,从数据库中获取实时进度和处理结果返回前端用户。本申请能够减轻边缘节点服务器的资源使用负担,降低故障发生频率,高效地实现轻客户端的交互效果。

    一种基于检验统计量的高维数据流变点检验方法及系统

    公开(公告)号:CN114239747A

    公开(公告)日:2022-03-25

    申请号:CN202111581957.6

    申请日:2021-12-22

    IPC分类号: G06K9/62

    摘要: 本申请提出了一种基于检验统计量的高维数据流变点检验方法及系统,包括:利用WBS2将高维数据流随机分成若干个完整的数据子集;计算数据子集区间的检验统计量值Lt,输出最大检验统计量值的数据点位置,将数据点作为候选点添加至变点候选集中;利用候选点将数据子集一分为二,在候选点的左右两侧再次递归抽取数据子集;重复上述步骤,直到数据子集的长度达到最小长度阈值;计算每个候选点对应的检验统计量值的累加和V,将累加和V除以标准差所得的商V/sv与检验阈值Zα比较;若所得的商V/sv大于检验阈值Zα,则认定该候选点为变点,输出变点的个数和位置。结合了高维数据流的时空依赖性,能够检验和估计位于时间序列边界上的变点,准确率和鲁棒性更高且速度更快。