基于Mixup和BQRNN的法律命名实体识别方法

    公开(公告)号:CN114372465B

    公开(公告)日:2024-09-20

    申请号:CN202111152985.6

    申请日:2021-09-29

    摘要: 本发明公开了一种基于Mixup和BQRNN的法律文书的命名实体识别方法,包括步骤:使用BERT预训练模型对训练集的法律判决文书进行向量化处理;使用Mixup数据增强方法在词向量表示层面对训练集规模进行扩充;使用BQRNN双向准循环神经网络对增强后的词向量表示进行处理,提取法律文本中带有上下文特征的深层特征向量,并输出相应的实体标签序列;使用CRF条件随机场解码,最后将概率最大的实体标签序列,作为训练结果输出,并生成相应训练模型;将训练模型在测试集上进行测试,调整训练模型参数信息,直至选取稳定前,指标性能最好的识别模型;输入中文法律文书案列,识别模型自动进行判断并输出法律文书中的法律实体。

    一种基于能耗预测的边端协同AI模型推理方法

    公开(公告)号:CN117331699A

    公开(公告)日:2024-01-02

    申请号:CN202311330737.5

    申请日:2023-10-13

    摘要: 本发明公开了一种基于能耗预测的边端协同AI模型推理方法,包括:将若干AI模型整合成AI统合模型;采集AI统合模型各类型层时延与能耗数据,形成时延与能耗数据集;构建AI统合模型各类型层时延与能耗预测模型;计算得到传输时延与能耗理论值;计算得到推理过程的总时延与总能耗;根据传输时延与能耗理论值、推理过程的总时延与总能耗,构建全局预测模型;根据全局预测模型预测全局时延与能耗;通过贪心算法找到最优分割点;执行推理,进行到最优分割点时,将推理数据和分割点索引传输给边缘服务器;边缘服务器继续推理,完成推理后将推理结果传输给终端,推理任务结束。本发明在保证时延的前提下将能耗作为优化目标,降低了应用AI模型所带来的能耗。

    基于级联模型和数据增强的法律命名实体识别方法及系统

    公开(公告)号:CN113609857A

    公开(公告)日:2021-11-05

    申请号:CN202110828255.7

    申请日:2021-07-22

    摘要: 本发明公开了一种基于级联模型和数据增强的法律命名实体识别方法,包括以下步骤:对经过数据增强后的训练数据进行处理,构建带有上下文语义的字符级别的向量表示和带有上下文语义的词语级别的向量表示;S2、将两个向量表示进行融合;S3、使用BiLSTM双向长短记忆神经网络对融合字词特征的向量表示进行处理,提取文本的深层特征;S4、使用两个CRF条件随机场解码,得到实体序列和属性序列并拼接,得到最后的标签表示;S5、将最后的标签表示与验证集进行比较,调整模型参数信息,反复训练,得到最好的模型;S6、输入中文法律文书案列,模型自动进行判断并输出法律文书中的法律实体。

    基于Mixup和BQRNN的法律命名实体识别方法

    公开(公告)号:CN114372465A

    公开(公告)日:2022-04-19

    申请号:CN202111152985.6

    申请日:2021-09-29

    摘要: 本发明公开了一种基于Mixup和BQRNN的法律文书的命名实体识别方法,包括步骤:使用BERT预训练模型对训练集的法律判决文书进行向量化处理;使用Mixup数据增强方法在词向量表示层面对训练集规模进行扩充;使用BQRNN双向准循环神经网络对增强后的词向量表示进行处理,提取法律文本中带有上下文特征的深层特征向量,并输出相应的实体标签序列;使用CRF条件随机场解码,最后将概率最大的实体标签序列,作为训练结果输出,并生成相应训练模型;将训练模型在测试集上进行测试,调整训练模型参数信息,直至选取稳定前,指标性能最好的识别模型;输入中文法律文书案列,识别模型自动进行判断并输出法律文书中的法律实体。

    基于级联模型和数据增强的法律命名实体识别方法及系统

    公开(公告)号:CN113609857B

    公开(公告)日:2023-11-28

    申请号:CN202110828255.7

    申请日:2021-07-22

    摘要: 本发明公开了一种基于级联模型和数据增强的法律命名实体识别方法,包括以下步骤:对经过数据增强后的训练数据进行处理,构建带有上下文语义的字符级别的向量表示和带有上下文语义的词语级别的向量表示;S2、将两个向量表示进行融合;S3、使用BiLSTM双向长短记忆神经网络对融合字词特征的向量表示进行处理,提取文本的深层特征;S4、使用两个CRF条件随机场解码,得到实体序列和属性序列并拼接,得到最后的标签表示;S5、将最后的标签表示与验证集进行比较,调整模型参数信息,反复训练,得到最好的模型;S6、输入中文法律文书案列,模型自动进行判断并输出法律文书中的法律实体。