一种基于BERT和前馈神经网络的文本纠错方法

    公开(公告)号:CN112836496B

    公开(公告)日:2024-02-13

    申请号:CN202110098015.6

    申请日:2021-01-25

    摘要: 本发明公开了一种基于BERT和前馈神经网络的文本纠错方法,能对大规模语料进行快速准确的错误识别和纠正。方法首先对文本进行预处理,然后将文本用BERT进行语义编码,之后先用文本整体的语义信息判断文本是否正确,然后对判断为错误的文本,使用序列标注的方法找出文本中错误出现的具体位置,最后结合错误的上下文信息,使用前馈神经网络生成对应的正确文本。本发明构建的文本纠错方法具有推理速度快、可解释性好的特点。

    一种基于BERT和前馈神经网络的文本纠错方法

    公开(公告)号:CN112836496A

    公开(公告)日:2021-05-25

    申请号:CN202110098015.6

    申请日:2021-01-25

    摘要: 本发明公开了一种基于BERT和前馈神经网络的文本纠错方法,能对大规模语料进行快速准确的错误识别和纠正。方法首先对文本进行预处理,然后将文本用BERT进行语义编码,之后先用文本整体的语义信息判断文本是否正确,然后对判断为错误的文本,使用序列标注的方法找出文本中错误出现的具体位置,最后结合错误的上下文信息,使用前馈神经网络生成对应的正确文本。本发明构建的文本纠错方法具有推理速度快、可解释性好的特点。

    一种高斯过程回归树分类器多元合金异常数据识别方法

    公开(公告)号:CN115017977B

    公开(公告)日:2024-09-20

    申请号:CN202210529720.1

    申请日:2022-05-16

    摘要: 本发明公开了一种高斯过程回归树分类器多元合金异常数据识别方法:高斯过程回归树分类器异常数据识别方法(英文名:Tree‑Classifier for Gaussian‑Process‑Regression,简称:TCGPR)。本方法基于随机过程假设,根据集合中数据之间的高斯关联性定义了数据集合的全局高斯无序因子(Global Gaussian Messy Factor,GGMF)。通过最大化全局高斯无序因子的期望降低值,不断地扩充初始的数据集合,直至数据集合的拟合优度饱和。本方法基于Stump‑Tree模型建立,通过初始数据集的动态扩容,切分输入的数据集合。本方法可用于例如检测合金性能测试的异常数据,等异常数据识别和分割的机器学习任务之中。本发明是一种基于全局关联性的有监督数据预处理方法,并在相关的数据评估中证实了本方法用于发现和强化数据之间关联的可行性。

    一种高斯过程回归树分类器多元合金异常数据识别方法

    公开(公告)号:CN115017977A

    公开(公告)日:2022-09-06

    申请号:CN202210529720.1

    申请日:2022-05-16

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种高斯过程回归树分类器多元合金异常数据识别方法:高斯过程回归树分类器异常数据识别方法(英文名:Tree‑Classifier for Gaussian‑Process‑Regression,简称:TCGPR)。本方法基于随机过程假设,根据集合中数据之间的高斯关联性定义了数据集合的全局高斯无序因子(Global Gaussian Messy Factor,GGMF)。通过最大化全局高斯无序因子的期望降低值,不断地扩充初始的数据集合,直至数据集合的拟合优度饱和。本方法基于Stump‑Tree模型建立,通过初始数据集的动态扩容,切分输入的数据集合。本方法可用于例如检测合金性能测试的异常数据,等异常数据识别和分割的机器学习任务之中。本发明是一种基于全局关联性的有监督数据预处理方法,并在相关的数据评估中证实了本方法用于发现和强化数据之间关联的可行性。

    一种基于遗传算法的生产业务流程超时异常处理方法

    公开(公告)号:CN118863493A

    公开(公告)日:2024-10-29

    申请号:CN202410800927.7

    申请日:2024-06-20

    摘要: 本发明提出一种基于遗传算法的生产业务流程超时异常处理方法,包括以下步骤:首先进行数据预处理,对生产业务流程的事件日志执行一系列清洗操作;然后提取特征,输入至双向长短期记忆网络BiLSTM,为其提供必要的信息以进行准确的剩余时间预测;接着预测超时风险,利用BiLSTM模型对生产业务流程的剩余执行时间进行预测;最后进行资源智能再分配,在BiLSTM模型预测到超时风险时,采用遗传算法对生产流程中尚未执行的部分进行资源的智能再分配,遗传算法模拟自然选择机制。本发明采用BiLSTM模型准确预测生产业务流程中的剩余执行时间,及时识别潜在的超时风险;引入遗传算法能够对资源进行全局优化再分配,提高资源利用率,降低生产成本。

    一种基于线性模型的多尺度补丁长期时序预测方法

    公开(公告)号:CN118349792A

    公开(公告)日:2024-07-16

    申请号:CN202410091729.8

    申请日:2024-01-23

    摘要: 本发明公开了一种基于线性模型的多尺度补丁长期时序预测方法。该方法首先提出多尺度补丁(Multiscale Patch)模块,利用快速傅里叶变换(FFT)检测时间序列中潜在的top‑k个周期模式,并以不同的周期模式作为补丁(Patch)长度,对原始序列进行补丁操作;然后设计补丁编码(Patch Encoding)模块,该模块包括补丁内线性层和补丁间线性层,使用线性模型来提取时序数据的局部深层依赖关系以及全局季节性和趋势变化;最后提出集成预测(Ensemble Prediction)模块,基于线性层对每个补丁编码序列进行预测,并通过线性加权整合多尺度补丁预测的结果,以获得更稳定的预测结果。该方法有效扩展了线性模型高效的优势,在七个现实世界数据集上的准确性和效率方面均实现了最先进的性能。

    一种基于大模型的域内外混合型任务多轮对话实现方法

    公开(公告)号:CN118332066A

    公开(公告)日:2024-07-12

    申请号:CN202410286466.6

    申请日:2024-03-13

    发明人: 曹斌 周顺

    摘要: 本发明提供了一种基于大模型的域内外混合型任务多轮对话实现方法,获取任务,进行域内任务和域外任务的划分,分别为意图识别大模型和Rasa定制模型准备相应的训练数据,分别训练意图识别大模型和Rasa定制模型;构建控制流程框架,将意图识别大模型、垂类大模型与Rasa定制模型进行结合,进行域内外混合型任务多轮对话实现。本发明的有益效果在于通过意图大模型将垂类大模型与Rasa定制模型相结合,实现域内外任务的无缝对话处理,提供更全面的对话交互能力;相较于传统的对话系统,本发明可以更好地应对领域内外任务的混合需求,提供更智能的对话体验,提高对话系统的适用性和实用性。