-
公开(公告)号:CN113672711A
公开(公告)日:2021-11-19
申请号:CN202110907685.8
申请日:2021-08-09
IPC分类号: G06F16/332 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种服务型机器人意图识别装置及其训练、识别方法,包括如下步骤:1)根据应用场景确定要识别的对话意图,并获取大量对话数据及对应的意图,人工找出对话数据中对应的意图,进行语料标注;2)采用期望交叉熵量化算法获取停用词表,并去除对话中的停用词;3)构建用于意图识别的装置,并通过1)、2)处理后的训练集数据对装置进行训练;4)由训练好的装置实时获取1)、2)处理后的对话数据,进行意图识别,输出最佳意图。本发明的意图识别效率高、准确率高、泛化能力强、人工标注语料成本低。
-
公开(公告)号:CN112836496B
公开(公告)日:2024-02-13
申请号:CN202110098015.6
申请日:2021-01-25
IPC分类号: G06F40/232 , G06F40/289 , G06F40/30 , G06N3/045 , G06N3/0499
摘要: 本发明公开了一种基于BERT和前馈神经网络的文本纠错方法,能对大规模语料进行快速准确的错误识别和纠正。方法首先对文本进行预处理,然后将文本用BERT进行语义编码,之后先用文本整体的语义信息判断文本是否正确,然后对判断为错误的文本,使用序列标注的方法找出文本中错误出现的具体位置,最后结合错误的上下文信息,使用前馈神经网络生成对应的正确文本。本发明构建的文本纠错方法具有推理速度快、可解释性好的特点。
-
公开(公告)号:CN113672711B
公开(公告)日:2024-01-19
申请号:CN202110907685.8
申请日:2021-08-09
IPC分类号: G06F16/332 , G06F40/216 , G06F40/295 , G06F40/30 , G06N3/0442 , G06N3/048
摘要: 本发明公开了一种服务型机器人意图识别装置及其训练、识别方法,包括如下步骤:1)根据应用场景确定要识别的对话意图,并获取大量对话数据及对应的意图,人工找出对话数据中对应的意图,进行语料标注;2)采用期望交叉熵量化算法获取停用词表,并去除对话中的停用词;3)构建用于意图识别的装置,并通过1)、2)处理后的训练集数据对装置进行训练;4)由训练好的装置实时获取1)、2)处理后的对话数据,进行意图识别,输出最佳意图。本发明的意图识别效率高、准确率高、泛化能力强、人工标注语料成本低。
-
公开(公告)号:CN112836496A
公开(公告)日:2021-05-25
申请号:CN202110098015.6
申请日:2021-01-25
IPC分类号: G06F40/232 , G06F40/289 , G06F40/30 , G06N3/04
摘要: 本发明公开了一种基于BERT和前馈神经网络的文本纠错方法,能对大规模语料进行快速准确的错误识别和纠正。方法首先对文本进行预处理,然后将文本用BERT进行语义编码,之后先用文本整体的语义信息判断文本是否正确,然后对判断为错误的文本,使用序列标注的方法找出文本中错误出现的具体位置,最后结合错误的上下文信息,使用前馈神经网络生成对应的正确文本。本发明构建的文本纠错方法具有推理速度快、可解释性好的特点。
-
公开(公告)号:CN115017977B
公开(公告)日:2024-09-20
申请号:CN202210529720.1
申请日:2022-05-16
申请人: 上海大学 , 之江实验室 , 云南锡业集团(控股)有限责任公司研发中心
IPC分类号: G06F18/243 , G06F18/2321 , G06F18/241 , G06F18/27 , G06F18/2433
摘要: 本发明公开了一种高斯过程回归树分类器多元合金异常数据识别方法:高斯过程回归树分类器异常数据识别方法(英文名:Tree‑Classifier for Gaussian‑Process‑Regression,简称:TCGPR)。本方法基于随机过程假设,根据集合中数据之间的高斯关联性定义了数据集合的全局高斯无序因子(Global Gaussian Messy Factor,GGMF)。通过最大化全局高斯无序因子的期望降低值,不断地扩充初始的数据集合,直至数据集合的拟合优度饱和。本方法基于Stump‑Tree模型建立,通过初始数据集的动态扩容,切分输入的数据集合。本方法可用于例如检测合金性能测试的异常数据,等异常数据识别和分割的机器学习任务之中。本发明是一种基于全局关联性的有监督数据预处理方法,并在相关的数据评估中证实了本方法用于发现和强化数据之间关联的可行性。
-
公开(公告)号:CN115017977A
公开(公告)日:2022-09-06
申请号:CN202210529720.1
申请日:2022-05-16
申请人: 上海大学 , 之江实验室 , 云南锡业集团(控股)有限责任公司研发中心
IPC分类号: G06K9/62
摘要: 本发明公开了一种高斯过程回归树分类器多元合金异常数据识别方法:高斯过程回归树分类器异常数据识别方法(英文名:Tree‑Classifier for Gaussian‑Process‑Regression,简称:TCGPR)。本方法基于随机过程假设,根据集合中数据之间的高斯关联性定义了数据集合的全局高斯无序因子(Global Gaussian Messy Factor,GGMF)。通过最大化全局高斯无序因子的期望降低值,不断地扩充初始的数据集合,直至数据集合的拟合优度饱和。本方法基于Stump‑Tree模型建立,通过初始数据集的动态扩容,切分输入的数据集合。本方法可用于例如检测合金性能测试的异常数据,等异常数据识别和分割的机器学习任务之中。本发明是一种基于全局关联性的有监督数据预处理方法,并在相关的数据评估中证实了本方法用于发现和强化数据之间关联的可行性。
-
公开(公告)号:CN117273168A
公开(公告)日:2023-12-22
申请号:CN202311238148.4
申请日:2023-09-25
申请人: 河北工业大学 , 之江实验室 , 电子科技大学(深圳)高等研究院 , 大连理工大学
IPC分类号: G06N20/00 , G06N3/0455 , G06N3/08 , G06F21/62
摘要: 本发明提供了一种联邦大模型自适应学习系统。在多目标优化与增量学习结合的基础上,构建多个优化指标,设计自适应的小模型增量学习;针对联邦学习下的数据隐私保护,提出小模型梯度放缩方法,使梯度信息得到充分利用;通过揭示模型泛化能力与采样数据的关联性,提出泛化能力评估函数;针对工业设备运行时面对的性能退化、故障等真实问题,结合泛化能力评估函数,设计多个优化目标,通过多目标演化学习自适应地更新与修复模型,提高大模型在真实工业场景下的可用性。最终实现大、小模型的自适应精准更新,提升模型泛化能力。
-
公开(公告)号:CN118863493A
公开(公告)日:2024-10-29
申请号:CN202410800927.7
申请日:2024-06-20
申请人: 浙江工业大学
IPC分类号: G06Q10/0633 , G06F18/2433 , G06F18/214 , G06F18/15 , G06F18/10 , G06F18/213 , G06N3/126 , G06N3/045 , G06N3/08
摘要: 本发明提出一种基于遗传算法的生产业务流程超时异常处理方法,包括以下步骤:首先进行数据预处理,对生产业务流程的事件日志执行一系列清洗操作;然后提取特征,输入至双向长短期记忆网络BiLSTM,为其提供必要的信息以进行准确的剩余时间预测;接着预测超时风险,利用BiLSTM模型对生产业务流程的剩余执行时间进行预测;最后进行资源智能再分配,在BiLSTM模型预测到超时风险时,采用遗传算法对生产流程中尚未执行的部分进行资源的智能再分配,遗传算法模拟自然选择机制。本发明采用BiLSTM模型准确预测生产业务流程中的剩余执行时间,及时识别潜在的超时风险;引入遗传算法能够对资源进行全局优化再分配,提高资源利用率,降低生产成本。
-
公开(公告)号:CN118349792A
公开(公告)日:2024-07-16
申请号:CN202410091729.8
申请日:2024-01-23
申请人: 浙江工业大学
IPC分类号: G06F18/20 , G06F18/2131 , G06F18/213 , G06N3/04 , G06N3/08 , G06F123/02
摘要: 本发明公开了一种基于线性模型的多尺度补丁长期时序预测方法。该方法首先提出多尺度补丁(Multiscale Patch)模块,利用快速傅里叶变换(FFT)检测时间序列中潜在的top‑k个周期模式,并以不同的周期模式作为补丁(Patch)长度,对原始序列进行补丁操作;然后设计补丁编码(Patch Encoding)模块,该模块包括补丁内线性层和补丁间线性层,使用线性模型来提取时序数据的局部深层依赖关系以及全局季节性和趋势变化;最后提出集成预测(Ensemble Prediction)模块,基于线性层对每个补丁编码序列进行预测,并通过线性加权整合多尺度补丁预测的结果,以获得更稳定的预测结果。该方法有效扩展了线性模型高效的优势,在七个现实世界数据集上的准确性和效率方面均实现了最先进的性能。
-
公开(公告)号:CN118332066A
公开(公告)日:2024-07-12
申请号:CN202410286466.6
申请日:2024-03-13
申请人: 浙江工业大学
IPC分类号: G06F16/33 , G06F16/332 , G06F40/30 , G06Q30/01
摘要: 本发明提供了一种基于大模型的域内外混合型任务多轮对话实现方法,获取任务,进行域内任务和域外任务的划分,分别为意图识别大模型和Rasa定制模型准备相应的训练数据,分别训练意图识别大模型和Rasa定制模型;构建控制流程框架,将意图识别大模型、垂类大模型与Rasa定制模型进行结合,进行域内外混合型任务多轮对话实现。本发明的有益效果在于通过意图大模型将垂类大模型与Rasa定制模型相结合,实现域内外任务的无缝对话处理,提供更全面的对话交互能力;相较于传统的对话系统,本发明可以更好地应对领域内外任务的混合需求,提供更智能的对话体验,提高对话系统的适用性和实用性。
-
-
-
-
-
-
-
-
-