-
公开(公告)号:CN115964486A
公开(公告)日:2023-04-14
申请号:CN202211512635.0
申请日:2022-11-28
Applicant: 北京大学(青岛)计算社会科学研究院 , 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司
Abstract: 本发明公开了一种基于数据增强的小样本意图识别方法,其步骤包括:1)获取用户意图识别数据集,并对其中每一条用户查询语句标注其意图,作为一样本,得到小样本意图识别数据集;构建小样本意图识别数据集的元任务;2)将小样本意图识别数据集输入自然语言推断生成模型,生成样本的扩展样本并构建扩展元任务;3)根据每一样本所属元任务的样本集,将每一样本映射到特征空间中,得到样本在对应元任务中的特征向量;4)将每一样本在各元任务中的特征向量融合作为该样本的最终向量;5)利用各样本的最终向量训练原型网络,将训练后的原型网络作为样本意图识别模型;6)使用小样本意图识别模型对输入的查询语句进行预测,得到该查询语句的意图。
-
公开(公告)号:CN115840824A
公开(公告)日:2023-03-24
申请号:CN202211514641.X
申请日:2022-11-29
Applicant: 海尔优家智能科技(北京)有限公司 , 北京大学(青岛)计算社会科学研究院 , 青岛海尔科技有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/30 , G06F16/33 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种面向环境信息扩增的智能家居用户口语理解系统,本系统将数据集按照意图域划分并存储源域、目标域数据文件;在源域、目标域上通过采样进行训练、测试任务构建;提取文本、环境信息并规范化组织、填充、拼接;提取意图、槽位信息并构建意图、槽位词典表;使用预训练语言模型、图卷积网络、标签注意力层与互注意力层实现文本、环境信息编码;使用注意力机制及环境信息与意图、槽位标签的文本语义信息相似性矩阵实现用户话语文本信息与域间通用、域间扩增的环境信息的融合;在源域、目标域上使用支持集、查询集进行少样本训练与测试;将向量编码的意图、槽位类别转化为可视化文本输出。本发明提供融合环境信息的用户口语理解解决方案。
-
公开(公告)号:CN116151271A
公开(公告)日:2023-05-23
申请号:CN202211507697.2
申请日:2022-11-25
Applicant: 海尔优家智能科技(北京)有限公司 , 北京大学(青岛)计算社会科学研究院 , 青岛海尔科技有限公司
IPC: G06F40/35 , G06F40/284
Abstract: 本发明公开了一种面向智能家居对话理解的用户意图识别方法及系统。本方法为:1)获取智能家居场景下的用户语料信息并将其存储到语料信息存储模块;用户语料信息包括文本格式的源域语料数据和目标域语料数据;源域语料数据为意图标注后样本数据;2)文本预处理模块对每一条目标域语料数据进行意图标注,得到目标域的样本数据;3)特征提取模块将源域的标注数据和目标域的标注数据分别编码为语义特征向量,得到各样本数据的语义特征向量;4)意图分类模型模块利用样本数据对小样本意图分类模型进行训练和检测;5)对于一查询语音,判定输出模块将该查询语音转化为文本后输入到训练检测后的小样本意图分类模型,预测输出该查询语音的意图类别。
-
公开(公告)号:CN114492435A
公开(公告)日:2022-05-13
申请号:CN202210121114.6
申请日:2022-02-09
Applicant: 中共青岛市委机构编制委员会办公室 , 青岛视图信息科技有限公司 , 北京大学(青岛)计算社会科学研究院
IPC: G06F40/289 , G06F40/30 , G06N20/00
Abstract: 本发明提供了大数据分析方法及系统,方法包括获取分析单位的历史年报信息;对历史年报信息进行预处理,以得到样本特征;对样本特征进行筛选,以得到筛选特征;根据筛选特征构建模型特征;根据分析算法对模型特征进行训练,得到分析模型;获取分析单位的实时年报信息,将实时年报信息输入至分析模型,以得到分析结果。该方法采集海量的年报信息,提高数据的覆盖程度和准确性;利用大数据及AI技术对年报信息进行处理分析,提取更加合理、有效的特征;使用多个分析算法训练选择分析模型,利用分析模型生成分析结果,并为分析企业或业务流程提供建设性建议,该方法能够适用于各种复杂的数据分析场景,适应性更广,同时提高了数据分析的工作效率。
-
公开(公告)号:CN117112790A
公开(公告)日:2023-11-24
申请号:CN202311123144.1
申请日:2023-09-01
Applicant: 北京大学(青岛)计算社会科学研究院
IPC: G06F16/35 , G06F40/30 , G06F18/213 , G06F18/214 , G06F18/22 , G06N3/045 , G06N3/0985
Abstract: 本发明提出了一种基于方面语义增强的文本情感分类方法及系统,属于信息技术领域,针对低资源环境方面语义学习不充分的情况,首先从社交媒体采集文本数据,利用元学习设置构建元测试任务和元训练任务。通过大规模语言模型从数据集中提取特征向量,然后构建原型并计算查询样本的语义增强对比损失。利用多头注意力机制生成情感特征向量,并构建交叉熵损失函数。结合两个损失函数进行模型训练,最后预测目标方面的情感极性。本发明在元学习范式中增强方面语义感知能力,提高小样本文本情感分类的准确率,提升目标方面的情感极性判定效果。
-
-
-
-