-
公开(公告)号:CN115878799A
公开(公告)日:2023-03-31
申请号:CN202211591620.8
申请日:2022-12-12
申请人: 山西财经大学 , 山西省信息产业技术研究院有限公司
摘要: 本发明属于自然语言处理情感分析技术领域,具体涉及一种基于句法结构迁移和领域融合的跨领域情感分类方法,基于句法结构迁移和领域融合的跨领域情感分类总体框架;依存句法递归神经网络模型;跨领域模型参数迁移策略;源领域网络到目标领域网络的参数预训练和微调;跨领域融合策略;领域联合学习和优化过程。本发明提出了一种基于句法结构迁移和领域融合的跨领域情感分类方法,具体设计一种新的可迁移的依存句法递归神经网络模型,通过句法结构迁移有效地迁移跨领域结构信息;在递归神经网络层和Softmax层之间加入了领域融合层,通过约束源领域和目标领域的分布,以领域融合的方式实现最大化源领域和目标领域情感信息之间的共享。
-
公开(公告)号:CN116204597A
公开(公告)日:2023-06-02
申请号:CN202310018076.6
申请日:2023-01-06
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06F16/28 , G06N3/0442 , G06N3/0464 , G06N3/09 , G06N3/084
摘要: 本发明属于信息分类方法技术领域,具体涉及一种政务集约平台信息分类的方法,包括下列步骤:通过爬虫,爬取各政务网站的政务公开信息,并将其保存于集约化政务平台的数据库中;使用政务公开数据训练政务信息识别AI模型;使用政务信息AI模型对政务大数据进行识别,输出政务信息的标签信息;将标签信息存储与政务集约化平台的关系型数据库中,平台根据标签信息,对政务信息进行分类展示、实现数据检索。本发明采用深度神经网络,构建了一个具有强鲁棒性与泛化能力的政务信息识别模型,相对于传统的机器学习模型,本发明在政务信息分类任务中不需要专家对数据特征进行人工特征工程,且具有优秀的识别效果。
-
公开(公告)号:CN116257637A
公开(公告)日:2023-06-13
申请号:CN202310214655.8
申请日:2023-03-08
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06F16/36 , G06F16/332
摘要: 本发明属于图谱构建方法技术领域,具体涉及一种基于JERPE的知识图谱构建方法,包括下列步骤:获取构建知识图谱所需要的数据源并将文本数据进行滑窗处理;初始化初级状态特征;初始化次级状态特征;初级状态特征与次级状态特征作为智能体所处的环境,最大化奖励更新多智能体的参数;中得到的多智能更新当前时刻的下一个时刻初级状态特征;得到当前时刻的下一个时刻次级状态特征;完成实体关系属性抽取而进行知识图谱构建。本发明能够解决传统管道式抽取中存在的积累误差问题,并且高效、准确地实现知识图谱的构建。能够为信息检索、智能对话等很多方面的应用,提供强有力的技术保障。
-
公开(公告)号:CN116052194A
公开(公告)日:2023-05-02
申请号:CN202211619256.1
申请日:2022-12-14
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06V30/414 , G06V30/19 , G06N3/048 , G06N3/08
摘要: 本发明属于科技图表识别方法技术领域,具体涉及一种基于STC‑OCR的科技图表识别方法,包括下列步骤:S1、数据获取,对文档图像进行分割得到图标数据;S2、对S1中图像分割得到的图标数据进行数据预处理;S3、将数据预处理后的图标进行分类;S4、对图标进行内容识别。本发明法利用可用的未标记数据使预训练的语言模型适应下游任务,并在定义调优之前将其嵌入引导到语义上有意义的空间。本发明使用模型蒸馏来生成语义上可比较的嵌入。此外,本发明设计了一种简单的策略,以有效地获取用于主动学习的初始迭代的一组标记的正样本和负样本。本发明可有效的降低数据的标注成本。
-
公开(公告)号:CN117611263A
公开(公告)日:2024-02-27
申请号:CN202311037875.4
申请日:2023-08-17
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06Q30/0601 , G06N7/02 , G06F18/22
摘要: 本发明属于数据处理技术领域,具体涉及构建血糖仪选择推荐系统的方法、决策方法及其装置,包括下列步骤:获取血糖仪的品牌集和属性集;根据血糖仪的品牌集和属性集生成三角模糊关系集;根据属性集和三角模糊关系集生成选择样本集;根据血糖仪的品牌集、属性集、三角模糊关系集和选择样本集构建血糖仪选择推荐系统。本发明计算得到的属性权重集和决策者权重集可以直观的呈现每类属性以及每位专家所占用的权重比例,而根据预设决策规则、得分函数和可调多粒度三角模糊隶属度,生成待选择样本集的决策信息,最后,利用多属性边界近似区域比较的方法计算出融合后的阈值,得出最终结果,从而通过血糖仪信息系统可以更客观的表征血糖仪的信息数据。
-
公开(公告)号:CN116343451A
公开(公告)日:2023-06-27
申请号:CN202310337679.2
申请日:2023-03-31
申请人: 山西省信息产业技术研究院有限公司 , 山西大学
摘要: 本发明公开一种构建森林火灾预警系统的方法、决策方法及其装置,其中,该构建森林火灾预警系统的方法包括获取天气状况集、日期集和不同地区下的关系集;根据所述天气状况集、日期集和关系集生成不完备T‑球型模糊关系集;针对不完备T‑球型模糊关系集构建一种补全方法;依据T‑球型模糊关系集生成火灾预警标准集;根据所述天气状况集、日期集、关系集、不完备T‑球型模糊关系集和火灾预警标准集构建森林火灾预警系统。上述方案可应对实际森林火灾预警背景下天气因素与火灾发生可能性关系的不完备性、不确定性问题,提高了森林火灾预警的准确性和问题处理效率,并且森林消防员可直观了解森林火灾的即时相关信息,从而对当下情况及时做出判断。
-
公开(公告)号:CN116012856A
公开(公告)日:2023-04-25
申请号:CN202211607231.X
申请日:2022-12-14
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06V30/244 , G06V30/162 , G06V30/19 , G06V10/28 , G06V10/774 , G06V10/80 , G06V10/82
摘要: 本发明属于识别方法技术领域,具体涉及基于多尺度特征融合空洞卷积网络的手写中文识别方法,使用CASIA‑HWDB1.1数据集作为模型训练与测试数据集;对数据的二值化与归一化处理;对数据标签进行处理,得到One‑Hot形式的数据标签,供网络进行训练;将数据以K折交叉方法划分为多个训练集‑测试集组合;构建识别网络;使用训练集数据对网络进行参数的优化训练;使用K折交叉得到的多个数据集获取最优模型;使用准确率、召回率与F1‑Score对模型进行评价。本发明基于深度神经网络构建了手写字识别模型,模型无需进行人工特征工程,具有更智能化的特征提取能力,可以更加有效的提取数据特征,进行准确率更高的手写汉字识别。
-
公开(公告)号:CN115757964A
公开(公告)日:2023-03-07
申请号:CN202211493784.7
申请日:2022-11-25
申请人: 山西省信息产业技术研究院有限公司
IPC分类号: G06F16/9535 , G06F16/332 , G06F16/35
摘要: 本发明属于分析算法技术领域,具体涉及一种基于相似性分析的科技平台偏好分析算法,将数据特征模型化为嵌入在D维空间中的图;推荐器对于每个会话的输出是项目的有序列表;系统中的每个项在D维欧几里得空间中分配一个点;两个因素的相似性由它们的距离和流行度反映;假设连接概率与会话中共现项目的数量成比例,计算余弦相似性;算得到欧几里得距离尽可能接近规定的距离;计算距离和观测距离之间差异的目标函数进行非线性优化;使用K‑means进行概率的计算,生成t个项目的列表,该列表按连接到活动会话中最流行项目的概率递减排序。本发明的方法相较于有监督学习方法,无需复杂的特征提取过程,极大地节约了数据处理成本与模型训练成本。
-
-
-
-
-
-
-