-
公开(公告)号:CN110880020A
公开(公告)日:2020-03-13
申请号:CN201911046277.7
申请日:2019-10-30
申请人: 西安交通大学
摘要: 本发明公开了一种自适应的跨区域基站能耗模型迁移与补偿方法,主要包括利用Wassertein生成对抗网络生成辅助日志文件和迁移源区域模型用于构建预测目标区域基站状态的模型两个部分。本发明采用的技术方案为:首先获取每个区域基站的日志文件,利用Wassertein生成对抗网络生成大量辅助基站日志文件。利用大量源区域基站的日志文件和少量目标区域基站文件生成分类模型,用于估计目标区域基站的性能。
-
公开(公告)号:CN111581964A
公开(公告)日:2020-08-25
申请号:CN202010333811.9
申请日:2020-04-24
申请人: 西安交通大学
IPC分类号: G06F40/289 , G06F40/30 , G06F40/242 , G06N3/04
摘要: 本发明提供了一种汉语古籍的主题分析方法,获取古汉语语料库中的古汉语文本,对获得的语料库文本进行预处理、分词,之后构建主题模型,对已经完成分词工作的古汉语文本进行训练,进而得到古汉语的文本-主题分布和主题-词分布,进行进一步的主题分析;本发明在对古汉语文本的分词上采用基于词典结合半监督学习的BILSTM-CRF模型的分词方法,一定程度上解决了古汉语的跨领域问题,即古代汉语在不同朝代部分词的含义是不同的,也能有效利用大量存在的无标注数据,降低模型训练对标注数据的依赖,降低人工标注数据的成本;同时与基于词典的分词结合起来,两相互补,解决了古汉语分词中的未登录词识别问题。
-
公开(公告)号:CN108376148A
公开(公告)日:2018-08-07
申请号:CN201810069693.8
申请日:2018-01-24
申请人: 西安交通大学
摘要: 本发明公开了一种基于数据隐结构分析的基站聚类检测方法,包括以下步骤:步骤一、电力日志文件的预处理;步骤二、建立基于电力日志的LDA主题模型:步骤三、计算基站文档之间的距离并进行聚类分析;步骤四、异常基站的检测。本发明通过建立基于电力日志的LDA主题模型能够分析出日志文件之间的相似性,并提出利用KL散度来计算文档之间的相似度,本发明通过常规方法无法挖掘出的日志内部隐含变量来度量相似度,克服了因为日志数据量大而产生较大误差的结果,比仅对日志行进行直接数据挖掘要有更好的准确度,更能发现数据集中隐含的变量,对大规模的数据集具有良好的扩展性。
-
公开(公告)号:CN114898741B
公开(公告)日:2024-07-16
申请号:CN202210302892.5
申请日:2022-03-25
申请人: 西安交通大学
摘要: 本发明公开了一种基于层重要度排序和RNN降维的轻量化语音识别方法及系统,提取原始语音序列的MFCC特征并划分训练集、验证集和测试集;对训练集、验证集和测试集进行语音信号增强,将增强后的训练集嵌入Transformer模型中;以随机层丢失的训练方式,对Transformer模型进行训练;基于增强后的验证集,利用梯度计算方式计算训练好的Transformer模型中各层的重要度,并按照层重要度排序;以得到的层重要度为基准,构建浅层的Transformer子模型;以Transformer子模型作为推理模型,将增强后的测试集输入推理模型,得到语音识别的结果。提升了数据的可用性和质量;减小模型宽度,提升模型鲁棒性,能够在保证模型精度的基础上降低模型深度,进一步实现模型轻量化。
-
公开(公告)号:CN114898741A
公开(公告)日:2022-08-12
申请号:CN202210302892.5
申请日:2022-03-25
申请人: 西安交通大学
摘要: 本发明公开了一种基于层重要度排序和RNN降维的轻量化语音识别方法及系统,提取原始语音序列的MFCC特征并划分训练集、验证集和测试集;对训练集、验证集和测试集进行语音信号增强,将增强后的训练集嵌入Transformer模型中;以随机层丢失的训练方式,对Transformer模型进行训练;基于增强后的验证集,利用梯度计算方式计算训练好的Transformer模型中各层的重要度,并按照层重要度排序;以得到的层重要度为基准,构建浅层的Transformer子模型;以Transformer子模型作为推理模型,将增强后的测试集输入推理模型,得到语音识别的结果。提升了数据的可用性和质量;减小模型宽度,提升模型鲁棒性,能够在保证模型精度的基础上降低模型深度,进一步实现模型轻量化。
-
公开(公告)号:CN110880020B
公开(公告)日:2022-10-25
申请号:CN201911046277.7
申请日:2019-10-30
申请人: 西安交通大学
摘要: 本发明公开了一种自适应的跨区域基站能耗模型迁移与补偿方法,主要包括利用Wassertein生成对抗网络生成辅助日志文件和迁移源区域模型用于构建预测目标区域基站状态的模型两个部分。本发明采用的技术方案为:首先获取每个区域基站的日志文件,利用Wassertein生成对抗网络生成大量辅助基站日志文件。利用大量源区域基站的日志文件和少量目标区域基站文件生成分类模型,用于估计目标区域基站的性能。
-
-
-
-
-