-
公开(公告)号:CN118781137A
公开(公告)日:2024-10-15
申请号:CN202411079074.9
申请日:2024-08-07
申请人: 合肥工业大学
IPC分类号: G06T7/11 , G06V10/20 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/096 , G06N3/0895 , G06N3/0985 , G06N3/084
摘要: 本发明公开了一种基于数据增强和聚焦线性注意力的半监督医学图像分割方法,包括:1对包含标记数据集和无标记数据集的医学图像数据集进行数据增强;2构建基于改进的Swin Transformer网络的学生模型和教师模型;3将增强标记数据集与强增强无标签数据集分别划分成图像补丁后,输入学生模型进行处理,将弱增强无标签数据集划分图像补丁后,输入教师模型进行处理;4对增强标记数据集的预测结果作监督约束,并对强增强无标记数据集与弱增强无标记数据集的预测结果作一致性约束,得到更新的学生模型;5根据更新的学生模型完成对测试医学图像的分割预测。本发明能在医学图像分割掩码缺失的场景下,提高医学图像分割性能。
-
公开(公告)号:CN118427294A
公开(公告)日:2024-08-02
申请号:CN202410888371.1
申请日:2024-07-04
申请人: 合肥工业大学
摘要: 本发明提供一种基于提示优化的日志解析方法、装置、设备和存储介质,涉及计算机技术领域,其中,基于提示优化的日志解析方法包括:对样本日志数据集进行聚类划分,生成候选示例库;所述聚类划分的依据包括Top‑K频繁令牌和预设特征字符;利用聚类算法从所述候选示例库中筛选出与待输入日志的相似度最高的至少一条日志数据作为演示示例;所述演示示例包括输入示例和输出期望;基于所述演示示例和任务描述文本创建初始提示词;所述任务描述文本包括任务背景和任务要求;利用自然语言梯度对所述初始提示词进行优化生成目标提示词,并基于所述目标提示词对所述待输入日志进行解析,提高了日志解析的性能和泛化能力,降低了日志解析成本。
-
公开(公告)号:CN111026846B
公开(公告)日:2021-08-17
申请号:CN201911251229.1
申请日:2019-12-09
申请人: 合肥工业大学
摘要: 本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构建在线深度学习网络;4对LSTM网络中神经元引入概念漂移信号量并检测短文本流的分布变化;5完成在线深度学习网络的模型更新与对短文本数据流的预测。本发明能够有效的提高短文本数据流分类准确率、正确地检测概念漂移并调整模型,从而达到快速适应短文本数据流环境的目的。
-
公开(公告)号:CN109657061B
公开(公告)日:2020-11-27
申请号:CN201811573390.6
申请日:2018-12-21
申请人: 合肥工业大学
摘要: 本发明公开了一种针对海量多词短文本的集成分类方法,包括:1获取多词短文本集合,并对多词短文本进行分词预处理;2在分词结果上利用Word2vec词向量表示方法中的CBOW连续词袋模型得到词向量表示模型;3基于词向量表示模型,利用Sentence2vec句向量表示方法中的PV‑DM模型,构建句向量表示;4在句向量表示模型基础上利用kNN分类器预测为标记数据的类别标签。本发明能解决传统表示学习方法的“维数灾难”问题,从而提高短文本表示学习的效果,提升文本分类的精度,具有较高的鲁棒性和实用性。
-
公开(公告)号:CN110119448B
公开(公告)日:2020-11-06
申请号:CN201910378359.5
申请日:2019-05-08
申请人: 合肥工业大学
摘要: 本发明公开了一种基于双重自动编码器的半监督跨领域文本分类方法,其步骤包括:采用双重自动编码器同时获取源领域文本数据集合和目标领域文本数据集合之间的全局和局部特征表示用于跨领域文本分类任务;第一重自动编码器为基于自适应分布的边缘降噪自动编码器,它主要用来学习源领域和目标领域文本数据集合的全局特征表示;第二重自动编码器为基于多类别的边缘降噪自动编码器,它以更细粒度方式学习源领域和目标领域文本数据集合的局部特征表示。本发明能更好地挖掘源领域文本数据集合和目标领域文本数据集合中特征之间的潜在关系,从而进一步提高文本分类的正确性。
-
公开(公告)号:CN107194524B
公开(公告)日:2020-05-22
申请号:CN201710631202.X
申请日:2017-07-28
申请人: 合肥工业大学
摘要: 本发明公开了一种基于RBF神经网络的煤与瓦斯突出预测方法,包括:1、对煤与瓦斯突出的特征数据进行维数约简,并对约简后的特征数据进行归一化处理,得到归一化特征数据;2、使用K‑均值算法对归一化特征数据进行聚类,计算出径向基函数的中心;3、在归一化特征数据上训练RBF神经网络,引入自适应差分进化算法确定隐含层神经元个数时的最优扩展因子和最优权重;4、增加隐含层神经元个数,重复步骤2‑3,得到RBF神经网络的全局最优参数,从而确定RBF神经网络的预测模型;5、使用RBF神经网络预测模型对测试数据进行预测。本发明能解决RBF神经网络的最优参数自适应问题,从而快速、准确地预测煤与瓦斯突出。
-
公开(公告)号:CN111026846A
公开(公告)日:2020-04-17
申请号:CN201911251229.1
申请日:2019-12-09
申请人: 合肥工业大学
摘要: 本发明公开了一种基于特征扩展的在线短文本数据流分类方法,其步骤包括:1根据外部语料库构建Word2vec模型,获取词向量集合Vec;2利用Vec向量化短文本数据流并基于CNN模型进行文本向量化扩展;3对扩展后的文本向量构建在线深度学习网络;4对LSTM网络中神经元引入概念漂移信号量并检测短文本流的分布变化;5完成在线深度学习网络的模型更新与对短文本数据流的预测。本发明能够有效的提高短文本数据流分类准确率、正确地检测概念漂移并调整模型,从而达到快速适应短文本数据流环境的目的。
-
公开(公告)号:CN107483256B
公开(公告)日:2020-02-18
申请号:CN201710737185.8
申请日:2017-08-24
摘要: 本发明公开了一种网络化数据流的标签提取方法,包括:1.根据社交网络中用户节点之间存在的关注关系,构建数据流形式的网络数据块,并获得网络数据块中每个用户节点的邻居列表;2.更新每一个网络数据块中每个用户节点的邻居列表;3.根据每一个网络数据块中用户的微博内容,采用主题建模法抽取出每个用户对应的候选标签列表,4.根据网络数据块中每个用户及其所有邻居用户的候选标签列表,得出每个用户的标签集。本发明在面向大规模的社交网络数据流中,能及时、有效的捕捉到社交用户的兴趣标签,从而能达到用户信息推荐和为公司做决策的目的。
-
公开(公告)号:CN109670182A
公开(公告)日:2019-04-23
申请号:CN201811573017.0
申请日:2018-12-21
申请人: 合肥工业大学
摘要: 本发明公开了一种基于文本哈希向量化表示的海量极短文本分类方法,其步骤包括:1数据集向量化的前期分词预处理;2模型设计和实现;3应用Signed Hash Trick算法映射得到的包含文本词频特征的稀疏矩阵;4特征提取完后,用随机森林分类模型在训练集上训练分类器;5用训练集上的分类器在测试集上做分类预测;6完成在测试集上的分类,得到最终文本分类的准确度。本发明解决现有极短文本分类中存在的分类精度低、分类时间过长的问题,从而能提高极短文本的分类效果,并降低硬件的内存消耗,具有较高的鲁棒性和实用性。
-
公开(公告)号:CN109344187A
公开(公告)日:2019-02-15
申请号:CN201810989323.6
申请日:2018-08-28
申请人: 合肥工业大学
IPC分类号: G06F16/25 , G06F16/332 , G06Q50/18
摘要: 本发明公开了一种司法判决书案情信息结构化处理系统,适用于信息抽取和自然语言处理领域;系统包括以下模块:司法判决书案情信息结构化表示模块、建立司法判决书案情信息序列标注模型模块、属性触发词管理模块和生成结构化司法判决书案情信息模块。根据用户给定的案件类型,建立司法判决书案情信息结构化数据表示框架,构建司法判决书案情信息序列标注训练集并训练序列标注模型,结合属性触发词集合,根据生成结构化司法判决书案情信息方法生成结构化的司法判决书案情信息。本发明根据用户提供的司法判决书案件类型和案情信息,实现司法判决书案情信息的结构化处理,其目的在于提供一种从无结构化司法判决书文本中抽取结构化信息的有效方式。
-
-
-
-
-
-
-
-
-