-
公开(公告)号:CN107862039A
公开(公告)日:2018-03-30
申请号:CN201711078635.3
申请日:2017-11-06
申请人: 工业和信息化部电子第五研究所 , 合肥工业大学 , 广州赛宝认证中心服务有限公司
IPC分类号: G06F17/30
摘要: 本发明涉及一种网页数据获取方法及系统、数据匹配推送方法、计算机存储介质及设备,其中网页数据获取方法包括:将目标网页的网址与参考网址进行比较,确定所述网址的类型;根据所述网址的类型,确定网页搜索策略;根据所述网页搜索策略采集所述目标网页的网页数据。上述方案通过将目标网页的网址与预设参考网址进行比较,确定网址的类型,根据网址的类型确定网页搜索策略,通过采取该网页搜索策略对目标网页进行网页数据采集,从而提高了网页数据获取的效率。
-
公开(公告)号:CN107784112B
公开(公告)日:2020-03-03
申请号:CN201711080284.X
申请日:2017-11-06
申请人: 广州赛宝认证中心服务有限公司 , 合肥工业大学 , 工业和信息化部电子第五研究所
IPC分类号: G06F16/335 , G06F16/33 , G06F16/31 , G06F16/35
摘要: 本发明涉及一种短文本数据增强方法,包括以下步骤:获取短文本文档合集,打开短文本文档合集内的所有文档,读取各文档的文本内容;将各文本内容作为文本数据增强项分别传送至临时存储区中;将临时存储区中的各文本数据增强项分别写入对应的文档中。上述短文本数据增强方法,通过读取文档的文本内容,将文本内容作为文本数据增强项传送至临时存储区中,将文本数据增强项写入文档中,在不引用外部信息的情况下,利用自身数据信息,增加文本长度,增强主题信息,有效提高主题质量,缓解了文本内容过少、文本稀疏性太强而无法深入理解主题信息的问题,有利于文本主题的挖掘。
-
公开(公告)号:CN107862039B
公开(公告)日:2020-11-17
申请号:CN201711078635.3
申请日:2017-11-06
申请人: 工业和信息化部电子第五研究所 , 合肥工业大学 , 广州赛宝认证中心服务有限公司
IPC分类号: G06F16/955 , G06F16/958 , G06F16/9535
摘要: 本发明涉及一种网页数据获取方法及系统、数据匹配推送方法、计算机存储介质及设备,其中网页数据获取方法包括:将目标网页的网址与参考网址进行比较,确定所述网址的类型;根据所述网址的类型,确定网页搜索策略;根据所述网页搜索策略采集所述目标网页的网页数据。上述方案通过将目标网页的网址与预设参考网址进行比较,确定网址的类型,根据网址的类型确定网页搜索策略,通过采取该网页搜索策略对目标网页进行网页数据采集,从而提高了网页数据获取的效率。
-
公开(公告)号:CN107784112A
公开(公告)日:2018-03-09
申请号:CN201711080284.X
申请日:2017-11-06
申请人: 广州赛宝认证中心服务有限公司 , 合肥工业大学 , 工业和信息化部电子第五研究所
IPC分类号: G06F17/30
摘要: 本发明涉及一种短文本数据增强方法,包括以下步骤:获取短文本文档合集,打开短文本文档合集内的所有文档,读取各文档的文本内容;将各文本内容作为文本数据增强项分别传送至临时存储区中;将临时存储区中的各文本数据增强项分别写入对应的文档中。上述短文本数据增强方法,通过读取文档的文本内容,将文本内容作为文本数据增强项传送至临时存储区中,将文本数据增强项写入文档中,在不引用外部信息的情况下,利用自身数据信息,增加文本长度,增强主题信息,有效提高主题质量,缓解了文本内容过少、文本稀疏性太强而无法深入理解主题信息的问题,有利于文本主题的挖掘。
-
公开(公告)号:CN118312671A
公开(公告)日:2024-07-09
申请号:CN202410419999.7
申请日:2024-04-09
申请人: 合肥工业大学 , 科大讯飞股份有限公司
IPC分类号: G06F16/9535 , G06N3/042 , G06N3/0455 , G06N3/09 , G06N3/0499 , G06F18/214 , G06F18/241
摘要: 一种基于对比学习的可解释个性化推荐方法,设有三个核心模块来学习用户短期行为的顺序表示;利用门融合操作来整合在线用户的长期和短期行为偏好;对于关键字生成任务,使用了Transformer,它在文本生成中也得到了广泛的应用,利用多头自注意来计算输出序列od中关键字的注意权重,设计一个复制网络,从短期和长期关键词序列中复制关键词,在时间步t上,λt决定关键字是从关键字分布pvocab中生成的,还是从短期和长期关键字序列中复制的;这产生一个关键字概率分布:推荐产品还生成关键字,从而增强了推荐结果的可解释性;该方法同时实现个性化产品推荐和解释关键词生成任务,在这两个任务中整合了长期和短期用户偏好。
-
公开(公告)号:CN113963718B
公开(公告)日:2024-04-16
申请号:CN202111245978.0
申请日:2021-10-26
申请人: 合肥工业大学
IPC分类号: G10L25/27 , G10L25/45 , G10L25/78 , G10L25/24 , G06N3/0464 , G06N3/09 , G06F18/23213
摘要: 本发明公开了一种基于深度学习的语音会话分割方法,包括:1获取会话语音集合并进行分帧和短时加窗处理;2筛除静音段;3提取语音信号的显式特征;4提取语音信号的隐式特征5κ‑means聚类。本发明方法在有背景噪声情况下仍然能保证分割聚类的准确性和时效性。
-
公开(公告)号:CN114387997B
公开(公告)日:2024-03-29
申请号:CN202210072804.7
申请日:2022-01-21
申请人: 合肥工业大学 , 合肥供水集团有限公司
摘要: 本发明公开了一种基于深度学习的语音情感识别方法,其步骤包括:1获取会话语音集合并进行分帧和加窗处理;2提取语音帧的LLDs特征序列和语谱图;3提取LLDs序列的表征;4提取语谱图的表征。5使用特征融合与结果融合的策略以得到最后的情感预测结果。本发明能有效预测语音的情感类别,并能提高预测准确性。
-
公开(公告)号:CN115935067A
公开(公告)日:2023-04-07
申请号:CN202211590930.8
申请日:2022-12-12
申请人: 合肥工业大学
IPC分类号: G06F16/9535 , G06F18/25 , G06N3/08 , G06N3/0464
摘要: 本发明公开了一种面向社会化推荐的语义与结构视图融合的物品推荐方法,其步骤包括:1提出社会化推荐中隐性关系的定义;2构建异构信息网络并定义元路径;3提取局部评分预测;4提取全局评分预测;5模型融合;6提出针对用户评级行为的约束;7模型训练并得到训练后的深度图模型和训练后的宽度线性注意力模型。本发明能在不同的社交关系分布不平衡性和稀疏性条件下仍能保证推荐的准确性和稳定性。
-
公开(公告)号:CN115544373A
公开(公告)日:2022-12-30
申请号:CN202211335432.9
申请日:2022-10-28
申请人: 合肥工业大学
IPC分类号: G06F16/9535 , G06F16/2458 , G06N3/04 , G06Q50/00
摘要: 本发明公开了一种问答社区中基于模体的问题推荐方法,其步骤包括:1、采集数据并构建问答社区网络;2、使用模体挖掘算法挖掘用户网络中的模体,并基于模体构建模体网络;3、使用网络嵌入学习算法学习网络的节点嵌入,学习到回答者对于提问者及问题的偏好;4、融合回答者两方面的偏好,利用评分函数预测回答者对于新问题的匹配程度,依据匹配分数将回答者降序排列,并给前N个用户推荐该问题进行回答,从而完成问题推荐任务。本发明结合了模体挖掘算法和模体网络的嵌入学习算法,利用图神经网络充分捕捉了模体网络中的用户历史交互信息,并充分融合了用户个人特征信息、网络结构信息和文本语义信息,从而实现了更准确的推荐效果。
-
公开(公告)号:CN112905741B
公开(公告)日:2022-04-12
申请号:CN202110183557.3
申请日:2021-02-08
申请人: 合肥供水集团有限公司 , 合肥工业大学
IPC分类号: G06F16/33 , G06F16/335 , G06F40/30
摘要: 本发明公开了一种考虑时空特征的供水用户关注点挖掘方法,其步骤包括:1.基于时间维度数据,构建T个带时间标签的用水文本数据;2.基于空间维度数据,构建K个带空间标签的用水文本数据;3.基于时间和空间维度数据,构建T×K个带时‑空标签的用水文本数据;4.对所述用户反馈的用水文本数据进行去停用词、语义对齐以及分词处理,得到预处理后的用水文本数据;5.利用TF‑IDF在微观局部上挖掘出用户用水的关注点;6.利用主题模型在宏观整体上挖掘出用户用水的关注点。本发明能通过对用户反馈的用水文本数据进行挖掘,从而能快速且精确的得到用户对用水的关注点,并结合TF‑IDF和主题模型技术,在微观局部与宏观整体上实现结果的对比。
-
-
-
-
-
-
-
-
-