-
公开(公告)号:CN107862039A
公开(公告)日:2018-03-30
申请号:CN201711078635.3
申请日:2017-11-06
Applicant: 工业和信息化部电子第五研究所 , 合肥工业大学 , 广州赛宝认证中心服务有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种网页数据获取方法及系统、数据匹配推送方法、计算机存储介质及设备,其中网页数据获取方法包括:将目标网页的网址与参考网址进行比较,确定所述网址的类型;根据所述网址的类型,确定网页搜索策略;根据所述网页搜索策略采集所述目标网页的网页数据。上述方案通过将目标网页的网址与预设参考网址进行比较,确定网址的类型,根据网址的类型确定网页搜索策略,通过采取该网页搜索策略对目标网页进行网页数据采集,从而提高了网页数据获取的效率。
-
公开(公告)号:CN107862039B
公开(公告)日:2020-11-17
申请号:CN201711078635.3
申请日:2017-11-06
Applicant: 工业和信息化部电子第五研究所 , 合肥工业大学 , 广州赛宝认证中心服务有限公司
IPC: G06F16/955 , G06F16/958 , G06F16/9535
Abstract: 本发明涉及一种网页数据获取方法及系统、数据匹配推送方法、计算机存储介质及设备,其中网页数据获取方法包括:将目标网页的网址与参考网址进行比较,确定所述网址的类型;根据所述网址的类型,确定网页搜索策略;根据所述网页搜索策略采集所述目标网页的网页数据。上述方案通过将目标网页的网址与预设参考网址进行比较,确定网址的类型,根据网址的类型确定网页搜索策略,通过采取该网页搜索策略对目标网页进行网页数据采集,从而提高了网页数据获取的效率。
-
公开(公告)号:CN107784112A
公开(公告)日:2018-03-09
申请号:CN201711080284.X
申请日:2017-11-06
Applicant: 广州赛宝认证中心服务有限公司 , 合肥工业大学 , 工业和信息化部电子第五研究所
IPC: G06F17/30
Abstract: 本发明涉及一种短文本数据增强方法,包括以下步骤:获取短文本文档合集,打开短文本文档合集内的所有文档,读取各文档的文本内容;将各文本内容作为文本数据增强项分别传送至临时存储区中;将临时存储区中的各文本数据增强项分别写入对应的文档中。上述短文本数据增强方法,通过读取文档的文本内容,将文本内容作为文本数据增强项传送至临时存储区中,将文本数据增强项写入文档中,在不引用外部信息的情况下,利用自身数据信息,增加文本长度,增强主题信息,有效提高主题质量,缓解了文本内容过少、文本稀疏性太强而无法深入理解主题信息的问题,有利于文本主题的挖掘。
-
公开(公告)号:CN107784112B
公开(公告)日:2020-03-03
申请号:CN201711080284.X
申请日:2017-11-06
Applicant: 广州赛宝认证中心服务有限公司 , 合肥工业大学 , 工业和信息化部电子第五研究所
IPC: G06F16/335 , G06F16/33 , G06F16/31 , G06F16/35
Abstract: 本发明涉及一种短文本数据增强方法,包括以下步骤:获取短文本文档合集,打开短文本文档合集内的所有文档,读取各文档的文本内容;将各文本内容作为文本数据增强项分别传送至临时存储区中;将临时存储区中的各文本数据增强项分别写入对应的文档中。上述短文本数据增强方法,通过读取文档的文本内容,将文本内容作为文本数据增强项传送至临时存储区中,将文本数据增强项写入文档中,在不引用外部信息的情况下,利用自身数据信息,增加文本长度,增强主题信息,有效提高主题质量,缓解了文本内容过少、文本稀疏性太强而无法深入理解主题信息的问题,有利于文本主题的挖掘。
-
公开(公告)号:CN119441640A
公开(公告)日:2025-02-14
申请号:CN202411579904.4
申请日:2024-11-07
Applicant: 合肥工业大学
IPC: G06F16/9537 , G06F16/9535 , G06F16/9538 , G06Q50/14 , G06F18/213
Abstract: 本发明公开了一种基于大模型图片内容特征增强的个性化景点推荐方法,包括:1、数据集获取与处理:获取带有地理标记图片的旅游数据集,并对图片的地理信息进行逆编码,得到用户‑景点交互矩阵;2、图片内容特征提取:利用大模型进行数据增强,将图片转为可解释性的文本语义信息;3、建立预测偏好模型:采用基于Wide&Deep变体的推荐模型,捕捉特征之间的直接关系;4、从预测偏好模型中得到用户对所有景点的偏好值,将偏好值进行降序排序,并选取前top个偏好值所对应的景点推荐给用户。本发明整合了地理信息、时间信息和大模型提取的图片内容属性信息,并设计基于Wide&Deep变体的推荐模型,从而有效提升了景点推荐的准确性和个性化水平。
-
公开(公告)号:CN118312671A
公开(公告)日:2024-07-09
申请号:CN202410419999.7
申请日:2024-04-09
Applicant: 合肥工业大学 , 科大讯飞股份有限公司
IPC: G06F16/9535 , G06N3/042 , G06N3/0455 , G06N3/09 , G06N3/0499 , G06F18/214 , G06F18/241
Abstract: 一种基于对比学习的可解释个性化推荐方法,设有三个核心模块来学习用户短期行为的顺序表示;利用门融合操作来整合在线用户的长期和短期行为偏好;对于关键字生成任务,使用了Transformer,它在文本生成中也得到了广泛的应用,利用多头自注意来计算输出序列od中关键字的注意权重,设计一个复制网络,从短期和长期关键词序列中复制关键词,在时间步t上,λt决定关键字是从关键字分布pvocab中生成的,还是从短期和长期关键字序列中复制的;这产生一个关键字概率分布:推荐产品还生成关键字,从而增强了推荐结果的可解释性;该方法同时实现个性化产品推荐和解释关键词生成任务,在这两个任务中整合了长期和短期用户偏好。
-
公开(公告)号:CN113963718B
公开(公告)日:2024-04-16
申请号:CN202111245978.0
申请日:2021-10-26
Applicant: 合肥工业大学
IPC: G10L25/27 , G10L25/45 , G10L25/78 , G10L25/24 , G06N3/0464 , G06N3/09 , G06F18/23213
Abstract: 本发明公开了一种基于深度学习的语音会话分割方法,包括:1获取会话语音集合并进行分帧和短时加窗处理;2筛除静音段;3提取语音信号的显式特征;4提取语音信号的隐式特征5κ‑means聚类。本发明方法在有背景噪声情况下仍然能保证分割聚类的准确性和时效性。
-
公开(公告)号:CN114387997B
公开(公告)日:2024-03-29
申请号:CN202210072804.7
申请日:2022-01-21
Applicant: 合肥工业大学 , 合肥供水集团有限公司
Abstract: 本发明公开了一种基于深度学习的语音情感识别方法,其步骤包括:1获取会话语音集合并进行分帧和加窗处理;2提取语音帧的LLDs特征序列和语谱图;3提取LLDs序列的表征;4提取语谱图的表征。5使用特征融合与结果融合的策略以得到最后的情感预测结果。本发明能有效预测语音的情感类别,并能提高预测准确性。
-
公开(公告)号:CN115935067A
公开(公告)日:2023-04-07
申请号:CN202211590930.8
申请日:2022-12-12
Applicant: 合肥工业大学
IPC: G06F16/9535 , G06F18/25 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种面向社会化推荐的语义与结构视图融合的物品推荐方法,其步骤包括:1提出社会化推荐中隐性关系的定义;2构建异构信息网络并定义元路径;3提取局部评分预测;4提取全局评分预测;5模型融合;6提出针对用户评级行为的约束;7模型训练并得到训练后的深度图模型和训练后的宽度线性注意力模型。本发明能在不同的社交关系分布不平衡性和稀疏性条件下仍能保证推荐的准确性和稳定性。
-
公开(公告)号:CN115731438A
公开(公告)日:2023-03-03
申请号:CN202211465025.X
申请日:2022-11-22
Applicant: 合肥工业大学
IPC: G06V10/80 , G06V10/764 , G06V10/82 , G06F16/35 , G06N3/0442
Abstract: 本发明公开了一种基于置信学习的有偏数据检测方法,包括:1.构建并表示包含有偏数据的数据集,2.构建多模态集成预测模块,3.多模态集成预测模块的训练,4.构建置信联合计数矩阵和联合概率分布,5.根据有偏率对有偏数据进行过滤。本发明基于置信学习框架,综合考虑了文本与图片的特征表达,能够估计含偏标签与正确标签的联合概率分布,从而能筛选出正确数据,并有效降低含偏标签对相关任务的影响。
-
-
-
-
-
-
-
-
-