-
公开(公告)号:CN118675233B
公开(公告)日:2024-11-12
申请号:CN202411170926.5
申请日:2024-08-26
Applicant: 南京邮电大学
IPC: G06V40/20 , G06V10/774 , G06V10/40
Abstract: 本发明公开了面向可控人类图像生成的姿态修正方法及计算机设备,其中方法包括:S1:对可控人类图像生成模型提取文本特征张量;S2:将文本特征张量池化后进行裁剪、展平,得到一维文本张量;S3:将一维文本张量与扩散步张量相加,得到条件张量;S4:将预测噪音张量做切片处理,得到噪音张量;S5:将位置编号张量与噪音张量相加,得到新噪音张量;S6:将新噪音张量按序输入至层归一化网络及多头自注意力网络中,得到输出张量;S7:将输出张量与条件张量同时输入至多头交叉注意力网络中,得到最终预测噪音张量;S8:生成姿态控制精度更高的最终图像。本发明能够提高姿态控制的精确度。
-
公开(公告)号:CN113947085B
公开(公告)日:2024-11-08
申请号:CN202111235560.1
申请日:2021-10-22
Applicant: 南京邮电大学
IPC: G06F40/295 , G06F40/216 , G06F16/332 , G06F17/15 , G06F17/16
Abstract: 一种面向智能问答系统的命名实体识别方法,包括如下步骤:为每条样本以滑动窗口的方式拼接上下文,并将普通的文本数据形式转化为机器阅读理解数据的形式;通过Bert预训练模型生成词向量特征;根据词向量特征,分别使用多尺度卷积与双向时序运算对其进行编码,得到样本的全局特征与局部特征;以等权重的方式为词向量特征拼接上全局特征与局部特征以增强词向量特征,得到上下文特征;对上下文特征采用多个线性网络识别文本中的命名实体。本发明能够充分利用问答系统中用户输入句子的上下文信息,以精准地抽取出用户问题中的命名实体;可以在命名实体识别的公开数据上都取得优异的效果,在对准确率要求较高的智能问答系统中具有良好的实用性。
-
公开(公告)号:CN118552261B
公开(公告)日:2024-10-18
申请号:CN202411025749.1
申请日:2024-07-30
Applicant: 南京邮电大学
IPC: G06Q30/0251 , G06Q30/0241 , G06N3/0499 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于多梯度兴趣上下文网络的点击率预测方法,步骤包括:1、用户行为序列建模,采用Transformer结构和多头自注意力机制,捕捉用户兴趣的长短期动态演变,发现复杂兴趣模式;2、广告上下文信息融合,将广告上下文信息嵌入模型,结合本地激活单元,自适应学习用户兴趣表示,增强对广告环境的理解,提高推荐精度;3、特征交互处理,引入因子分解机模块处理低阶特征交互,充分考虑用户和广告属性之间的关系,提升数据建模效果。通过对用户行为序列、广告上下文信息和特征交互进行建模和融合,并使用改进算法训练,与传统方法和现有模型相比,该模型显著提高了点击率预测的精度,对在线广告推荐系统的改进具有重要意义。
-
公开(公告)号:CN118673218A
公开(公告)日:2024-09-20
申请号:CN202410883074.8
申请日:2024-07-02
Applicant: 南京邮电大学
IPC: G06F16/9535 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/045 , G06N3/0985 , G06Q30/0601
Abstract: 本发明涉及一种基于多视图转换的双目标域个性化物品推荐方法及装置,属于人工智能技术领域。方法包括:通过对用户行为进行编码和模型训练,得到每个目标域的用户直接嵌入、用户关系嵌入和用户基于元路径的嵌入;分别构建个性化桥接函数,将本目标域的各个用户嵌入转换到另一个目标域;对各个转换后的嵌入进行合并,得到转换到本目标域的多视图转换嵌入;利用本目标域的解码器对用户直接嵌入和多视图转换嵌入进行解码,分别得到域内和跨域预测的物品推荐结果;利用联合损失函数对整个模型进行训练。本方法能够提供更加个性化和精确的推荐内容,有效减少单一视角带来的偏差和数据稀疏性问题,提高整体推荐系统的鲁棒性和可靠性。
-
公开(公告)号:CN118571015A
公开(公告)日:2024-08-30
申请号:CN202410774637.X
申请日:2024-06-17
Applicant: 南京邮电大学
IPC: G08G1/01 , G06N3/08 , G06F18/214
Abstract: 本发明涉及一种基于深度学习的道路交通流量预测方法及系统,涉及智慧交通流量预测技术领域。方法包括:构建城市道路的网络拓扑结构图,建立预测交通流量的训练模型,将特征提取得到的节点特征和边特征作为输入,利用融合了时空自注意机制的所述特征表示对所述训练模型进行训练,得到预测模型;将待预测时刻的节点特征数据输入所述预测模型,输出预测的该时刻的交通流量;对所述预测模型进行评估,根据评估结果对所述预测模型进行优化,调整所述预测模型的结构和参数。该方法不仅可以在单个交通节点上进行流量预测,还可以在整个路网范围内进行预测,具有较强的普适性和适用性,能够提高交通流量预测的精度和鲁棒性。
-
公开(公告)号:CN118433200A
公开(公告)日:2024-08-02
申请号:CN202410461015.1
申请日:2024-04-17
Applicant: 国网江苏省电力有限公司信息通信分公司 , 南京邮电大学 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: H04L67/1095 , H04L67/1097 , H04L67/563 , H04L67/1001
Abstract: 本发明涉及数据多副本技术领域,本发明所述方法包括,通过对具有业务关联的待迁移数据副本建立逻辑聚合关系,将复杂的大规模数据副本迁移问题通过聚合函数进行描述,解决了对于复杂的云边环境下的数据副本有序化迁移建模问题,使问题描述简单;而且能够将待迁移数据副本位置、业务关联及迁移目标节点、边缘计算设施分布及其容量等影响迁移规划的因素考虑在内,给待迁移数据副本提供有序化迁移引导,在迁移过程中对边缘计算设施容量进行均衡分配,节省了大量数据迁移时间,实现高效率有序化迁移。
-
公开(公告)号:CN117971294A
公开(公告)日:2024-05-03
申请号:CN202410153617.0
申请日:2024-02-02
Applicant: 国网江苏省电力有限公司信息通信分公司 , 南京邮电大学 , 国网江苏省电力有限公司 , 国家电网有限公司
IPC: G06F8/70
Abstract: 本发明公开了一种面向云边算网的微服务编排方法及系统,涉及云计算和微服务技术领域。包括基于逻辑映射方程,在模糊空间中随机生成m个模糊变量;通过模糊初始化将m个模糊变量映射到m种微服务上,得到一个初始化微服务编排方案;通过迭代执行得到n个初始化微服务编排方案;根据个性化调节函数评价n个微服务编排方案以确定最佳微服务编排方案;若最佳微服务编排方案是理论最佳或迭代次数达到上限,则输出最终的全局最佳微服务编排方案;若最佳微服务编排方案不是理论最佳,则使用模糊扰动更新n个微服务编排方案。本发明在搜索过程中采用模糊搜索,充分遍历所有可能的最佳微服务编排方案,保证了微服务编排方案的多样性。
-
公开(公告)号:CN117955747A
公开(公告)日:2024-04-30
申请号:CN202410349047.2
申请日:2024-03-26
Applicant: 南京邮电大学
Abstract: 本发明公开了一种用于语音识别系统的后门安全性评估方法、装置及介质,属于人工智能技术领域。方法包括:根据已有训练好的语音合成模型计算得到优化损失函数,优化生成宿主样本及其语音风格参数,并组成宿主样本集;将触发器注入所述宿主样本集中,组合生成中毒样本集,并与原始训练样本集组合生成混合训练样本集;将已有干净语音训练模型在混合训练样本集中进行标准化训练,生成受害者模型;将干净测试样本以及带有隐形触发器的测试样本分别输入到受害者模型;根据精度测试及后门攻击的结果对受害者模型进行安全性评估。本发明通过语音合成、反向梯度优化及设定目标损失函数的方式,保证了后门攻击下良性训练样本的易获取及标签干净。
-
公开(公告)号:CN117690191B
公开(公告)日:2024-04-30
申请号:CN202410150884.2
申请日:2024-02-02
Applicant: 南京邮电大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/80 , G06N3/048
Abstract: 本发明公开了一种用于智能监控系统的弱监督异常行为智能检测方法,涉及异常行为检测技术领域,本发明结合弱监督伪标签生成和跨模态交互的思想设计网络结构,以解决弱监督下精细的片段标签缺失的问题,提高网络对弱监督异常行为识别的准确性,其损失函数兼顾帧级识别和视频级识别的需求,且对噪声鲁棒,可以应用到智能监控设备异常行为检测的任务中。
-
公开(公告)号:CN117393000B
公开(公告)日:2024-04-16
申请号:CN202311490667.X
申请日:2023-11-09
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于神经网络和特征融合的合成语音检测方法,所述方法包括:获取音频待测数据集,对音频待测数据集提取音频的声学特征和对应的频谱图图像特征;将音频的声学特征和对应的频谱图图像特征输入预先训练的合成音频检测模型中,分别得到音频的真实性分数一和音频的真实性分数二;将音频的真实性分数一和音频的真实性分数二加权融合,得到特征信息融合后的音频真实性得分;将得到的特征信息融合后的真实性得分与预先设定的阈值比较得到最终音频检测结果;本发明巧妙融合了声学特征和频谱图图像信息进行合成语音检测,具有更好的稳定性和泛化能力。
-
-
-
-
-
-
-
-
-