面向可控人类图像生成的姿态修正方法及计算机设备

    公开(公告)号:CN118675233B

    公开(公告)日:2024-11-12

    申请号:CN202411170926.5

    申请日:2024-08-26

    Inventor: 徐小龙 许逸非

    Abstract: 本发明公开了面向可控人类图像生成的姿态修正方法及计算机设备,其中方法包括:S1:对可控人类图像生成模型提取文本特征张量;S2:将文本特征张量池化后进行裁剪、展平,得到一维文本张量;S3:将一维文本张量与扩散步张量相加,得到条件张量;S4:将预测噪音张量做切片处理,得到噪音张量;S5:将位置编号张量与噪音张量相加,得到新噪音张量;S6:将新噪音张量按序输入至层归一化网络及多头自注意力网络中,得到输出张量;S7:将输出张量与条件张量同时输入至多头交叉注意力网络中,得到最终预测噪音张量;S8:生成姿态控制精度更高的最终图像。本发明能够提高姿态控制的精确度。

    一种面向智能问答系统的命名实体识别方法

    公开(公告)号:CN113947085B

    公开(公告)日:2024-11-08

    申请号:CN202111235560.1

    申请日:2021-10-22

    Abstract: 一种面向智能问答系统的命名实体识别方法,包括如下步骤:为每条样本以滑动窗口的方式拼接上下文,并将普通的文本数据形式转化为机器阅读理解数据的形式;通过Bert预训练模型生成词向量特征;根据词向量特征,分别使用多尺度卷积与双向时序运算对其进行编码,得到样本的全局特征与局部特征;以等权重的方式为词向量特征拼接上全局特征与局部特征以增强词向量特征,得到上下文特征;对上下文特征采用多个线性网络识别文本中的命名实体。本发明能够充分利用问答系统中用户输入句子的上下文信息,以精准地抽取出用户问题中的命名实体;可以在命名实体识别的公开数据上都取得优异的效果,在对准确率要求较高的智能问答系统中具有良好的实用性。

    基于多梯度兴趣上下文网络的点击率预测方法

    公开(公告)号:CN118552261B

    公开(公告)日:2024-10-18

    申请号:CN202411025749.1

    申请日:2024-07-30

    Inventor: 徐小龙 郑佳奇

    Abstract: 本发明公开了一种基于多梯度兴趣上下文网络的点击率预测方法,步骤包括:1、用户行为序列建模,采用Transformer结构和多头自注意力机制,捕捉用户兴趣的长短期动态演变,发现复杂兴趣模式;2、广告上下文信息融合,将广告上下文信息嵌入模型,结合本地激活单元,自适应学习用户兴趣表示,增强对广告环境的理解,提高推荐精度;3、特征交互处理,引入因子分解机模块处理低阶特征交互,充分考虑用户和广告属性之间的关系,提升数据建模效果。通过对用户行为序列、广告上下文信息和特征交互进行建模和融合,并使用改进算法训练,与传统方法和现有模型相比,该模型显著提高了点击率预测的精度,对在线广告推荐系统的改进具有重要意义。

    一种基于多视图转换的双目标域个性化物品推荐方法及装置

    公开(公告)号:CN118673218A

    公开(公告)日:2024-09-20

    申请号:CN202410883074.8

    申请日:2024-07-02

    Inventor: 徐小龙 朱凡 徐佳

    Abstract: 本发明涉及一种基于多视图转换的双目标域个性化物品推荐方法及装置,属于人工智能技术领域。方法包括:通过对用户行为进行编码和模型训练,得到每个目标域的用户直接嵌入、用户关系嵌入和用户基于元路径的嵌入;分别构建个性化桥接函数,将本目标域的各个用户嵌入转换到另一个目标域;对各个转换后的嵌入进行合并,得到转换到本目标域的多视图转换嵌入;利用本目标域的解码器对用户直接嵌入和多视图转换嵌入进行解码,分别得到域内和跨域预测的物品推荐结果;利用联合损失函数对整个模型进行训练。本方法能够提供更加个性化和精确的推荐内容,有效减少单一视角带来的偏差和数据稀疏性问题,提高整体推荐系统的鲁棒性和可靠性。

    一种基于深度学习的道路交通流量预测方法及系统

    公开(公告)号:CN118571015A

    公开(公告)日:2024-08-30

    申请号:CN202410774637.X

    申请日:2024-06-17

    Abstract: 本发明涉及一种基于深度学习的道路交通流量预测方法及系统,涉及智慧交通流量预测技术领域。方法包括:构建城市道路的网络拓扑结构图,建立预测交通流量的训练模型,将特征提取得到的节点特征和边特征作为输入,利用融合了时空自注意机制的所述特征表示对所述训练模型进行训练,得到预测模型;将待预测时刻的节点特征数据输入所述预测模型,输出预测的该时刻的交通流量;对所述预测模型进行评估,根据评估结果对所述预测模型进行优化,调整所述预测模型的结构和参数。该方法不仅可以在单个交通节点上进行流量预测,还可以在整个路网范围内进行预测,具有较强的普适性和适用性,能够提高交通流量预测的精度和鲁棒性。

    一种用于语音识别系统的后门安全性评估方法、装置及介质

    公开(公告)号:CN117955747A

    公开(公告)日:2024-04-30

    申请号:CN202410349047.2

    申请日:2024-03-26

    Inventor: 唐瑀 徐小龙

    Abstract: 本发明公开了一种用于语音识别系统的后门安全性评估方法、装置及介质,属于人工智能技术领域。方法包括:根据已有训练好的语音合成模型计算得到优化损失函数,优化生成宿主样本及其语音风格参数,并组成宿主样本集;将触发器注入所述宿主样本集中,组合生成中毒样本集,并与原始训练样本集组合生成混合训练样本集;将已有干净语音训练模型在混合训练样本集中进行标准化训练,生成受害者模型;将干净测试样本以及带有隐形触发器的测试样本分别输入到受害者模型;根据精度测试及后门攻击的结果对受害者模型进行安全性评估。本发明通过语音合成、反向梯度优化及设定目标损失函数的方式,保证了后门攻击下良性训练样本的易获取及标签干净。

    一种基于神经网络和特征融合的合成语音检测方法

    公开(公告)号:CN117393000B

    公开(公告)日:2024-04-16

    申请号:CN202311490667.X

    申请日:2023-11-09

    Inventor: 徐小龙 刘畅

    Abstract: 本发明公开了一种基于神经网络和特征融合的合成语音检测方法,所述方法包括:获取音频待测数据集,对音频待测数据集提取音频的声学特征和对应的频谱图图像特征;将音频的声学特征和对应的频谱图图像特征输入预先训练的合成音频检测模型中,分别得到音频的真实性分数一和音频的真实性分数二;将音频的真实性分数一和音频的真实性分数二加权融合,得到特征信息融合后的音频真实性得分;将得到的特征信息融合后的真实性得分与预先设定的阈值比较得到最终音频检测结果;本发明巧妙融合了声学特征和频谱图图像信息进行合成语音检测,具有更好的稳定性和泛化能力。

Patent Agency Ranking