基于成果转化大模型的语义增强文本匹配方法及系统

    公开(公告)号:CN119988589A

    公开(公告)日:2025-05-13

    申请号:CN202510161554.8

    申请日:2025-02-13

    Abstract: 本发明属于大模型应用技术领域,尤其涉及一种基于成果转化大模型的语义增强文本匹配方法及系统。其中,基于成果转化大模型的语义增强文本匹配方法包含五个部分,分别是数据与知识的的准备、多层次语义知识的增强、语义差异性的学习、语义信息的智能权重分配、文本相似性的预测。数据与知识的准备用于构建文本匹配任务所需的基础数据和知识资源,通过文本预处理和知识库构建。多层次语义知识的增强,通过在词级、短语级和句式级三个层次注入外部知识,丰富文本的语义表示。语义差异性的学习,通过对比学习框架学习细粒度的语义特征,提升模型对文本语义差异的识别能力。语义信息的智能权重分配,通过评估特征重要性和动态调整权重,实现不同来源信息的动态平衡与优化组合。文本相似性的预测,通过整合前述各个阶段的特征信息,计算文本对的相似度分数,并提供可解释的预测结果。本发明基于成果转化大模型设计了完整的文本匹配方法与系统,有效解决了大模型在文本匹配任务中知识利用不足、语义表示不全面、特征权重固定等问题,提升了大模型在实际应用场景中的文本匹配效果,为大模型技术的成果转化提供了可行的解决方案。

    一种基于深度字符树模型的图像可解释性及防御扰动方法

    公开(公告)号:CN115019081B

    公开(公告)日:2024-11-19

    申请号:CN202210313273.6

    申请日:2022-03-28

    Applicant: 广州大学

    Inventor: 王宇 卓胜达 吴迪

    Abstract: 本发明公开了一种基于深度字符树模型的图像可解释性及防御扰动方法,收集相关的输入图像数据集,对图像数据集进行初步预处理,处理并保存使用五种攻击扰动算法生成对应的五种不同对抗样本及不经过任何处理的正常样本,将对应不同的对抗样本+正常样本作为训练样本,将训练样本输入到深度字符树模型训练,采用对抗样本+正常样本作为测试样本,检验模型的防御能力,模型对不同的扰动样本高亮显示输出对应的扰动决策点。该基于深度字符树模型的图像可解释性及防御扰动方法,对于不同的对抗样本具备有很好防御能力的同时,也具备有对不同对抗样本扰动攻击点的可解释性,从而确保能精确识别出不同的对抗样本对图像的攻击扰动最大决策点所处位置。

    一种基于混合数据流的在线学习建模方法

    公开(公告)号:CN116245155A

    公开(公告)日:2023-06-09

    申请号:CN202211531995.5

    申请日:2022-12-01

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于混合数据流的在线学习建模方法,包括以下步骤:S1、预处理数据集,构建混合数据集;S2、定义在混合数据下的Gaussian Copula模型;S3、针对连续型和序数型、离散型数据,分别使用S2中所定义的Gaussian Copula模型来计算各自的潜在特征空间;S4、设计使用滑动窗口缓冲区,来更新步骤S1中所定义的数据流;S5、使用EM算法更新极大似然函数,其中E‑step更新Gaussian Copula模型,M‑step更新协相关矩阵;S6、模型通过上述S5更新联合分布函数,以及获得混合数据的连续潜在特征空间Z,潜在特征空间Z用于在线学习模型的更新;本发明能有效解决混合流式数据导致在线学习模型或算法收敛速度和精度下降的问题,也能有效的解决在线混合数据特征空间重构问题。

    一种基于GAN模型的多数据特征域扰动攻击方法

    公开(公告)号:CN115967944A

    公开(公告)日:2023-04-14

    申请号:CN202211382604.8

    申请日:2022-11-07

    Applicant: 广州大学

    Abstract: 本发明提出了一种基于GAN模型的多数据特征域扰动攻击方法,其特征在于:所述GAN模型是包括生成器和判别器这两个神经网络,通过生成器与判别器之间的相互博弈,达到相互平衡的状态的模型。所述多数据特征域是指同一物体的数据存在形式并不是单一的,如雷达数据就包括复数、实数及RGB等三种格式,同样音频也存在有时频、空间频域等格式。该基于GAN模型的多数据特征域扰动攻击方法,提出相对均值交叉熵损失函数,在考虑单一样本的区分情况下,也考虑同一类别的区分情况。同时通过跨域算法实现不同数据特征空间都成功发起扰动攻击,并且能灵活在不同的数值空间上迁移扰动,从而实现对样本的有目标跨域攻击以及无目标跨域攻击。

    一种基于深度字符树模型的图像可解释性及防御扰动方法

    公开(公告)号:CN115019081A

    公开(公告)日:2022-09-06

    申请号:CN202210313273.6

    申请日:2022-03-28

    Applicant: 广州大学

    Inventor: 王宇 卓胜达 吴迪

    Abstract: 本发明公开了一种基于深度字符树模型的图像可解释性及防御扰动方法,收集相关的输入图像数据集,对图像数据集进行初步预处理,处理并保存使用五种攻击扰动算法生成对应的五种不同对抗样本及不经过任何处理的正常样本,将对应不同的对抗样本+正常样本作为训练样本,将训练样本输入到深度字符树模型训练,采用对抗样本+正常样本作为测试样本,检验模型的防御能力,模型对不同的扰动样本高亮显示输出对应的扰动决策点。该基于深度字符树模型的图像可解释性及防御扰动方法,对于不同的对抗样本具备有很好防御能力的同时,也具备有对不同对抗样本扰动攻击点的可解释性,从而确保能精确识别出不同的对抗样本对图像的攻击扰动最大决策点所处位置。

    智能音箱网络流量异常的检测方法、系统、设备和介质

    公开(公告)号:CN114172706A

    公开(公告)日:2022-03-11

    申请号:CN202111432544.1

    申请日:2021-11-29

    Applicant: 广州大学

    Abstract: 本发明公开了一种智能音箱网络流量异常的检测方法、系统、电子设备和存储介质,所述方法包括:采集智能音箱网络流量数据;对所述智能音箱网络流量数据进行预处理,得到特征数据集;对所述特征数据集中的特征进行Hurst指数估计,根据Hurst值选取异常检测的特征;其中,所述进行Hurst指数估计分别采用重标度极差分析法、方差时间法和迭代估计算法;根据所述异常检测的特征,对待测智能音箱网络流量进行异常检测。本发明利用重标度极差分析法、方差时间法和迭代估计算法等方法对选定的特征进行Hurst指数估计,根据Hurst值的取值范围来判断智能音箱网络的安全状况,确保检测方法的可靠性。

    一种基于联邦半监督学习的网络流量分类方法和系统

    公开(公告)号:CN113705712A

    公开(公告)日:2021-11-26

    申请号:CN202111028686.1

    申请日:2021-09-02

    Applicant: 广州大学

    Abstract: 本发明涉及网络流量分类领域,为一种基于联邦半监督学习的网络流量分类方法和系统,其包括:数据预处理模块,用于通过增强采样方法获取客户端本地的无标签网络流和服务端中的标签网络流,得到无标签数据集和标记数据集;客户端预训练模块,用于客户端执行本地无监督训练,通过自编码器模型学习各个客户端上本地数据的特征,将学习到的数据特征用于训练分类器;服务器端重训练模块,用于服务器端执行有监督训练,利用联邦服务器上的带标记数据对重训练模型执行重训练,得到一个用于客户端分类网络流的通用分类器。本发明可以在保护用户数据隐私的前提下,协助多方在不公开和共享本地用户数据集的情况下共同学习一个准确且通用的网络流量分类模型。

    一种基于深度强化学习的数据中心网络路由方法

    公开(公告)号:CN108401015B

    公开(公告)日:2020-10-02

    申请号:CN201810105232.1

    申请日:2018-02-02

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于深度强化学习的数据中心网络路由方法,包括下述步骤:S1、为网络划分区域,将全网划分为多个社团,一个社团作为一个区域,每个区域中节点介数最大的节点上部署一个SDN控制器,并在其上部署代理agent;S2、建立网络的全局视图,SDN控制器建立节点的邻接矩阵,节点之间链路的资源值为缓存与带宽的复合资源;S3、构建面向路由的深度强化学习框架;S4、确定路由的路径以及转发规则,SDN控制器根据agent的动作选择结果确定路径。本发明基于数据驱动的思想,将流对性能的要求转换为流对网络资源的要求;利用深度学习感知和表示高维度数据的能力发现资源的多维度特征表示,最终实现在SDN控制面为流优化地分配网络资源,实现自适应的智能路由。

    一种基于网络安全的低轨卫星仿真系统

    公开(公告)号:CN115765842A

    公开(公告)日:2023-03-07

    申请号:CN202211423379.8

    申请日:2022-11-14

    Applicant: 广州大学

    Abstract: 本发明设计了一种基于网络安全的低轨卫星仿真系统,比以往的工作更友好、更详细。本发明在Linux系统中使用Python和JavaScript语言实现了LEOCN,深入考虑了拓扑和路由算法、可视化、卫星移动性、通信协议和网络流量。主要包括以下模块:节点模块、连接模块、星群模块、拓扑模块、网络模块、监控模块。在此基础上,本发明可以在LEOCN上通过SDN或节点部署的方式进行路由算法的实验,并以此为基础开展更进一步的边缘计算、机器学习、区块链方面的实验。

Patent Agency Ranking