一种基于深度学习的中文分词方法

    公开(公告)号:CN109086267B

    公开(公告)日:2022-07-26

    申请号:CN201810756452.0

    申请日:2018-07-11

    发明人: 王传栋 史宇 李智

    IPC分类号: G06F40/289 G06N3/02

    摘要: 本发明公开了一种基于深度学习的中文分词方法,包括如下步骤:基于字面字频将汉字映射为字面向量;对字面向量进行精化,提取携带上下文语义信息的特征向量和携带字性特征的特征向量;将字符级别向量有效融合成词级别的分布式表示,再将融合好的候选词向量送入深度学习模型中计算句子得分,运用集束搜索的方法进行解码,最终通过句子得分来选择合适的分词结果。如此使得分词任务从繁琐的特征工程中解脱出来,通过提取更丰富的特征信息能够获得更好的系统性能,并且利用完整的分割历史进行建模,具有序列级别的分词能力。

    一种基于KNN离群点检测算法的网络入侵检测方法及系统

    公开(公告)号:CN111314327A

    公开(公告)日:2020-06-19

    申请号:CN202010078565.7

    申请日:2020-02-03

    IPC分类号: H04L29/06 G06K9/62 G06N20/20

    摘要: 本发明公开了一种基于KNN离群点检测算法的网络入侵检测方法及系统,该方法包括以下步骤,训练阶段:采集网络流量数据集,并将数据集进行预处理,得到第一层网络疑似入侵数据集;采用遗传算法对第一层网络疑似入侵数据特征进行寻优,得到第二层疑似入侵数据集;将事先分好类别的训练数据集分别使用KNN离群点检测算法优化,得到若干个新数据集;采用果蝇算法优化随机森林算法,并使用若干个新数据集分别对随机森林进行训练,得到训练模块;测试阶段:采用第二层疑似入侵数据集对训练模型进行分类。该方法从检测正确率,误报率,漏报率三个方面进行比较,对于传统的方法来说,有了更好的检测效果和正确性。

    一种基于卷积神经网络的无人驾驶行人轨迹预测方法

    公开(公告)号:CN109635793A

    公开(公告)日:2019-04-16

    申请号:CN201910097865.7

    申请日:2019-01-31

    IPC分类号: G06K9/00 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于卷积神经网络的无人驾驶行人轨迹预测方法,包括处理样本数据、获取输入信息序列、构建并优化网络、测试及评估最优模型。将无人驾驶车辆上的视觉传感器采集到的实时视频,分割成以帧为单位的图像作为样本数据,将样本数据中即将通过斑马线的目标人群划分成三类,从样本中获取行人位置‑比例信息序列、行人骨架信息序列、视觉传感器自身运动序列,再将信息序列输入卷积神经网络进行训练,得到初步的预测模型,经过测试和评估,最终输出预测轨迹和动作类别。本发明采用卷积神经网络进行无人驾驶行人轨迹预测,可以有效降低无人驾驶车辆在道路行驶过程中碰撞行人发生的概率。

    一种基于神经网络聚类优化的Web服务发现的实现方法

    公开(公告)号:CN102123172B

    公开(公告)日:2014-09-10

    申请号:CN201110046066.0

    申请日:2011-02-25

    IPC分类号: H04L29/08 G06F17/30

    摘要: 本发明提供一种基于神经网络聚类优化的Web服务发现的实现方法,主要用于解决开放网络环境下快速、准确地发现满足用户需求的Web服务。本发明由服务请求子系统、服务提供子系统、服务注册中心和服务发现中介子系统四部分组成。其中服务发现中介子系统是该系统的核心构件,包括服务表示模块、服务分类模块和服务匹配模块。本发明实现了一个聚类优化的语义Web服务发现原型系统,真实Web服务数据集上的评测结果表明,本发明不仅具有较高的服务发现效率和精度,而且实现简单,系统灵活,代价低,易推广。

    一种基于神经网络聚类优化的Web服务发现的实现方法

    公开(公告)号:CN102123172A

    公开(公告)日:2011-07-13

    申请号:CN201110046066.0

    申请日:2011-02-25

    IPC分类号: H04L29/08 G06F17/30

    摘要: 本发明提供一种基于神经网络聚类优化的Web服务发现的实现方法,主要用于解决开放网络环境下快速、准确地发现满足用户需求的Web服务。本发明由服务请求子系统、服务提供子系统、服务注册中心和服务发现中介子系统四部分组成。其中服务发现中介子系统是该系统的核心构件,包括服务表示模块、服务分类模块和服务匹配模块。本发明实现了一个聚类优化的语义Web服务发现原型系统,真实Web服务数据集上的评测结果表明,本发明不仅具有较高的服务发现效率和精度,而且实现简单,系统灵活,代价低,易推广。

    一种基于时序先验和稀疏表示的IP网络流量估计方法

    公开(公告)号:CN112564945A

    公开(公告)日:2021-03-26

    申请号:CN202011318745.4

    申请日:2020-11-23

    发明人: 王传栋 张永

    IPC分类号: H04L12/24 H04L12/26

    摘要: 本发明公开了一种基于时序先验和稀疏表示的IP网络流量估计方法,首先采集网络中所有源‑目的节点对间传输的流量值构建不完整的流量矩阵;然后通过对不完整的流量矩阵中存在的时空相关性,利用稀疏表示理论和正则化技术建模为流量矩阵估计模型;然后通过交替方向乘子法,将较为复杂的原始问题转换为若干易于求解的子问题,通过迭代优化子问题的全局最优解来找到原始问题的局部最优解。最终估计出完整的流量矩阵。本发明基于流量矩阵中的时序性和空间相关性,考虑相邻网络结点的时序相关性的同时能够利用流量矩阵的空间相关性,为流量估计方法的优化提供了理论支持。

    一种基于深度学习的中文分词方法

    公开(公告)号:CN109086267A

    公开(公告)日:2018-12-25

    申请号:CN201810756452.0

    申请日:2018-07-11

    发明人: 王传栋 史宇 李智

    IPC分类号: G06F17/27 G06N3/02

    摘要: 本发明公开了一种基于深度学习的中文分词方法,包括如下步骤:基于字面字频将汉字映射为字面向量;对字面向量进行精化,提取携带上下文语义信息的特征向量和携带字性特征的特征向量;将字符级别向量有效融合成词级别的分布式表示,再将融合好的候选词向量送入深度学习模型中计算句子得分,运用集束搜索的方法进行解码,最终通过句子得分来选择合适的分词结果。如此使得分词任务从繁琐的特征工程中解脱出来,通过提取更丰富的特征信息能够获得更好的系统性能,并且利用完整的分割历史进行建模,具有序列级别的分词能力。

    一种基于多模双线性池化融合GNN的事件关系抽取方法

    公开(公告)号:CN115964660A

    公开(公告)日:2023-04-14

    申请号:CN202211693617.7

    申请日:2022-12-28

    摘要: 本发明属于数据挖掘技术领域,公开了一种基于多模双线性池化融合GNN的事件关系抽取方法,包括:步骤1:对数据集进行预处理,划分双重GNN模型的训练集和测试集;步骤2:利用BiLSTM作为句子编码器,来获取每个句子中单词基于上下文的隐表示;步骤3:将隐表示分别输入到SynGCN模块和SemGAT模块中,提取句法结构特征和语义特征;步骤4:使用多模双线性池化来融合两模块的特征,再用PCA对特征进行降维后,利用融合特征来进行关系分类,得到对应关系的概率;步骤5:对网络参数进行优化更新;步骤6:根据训练好的模型,对测试集中的数据进行预测。本发明时考虑句法特征和语义特征,达到对句子的全局理解。