-
公开(公告)号:CN110516239B
公开(公告)日:2022-12-09
申请号:CN201910788092.7
申请日:2019-08-26
Applicant: 贵州大学
IPC: G06F16/36 , G06F40/279 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种基于卷积神经网络的分段池化关系抽取方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量以及零向量对文本进行向量映射;步骤二:通过神经网络对向量矩阵进行卷积操作提取特征;步骤3:对卷积后的结果分段池化进一步抽象特征;步骤4:全连接、Softmax层预测结果。在充分利用句子文本完整信息的基础上,采用实体分割策略,引入神经网络技术,充分发挥神经网络分层自动提取高维抽象特征的特点,将提取由实体分割的文本各部分池化特征,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高关系抽取的性能。
-
公开(公告)号:CN105701495B
公开(公告)日:2022-08-16
申请号:CN201610001687.X
申请日:2016-01-05
Applicant: 贵州大学
Abstract: 本发明提供了一种图像纹理特征提取方法,本发明通过提供一种图像特征提取、训练、检测方法。原始图像归一化降低了光照变化、阴影和噪点的影响,特征提取采用类Haar方法,保留有原始图像中的边缘梯度信息,同时通过比较中心点和其上下左右点,四个对角点,在特征提取过程中加上权重信息,弥补了常规纹理特征的不足;特征的组合方式大大降低了特征维度,最终的特征提取方法在行人检测时,相比于常规的纹理特征有更低的特征维数和更快的训练和检测速度,同时检测率获得了相应的提高。
-
公开(公告)号:CN114840640A
公开(公告)日:2022-08-02
申请号:CN202210382738.3
申请日:2022-04-13
Applicant: 贵州大学 , 贵州耕云科技有限公司
IPC: G06F16/33 , G06F16/335 , G06F16/387 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明是一种基于ELECTRA‑GCNN‑CRF模型的中文文本语法错误检测方法。本发明涉及自然语言处理技术领域,本发明将文本语法错误检测视为序列标注任务,在输入层使用ELECTRA预训练语言模型替换BERT模型,避免预训练阶段与微调阶段数据不匹配的问题;通过GCNN获取文本的局部信息,减轻语法错误对上下文语义的影响;通过CRF得到表示文本中包含的语法错误范围和类型的标签序列,最后输出语法错误检测结果。本发明通用性较强,无需人工提取词法句法特征,节约了人力和时间成本,效果较好,满足了中文语法错误自动检测的需求。
-
公开(公告)号:CN109190547B
公开(公告)日:2021-11-19
申请号:CN201810986642.1
申请日:2018-08-28
Applicant: 贵州大学
Abstract: 本发明公开了一种快速高效的行人检测方法。本发明在传统的行人检测框架上做出了改进,在提取特征之前提出了一种基于BING特征的改进算法HWEBING对图像进行预检测,预检测能够减少大量的非物体的窗口,筛选出可能是物体的候选窗口。本发明的MLBP特征的检测率比均匀模式LBP和基本模式LBP的检测率分别提高了3.5%和2.1%。并且相比传统的行人检测方法,本方法利用HWEBING算法对图片进行预检测后再提取HOG和MLBP特征比直接提取HOG和MLBP特征的速度提高了5.5倍。使用HWEBING算法与HOG‑MLBP特征结合取得较好的行人检测效果。
-
公开(公告)号:CN111813935A
公开(公告)日:2020-10-23
申请号:CN202010570969.8
申请日:2020-06-22
Applicant: 贵州大学
IPC: G06F16/35 , G06F40/284
Abstract: 本发明公开了一种基于层次狄利克雷多项分配模型的多源文本聚类方法,所述方法包含有如下步骤:一、从多个来源收集文本集;二、将来自多个数据源的文本信息进行文本预处理;三、基于层次狄利克雷多项分配模型构建主题模型;四、进行Blocked Gibbs采样并更新参数;五、根据采样结果进行文本聚类。本发明通过更新多源文本的主题-词分布的先验参数,改善多源文本聚类效果;所建立的模型能够自动判别每个数据源文本中簇的数目,而不需要人为提前给定,能够较大程度地提高多源文本聚类效果。
-
公开(公告)号:CN111062210A
公开(公告)日:2020-04-24
申请号:CN201911355237.0
申请日:2019-12-25
Applicant: 贵州大学
IPC: G06F40/289 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于神经网络的谓语中心词识别方法,所述方法包括如下步骤:步骤一:基于预训练词向量和随机词向量对文本进行向量映射;步骤二:通过神经网络模型获取句子的特征及长期依赖关系;步骤三:使用Highway网络缓解深度模型中的梯度消失问题;步骤四:通过约束函数对序列标注的输出路径进行约束。该方法通过多层Bi-LSTM叠加获取句子内部的长期依赖关系。然后通过高速公路(Highway)连接缓解深层模型出现梯度消失的问题,最后,通过Softmax层进行归一化,得到一条最大化的标注路径,另外,通过约束函数对输出路径进行规划,解决谓语中心词的唯一性问题。
-
公开(公告)号:CN110516257A
公开(公告)日:2019-11-29
申请号:CN201910816186.0
申请日:2019-08-30
Applicant: 贵州大学
Abstract: 本发明公开了一种一种基于边界识别与组合的裁判文书证据抽取方法。为了有效抽取裁判文书里的证据,本发明分为三步:(1)使用RNNs识别证据实体的开始边界和结束边界。(2)组合所有开始边界和结束边界形成候选证据实体。(3)使用CNN对候选证据进行分类,识别真实的证据。基于边界识别与组合的方法弥补了传统的序列标注模型在长实体的识别上性能比较低的缺点,并且在一定程度上避免传统机器学习方法产生的特征稀疏问题,从而提高了裁判文书中证据抽取的性能。
-
公开(公告)号:CN110377912A
公开(公告)日:2019-10-25
申请号:CN201910669518.7
申请日:2019-07-24
Applicant: 贵州大学
Abstract: 本发明公开了一种基于多通道深度神经网络的关系识别方法,该方法可以有效获取句子的结构信息和语义信息。在关系识别任务中,能否有效获取句子的结构信息对最终识别效果有至关重要的作用。目前获取句子结构信息的方法主要是位置向量和解析树。本发明提出了一种新的获取句子结构信息的思路,即利用句子本身的特点,将句中两实体将句子切分成不同的部分,每部分作为一个通道单独进行词嵌入,经过深度神经网络进行特征提取,进行关系识别。使用真实数据证明该方法能显著提高关系识别效果。
-
公开(公告)号:CN110162790A
公开(公告)日:2019-08-23
申请号:CN201910437728.3
申请日:2019-05-24
Applicant: 贵州大学
Abstract: 本发明公开了一种基于神经网络的犯罪行为识别方法,所述方法包括以下步骤:一、介绍犯罪行为的概念,制定犯罪行为的标注规范,并构建犯罪行为数据集;二、面向步骤一中所得的数据集,以Attentional-BiLSTM-CRF神经网络结构模型为依托,进行犯罪行为识别。该方法通过介绍犯罪行为的概念,制定犯罪行为识别规范,并构建了犯罪行为数据集。我们面向法律裁判文书,研究针对案情要素的行为序列关键词提取方法,围绕“犯罪行为词”提取关键案情要素特征。提出基于Attentional-BiLSTM-CRF神经网络结构的犯罪行为识别方法,该方法可以有效地提高犯罪行为识别的性能,取得了很好的效果。
-
公开(公告)号:CN109032282A
公开(公告)日:2018-12-18
申请号:CN201811162855.9
申请日:2018-09-30
Applicant: 贵州大学
Abstract: 本发明公开了一种防水型电脑主机机箱,包括箱体、散热组件、第一螺纹孔、支撑座、箱盖、磁性封条、通孔、转手、螺纹杆、散热栅、第二螺纹孔、升降杆、支撑板和万向轮,所述箱体内侧一壁安装有散热组件,本发明结构科学合理,使用安全方便,箱体和箱盖通过螺栓连接固定,通过箱盖一侧的磁性封条保证机箱的密封性,则使机箱整体具有良好的防水性,箱体一侧的内壁安装有散热组件,通过箱体外侧的散热栅共同完成机箱的散热;通过转动转手,促使升降杆在螺纹杆上升降,伸长时,升降杆底部的支撑板上的万向轮起到支撑作用,即可通过万向轮进行整体移动,收缩时,则箱体底部的支撑座起到支撑固定作用。
-
-
-
-
-
-
-
-
-