一种基于词汇投影混合标签学习的文本分类方法

    公开(公告)号:CN116304027A

    公开(公告)日:2023-06-23

    申请号:CN202310139656.0

    申请日:2023-02-20

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于词汇投影混合标签学习的文本分类方法,该方法首先基于所有样本的标签和文本使用TF‑IDF和注意力结合建了标签的特征词词汇表丰富标签信息,并进行投影提纯保留每个标签之间的独立性;再使用语义学习模型对样本模型进行语义信息的学习;接着在one‑hot编码的基础上,使用语义信息和标签特征词词汇表建立样本文本和各个标签之间的混合学习,得到混合学习标签;最后在输出层对语义信息进行分类,并计算其和混合学习标签之间的KL散度作为最后的交叉熵损失;由于标签混合学习模型不参与语义学习模型和分类的过程中,因此,对模型分类的性能没有影响,并且语义学习模型中的特征提取器可以换成任意模型,有较高的自由度和灵活度。

    一种基于UFLane-Detection的车道线检测方法

    公开(公告)号:CN116188779A

    公开(公告)日:2023-05-30

    申请号:CN202310162660.9

    申请日:2023-02-24

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于UFLane‑Detection的车道线检测方法,采集行车记录仪拍摄的车道线图片,并对图片进行清洗后获得训练集;构建基于UFLane‑Detection的车道线检测模型,主干网络通过下采样,将车道线和背景分离,提取其车道线特征,同时不断压缩图像像素;利用Lane‑Decoder解码器还原图像像素,同时结合全局通道注意力模块,将主干网络提取的特征信息进行进一步的加强;利用Softmax分类器对车道线进一步识别;将训练集输入到车道线检测模型中进行训练,最终模型输出结果再重新缩放回待测图片的原始大小,得到最终的分割结果。本发明能够实现复杂交通场景车道线的识别,具有较高的准确率,具有稳定性好、抗干扰能力强、通用性高,鲁棒性好等优点,能够应用于驾驶辅助系统或者无人驾驶系统中。

    一种用于人工智能数据采集的样本监控设备

    公开(公告)号:CN116116482A

    公开(公告)日:2023-05-16

    申请号:CN202310095990.0

    申请日:2023-02-10

    申请人: 淮阴工学院

    IPC分类号: B01L9/00 B01L3/00 H01R9/20

    摘要: 本发明提供一种用于人工智能数据采集的样本监控设备,其结构包括:底座、数据传输端、拼装件、存储解析区、折叠盖、调控端;本发明由存储解析区进一步改进后,通过装载槽装有的四方限定轨与独立中心区加持下,可将多组分类组件装入限定轨内部,从而单一的分类组件可通过夹环与限定框来将单一样本管进行固定,使样本置入存储解析区后能保证自身的垂直度,并且利用人工智能特点加持下,需对某组分类组件的样本管进行研究时,AI信息环可驱动滑杆与轮体在限定轨当中移动,使得让特定样本管位移进入中心区内,进而保证了多种不同的样本管一同存储解析后而产生的混乱不易辨别的情况产生,进而能够提高样本在存储解析区内部的存储效果与分辨度。

    一种基于多交互信息融合的图像描述方法

    公开(公告)号:CN115512195A

    公开(公告)日:2022-12-23

    申请号:CN202211194469.4

    申请日:2022-09-28

    申请人: 淮阴工学院

    摘要: 本发明涉及计算机视觉与自然语言处理领域,公开了一种基于多交互信息融合的图像描述方法,采用目标检测模型提取预处理后训练集的图像显著区域特征,然后使用多视觉语义信息交互模块进行编码显著区域特征得到多层增强图像融合特征,通过对多层增强图像融合特征进行平均池化生成全局图像融合特征;利用多模态交互信息网络挖掘全局图像融合特征与文本语义信息间的关系,从而得到该时间步上下文信息;再经语义解码的线性单元解码上下文信息生成输出单词序列的概率分布。与现有技术相比,本发明能够充分捕获图像视觉信息间的交互信息以及图像视觉信息与文本语义信息间交互信息的多种互补信息,实现对图像语义更加全面的理解。

    一种基于深度学习的多视角三维重建方法

    公开(公告)号:CN115496857A

    公开(公告)日:2022-12-20

    申请号:CN202211177730.X

    申请日:2022-09-22

    申请人: 淮阴工学院

    摘要: 本发明公开了一种基于深度学习的多视角三维重建方法,包括:利用相机对重建目标进行多角度图像采集并选取一张图像作为参考图像;将采集的图像输入图像特征提取模块生成对应的特征图;通过单应性变换算法将特征图转换成参考图像视角下的特征图,并通过逐像素计算图像一致性构建代价体;将构建的代价体输入代价体正则化模块生成参考图像的稀疏深度图;将稀疏深度图输入深度图细化模块生成稠密深度图;根据稠密深度图生成重建目标的空间点云结构,实现三维重建。上述方法是一种基于图像的深度学习重建方法,具有较高稳定性,不受光照强度等环境因素影响,重建效果好,并采用端到端的重建方式,提高了重建效率。

    一种基于多助教模型知识蒸馏训练的文本分类方法

    公开(公告)号:CN114676256A

    公开(公告)日:2022-06-28

    申请号:CN202210329290.9

    申请日:2022-03-30

    申请人: 淮阴工学院

    IPC分类号: G06F16/35 G06N3/04 G06N3/08

    摘要: 本发明专利涉及一种基于多助教模型知识蒸馏训练的文本分类方法,首先根据样本数据,分别针对主教师模型、副教师模型进行训练,接着根据样本数据,结合副教师模型与主教师模型对助教模型的联合渐进蒸馏,同时副教师模型与助教模型之间进行相互学习;再通过对副教师模型与助教模型联合渐进蒸馏得到第一学生模型,并继续对第一学生模型与副教师模型进行联合蒸馏,得到第二学生模型与第三学生模型,并相互学习;最后得到文本分类精度高的第一学生模型、推理速度快的第三学生模型、以及处于两者之间水平的第二学生模型;在实际应用中,将文本输入相应学生模型,得到相应类型下的文本分类结果,有效加快了模型推理速度,提高学生模型文本分类准确度。

    基于视觉协同的危化品运输车违规驾驶行为检测方法及系统

    公开(公告)号:CN111368696A

    公开(公告)日:2020-07-03

    申请号:CN202010129691.0

    申请日:2020-02-28

    申请人: 淮阴工学院

    IPC分类号: G06K9/00 G06N3/04

    摘要: 本发明公开了一种基于视觉协同的危化品运输车违规驾驶行为检测方法及系统,首先制作数据集并进行图像增强和归一化处理;对危险驾驶行为敏感物品进行标注,通过目标识别神经网络对数据集针对敏感物体进行训练;读取视频每一帧,先经过训练好的网络模型检测敏感物体,后将帧进行人体姿态关键点检测;人体姿态检测得到左右手关键点在帧图像中坐标位置,判断其与敏感物体识别框的位置信息,识别对应违规驾驶行为;在违规驾驶行为连续时间窗口超过设定阈值进行预警,并将视频片段保留。本发明可以适应驾驶员监控视频危险驾驶行为实时检测预警,便于及时发现并提醒不规范驾驶行为,从而减小交通事故的发生,检测种类多,识别效果好。