-
公开(公告)号:CN118072227A
公开(公告)日:2024-05-24
申请号:CN202410457964.2
申请日:2024-04-17
申请人: 西北工业大学太仓长三角研究院 , 同济大学
IPC分类号: G06V20/40 , G06V10/75 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/08
摘要: 本发明属于视频理解技术领域,具体涉及基于知识蒸馏的轨道交通列车测速方法。本发明的方法将Transformer融合yolo使用多场景数据集先在教师神经网络上进行训练,再用不同的单一场景数据集单独训练参数量较小的学生神经网络,来解决Transformer需要计算量大实时性差的问题。考虑到数据集特点,本发明的方法还将蛇形卷积融合到yolo网络模型中来提高性能。本发明使用教师神经网络训练学生神经网络能使模型取得更好的泛化能力,消耗更少的训练时间,也能使模型取得更快的推理速度。除了能够处理固定视角的列车定位与测速,本发明的方法也能处理移动视角下的列车定位与测速,且具有较好的实时性。
-
公开(公告)号:CN118072227B
公开(公告)日:2024-07-05
申请号:CN202410457964.2
申请日:2024-04-17
申请人: 西北工业大学太仓长三角研究院 , 同济大学
IPC分类号: G06V20/40 , G06V10/75 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/08
摘要: 本发明属于视频理解技术领域,具体涉及基于知识蒸馏的轨道交通列车测速方法。本发明的方法将Transformer融合yolo使用多场景数据集先在教师神经网络上进行训练,再用不同的单一场景数据集单独训练参数量较小的学生神经网络,来解决Transformer需要计算量大实时性差的问题。考虑到数据集特点,本发明的方法还将蛇形卷积融合到yolo网络模型中来提高性能。本发明使用教师神经网络训练学生神经网络能使模型取得更好的泛化能力,消耗更少的训练时间,也能使模型取得更快的推理速度。除了能够处理固定视角的列车定位与测速,本发明的方法也能处理移动视角下的列车定位与测速,且具有较好的实时性。
-