一种机务段场景视觉问答方法、系统及服务器

    公开(公告)号:CN113222026B

    公开(公告)日:2022-11-11

    申请号:CN202110539044.1

    申请日:2021-05-18

    摘要: 本发明提供了一种机务段场景视觉问答方法、系统及服务器,采用机车正常状态和动作前状态的两种机务段场景的图像数据,创建具有双重注意力与动态描述的第一视觉问答模型,通过对两个模块的联合训练,极大地提升在多个需要机车做出反应的场景变化对象同时出现以及场景内干扰物较多情况下的场景视觉问答能力、提高了复杂环境下机务段场景的检测效果,同时提升对于机务段场景视频的动态判断与描述能力,在需引起机车反应的机务段场景对象动态变化时,保持高稳定性的描述,满足了复杂度极高的工业的使用需求。

    一种新能源电池帽缺陷检测方法和系统

    公开(公告)号:CN114047195A

    公开(公告)日:2022-02-15

    申请号:CN202111333918.4

    申请日:2021-11-11

    IPC分类号: G01N21/89 G01N21/892

    摘要: 本发明公开了一种新能源电池帽缺陷检测方法,在上料盘上将电池帽按照顺序要求和姿态要求排列好之后,转入输送带;输送带运输电池帽依次通过第一检测装置、变位机、第二检测装置和分选机;电池帽以弧焊面向上的形式运动到第一检测装置,第一检测装置对电池帽的弧焊面拍照取样,并将数据发送给主控系统;变位机将电池帽进行180°翻转,使得电池帽点焊面朝上;第二检测装置对电池帽的电焊面拍照取样,并将数据发送给主控系统;主控系统根据其内的识别模型判断电池帽的状态并将识别结果发送到分选机;分选机根据识别结果对电池帽进行分类。同时设置相应的系统,本发明采用双工位的检测方式,保证每部相机能采集到工件缺陷数据,确保数据的准确性。

    针对可变分辨率计算可变卷积核的方法、存储介质

    公开(公告)号:CN114692831B

    公开(公告)日:2024-08-27

    申请号:CN202210304788.X

    申请日:2022-03-23

    摘要: 本发明公开了针对可变分辨率计算可变卷积核的方法,小波变换中各窗函数的时间分辨率和频率分辨率均不同,小波变换的时频图像中各窗口的时域宽度和频域宽度均不同,根据时频图像中各窗口的时域宽度频域宽度,分别确定与时频图像中各窗口进行卷积的卷积核大小。本发明根据时频图像中各窗口的时域宽度和频域宽度设计对应的卷积核大小,解决在不同位置有不同尺度或变形的对象难以用相同大小的卷积核进行卷积的问题,能够在更短的时间内进行轴承故障诊断分类,从而获得更高的精度。

    一种基于全局-局部对比学习的领域自适应目标检测方法

    公开(公告)号:CN117876668A

    公开(公告)日:2024-04-12

    申请号:CN202410063203.9

    申请日:2024-01-16

    摘要: 本发明公开了一种基于全局‑局部对比学习的领域自适应目标检测方法,包括:获取数据样本,所述样本数据包括源域数据和目标域数据;基于所述源域数据和目标域数据生成中间域数据并进行域自适应过程;基于全局‑局部对比学习特征对齐模块对所述域自适应过程进行训练得到训练好的判别器;基于所述训练好的判别器对所述源域数据和目标域数据进行特征提取得到源域数据特征图像和目标域数据特征图像;将所述源域数据特征图像和目标域数据特征图像输入协同训练网络得到域自适应目标检测结果。本发明通过全局和局部对比学习在两层特征层面上进行域适应,有效减小图像域之间的特征差异促进了全局和局部一致的表示,同时提高了检测精度。

    一种基于world-tacotron的语音合成方法、系统及服务器

    公开(公告)号:CN113129862B

    公开(公告)日:2024-03-12

    申请号:CN202110436317.X

    申请日:2021-04-22

    摘要: 本发明涉及一种人工智能技术领域,提供一种基于world‑tacotron的语音合成方法、系统及服务器,本发明在现有的tacotron模型基础上,将韵律信息融入端到端声学建模过程,引入双任务学习框架,主任务为改进的tacotron模型,学习基于字符级嵌入表示的声学特征参数预测;辅助任务为韵律生成模型,即韵律生成器,学习基于词级嵌入的韵律预测。本发明在训练阶段,通过双任务的联合训练,在模型训练中可以学习到更加显示的韵律知识,从而优化了输出语音的质量。

    一种用于悬垂线夹的R型销安装装置

    公开(公告)号:CN116728344A

    公开(公告)日:2023-09-12

    申请号:CN202310845460.3

    申请日:2023-07-11

    发明人: 王彬 赵冲 姬鹏东

    IPC分类号: B25B27/02 B25B11/00

    摘要: 本发明公开了一种用于悬垂线夹的R型销安装装置,涉及电力器械技术领域。本发明包括安装盒,安装盒内安装有电机;电机的输出轴连接有安装架,安装架滑动连接有安装板和侧板,以及连接有电动推杆,导杆和光电传感器;安装板与电动推杆连接,安装板连接有夹持块,夹持块开设有夹持槽;侧板连接有导板、条形板,以及连接有定位球,通过电机带动定位球和夹持块绕螺栓或销轴转动,当定位球与螺栓或销轴的销孔位置对应时,则通过条形板触发光电传感器,并通过电动推杆带动安装板,将R型销插入销孔。本发明通过电机带动安装架转动,使得定位球和夹持块沿螺栓或销轴转动,使得定位球能够准确定位销孔位置,解决了现有使用灵活性和便利性差的问题。

    一种视觉问答方法、系统及服务器

    公开(公告)号:CN113205507B

    公开(公告)日:2023-03-10

    申请号:CN202110540093.7

    申请日:2021-05-18

    摘要: 本发明提供一种视觉问答方法、系统及服务器,包括:获取输电设备的图像数据,图像数据包括视频数据和图片数据;预处理图像数据,得到原始数据集;对原始数据集依次进行视觉问答标注和语义分割标注,得到视觉问答数据集;对视觉问答数据集进行训练,得到视觉问答模型;输入问题文本和图片到视觉问答模型,得到视觉问答结果。本发明对图像数据进行视觉问答标注和语义分割标注,得到视觉问答数据集,从而建立了图像数据的语义分割与文本问答之间的图文链接;根据该视觉问答数据集训练得到的视觉问答模型,以图文链接作为锚点,将输入的图片与文本在语义上对齐,提高了视觉问答模型的性能,获得了更加准确的视觉问答结果。

    多领域自适应模型的训练方法、系统、设备及存储介质

    公开(公告)号:CN114663725A

    公开(公告)日:2022-06-24

    申请号:CN202210278102.4

    申请日:2022-03-21

    摘要: 本发明提供一种多领域自适应模型的训练方法、系统、设备及存储介质,所述方法包括:获得源域数据和目标域数据,并根据域不同将目标域数据划分为若干个分组,每个分组包含一个域的目标域数据;将源域数据输入源域分类网络,将一组目标域数据输入目标域分类网络进行训练,根据训练结果更新增量卷积层的权重,其中,源域分类网络和目标域分类网络的权重共享;将增量卷积层的权重加载至源域分类网络和目标域分类网络;选择另一组目标域数据,进行迭代训练,直至目标域数据训练完毕,获得多领域自适应模型。解决了在传统自适应模型中,只能使用单源域到单目标域的问题。