图像块自监督学习训练方法、装置、设备及介质

    公开(公告)号:CN116935153A

    公开(公告)日:2023-10-24

    申请号:CN202310685853.2

    申请日:2023-06-09

    发明人: 徐博诚 张睿

    摘要: 本发明涉及计算机技术领域,公开了一种图像块自监督学习训练方法、装置、设备及介质,包括:获取待学习原始图像,将所述待学习原始图像划分为多个图像块;将所述待学习原始图像表示为视觉标记;按照预设遮掩比例,遮掩所述多个图像块比例将所述多个图像块;将遮掩像素块表示为视觉标记;将所述视觉标记、所述图像块输入预训练网络结构中,对所述预训练网络结构进行自监督学习训练,得到自监督学习训练后的计算机视觉神经网络模型。

    基于IoT设备的楼宇装饰图像生成方法、装置、设备

    公开(公告)号:CN116883535A

    公开(公告)日:2023-10-13

    申请号:CN202310921646.2

    申请日:2023-07-25

    IPC分类号: G06T11/00 G06F30/13 G16Y10/80

    摘要: 本公开的实施例提供了一种基于IoT设备的楼宇装饰图像生成方法、装置、设备,应用于图像生成技术领域,该方法包括:基于目标楼宇内部署的IoT设备采集目标楼宇的环境信息;将采集的环境信息输入至楼宇装饰图像生成模型中,生成目标楼宇对应的装饰图像;其中,楼宇装饰图像生成模型是基于样本集对预设的待训练楼宇装饰图像生成模型进行训练得到的,样本集中的样本以环境信息为样本特征,以与环境信息对应的装饰图像为样本标签。本公开通过IoT设备采集数据,并基于机器模型进行计算,从而实现迅速且准确地生成目标楼宇对应的装饰图像。

    广告屏动态显示方法、装置、电子设备和存储介质

    公开(公告)号:CN116863845A

    公开(公告)日:2023-10-10

    申请号:CN202310911053.8

    申请日:2023-07-24

    发明人: 王海 杨旸

    IPC分类号: G09F27/00 G09G3/20

    摘要: 本公开实施例提供了一种广告屏动态显示方法。应用于数据处理技术领域,所述方法包括:通过雷达获取目标区域的各数据点;根据所述数据点的坐标信息、速度信息,得到行人数据点;根据所述行人数据点的数量,向广告屏发送开启指令或第一关闭指令;获取所述广告屏开启后的显示时间;根据所述显示时间,向广告屏发送第二关闭指令。以此方式,在检测到广告屏范围内有行人靠近时,点亮屏幕,当屏幕前没有行人时关闭屏幕,相较于现有技术中采用红外传感器对人体检测的方式来判定是否打开广告屏,解决了现有技术只能在狭小空间使用的限制,不仅可以在狭小空间使用,还可以适用于商场、步行街等位置,使用范围更加广泛,效果更佳。

    一种区域碳排放态势感知预警方法

    公开(公告)号:CN116862109A

    公开(公告)日:2023-10-10

    申请号:CN202310848998.X

    申请日:2023-07-11

    摘要: 本发明涉及一种区域碳排放态势感知预警方法。本方法通过环境系统的物联网采集排放设施的数据信息,然后对采集的数据信息进行AI建模分析,计算出区域碳排放系统的风险度,最后根据区域碳排放系统的风险度变化曲线反映出的区域碳排放态势进行风险预警。通过本方法可以预测出区域碳排放的潜在风险,并以可视化的方式展示风险度变化曲线,进而对可能出现的区域碳排放隐患做出实时分级预警,同时提示引起区域碳排放风险度变化的原因,便于提前发现和处置碳排放隐患,以减少碳排放超标事件的发生。由于本方法的分析对象为区域碳排放系统中采集的全部传感器状态,当发现其状态开始偏离正常值时就进行预警,因此可以更早、更快地预警碳排放超标。

    一种支持语音和手势的展示交互系统及方法

    公开(公告)号:CN116820227A

    公开(公告)日:2023-09-29

    申请号:CN202310362235.4

    申请日:2023-04-06

    发明人: 胡伟

    摘要: 本公开涉及一种支持语音和手势的展示交互系统及方法,所述系统包括:用于暂存数据的系统缓存;用于传递数据的消息中间件;用于存储数据的数据库,其中,所述数据库包括:关系型数据库和文件数据库;以及,服务器;所述系统还包括:展示层,用于向用户展示待展示的音频、视频和/或图像数据;应用层,用于接收用户向所述系统输入的交互指令并处理,将所述交互指令转换为系统指令;服务层,用于基于所述系统指令向用户提供服务。本公开的支持语音和手势控制的展示交互方法与系统无需使用键盘鼠标、触摸屏幕、遥控器,甚至不需要在现场,只需要语音和手势即可以实现交互,完成切换页面、打开或关闭App等操作。

    基于室内定位的智能零售系统和方法

    公开(公告)号:CN116385723B

    公开(公告)日:2023-09-15

    申请号:CN202310380078.X

    申请日:2023-04-11

    发明人: 唐建红

    摘要: 本发明涉及一种基于室内定位的智能零售系统及方法,属于人工智能智能零售技术领域。所述系统包括:内容汇总器件,将各个分视野分别对应的各个商品类型作为各个不同商品存放区域分别存放的各个商品类型以作为捕获时间点对应的输出数据;第一处理器件、第二处理器件以及第三处理器件,用于建立并训练卷积神经网络,并运行多次训练后的卷积神经网络以获取未来时间点对应的商品定位数据以作为所述智能零售系统的当前室内定位数据输出。通过本发明,能够采用针对性设计和训练的卷积神经网络,基于无人超市各件商品的历史位置预测未来时间点各件商品的当前位置,从而为无人超市的整理策略提供数据基础。

    基于内容感知及自蒸馏结构的自监督算法训练方法和装置

    公开(公告)号:CN116486193A

    公开(公告)日:2023-07-25

    申请号:CN202310228804.6

    申请日:2023-03-10

    发明人: 张睿

    摘要: 本公开提供一种基于内容感知及自蒸馏结构的自监督算法训练方法和装置,包括:分别使用第一增强方式和第二增强方式对图像进行处理,分别得到第一增强图和第二增强图;获取第一增强图的能量图,得到第一能量图,获取第二增强图的能量图,得到第二能量图;根据第一增强图、第二增强图、第一能量图和第二能量图得到无损表征集和有损表征集;分别将将有损表征集和无损表征集输入自蒸馏结构中的学生网络和教师网络,根据输出结果得到总损失函数。本公开的一种基于内容感知及自蒸馏结构的自监督算法训练方法,提出了基于不变因果机制的对比式自监督学习训练方法,优化当前的对比式自监督学习方法,使得所述训练方法可以更好利用无标签数据来训练模型的。

    埋入线缆的故障人工智能检测系统、方法和存储介质

    公开(公告)号:CN116466181A

    公开(公告)日:2023-07-21

    申请号:CN202310380312.9

    申请日:2023-04-11

    发明人: 杨钰

    摘要: 一种线缆故障的人工智能确定检测系统、方法和计算机程序,涉及人工智能技术领域。该系统包括两个以上的第一检测管理设备终端,与云端服务器通过通信网络连接,用于检测测点的磁场和位置并将其传输至云端服务器,通过云端服务器接收划区范围内的第一控制中心输出的故障信息并显示;以及第一控制中心,与云端服务器通过通信网络连接,用于根据从云端服务器获取的第一检测管理设备终端输出的磁场确定获得故障信息,将故障信息进行显示及传输至云端服务器。本发明具有智能化程度高、检测精度高、故障响应及时性高、不易漏检、误检的优点。

    基于注意力模型的视频推荐方法及装置

    公开(公告)号:CN116401402A

    公开(公告)日:2023-07-07

    申请号:CN202310219440.5

    申请日:2023-03-01

    摘要: 本发明涉及一种基于注意力模型的视频推荐方法及装置,方法包括:获取目标用户的用户信息和第一视频信息;基于目标用户的用户信息、第一视频信息以及预训练好的视频推荐模型,确定目标用户对应的初始的视频推荐信息;预训练好的视频推荐模型为基于注意力机制的逻辑回归模型;基于目标用户对应的初始的视频推荐信息以及第二视频信息,从初始的视频推荐信息中确定最终的视频推荐信息,并向用户推荐所述最终的视频推荐信息中的第三视频;第二视频信息为目标用户在当前时刻相邻的第一预设历史时间段观看过的第二视频对应的视频信息,包括视频的类型和每个视频的观看时长。基于此,使推荐的视频能够使用户处于持续感兴趣的状态,满足用户的特定需求。

    多模态对比学习模型训练方法及装置、电子设备、介质

    公开(公告)号:CN116341678A

    公开(公告)日:2023-06-27

    申请号:CN202310252124.8

    申请日:2023-03-10

    发明人: 熊艺华

    IPC分类号: G06N20/00 G06N3/0499 G06N3/08

    摘要: 本公开实施例涉及计算机领域,提供一种多模态对比学习模型训练方法及装置、电子设备、介质,方法包括:获取包括文本数据和图像数据的多模态数据;对多模态数据进行处理,得到文本数据对应的序列化标记数据以及图像数据对应的图像块数据;将序列化标记数据和图像块数据输入特征编码器,得到初始文本特征和初始图像特征;将初始文本特征和初始图像特征输入预设的基于路由的专家层得到多模态特征;将多模态特征输入编码层得到编码文本特征和编码图像特征;根据编码文本特征和编码图像特征训练对比学习网络,得到训练好的多模态对比学习模型。本公开实施例可利用一个模型同时处理多种单/多模态任务,避免灾难性遗忘问题,提高工作效率和训练效果。