-
公开(公告)号:CN118643342A
公开(公告)日:2024-09-13
申请号:CN202410875590.6
申请日:2024-07-01
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06F18/25 , G06F16/58
摘要: 本公开提供了一种样本对生成、大模型的训练、图像检索方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于OCR等场景。该样本对生成方法包括:对图像样本进行处理,得到对象信息;根据提示词信息和对象信息,生成图像说明文本,其中,提示词信息包括系统提示信息和任务提示信息,图像说明文本用于描述图像样本的属性;以及,根据图像样本和图像说明文本,生成样本对。
-
公开(公告)号:CN118628843A
公开(公告)日:2024-09-10
申请号:CN202411098784.6
申请日:2024-08-12
申请人: 北京小蝇科技有限责任公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/042 , G06F16/55 , G06F16/583 , G06F16/58 , G06F40/284 , G06F40/216 , G06F18/25
摘要: 本发明提供一种用于医疗数据的长尾目标数据分类方法和装置,所述方法包括:在长尾目标数据库中获取待分类的目标图像,在所述目标图像中增加类别文本描述,以得到输入数据;将所述输入数据输入预先训练的分类识别模型,得到所述分类识别模型输出的分类结果;其中,所述分类识别模型是利用样本数据和预先构建的网络模型进行训练得到的;所述样本数据是在收集到的自然图像中增加类别文本描述得到的,所述网络模型包括预先构建的编码器、图像特征分类头和文图指导图像特征分类头。解决了现有技术中长尾分类的准确性和泛化性较差的问题,提高了长尾分类的准确性和泛化性。
-
公开(公告)号:CN118626666A
公开(公告)日:2024-09-10
申请号:CN202410623360.0
申请日:2024-05-16
申请人: 杭州短趣网络传媒技术有限公司
IPC分类号: G06F16/55 , G06F16/58 , G06N3/0475 , G06N3/088
摘要: 本申请实施例提供了一种图像分类方法、图像展示方法及电子设备。图像分类方法包括:对待分类图像生成不同类型的多个标题文本;通过生成式语言模型对每个标题文本进行改写处理,生成每个所述标题文本对应的多个描述角度的描述文本;根据得到的描述文本对所述待分类图像进行分类,得到分类结果。本申请实施例的技术方案可以提高图像分类展示效果。
-
公开(公告)号:CN115019064B
公开(公告)日:2024-09-10
申请号:CN202210740974.8
申请日:2022-06-27
申请人: 华中科技大学 , 深圳华中科技大学研究院
IPC分类号: G06V10/46 , G06V10/25 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/09 , G06F16/58
摘要: 本发明公开了一种针对旋翼无人机防控的双阶段关键部位识别方法,属于图像处理领域。本发明将旋翼无人机部位识别转化成关键部位中心点识别,利用了关键点检测网络强大的结构建模能力,不仅可对清晰可见的部位进行准确定位,也可对模糊、被遮挡部位给出可靠的位置预测。此外,本发明采用双阶段检测方式,即先检测旋翼无人机目标区域,再对目标区域进行缩放和关键部位中心点检测;一方面固定了输入旋翼无人机的尺度,降低了输入复杂度,有助于提升检测效果,另一方面,克服了旋翼无人机尺寸过小时,部位定位困难、相对误差大的问题。因此,本发明可实现旋翼无人机关键部位准确定位,有助于提高无人机防控系统工作性能。
-
公开(公告)号:CN111460189B
公开(公告)日:2024-09-06
申请号:CN202010248333.1
申请日:2020-04-01
申请人: 华显光电技术(惠州)有限公司
IPC分类号: G06F16/532 , G06F16/58 , G06F16/2457 , G06V10/22 , G06T7/00 , G06K17/00 , G02F1/13
摘要: 本发明涉及一种面板复判方法、装置、服务器、计算机设备和存储介质,方法包括获取面板的测试数据;检测测试数据与预设测试数据是否匹配;当测试数据与预设测试数据不匹配时,获取测试数据中与预设测试数据不匹配的部分所对应的缺陷特征画面;检测缺陷特征画面与预设特征画面是否匹配;当缺陷特征画面与预设特征画面匹配时,将数据库内面板对应的复判状态更新为复判合格状态。在确定面板需要进行复判时,根据之前已获取的测试数据生成对应的缺陷特征画面,将其与预设特征画面进行比对,从而快速判断出面板的复判状态,通过对面板的测试数据的采集,使得复判过程自动化,减少了人工检测工序,降低了面板的复判难度。
-
公开(公告)号:CN118586959A
公开(公告)日:2024-09-03
申请号:CN202411070520.X
申请日:2024-08-06
申请人: 杭州明讯软件技术有限公司
IPC分类号: G06Q30/0202 , G06Q50/14 , G06F16/58 , G06V20/30 , G06V10/44 , G06V10/56 , G06V10/764 , G06V10/82
摘要: 本发明涉及大数据分析技术领域,涉及到基于大数据的游客行为预测系统及方法,通过从各数据源收集目标旅游城市的各相关照片,并获取目标旅游城市对应各相关照片的时间戳;对收集得到的目标旅游城市的各相关照片进行预处理,由此对目标旅游城市的各相关照片进行旅游景区归类,同时分析得到目标旅游城市对应各旅游景区的游客人数变化速率;对目标旅游城市对应各旅游景区的各相关照片进行饱和度量化处理,进一步预测得到目标旅游城市对应各旅游景区的游客出行意愿强度;进而综合对目标旅游城市进行区域划分,提高游客的游览体验和景区的管理效率,能够为景区管理提供科学依据,支持数据驱动的决策,提高管理的科学性和有效性。
-
公开(公告)号:CN118586502A
公开(公告)日:2024-09-03
申请号:CN202410796817.8
申请日:2024-06-19
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N5/04 , G06F16/332 , G06F16/58 , G06N5/022 , G06N3/0455 , G06N3/08 , G06V10/80
摘要: 本公开提供了问答信息的生成及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域,可应用于光学字符识别等场景。其中的问答信息的生成方法可包括:获取待处理的目标图像,目标图像中包括待解答的问题内容以及问题内容对应的配图;分别获取问题内容对应的文本模态信息以及配图对应的图像模态信息;结合文本模态信息以及图像模态信息,利用多模态大模型确定出问题内容对应的解答信息。
-
公开(公告)号:CN118132918B
公开(公告)日:2024-09-03
申请号:CN202410177327.X
申请日:2024-02-08
申请人: 天津圣杰汽车零件制造有限公司
发明人: 张金国
摘要: 本申请提供了一种油管接头密封性能测试系统与测试方法,属于油管接头检测的领域,用于解决相关技术中油管接头的密封性能检测方式存在随机性和偶然性的问题,该系统与方法中,在针对一批次的油管接头的密封性能进行量化评价时,能够结合密封记录大数据以及该批次抽检样品的样品密封模型、样品合格率数据来合理确定这一批次油管接头密封性能的密封性能评价分值,有利于消除抽检结果的随机性对评价结果的影响,使密封性能评价分值能够更合理、准确的反映一批次油管接头的密封性能。
-
公开(公告)号:CN118535760A
公开(公告)日:2024-08-23
申请号:CN202410532287.6
申请日:2024-04-29
申请人: 北京理工大学
IPC分类号: G06F16/58 , G06F16/51 , G06F16/9535 , G06F21/62 , G06F21/60
摘要: 本发明提供一种基于局部敏感哈希的隐私保护跨模态语义检索方法,首先,局部敏感哈希可以将高维数据映射到低维空间,在低维空间中进行哈希索引,以实现快速的近似最近邻搜索,这使得在大规模数据集上的近似最近邻搜索成为可能,大大提高了检索效率;其次,局部敏感哈希与加密技术结合使用,能够实现对敏感数据的安全检索;最后,由于本发明的索引和搜索令牌都是加密的,则本发明的跨模态检索可允许在加密状态下进行数据检索,从而保护了数据的隐私,即使数据是跨多种模态存储的,也可以确保数据在传输和存储过程中得到保护,同时可以在不同模态的数据之间进行关联搜索。
-
公开(公告)号:CN118535758A
公开(公告)日:2024-08-23
申请号:CN202310173675.5
申请日:2023-02-23
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F16/55 , G06F16/583 , G06F16/58 , G06V10/44 , G06V10/75
摘要: 本公开提出一种图文匹配模型训练方法、装置及电子设备,该方法包括根据图像,获取多个第一标签;在对第一图文匹配模型进行本轮迭代训练的情况下,获取第一图文匹配模型对图像预测得到的第二标签;根据图像、多个第一标签,以及第二标签生成多个图像标签组,其中,与不同图像标签组对应的匹配程度值不相同,匹配程度值是相应图像标签组中图像和第一标签或者第二标签之间的匹配程度值;根据多个图像标签组对第一图文匹配模型进行迭代训练,以得到目标图文匹配模型。通过本公开,能够有效提升训练所得模型的图文匹配效果。
-
-
-
-
-
-
-
-
-