-
公开(公告)号:CN114677442A
公开(公告)日:2022-06-28
申请号:CN202210583847.1
申请日:2022-05-26
Applicant: 之江实验室
Abstract: 本发明公开了一种基于序列预测的车道线检测系统、装置和方法,所述方法对待检测的图像数据进行归一化操作得到归一化后的图像,并查找相应的预测关键点序列;提取归一化后的图像的特征向量,对该特征向量进行降维得到降维特征,将该降维特征按高宽维度展开,得到图像序列特征;基于降维特征的维度计算图像位置编码,将图像序列特征和图像位置编码相加,再共同进行编码得到编码记忆;对预测关键点序列进行特征提取得到解码序列特征;对编码记忆、预测关键点序列的位置编码与解码序列特征进行解码,得到待预测关键点的隐状态向量;将待预测关键点的隐状态向量转化为关键点的坐标。本发明提高了车道线的密集关键点的预测准确率,并实现快速预测。
-
公开(公告)号:CN112307553A
公开(公告)日:2021-02-02
申请号:CN202011396522.X
申请日:2020-12-03
Applicant: 之江实验室
Abstract: 本发明公开了一种对三维道路模型进行提取与简化的方法,在待提取道路要素的模型中获取多面片基准面,构建六边形包围盒并正交投影至二维,在保留了颜色与深度信息的条件下,极大地简化了复杂三维场景中道路勾画的操作难度,并根据道路提取区域获取其对应的空间与纹理坐标,达到了自动化构建道路模型的效果。本发明以计算机空间解算技术代替了原有的人工目视解译工作,有效保证了大规模三维场景下道路要素的提取效率与准确性。
-
公开(公告)号:CN119152071A
公开(公告)日:2024-12-17
申请号:CN202411596659.8
申请日:2024-11-11
Applicant: 之江实验室
IPC: G06T11/20 , G06F3/04845 , G06F40/30
Abstract: 本发明公开了一种基于大模型代理的地质图图件生成方法及系统,本方法包括如下步骤:构建地质图生成工具库,并对工具函数实现;上传地质图要素文件,进行地质图图件初始化;基于大语言模型对地质图生成指令进行理解,实现地质图工具调用,生成地质图图件;导出地质图图件结果。本发明设计了一种通过自然语言与大模型交互,将传统软件制图流程转换为地质图图件生成指令,以调用制图工具的形式实现地质图图件高效生成的方法与系统。通过本方法得到的地质图图件生成结果,符合用户指令意图,并严格遵循系统定义的制图流程规范,使用操作便捷、产品质量稳定。
-
公开(公告)号:CN112307553B
公开(公告)日:2024-04-16
申请号:CN202011396522.X
申请日:2020-12-03
Applicant: 之江实验室
Abstract: 本发明公开了一种对三维道路模型进行提取与简化的方法,在待提取道路要素的模型中获取多面片基准面,构建六边形包围盒并正交投影至二维,在保留了颜色与深度信息的条件下,极大地简化了复杂三维场景中道路勾画的操作难度,并根据道路提取区域获取其对应的空间与纹理坐标,达到了自动化构建道路模型的效果。本发明以计算机空间解算技术代替了原有的人工目视解译工作,有效保证了大规模三维场景下道路要素的提取效率与准确性。
-
公开(公告)号:CN117077691A
公开(公告)日:2023-11-17
申请号:CN202310883256.0
申请日:2023-07-18
Applicant: 之江实验室
IPC: G06F40/58 , G06F40/166 , G06F40/284 , G06N3/0455 , G06N3/084 , G09B21/00
Abstract: 本发明公开了一种基于规则生成数据增强的手语词目序列翻译方法及系统,包括以下步骤:基于语义相似度建立中文词到手语词目的映射关系;基于映射关系通过替换方式将中文文本序列翻译成伪手语词目序列,基于噪声规则将伪手语词目序列增强以生成伪平行语料对;利用伪平行语料对预训练机器翻译模型得到预训练模型;利用真实双语语料对预训练模型进行微调得到最终翻译模型;利用最终翻译模型进行手语词目序列的翻译。系统包括:映射关系建立模块、数据增强模块、预训练模块、微调模块以及翻译模块。上述方法及系统针对中文文本生成手语词目序列的任务,旨在尽可能提高手语词目翻译水平,为听障人士提供便利。
-
公开(公告)号:CN116049371A
公开(公告)日:2023-05-02
申请号:CN202310119450.1
申请日:2023-01-18
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/34 , G06F16/54 , G06F16/35 , G06F16/532 , G06F18/214 , G06V10/774
Abstract: 本发明公开了一种基于正则化和对偶学习的视觉问答方法与装置,所述方法具体包括以下子步骤:提取VQA数据集中问题的关键词;对图像数据预处理,筛选图像中的关键区域;将关键词和图像中的关键区域输入至VQA、VQG模型进行预训练;构建视觉蕴涵模型,并进行预训练;利用视觉蕴涵模型进行相关性判断,构建训练样本,基于正则化和对偶学习对预训练好的VQA和VQG模型进行协同训练;利用训练好的VQA和VQG模型进行视觉问答。
-
公开(公告)号:CN115496863A
公开(公告)日:2022-12-20
申请号:CN202211354722.8
申请日:2022-11-01
Applicant: 之江实验室
Abstract: 本发明涉及影视创作领域,公开一种用于影视智能创作的情景互动的短视频生成方法和系统,通过预训练的跨模态文本‑图像匹配模型和预训练的语言模型,可以实现场景图片和动作序列的匹配筛选;基于三维深度估计算法,计算出场景图像对应的深度信息,并通过预设的相机内参,估计出该场景图对应的三维信息;基于smpl‑x人体模型,对用户上传的人体进行参数估计和纹理贴图,获取带纹理的人体模型;通过估计的三维信息、动作序列、带纹理的人体模型、场景图片,合成互动者融于该场景图片的短视频。本发明可有效应用于当前影视创作中的分镜稿、故事版及预演动画等智能化生成工作,对影视创造的流程具体革新作用。
-
公开(公告)号:CN115022711A
公开(公告)日:2022-09-06
申请号:CN202210460469.8
申请日:2022-04-28
Applicant: 之江实验室
IPC: H04N21/44 , H04N21/845 , G06N3/04 , G06N3/08
Abstract: 本发明属于视频制作领域,公开了一种电影场景内镜头视频排序系统及方法,包括电影数据预处理模块、镜头特征提取模块、镜头排序模块;电影数据预处理模块包括镜头检测与分割,用于将输入的整个电影按照镜头进行切分;镜头特征提取模块用于提取单个镜头的多个关键帧图像的内容特征;镜头排序模块,用于将一个场景下的图像时序特征进行组合为一组特征图,多个场景的多组特征图进行输入;选定一个视频片段作为初始片段,预测出下一个视频片段是其中的哪一个镜头,直至完成所有视频片段的排序。本发明可实现以每一个分镜的多个镜头作为输入,自动的从中选择一个最符合此视频风格的镜头并将其串联成一个完整的视频。
-
公开(公告)号:CN118865393A
公开(公告)日:2024-10-29
申请号:CN202411343007.3
申请日:2024-09-25
Applicant: 之江实验室
Abstract: 本发明提出了一种面向大模型训练的地质图语料标注方法和装置,其方法在待标注地质图中定义了多层级标注要素,并提出了具体标注流程,包括1)对地质图的一级要素进行区域性标注,2)对空间标识包含的二级要素进行标注,3)对图例包含的二级要素进行标注,4)导出标准化标注结果。本发明构造了符合地质图图件要素表达逻辑的标注架构和方法,提高了标注效率,提升地质图的可用性,推动地学研究与人工智能技术的深度融合,为大模型支持地球科学研究提供基础语料的支持。
-
公开(公告)号:CN118170933B
公开(公告)日:2024-08-13
申请号:CN202410585594.0
申请日:2024-05-13
Applicant: 之江实验室
IPC: G06F16/45 , G06F16/483 , G06F16/41 , G06F16/215 , G06F40/30 , G06N3/045
Abstract: 本发明公开了一种面向科学领域多模态语料数据的构建方法和装置,方法包括以下步骤:按语料主题分类采集待处理的科学领域相关多模态原始语料数据;构建任务处理流管线对原始语料数据依次进行预处理、内容解析、数据清洗和结构化得到整体语料数据;对包括文本、图片、表格和公式的不同子类型语料数据进行语料评测,基于语料评测结果对整体语料数据进行质量评估;根据质量评估结果优化整体语料数据完成科学领域语料数据库构建。本发明通过自动化任务处理流管线高效处理并生成语料数据,同时提供统一存储与质量评测,通过不断优化处理流程得到高质量科学领域语料数据库,能够为大模型训练提供可靠的数据基础,推动科学研究和应用技术的不断发展。
-
-
-
-
-
-
-
-
-