-
公开(公告)号:CN119599026A
公开(公告)日:2025-03-11
申请号:CN202411687751.5
申请日:2024-11-25
Applicant: 联通在线信息科技有限公司
Abstract: 本发明属于图像处理技术领域,提供一种图像搜索领域的时间短语语义分析方法和装置。该方法包括:对待处理图像中的搜索文本进行预处理;基于预训练语言大模型BERT和条件随机场CRF,建立序列标注模型,用于识别上下文中的时间表达,获取与待处理图像文本相对应的语义特征向量,并将所获取的语义特征向量输入时间语义分析模型,得到时间识别结果;根据所得到的时间识别结果进行细分类别确定,进行时间模糊化处理和结果整合处理,以向用户返回响应信息。本发明能够精确识别时间类型、时间信息,为用户响应更精确的搜索信息。
-
公开(公告)号:CN117854082A
公开(公告)日:2024-04-09
申请号:CN202311625963.6
申请日:2023-11-30
Applicant: 联通在线信息科技有限公司
IPC: G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06F40/30
Abstract: 本申请公开了一种基于跨模态大模型的图像信息抽取方法、系统及存储介质,属于属于图像信息抽取领域,包括如下步骤:步骤1:采用小型关键信息抽取模型从输入的原始图像中进行信息的初步抽取得到关键信息;步骤2:将所述关键信息以及所述原始图像输入跨模态大模型中,由跨模态大模型对所述关键信息进行优化和矫正后输出最终的图像信息。通过本方案实现了从输入文字图像到输出文字结果全流程自动化,并且利用跨模态大模型中蕴含的丰富知识加深对图片的理解,对于小型关键信息抽取模型的识别结果进行二次审核和加工了,实现了噪声抑制和纠错,大大减少人工工作量,提升信息抽取的准确率和效率。
-
公开(公告)号:CN117058739A
公开(公告)日:2023-11-14
申请号:CN202311084733.3
申请日:2023-08-28
Applicant: 联通在线信息科技有限公司
IPC: G06V40/16 , G06V10/762 , G06V10/764 , G06V10/82 , G06F16/55 , G06N3/0464 , G06N3/08
Abstract: 本发明属于图像处理技术领域,提供一种人脸聚类更新方法及装置,该方法包括:接收待处理图片,在检测到待处理图片中有人脸特征时,截取人脸图像;将所截取的人脸图像输入特征提取模型,输出与人脸图像相对应的当前人脸特征向量和人脸置信度;将当前人脸特征向量与预先建立的人脸特征数据库中的代表性人脸特征向量进行相似度计算;当所计算的相似度小于第一相似度阈值时,重新建立新的人脸标识,更新人脸特征数据库;当所计算的相似度大于等于第一相似度阈值时,判断所输出的人脸置信度是否大于置信度阈值,确定是否更新人脸特征数据库。本发明能精确动态更新人脸特征数据库,能确保数据库中人脸特征的多角度、多样性。
-
公开(公告)号:CN119583724A
公开(公告)日:2025-03-07
申请号:CN202411598326.9
申请日:2024-11-11
Applicant: 联通在线信息科技有限公司
Abstract: 本申请请求保护一种图像敏感信息保护方法,包括如下步骤:步骤1:识别原始图像中的文本块,并识别文本块中的文本信息及在图像中的位置信息;步骤2:判断所述文本信息是否涉及敏感信息,若存在敏感信息,则询问是否进行脱敏处理;步骤3:若选择脱敏处理,则根据脱敏规则对所述敏感信息进行脱敏处理,根据所述位置信息输出符合安全要求的脱敏信息,并根据需要设置查看条件;步骤4:展示带有脱敏信息的图像,并通过执行查看条件查看所述敏感信息。通过引入注意力机制来提高模型对重要特征的关注度,面对不同图像文本信息仍能保持准确度。当使用该方法识别出图像中的敏感信息后,可主动选择对敏感信息的保护或展示,并需解锁才能显示完整信息。
-
公开(公告)号:CN119295814A
公开(公告)日:2025-01-10
申请号:CN202411351440.1
申请日:2024-09-26
Applicant: 联通在线信息科技有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/80
Abstract: 本申请公开了小样本图像分类方法、装置及电子设备,属于图像处理技术领域,该方法:获取原始类别描述文本,基于生成式语言模型确定目标类别描述文本;基于所述目标类别描述文本和样本图像,得到类别编码;获取待分类图像,对所述待分类图像进行编码,得到待分类图像编码;基于所述类别编码和所述待分类图像编码,采用距离度量算法计算所述待分类图像的类别概率,并确定分类结果。本方法不仅能够显著减少对大量标注数据的依赖,还能通过灵活的类别定义适应动态的应用需求,提高了图像分类的准确率。
-
公开(公告)号:CN115795093A
公开(公告)日:2023-03-14
申请号:CN202211496280.0
申请日:2022-11-25
Applicant: 联通在线信息科技有限公司
IPC: G06F16/75 , G06F16/783
Abstract: 本发明涉及一种层次化自适应的视频鉴黄方法,其特征在于,所述视频鉴黄方法包括:对待检测的视频数据进行图片选帧处理;对选取的图片帧进行涉黄概率计算,对选取的图片帧的涉黄概率与预设涉黄概率阈值进行比较;当选取的图片帧的涉黄概率大于预设涉黄概率阈值时,根据自适应视频选取策略,选取进一步检测视频数据;将进一步检测视频数据输入三维卷积神经网络模型进行涉黄分类,鉴别视频涉黄分类。本发明解决了静态图片缺少时序信息,三维卷积神经网络计算整段视频时效率过低的技术问题。
-
公开(公告)号:CN119380350A
公开(公告)日:2025-01-28
申请号:CN202411318781.9
申请日:2024-09-21
Applicant: 联通在线信息科技有限公司
IPC: G06V30/148 , G06V10/26 , G06V20/70 , G06V30/414 , G06V30/19
Abstract: 本发明属于图像处理技术领域,具体涉及一种基于融合版面结构与语义知识的手写体消除方法和系统。该方法包括:将待处理文档图像输入语义分割模型,对待处理文档图像进行逐个像素点分割,消除手写体,得到第一中间文档图像;利用版面分析模型确定所述第一中间文档图像中的版面结构信息和文本信息以得到用于印刷体还原的还原信息;对所述还原信息中的文本块进行纠错,得到第二中间文档图像;对所述第二中间文档图像进行印刷体还原,以输出仅包含印刷体的文本图像。本发明能针对字体缺失、漏字、错误字体、进行有效修复,解决了因受到拍摄条件和模型消除效果的影响。
-
公开(公告)号:CN119273983A
公开(公告)日:2025-01-07
申请号:CN202411349349.6
申请日:2024-09-26
Applicant: 联通在线信息科技有限公司
IPC: G06V10/764 , G06V20/70 , G06V10/82 , G06F40/295 , G06N3/0442 , G06N3/08
Abstract: 本申请公开了一种知识引导的图像搜索召回方法、系统及服务器,属于信息技术领域,包括步骤1:图像存储至云存储系统中时,采用Chinese‑CLIP模型的视觉编码器提取图像的图像语义特征向量,并将图像语义特征向量存入数据库中;步骤2:输入搜索语句时,采用BERT模型对搜索语句做实体识别,抽取出搜索语句中的所有实体;步骤3:将所述实体与中文WordNet知识库中的词进行匹配,获取所有实体的概念层级;步骤4:根据所述概念层级,归一化计算得到相似度阈值;步骤5:提取搜索语句的文本语义特征向量,与所述图像语义特征向量进行相似度计算,基于所述相似度阈值得到召回结果。本方法能够有效提高图像搜索的召回率与准确率。
-
公开(公告)号:CN117763175A
公开(公告)日:2024-03-26
申请号:CN202311515168.1
申请日:2023-11-14
Applicant: 联通在线信息科技有限公司
IPC: G06F16/53 , G06F16/532 , G06F16/538 , G06F16/51 , G06F16/55 , G06F16/903 , G06V40/16 , G06V10/762 , G06V30/10 , G06V20/70 , G06V10/80 , G06F40/30 , G06F40/289
Abstract: 本发明涉及一种融合异构知识的多策略图像检索方法及系统,属于图像检索技术领域,该方法包括:采集图像,采用不同的策略分别对各个图像分别进行相应处理,并将处理结果存储在数据库中;用户输入查询文本,对查询文本进行语义特征提取或预处理,基于语义特征提取结果或预处理结果匹配相应的检索结果集;获取检索结果集之间的交集以及检索结果集中任意两个之间的交集,基于检索结果集之间的交集以及检索结果集中任意两个之间的交集形成总结果集。本申请提供的方法及系统,可深入挖掘图像中的潜在语义信息,从而提高检索的召回率,更加准确理解用户查询意图,此外对检索结果集进行重排序,确保在满足检索相关性的基础上,优先展示最相关的信息。
-
公开(公告)号:CN115914161A
公开(公告)日:2023-04-04
申请号:CN202211496279.8
申请日:2022-11-25
Applicant: 联通在线信息科技有限公司
IPC: H04L51/42 , H04L41/084 , G10L15/06 , G10L17/04
Abstract: 本发明涉及一种基于提示的小样本邮件分类方法及系统,其特征在于,所述邮件分类方法:获取待分类邮件内容,对待分类邮件进行预处理,形成待分类邮件内容;构建提示模板,将待分类邮件内容代入预设构建的提示模板,形成带掩码的提示文本;以提示文本为输入数据,对预训练语言模型进行微调,形成垃圾邮件分类模型;重新获取新的待分类邮件内容,并将新的待分类邮件内容输入垃圾邮件分类模型中,获取邮件分类结果。本发明基于提示的小样本邮件分类方法及系统解决了邮件分类模型的训练及更新需要大量人工标注数据的技术问题。
-
-
-
-
-
-
-
-
-