-
公开(公告)号:CN113505597B
公开(公告)日:2024-11-12
申请号:CN202110848123.0
申请日:2021-07-27
申请人: 随锐科技集团股份有限公司
IPC分类号: G06F40/289 , G06F40/216 , G06F16/483
摘要: 本发明公开了一种视频会议中提炼关键词的方法、装置及存储介质,属于视频多媒体通信的技术领域,该方法包括:S1:获取插话者和主持者的语音,识别语音中的文字,并对文字进行分词;S2:对分词后的文字进行关键词提取;S3:在插话者和主持者的语音中分别抽取关键词,采用余弦相似度算法,计算关键词的相似度,如果相似度不小于阈值,则进行步骤S5;S4:在插话者和主持者的语音中分别抽取关键词,计算抽取的关键词的语义距离,如果语义距离不小于阈值,则进行步骤S5;其中,步骤S3和S4同步进行;S5:展示插话者的语音内容。本发明能够基于自动分词、关键词提取、语义距离和余弦相似度相结合来规范会议纪律,提炼课堂提问过程。
-
公开(公告)号:CN114385729B
公开(公告)日:2024-10-29
申请号:CN202111567158.3
申请日:2021-12-20
申请人: 航天信息股份有限公司
IPC分类号: G06F16/25 , G06F16/483 , G06F16/583 , G06F16/182
摘要: 本申请公开了一种数据处理方法、装置、设备及介质,用以提高数据质量。由于本申请可以在接收到事件处理指令后,获取事件处理指令中携带的发生的目标事件的信息;其中,目标事件的信息可以包括:事件内容和目标事件涉及的第一人物信息;根据预先设置的每个标识,获取基于第一人物信息确定的每个目标标识对应的属性值;创建事件处理指令对应的处理标识,在处理标识对应的事件栏中保存事件内容,并在处理标识对应的人物栏中保存每个目标标识对应的属性值,因此,本申请可以将目标事件的信息中包含的数据治理为质量较高的结构化数据,基于该质量较高的结构化数据,可以使目标事件的信息的价值被最大程度的利用。
-
公开(公告)号:CN115062168B
公开(公告)日:2024-10-25
申请号:CN202210749375.2
申请日:2022-06-28
申请人: 北京字跳网络技术有限公司
IPC分类号: G06F16/44 , G06F16/48 , G06F16/483 , G06F3/0481 , G06F3/04845 , G06F3/04883
摘要: 本公开实施例公开了媒体内容展示方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:在预设展示页面中展示包括预设音频和多个媒体内容的目标媒体作品中的当前媒体内容,并播放预设音频,根据预设音频的当前播放进度和预设音频关联的特征时刻信息,确定目标特征时刻,其中,特征时刻包括预设音频中的音频特征满足预设条件的时间点,目标特征时刻为预设音频在当前播放进度下待播放下一个媒体内容的特征时刻,在预设音频的播放进度到达目标特征时刻时,控制预设展示页面由展示当前媒体内容自动切换至展示下一个媒体内容,使得媒体内容的切换更加灵活地匹配音频的音频特征,可以达到实时卡点的展示效果,提升媒体作品的观看体验。
-
公开(公告)号:CN118820491A
公开(公告)日:2024-10-22
申请号:CN202410927399.1
申请日:2024-07-10
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F16/432 , G06F16/483 , G06F16/45 , G06F16/33 , G06F16/35 , G06F16/38 , G06F16/532 , G06F16/55 , G06F16/583
摘要: 本发明提供一种融入图像描述驱动的图文双向检索方法及系统。该方法包括:获取待检索图文数据集,包括若干个待检索图像和待检索文本;分析待检索图文数据集的平台来源,根据平台来源选择提示词策略;利用提示词策略和预设大语言模型生成每个待检索图像的文本描述,并建立待检索图像与其对应的文本描述的索引;利用提示词策略和预设大语言模型生成每个待检索文本的语义增强文本;针对以文搜图任务,将给定的查询文本与每个待检索图像的文本描述进行相似度比较,返回相似度最高的前N个待检索图像;针对以图搜文任务,生成给定的查询图像的文本描述并将其与每个待检索文本的语义增强文本进行相似度比较,返回相似度最高的前N个待检索文本。
-
公开(公告)号:CN118779477A
公开(公告)日:2024-10-15
申请号:CN202310361800.5
申请日:2023-04-06
申请人: 腾讯云计算(北京)有限责任公司
发明人: 郑少胤
IPC分类号: G06F16/483 , G06F16/36
摘要: 本申请涉及计算机领域,提供了一种内容检测方法、装置、设备及存储介质。该方法包括:基于预设的字扩展方式,对原始禁用词中的至少一个字进行扩展,得到相应的扩展禁用词,再基于原始禁用词与扩展禁用词进行内容检测,确定含有至少一个禁用词时,从待检测内容中提取表征产品信息的关键词;针对待检测内容中的各内容段,分别执行以下操作,获得各自的局部内容特征,并基于获得的各局部内容特征,得到待检测内容的检测结果:基于一个内容段与关键词各自的上下文信息,获得该内容段与关键词之间的关联权重,并基于该内容段的上下文信息与关联权重,获得相应的局部内容特征。通过扩展原始禁用词与引入名词性的关键词,以提高检测覆盖率与检测准确率。
-
公开(公告)号:CN115391578B
公开(公告)日:2024-10-15
申请号:CN202210925063.2
申请日:2022-08-03
申请人: 北京乾图科技有限公司
IPC分类号: G06F16/483 , G06F16/438 , G06V10/774 , G06V10/74 , G06V10/75 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种用于跨模态图文检索模型的样本生成方法,用于对跨模态图文检索模型的训练集进行处理,其中,所述训练集中包括多个由图像样本和文本样本组成的图像‑文本样本对,相互匹配的图像样本和文本样本互为正样本,相互不匹配的图像样本和文本样本互为负样本,所述方法以训练集中的每个样本为锚点样本,从训练集中获取该锚点样本的正样本和负样本,并将获取的正样本和负样本与锚点样本组成原始三元组,对原始三元组执行如下步骤:S1、根据原始三元组中正样本和负样本的特征,获得其各自对应的激活特征和剩余特征;S2、将正样本的剩余特征和负样本的激活特征组合以生成增强负样本,并用该增强负样本替换原始三元组中的负样本以生成增强三元组。
-
公开(公告)号:CN118734270A
公开(公告)日:2024-10-01
申请号:CN202411214860.5
申请日:2024-09-02
申请人: 武汉大学
IPC分类号: G06F21/16 , G06F18/214 , G06F18/2433 , G06F18/15 , G06F16/41 , G06F16/45 , G06F16/483 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/084 , G06N3/048
摘要: 本发明提出了一种基于模型隐藏的所有权确认方法。为保护和确认模型所有者知识产权问题,通过利用深度学习网络的双向训练能力,模型架构能够转置的性质,与反向模型的功能能够仅被模型所有者识别的特点,基于空间索引为反向任务标识数据,实现有效的数据记忆与提取,提供一种新的模型所有权确认方式。
-
公开(公告)号:CN118733799A
公开(公告)日:2024-10-01
申请号:CN202410766829.6
申请日:2024-06-14
申请人: 北京中科睿途科技有限公司
IPC分类号: G06F16/44 , G06F16/483 , G06N3/045
摘要: 本说明书实施例提供大模型多模态输出展示方法及装置,其中大模型多模态输出展示方法包括:获取初始数据,将初始数据输入大模型获取目标数据;基于提取规则对目标数据进行提取,确定解析数据;基于解析数据,绘制目标图像,并将目标图像进行展示。通过获取初始数据,将初始数据输入大模型获取目标数据;基于提取规则对目标数据进行提取,确定解析数据;基于解析数据,绘制目标图像,并将目标图像进行展示,可以增强大模型输出数据的灵活性和多样性,从而易于进行图像绘制,提高了绘图效率,增加了成功率。
-
公开(公告)号:CN113377970B
公开(公告)日:2024-10-01
申请号:CN202010163157.1
申请日:2020-03-10
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F16/43 , G06F16/483 , G06F16/953
摘要: 本发明公开了一种信息的处理方法和装置。其中,该方法包括:获取第一信息,并根据第一信息生成第一匹配结果,其中,第一信息的类型与第一匹配结果的类型允许相互切换;在第一匹配结果中不包含目标对象的情况下,获取第二信息,并基于第二信息生成第二匹配结果,其中,第二信息的类型与第一信息的类型允许相互切换,第二信息用于对第一信息进行补充。本发明解决了现有技术中智能交互平台的交互模式单一的技术问题。
-
公开(公告)号:CN118690029A
公开(公告)日:2024-09-24
申请号:CN202411170753.7
申请日:2024-08-26
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/432 , G06F16/45 , G06F16/483 , G06F18/22 , G06F18/25 , G06F18/2321 , G06F18/2431
摘要: 本发明公开了一种基于多模态信息融合的视频问答方法、系统及介质,属于计算机视觉技术领域,用于解决视频问答技术依赖于单一模态信息,无法充分利用视频中蕴含的多模态信息,视频检索的效率和准确性不足的技术问题。包括:视频文件基础信息提取得到视频摘要及文本字幕;对文本字幕语句切分得到字幕片段,获取对应的视频片段及音频片段;对每个音频片段进行聚类得到若干个声纹类型簇;获取每个声纹类型簇对应的视频镜头集以及字幕集,获取每类声纹对应的人物标签;根据视频片段以及字幕片段,获取关键帧向量以及字幕片段向量;将全部信息存入向量数据库;基于视频摘要对用户输入的问题进行意图分析,并调用向量数据库进行视频检索及问题回答。
-
-
-
-
-
-
-
-
-