一种视频跨模态搜索模型训练方法、搜索方法及装置

    公开(公告)号:CN116955699A

    公开(公告)日:2023-10-27

    申请号:CN202310882289.3

    申请日:2023-07-18

    Abstract: 本发明提供一种视频跨模态搜索模型训练方法、搜索方法及装置,对于用于检索的文本数据采用文字特征编码模型和初始文本语义映射网络映射至公共语义空间;被检索的科技视频通过光学字符识别和科技视频自动语音识别提取文本内容,提取首尾帧图像内容,分别进行特征提取后执行特征融合,并通过初始视频语义映射网络映射至公共语义空间;在下游构建相似度比对任务、语义分类任务和模态判别任务,对初始文本语义映射网络、初始模态融合网络和初始视频语义映射网络进行训练,提升文本和视频两种类型数据在公共语义空间内表示的精确度,并关注到模态内和模态间的关联及差异。

    面向学者聚类的研究兴趣挖掘方法、装置和存储介质

    公开(公告)号:CN113515638B

    公开(公告)日:2021-12-07

    申请号:CN202111072396.7

    申请日:2021-09-14

    Abstract: 本发明提供一种面向学者聚类的研究兴趣挖掘方法、装置和存储介质,该方法包括以下步骤:基于多源学者相关学术数据构造学术元数据集合;将学术元数据作为输入数据输入到预先建立的研究兴趣挖掘模型中,对主题模型进行采样获得学者兴趣语义表示,学者兴趣语义表示包括专业领域‑主题分布、主题‑英文单词分布、主题‑中文单词分布和主题‑学者分布;基于获得的学者兴趣语义表示进行学者聚类,获得学者聚类结果;研究兴趣挖掘模型对来自同一数据源且属于同一个专业领域的学者的数据共享同一个主题分布,研究兴趣挖掘模型中,专业领域‑主题分布被建模为狄利克雷分布,主题‑英文单词分布、主题‑中文单词分布和主题‑学者分布被建模为多项式分布。

    面向学者聚类的研究兴趣挖掘方法、装置和存储介质

    公开(公告)号:CN113515638A

    公开(公告)日:2021-10-19

    申请号:CN202111072396.7

    申请日:2021-09-14

    Abstract: 本发明提供一种面向学者聚类的研究兴趣挖掘方法、装置和存储介质,该方法包括以下步骤:基于多源学者相关学术数据构造学术元数据集合;将学术元数据作为输入数据输入到预先建立的研究兴趣挖掘模型中,对主题模型进行采样获得学者兴趣语义表示,学者兴趣语义表示包括专业领域‑主题分布、主题‑英文单词分布、主题‑中文单词分布和主题‑学者分布;基于获得的学者兴趣语义表示进行学者聚类,获得学者聚类结果;研究兴趣挖掘模型对来自同一数据源且属于同一个专业领域的学者的数据共享同一个主题分布,研究兴趣挖掘模型中,专业领域‑主题分布被建模为狄利克雷分布,主题‑英文单词分布、主题‑中文单词分布和主题‑学者分布被建模为多项式分布。

    文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254655B

    公开(公告)日:2021-09-17

    申请号:CN202110757754.1

    申请日:2021-07-05

    Abstract: 本发明提供了一种文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取多个话题类别及其对应的多个词和多个文档;统计每个话题类别的所有文档中包含该话题类别对应的每个词的第一文档数量和所有话题类别的所有文档中包含每个话题类别的每个词的第二文档数量;计算每个话题类别的每个词的第一文档数量与第二文档数量的比值,作为词对话题覆盖率;若词的词对话题覆盖率大于设定阈值,将该词选作相应话题类别的特征词,得到相应类别特征词袋;对待分类文档分词,以得到待分类文档的词袋模型;计算待分类文档的词袋模型与各类别特征词袋的相似度;根据各相似度确定该待分类文档的类别。通过上述方案能够利用较少标注完成文本分类任务。

    专利文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254656A

    公开(公告)日:2021-08-13

    申请号:CN202110763595.6

    申请日:2021-07-06

    Abstract: 本发明提供了一种专利文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取专利文本的字向量表示;利用卷积神经网络提取字向量表示中的短语特征;利用长短时记忆网络提取字向量表示中的上下文特征;利用注意力层为长短时记忆网络输出的隐层特征向量添加不同权重,以突出区分度较大部分并降低文本结构和重复度较高结构权重,得到第一注意力层的输出;利用全连接层将第一注意力层的输出压缩为与短语特征的维度匹配的特征向量;将专利文本的短语特征和上下文特征连接得到输入向量,利用第二注意力层为输入向量添加注意力权重,以减少融合过程信息损失,得到融合特征向量,用于对专利文本分类。通过上述方案能够提高专利文本分类准确性。

    文本分类方法、电子设备及计算机存储介质

    公开(公告)号:CN113254655A

    公开(公告)日:2021-08-13

    申请号:CN202110757754.1

    申请日:2021-07-05

    Abstract: 本发明提供了一种文本分类方法、电子设备及计算机存储介质,其中,该方法包括:获取多个话题类别及其对应的多个词和多个文档;统计每个话题类别的所有文档中包含该话题类别对应的每个词的第一文档数量和所有话题类别的所有文档中包含每个话题类别的每个词的第二文档数量;计算每个话题类别的每个词的第一文档数量与第二文档数量的比值,作为词对话题覆盖率;若词的词对话题覆盖率大于设定阈值,将该词选作相应话题类别的特征词,得到相应类别特征词袋;对待分类文档分词,以得到待分类文档的词袋模型;计算待分类文档的词袋模型与各类别特征词袋的相似度;根据各相似度确定该待分类文档的类别。通过上述方案能够利用较少标注完成文本分类任务。

    一种基于粗定位与精定位融合的车牌识别方法和系统

    公开(公告)号:CN103870803A

    公开(公告)日:2014-06-18

    申请号:CN201310495102.0

    申请日:2013-10-21

    Abstract: 本发明实施方式提出一种基于粗定位与精定位融合的车牌识别方法和系统。采集关于车牌图像的正样本集和负样本集,提取正样本集和负样本集的类哈尔(Haar)特征以训练车牌分类器,并使用该车牌分类器粗定位待检测图像中的车牌区域;将粗定位车牌区域转化为灰度图,并分析垂直以及水平投影信息以确定车牌的上下边界和左右边界,获得精定位的车牌区域;采集包含预定车牌字符的车牌字符集,利用超正方体(Tesseract)引擎分析车牌字符集中预定车牌字符的字符特征并训练得到车牌字符库,并利用车牌字符库识别精定位的车牌区域,以确定精定位的车牌区域中的字符。解决由于复杂背景产生的干扰车牌定位精度的问题。

    利用小磁钢建立的耦合单摆实验装置及测量方法

    公开(公告)号:CN102306465B

    公开(公告)日:2013-06-12

    申请号:CN201110192797.6

    申请日:2011-07-11

    Abstract: 一种利用小磁钢建立的耦合单摆实验装置及测量方法,该装置基于现有仪器改造而成,设有:三角形支架,旋转轴及轴承,等间隔排列在旋转轴上的多个轴套,每个轴套下悬挂一个单摆。旋转轴的一端固联一个步进电机,该步进电机的转速和旋转角度可调,并能带动旋转轴在设定角度内转动,从而使各单摆作受迫振动;每个轴套上都吸附一个或多个小磁钢,且相邻轴套上的小磁钢相互吸引,导致各单摆各自运动时互相影响,实现耦合。改变小磁钢数量,可以改变耦合强度。数字摄像装置可同时连续拍摄和处理多个单摆的运动图像,并通过PC机实时显示、计算和记录耦合单摆的运动轨迹、振幅等信息。该装置结构简单,操作便利,价格便宜,易于推广。

    针对公共安全多文档的摘要提取模型训练方法、摘要提取方法及装置

    公开(公告)号:CN119416775A

    公开(公告)日:2025-02-11

    申请号:CN202411309717.4

    申请日:2024-09-19

    Abstract: 本申请提供针对公共安全多文档的摘要提取模型训练方法、摘要提取方法及装置,方法包括:基于记载有公共安全内容的多个原始文档生成对应的多文档异质图;采用多文档异质图训练由依次相接的图卷积网络、图注意力网络以及强化学习模型构成的本地摘要提取模型,以使该本地摘要提取模型用于根据输入的多文档异质图,输出该多文档异质图对应的多个目标句子,以形成该多文档异质图的摘要数据。本申请能够提高自动获取多个公共安全文档之间的跨文档信息的效率及可靠性,能够有效提高公共安全多文档的摘要提取模型的训练效率以及泛化性,进而能够有效提高多个公共安全文档的摘要提取的全面性、准确性及高效性。

Patent Agency Ranking