专利检索 ap:("新华融合媒体科技发展(北京)有限公司" OR "北京中科闻歌科技股份有限公司") AND inv:"曹家" 第 1 页

1.

发明授权
一种基于预训练模型的话题生成方法有权

公开(公告)号：CN116361469B

公开(公告)日：2024-07-19

申请号：CN202310347857.X

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 王宇琪 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种基于预训练模型的话题生成方法，包括：获取待聚类文本中的每个文本的特征向量和关键词，每个文本包括h个关键词；利用设定聚类算法对待聚类文本进行聚类，得到多个话题；对多个话题进行清洗和合并处理，得到处理后的n个话题；对于n个话题中的任一话题，基于预训练生成模型生成对应的话题描述；输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述，使得得到的话题描述通顺，可读性强，并且由于对话题进行了清洗和合并，使得聚类结果更加准确。

2.

发明授权
基于事件演化的用户观点和立场获取方法有权

公开(公告)号：CN116049413B

公开(公告)日：2023-06-13

申请号：CN202310346366.3

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 罗引 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 王璋盛 , 曹家 , 王磊

IPC分类号： G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047

摘要： 本发明提供了一种基于事件演化的用户观点和立场获取方法，首先对输入的多个文本例如新闻进行文本聚类，然后对聚类结果进行清洗和合并以得到事件，然后针对事件的演化过程，抽取事件对应的评论者、观点和立场，最后按照事件的演化时间顺序，输出对应的评论者、观点和立场，能够根据事件的演变，推断评论者的观点、立场的变化情况。

3.

发明授权
一种事件脉络生成方法、电子设备和存储介质有权

公开(公告)号：CN116361468B

公开(公告)日：2024-05-03

申请号：CN202310347374.X

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种事件脉络生成方法、电子设备和存储介质，方法包括：首先对接收到的文本进行文本编码，然后进行文本聚类，并进行话题清洗与合并，得到所有话题，然后对每个话题，进行事件拆分，得到每个事件，并对相似事件进行合并，然后基于文本相似度进行事件脉络生成，能够更好地划分话题或事件，使得生成的话题或事件更加准确。此外，本发明不需要人工干预，可自动对多篇新闻进行数据预处理，生成话题库和事件库，并根据发布时间，输出事件的事件脉络。

4.

发明公开
一种基于多模态特征的视频分类方法审中-实审

公开(公告)号：CN116361509A

公开(公告)日：2023-06-30

申请号：CN202310217049.1

申请日：2023-03-02

申请人： 新华融合媒体科技发展(北京)有限公司 , 北京中科闻歌科技股份有限公司

发明人： 郭鸿飞 , 马先钦 , 李雪 , 刘宏宇 , 蔡昌艳 , 王璋盛 , 曹家 , 罗引 , 王磊

IPC分类号： G06F16/75 , G06F16/735 , G06F16/783

摘要： 本申请涉及视频分类技术领域，特别是涉及一种基于多模态特征的视频分类方法。所述方法包括以下步骤：S100，抽取目标视频vid的视频时序特征Fts；将Fts进行聚合得到Fv；S200，将vid转换为wav格式的音频数据aud；抽取aud的音频时序特征Fas；将Fas进行聚合得到Fa；S300，按照预设频次对vid进行视频帧图像抽取，得到视频帧图像集合img；提取img中的字幕文本信息textocr，并结合vid的文本标题texttitle获取vid的第三特征向量Ft；S400，将Fv、Fa和Ft输入到经训练的第一神经网络模型，得到对vid的一级标签分类结果。本发明实现了对短视频内容的准确分类。

5.

发明公开
一种事件脉络生成方法、电子设备和存储介质有权

公开(公告)号：CN116361468A

公开(公告)日：2023-06-30

申请号：CN202310347374.X

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种事件脉络生成方法、电子设备和存储介质，方法包括：首先对接收到的文本进行文本编码，然后进行文本聚类，并进行话题清洗与合并，得到所有话题，然后对每个话题，进行事件拆分，得到每个事件，并对相似事件进行合并，然后基于文本相似度进行事件脉络生成，能够更好地划分话题或事件，使得生成的话题或事件更加准确。此外，本发明不需要人工干预，可自动对多篇新闻进行数据预处理，生成话题库和事件库，并根据发布时间，输出事件的事件脉络。

6.

发明公开
一种LOGO识别系统审中-公开

公开(公告)号：CN116206295A

公开(公告)日：2023-06-02

申请号：CN202310196542.X

申请日：2023-03-02

申请人： 新华融合媒体科技发展(北京)有限公司 , 北京中科闻歌科技股份有限公司

发明人： 郭鸿飞 , 马先钦 , 张垚 , 姚奇伶 , 蔡津津 , 王璋盛 , 曹家 , 罗引 , 王磊

IPC分类号： G06V20/60 , G06V10/22 , G06V10/426 , G06V10/74 , G06F16/583 , G06V10/776 , G06V10/82

摘要： 本申请涉及计算机视觉技术领域，特别是涉及一种LOGO识别系统。该系统包括存储器，所述存储器存储有LOGO数据库，所述LOGO数据库由至少两个LOGO子数据库组成，不同LOGO子数据库对应的LOGO宽高比例范围不同；每个LOGO子数据库存储有对应LOGO的特征向量，每个LOGO子数据库中LOGO对应的特征向量的存储位置标号与对应的LOGO面积占比正相关或负相关；所述系统还包括处理器和存储有计算机程序的存储介质，当所述计算机程序被处理器执行时，实现对应的LOGO识别方法。本发明能够快速识别出图像和视频数据中的LOGO。

7.

发明公开
基于事件演化的用户观点和立场获取方法审中-公开

公开(公告)号：CN116049413A

公开(公告)日：2023-05-02

申请号：CN202310346366.3

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 罗引 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 王璋盛 , 曹家 , 王磊

IPC分类号： G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047

摘要： 本发明提供了一种基于事件演化的用户观点和立场获取方法，首先对输入的多个文本例如新闻进行文本聚类，然后对聚类结果进行清洗和合并以得到事件，然后针对事件的演化过程，抽取事件对应的评论者、观点和立场，最后按照事件的演化时间顺序，输出对应的评论者、观点和立场，能够根据事件的演变，推断评论者的观点、立场的变化情况。

8.

发明公开
一种基于话题描述的文本聚类清洗和合并方法有权

公开(公告)号：CN116361470A

公开(公告)日：2023-06-30

申请号：CN202310347961.9

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 蒋永余 , 王璋盛 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种基于话题描述的文本聚类清洗和合并方法，首先对文本进行聚类，得到多个聚类结果，每个聚类结果相当于一个话题，然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的描述，能够使得聚类结果更加准确。

9.

发明授权
一种基于话题描述的文本聚类清洗和合并方法有权

公开(公告)号：CN116361470B

公开(公告)日：2024-05-14

申请号：CN202310347961.9

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 蒋永余 , 王璋盛 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种基于话题描述的文本聚类清洗和合并方法，首先对文本进行聚类，得到多个聚类结果，每个聚类结果相当于一个话题，然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的描述，能够使得聚类结果更加准确。

10.

发明公开
一种基于预训练模型的话题生成方法有权

公开(公告)号：CN116361469A

公开(公告)日：2023-06-30

申请号：CN202310347857.X

申请日：2023-04-03

申请人： 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

发明人： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 王宇琪 , 曹家 , 罗引

IPC分类号： G06F16/35

摘要： 本发明提供了一种基于预训练模型的话题生成方法，包括：获取待聚类文本中的每个文本的特征向量和关键词，每个文本包括h个关键词；利用设定聚类算法对待聚类文本进行聚类，得到多个话题；对多个话题进行清洗和合并处理，得到处理后的n个话题；对于n个话题中的任一话题，基于预训练生成模型生成对应的话题描述；输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述，使得得到的话题描述通顺，可读性强，并且由于对话题进行了清洗和合并，使得聚类结果更加准确。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类